·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
12下一页
返回列表 发布新帖

一个简单的题目,难倒众多家的AI

189 10
发表于 2024-4-28 13:19:50 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
今天我有3个苹果,昨天吃了1个苹果,还剩几个?
目前为止只有GPT4和文心回答准确,GPT3.5也是错的。其他都是错。
表扬下,从没看得起文心,没想到文心的理解能力一流一个简单的题目,难倒众多家的AI 苹果,GPT4,文心,理解能力
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务

评论10

拾光Lv.8 发表于 2024-4-28 13:20:38 | 查看全部
克劳德的回答oups版本的

好的,让我们一步一步分析这个问题:

今天你有3个苹果。
昨天你吃了1个苹果。
所以,剩下的苹果数量应该是:

剩余苹果数 = 今天的苹果数 - 昨天吃掉的苹果数
剩余苹果数 = 3 - 1
剩余苹果数 = 2
因此,你现在还剩下2个苹果。
我要说一句 收起回复
独家记忆Lv.8 发表于 2024-4-28 13:21:26 | 查看全部
一个简单的题目,难倒众多家的AI 苹果,GPT4,文心,理解能力
一个简单的题目,难倒众多家的AI 苹果,GPT4,文心,理解能力

我用 coze 的纯 gpt-4-128k,但是结果也是瞎答的【见上图】。还是感觉 coze 掺水严重。

作为对比,我用自己搭建的 gpt-4(用的是 Azure 的 Openai api),测试了好几次都是准的【见下图】。
我要说一句 收起回复
浅生Lv.8 发表于 2024-4-28 13:21:34 | 查看全部
昨天吃了1个苹果,所以今天还剩3-1=2个苹果。

答案是2。

Therefore, you have 2 apples left today.


谷歌的bard一本正经的胡说。 {:2_33:}
我要说一句 收起回复
TyCodingLv.8 发表于 2024-4-28 13:21:52 | 查看全部
还剩4个,已经吃掉的也算你有的
我要说一句 收起回复
TyCodingLv.8 发表于 2024-4-28 13:22:28 | 查看全部
如果你今天有3个苹果,并且昨天吃了1个苹果,那么在昨天吃苹果之前,你拥有的苹果数量应该是今天的数量加上昨天吃掉的数量。但是,因为你今天仍然有3个苹果,这意味着昨天吃掉的1个苹果并不包括在今天的3个苹果之内。  所以,昨天你吃掉1个苹果后,剩下的苹果数量应该是今天你拥有的3个苹果。因此,无论是昨天还是今天,你剩下的苹果数量都是3个。

kimi不错
我要说一句 收起回复
独家记忆Lv.8 发表于 2024-4-28 13:22:55 | 查看全部
如果你今天有3个苹果,并且昨天吃了1个,那么你还剩下3个苹果。昨天吃掉的苹果不会影响你今天拥有的数量。

coze也挺好的
我要说一句 收起回复
婷姐Lv.8 发表于 2024-4-28 13:23:33 | 查看全部
不管怎么理解,反正不能回答 2 个。但是一众所谓的 gpt-4,回答都是 2 个。只有我自用的不掺水 gpt-4,回答就是 3 个。
我要说一句 收起回复
浅生Lv.8 发表于 2024-4-28 13:23:48 | 查看全部
coze的gpt4是假的
我要说一句 收起回复
TyCodingLv.8 发表于 2024-4-28 13:24:20 | 查看全部
和智普清言回答一样

如果你今天有3个苹果,昨天吃了1个,那么今天还剩下3个苹果。昨天的行为不会影响今天苹果的数量。
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.144.38.184,GMT+8, 2024-11-22 19:42 , Processed in 0.385978 second(s), 127 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表