如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-25 18:25:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19 17:45:12能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
- 2025-06-19 17:05:13为什么中国现在全球军事实力第一,但包括中国人在内很多人不认可?
- 2025-06-19 16:35:14什么才是真正的爱情?
- 2025-06-19 17:00:14作为一个服务器,node.js 是性能最高的吗?
- 2025-06-19 16:10:13炫富真的很爽吗?
- 2025-06-19 17:10:13一个人山林徒步时都要关注哪些点?
- 2025-06-19 16:55:13你觉得最毁三观的事是什么?
- 2025-06-19 17:30:12日本AV对中国人的毒害有多大?
- 2025-06-19 16:45:13为什么中国现在全球军事实力第一,但包括中国人在内很多人不认可?
- 2025-06-19 16:45:13穿瑜伽裤爬山的女生会不会害羞?
推荐产品
-
女人为什么身体那么软?
因为女人没有那俩***,是靠卵巢分泌睾酮,只有男的几分之一。 -
为什么QQ上的网络状态没有了?
现在是2025年,Mac 版新QQ仍然有这个网络在线状态,只 -
发生了什么导致你从此再不吃某样食物?
螃蟹 之前挺喜欢吃的 后来看到一个***问为什么蒸螃蟹的时候 -
颈椎生理曲度变直可以通过运动康复吗?
来门诊看颈椎不适、活动不利的年轻人特别多, 他们的颈椎X线片
最新资讯

