如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-18 21:55:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-18 19:40:11你最满意的10款 PC 软件是什么?
- 2025-06-18 19:25:12有钱人的大额现金是怎么转出到国外账户的?
- 2025-06-18 19:20:11我觉得隋唐是鲜卑帝国,有问题吗?
- 2025-06-18 19:45:10不是都说6月美债要爆吗 怎么没消息了?
- 2025-06-18 19:05:11内塔尼亚胡***访时公开威胁,不排除干掉哈梅内伊,如何评价这一言论?伊朗会亡国吗?
- 2025-06-18 18:50:12为什么小爱音箱只能播放qq音乐免费音乐?
- 2025-06-18 19:40:11和父母无法沟通你有多绝望?
- 2025-06-18 19:30:11如果是巴基斯坦被印度击落三架歼-10C,这些天舆论会是怎样的?
- 2025-06-18 18:45:11近日中国开始在以色列撤侨,中东是否有大战要发生?
- 2025-06-18 18:30:11有没有用过GOOVIS的?
推荐产品
-
如何看待伊朗议员沙赫里亚里: 我们恳求最高领袖批准使用核武器?
现在我国为啥在国防不藏着掖着了?有什么武器亮什么武器 这次更 -
大海捞针还捞着了是一种什么样的体验?
如果知乎算海的话,那我,被捞着了。 事情是这样的:我以前有 -
我国004号航母什么时候下水?
有资料显示,之前猜测的003二号舰,即福建舰姊妹舰已取消。 -
在中国儿子就那么重要吗?
我一儿一女,平心而论和儿子在一起更轻松。 ***期早上起来
新闻动态
最新资讯

