如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-19 21:55:11
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-26 23:25:12一个母亲对儿女说,这世上除了爸妈没人真心希望你们好。请问你怎么看?
- 2025-06-26 22:50:13都说机械键盘的寿命长,为什么我身边(包含我自己)买的某些机械键盘反而没有薄膜键盘寿命长?
- 2025-06-26 22:10:13乔丹的身体素质放到现在是不是只能算平庸?
- 2025-06-26 22:15:11RTX5060真的有那么不值吗?
- 2025-06-26 21:40:12Anthropic 推出的 Claude Code Agent 有哪些亮点值得关注?
- 2025-06-26 22:15:11MongoDB的缺点以及你为什么不使用MongoDB?
- 2025-06-26 23:25:12Golang 中为什么没有注解?
- 2025-06-26 21:50:12紧身牛仔裤看起来不正经,真的是这样吗?
- 2025-06-26 22:10:13有哪些好用不火的软件?
- 2025-06-26 22:30:12起点直发19万66章,多次申请签约失败,目前存稿95万380章,请问还有继续发的必要吗?
推荐产品
-
如何评价杨***钰这个人?
杨***钰怀孕,她还是对顶级富豪祛魅了。 看到一个新闻,杨 -
张学友在澳门演唱会被要求讲普通话,这背后反映了哪些文化和社会问题?
如果你去到一个西餐厅,只有英文菜单,你两眼一抹黑,“服务员, -
如何评价电视剧《长安的荔枝》大结局?
看到大结局我才终于意识到,剧版里的这些历史人物为什么要改名了 -
为什么白银案的嫌疑人在之后的十几年间突然停手?
老了,干不动了,而且担心影响到孩子的将来。 在犯罪心理学上
新闻动态
最新资讯

