如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-18 21:25:12
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-20 14:50:12全栈(前端+j***a)是不是前端的未来?
- 2025-06-20 14:00:13你们都什么时候对男女之事开窍的?
- 2025-06-20 15:10:14参考 FreeBSD,随着 Ruby 的没落,GitHub、GitLab 是否会去 Ruby 化?
- 2025-06-20 15:30:14你认为这次伊以冲突,以色列这次干得漂亮吗?
- 2025-06-20 14:55:13商业史上有哪些降维打击的经典案例?
- 2025-06-20 14:55:13如何评价sketch 2025的改版?
- 2025-06-20 14:55:13***移动在德国起诉小米侵犯4G专利,大家如何看待此***?
- 2025-06-20 15:15:12女生真正的完美身材是什么样子?
- 2025-06-20 15:00:14如何评价Cursor?
- 2025-06-20 14:20:16婆婆早晚喝一瓶纯牛奶,每一次还剩半箱就开始催儿子买。每次听见她喊她儿子买我就不太舒服我是不是太小气?
推荐产品
-
地球上明明有吃塑料的虫子,为什么没有普及?
说一个许多人可能没想到的事: 我们经常看到塑料需要500年甚 -
明星现实中真的很漂亮吗?
见过杨幂,17年绣春刀杭州路演。 概括来说就是“一个很** -
你和你老婆是怎么认识的?
明天就是和她认识的第十周年,十年了,我和她的聊天记录从来没有 -
postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢?
普通人用pg会碰到稀奇古怪的障碍,一气之下就退回mysql了
新闻动态
最新资讯

