如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-25 02:10:10
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2026-03-23 09:15:02「龙虾」爆火,token成「硬通货」后,这场AI比赛变得更重要了_模型_系统_问题
- 2026-05-01 15:55:04老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!_Nemo_标准单元_逻辑
- 2026-03-26 15:25:09积分算展开系数有困难?《张朝阳的物理课》特色方法算勒让德展开系数_方程_引力_月球
- 2026-05-03 12:30:06Manus案启示录:AI时代的技术主权博弈与创业者的新生存法则_监管_科技_数据
- 2026-03-26 16:55:03美团、阿里巴巴大涨!市场监管总局转载评论:外卖大战该结束了_服务_涨超_惠企
- 2026-05-04 20:40:04反超三倍!中科院院长正式宣布,这项技术突破,连美日都羡慕_反射镜_尺寸_垄断
- 2026-05-04 12:05:06AI进入下半场,国产CPU芯片上桌,迎来了巨大利好!_场景_推理_wintel
- 2026-03-20 16:05:02忍无可忍!傅盛深夜开撕周鸿祎:欠债数亿不还_小雷_科技_官司
- 2026-03-20 09:45:03月薪3万,AI大厂正在“疯抢”文科生?_模型_工作_丹妮拉·阿莫迪
- 2026-05-03 11:55:04800人实测:AI给你的烂方案,比最优解更值钱_MAP-Elites_设计_参与者
推荐产品
-
“龙虾”爆改小米、宇树,但关键问题仍未解决_智能_手机_应用
实际上,现在能“养龙虾”的不止电脑,手机、智能眼镜、智能耳机,甚至机器人,都在积极接入Openclaw,或是推出自己的龙虾产品。目前,智能眼镜品牌Rokid、李未可,智能耳机品牌光帆科技等产品,已经完成Op… -
冲刺具身智能第一股!宇树IPO获受理:去年营收超17亿,初始市值达420亿,王兴成大赢家_机器人_占比_人形
冲刺具身智能第一股!宇树IPO获受理:去年营收超17亿,初始市值达420亿,王兴成大赢家_机器人_占比_人形 -
Manus终于喝下自己藏好的毒_Agent_OpenClaw_产品
Manus终于喝下自己藏好的毒_Agent_OpenClaw_产品 -
林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
新闻动态
最新资讯
- 手机遭遇“5年内最猛烈涨价潮”,AI入侵咋让一切变贵了_消费者_机型_内存
- 考核全部不达标,马斯克1583亿美元天价年薪实际一分没拿
- 全球首台阔比例大折叠手机来了!华为Pura X2定档4月发布:提前苹果半年_尺寸_影像_核心
- 成本增加2万只涨4000元绝对值!雷军:做新SU7压力很大 邀请舒淇代言顺应网友意愿_小米_新车_定价方式
- 2023中国软件技术大会于12月15-16日在北京成功举办 - *
- 成为全球AI工厂,中国的又一张国运王牌_模型_Token_电力
- 发动机被卡脖子,C919交付跟不上,国产大飞机换国产心脏有多难_中国_配件_美国***
- 华夏基金试水***播客 解锁投资陪伴新范式_深度_DeepTalk_专业
- 微信龙虾插件上线72小时,就被OpenClaw一次更新干崩了_代码_qqbot_官方

