如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

时间：2025-06-24 07:15:15来源：当前位置：当前位置：首页 >

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 女生被踢裆也会很疼吗？

下一篇 : 椎间盘突出后突出物会一直压着神经吗？保守治疗是通过什么原理让椎间盘回纳的啊？

相关文章：

{dede:myad name='右侧广告位'/}

你们的腰突是怎么突然好的？

时隔一年后再次上来更新，目前再次恢复得差不多了，今天女儿去...
2025-06-25阅读全文 >>
据报道称“浏览器内核有上千万行代码”，浏览器内核真的很复杂吗？

这会儿正好在rebuild chromium，机器卡到不行。...
2025-06-25阅读全文 >>
使用内存超过32G(含)的电脑是种怎样的体验？

我家那位，公司标配32G内存，她一直以为32G是现在的主流配...
2025-06-25阅读全文 >>
5070ti什么时候才能回归正常价格？

618第一天其实是在5月13日，那天某音突然发了大额券，打了...
2025-06-25阅读全文 >>
养乌龟是什么体会？

大水体深水养乌龟的忠实信徒。条件不允许，只有25厘米的水深...
2025-06-25阅读全文 >>

养花知识本月排行

1鱼缸氨氮含量低，但是硝酸盐和亚硝酸盐爆表，已经一个多周了，咋办？
go为了编译速度减少了很多编译优化？为什么不能提供优化编译模式来提升运行效率？是太懒还是另有隐情？
如果SSD硬盘闲置很多年，内部数据会不会丢失？
rust有什么适合萌新练手的项目吗？
亚洲体坛最漂亮的十位女运动员都有谁？
个人开发者或小企业不申请经营性ICP备案，怎样开发APP盈利?
怎么向老婆简单解释nas的用途？
中国女明星里谁的身材特别好？
有哪些支持.Net系语言的开源中间件？
为什么某些人说中国现在全球军事实力第一，但包括中国人在内很多人不认可？

{dede:myad name='右侧广告位'/}

养花知识精选

养花知识推荐