两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
相当离谱。 半决赛对阵阿尼西莫娃这剧情又出现了一次,这次更...
2025-06-20阅读全文 >>OpenAI CEO 奥特曼前两天发了一篇博文,名字叫「温和...
2025-06-20阅读全文 >>坦白说,我第一次听说 Cloudflare 是因为他们提供的...
2025-06-20阅读全文 >>嗯,趁着这两天618预热,直接入手了降价两千多的16pm。 ...
2025-06-20阅读全文 >>我倒是感觉没什么特别的问题,就是单纯的不够熟练。 你打练习...
2025-06-20阅读全文 >>