两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
以色列为什么突然敢打伊朗了?不怕被报复?
和女生旅游开一间房有什么注意事项?
胸大的女孩会自卑 吗?
PHP和Node.js哪个更爽?
以色列为什么突然敢打伊朗了?不怕被报复?
周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权?
为什么韩国的热辣舞团无法征服中国的男性市场??
亚洲体坛最漂亮的十位女运动员都有谁?
如何评价首个女性友好的编程语言HerCode?
蜂鸟音乐指控邓紫棋侵权,要求 48 小时内下架重录歌曲,邓紫棋回应「不会下架」,这一指控合理吗?
如果战争爆发,中国普通老百姓枪都不会打该怎样自卫?
空战的时候可不可以先击落预警机?
如何评价字节跳动开源的 HTTP 框架 Hertz ?
身体上的哪些迹象表明你正在衰老?
老板说我设计了一周的海报还是不行,我到底该怎么学啊?
一个程序员的水平能差到什么程度?