欢迎学习chatgpt使用教程
2024 年 12 月 21 日 04:00:00,OpenAI 重磅推出 o3,瞬间,整个科技界都炸锅了。就如同超级炸弹在平静湖面引爆,惊涛骇浪滚滚而来。这可不是普通的发布,那是通往 AGI 之路上的重大里程碑,感觉都没啥阻碍了。
还记得 OpenAI 的 12 天直播不?那简直是一场漫长又充满期待的旅程。一开始,大伙都焦急等待,不知道会有啥惊喜。嘿,终于在圣诞氛围中,奥特曼回归,带来压轴大戏——OpenAI o3。
o3 的能力逆天得很呐!对现有的所有模型那都是降维打击。瞧瞧软件工程考试(SWE-Bench Verified),就像一场超牛的写程序大考,要快、要准、还不能有 bug。o3 成绩高达 71.7%,比 o1 强不少呢。再瞅瞅 Codeforces,全球著名编码竞赛平台。o3 得分 2727,啥概念?相当于榜单第 175 名,超越 99.99%的人类,惊掉下巴有木有!
数学竞赛 AIEM 2024 和博士级科学考试 GPQA Diamond 中,o3 也超厉害。AIEM 2024 接近满分,头一回有 AI 达这么高水平。博士级科学考试虽没那么猛,但也相当牛。
还有那个 FrontierMath,60 多位顶尖数学家合作开发的数学基准测试。之前 GPT-4 和 Gemini 1.5 Pro 评估时,成功率不足 2%,o3 直接飙到 25.2,差距巨大,一个天上一个地下。
最有意思的当属 ARC-AGI。这是通过一系列抽象和推理任务测试 AI 系统能力的基准。过去几代模型在这上面表现不咋地,从 GPT-2 到 GPT-4,分数一直低。可 o3 一出现,分数直接冲到恐怖的 87.5%,人类阈值分数才 85%。这意味着啥?咱离真正的 AGI 越来越近啦!
不过呢,o3 虽强,目前只对红队开放~又是一个期货?我们拭目以待。但过去一年AI界的进度可谓是神速了,展望2025年,相信会有更多的落地场景。到时候继续分享给大家。
openai o3-mini试用申请地址:
https://openai.com/index/early-access-for-safety-testing/
本文链接:https://ruoxuan.net/CHATGPT/576.html
o3 minio3openai o3 miniopenai o3chatgpt o3 minichatgpt o3o3 mini官网openai o3官网
网友评论