0 已点赞

OpenAI推出重磅o3推理模型！展现强大推理能力

产业报道 2025年01月01日 10:41:29来源：化工仪器网 17445

摘要近日，美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。

　　【 仪表网产业报道】近日，美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。

　　o3能够进行复杂任务的推理，在科学、编码、数学等领域的表现要优于前一代o1模型，同时花费的处理时间也会更长。以一项评估AI高级数学推理能力的测试EpochAI Frontier Math为例，以往所有模型都未达到2%的准确率，而o3准确率达到了创纪录的25%。

　　在2024年美国数学邀请赛中，o3模型的准确率高达96.7%，仅答错了一个问题。而在OpenAI研究人员认为最严格的基准测试之一——Frontier Math中，o3也解决了25.2%的问题。尽管这一得分看似不高，但此前其他大型语言模型曾在此“集体翻车”，正确率均未超过2%。

　　在对科学知识的掌握方面，o3的表现也超出一般博士水平。在GPQA Diamond(衡量模型在博士级科学问题上的表现，涵盖化学、物理和生物学方面的专业知识)基准测试中，o3的准确率达到87.7%，超过了人类博士的70%，也比之前o1表现高近10%。

　　此外，o3的编码能力也比之前的o1系列更胜一筹。在 SWE-bench Verified(衡量AI模型解决现实世界软件问题的能力)基准上，o3的准确率约为71.7%，比o1高20%以上。在Codeforces编码竞赛平台中，o3的得分为2727，相当于榜单上第175名人类编程员的水平，而o1得分仅为1891。

　　o3模型让OpenAI在通往AGI的道路上又迈前了一步。在相关基准测试ARC-AGI中，高配版o3得分为87.5%，低计算设置下o3得分为75.7%，是o1模型的三倍。但高计算模式需要花费极其昂贵的成本，每个任务高达数千美元，低计算模式则需要20美元左右。

我要评论

昵称

匿名

文明上网，理性发言。（您还可以输入200个字符)

表情

所有评论仅代表网友意见，与本站立场无关。

仪表网首页资讯首页

延伸阅读

版权与免责声明

凡本网注明"来源：仪表网"的所有作品，版权均属于仪表网，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明"来源：仪表网"。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。
合作、投稿、转载授权等相关事宜，请联系本网。联系电话：0571-87759945，QQ：1103027433。