最新!OpenAI发布发布o3及o3 mini推理模型

chatgpt中文网2024-12-21 09:42:0980

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi

前情回顾

OpenAI连续12日圣诞前发布完整回顾:

最新!OpenAI发布发布o3及o3 mini推理模型推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top 

Day1:发布o1满血版、ChatGPT Pro最贵订阅版本200美元/月

Day2:发布强化微调新功能,用少量训练数据即可在特定领域构建专家模型Day3:发布视频生成模型Sora

Day4:Canvas全面开放,升级代码功能

Day5:展示OpenAI与苹果智能合作功能

Day6:发布高级实时视频理解功能

Day7:发布Projects In ChatGPT功能

Day8:搜索功能全面开放,支持语音搜索

Day9:o1 API开放,实时API更新

Day10:拨打1-800-ChatGPT热线电话,可访问ChatGPT

Day11:展示Mac桌面版App与各类App的互操作性

本期,详细给大家介绍Day12:发布o3及o3 mini推理模型。

在OpenAI为期12天的圣诞系列发布活动的高潮时刻,终于揭晓了备受期待的重磅新品——o3,这是其迄今为止最先进的前沿推理模型的升级版。OpenAI宣称,在特定条件下,o3的性能已经接近于通用人工智能(AGI)的水平。

在直播环节中,OpenAI的首席执行官Sam Altman表示:“我们视o3为人工智能发展的新篇章。这些模型能够处理日益复杂且需要深度推理的任务。”他还特别强调了o3在编程领域的卓越表现,称其为“不可思议”。

  
2
o3系列模型,性能卓越,接近通用人工智能(AGI)
    o3系列模型介绍:
    OpenAI推出了o3系列,包括两款模型:
    1. OpenAI o3:旗舰版,性能强大。
    2. OpenAI o3 mini:轻量级,速度快,成本低,性价比高
    o3系列模型的开放计划:
    o3系列目前不向普通用户开放,OpenAI计划先进行外部安全测试,预计明年1月正式发布。感兴趣的人可以提交申请:
    [OpenAI安全测试申请](https://openai.com/index/early-access-for-safety-testing/)
    o3模型的性能提升:
    o3模型在多个基准测试中表现出色:
    - 在SweepBench Verified基准测试中,准确率达到71.7%,比o1高出20%。
    - 在Codeforces编程竞赛平台上,得分2727,远超o1的1891分
    - 在美国数学竞赛AIME 2024测试中,准确率为90.67%,高于o1的83.3%
    - 在GPQA Diamond测试中,得分87.7%,比o1的78%高。
    - 在EpochAI Frontier Math测试中,得分超过2457分,远超其他模型。
    o3在AGI领域的进展:
    o3在ARC-AGI基准测试中表现出色,得分75.7分,在提高算力和思考时间后,得分达到87.5%,超过大多数真人。
    o3 mini模型的特点:
    o3 mini继承了o1 mini的数学和编程能力,成本极低,并向安全研究人员开放测试申请。它支持低、中、高三种推理时间模式,可根据任务复杂度调整思考时间。在Codeforces Elo评分中,随着推理时间增加,得分持续攀升。o3 mini还能自我测试,在GPQA数据集测试中,准确率达到61.62%。
    o3 mini模型的数学和编程能力:
    在AIME数学基准测试中,o3 mini低推理模式性能与o1 mini相当,中等推理模式超越o1 mini。o3 mini还支持函数调用、结构化输出和开发者指令等API功能。
    o3模型的市场影响:
    OpenAI在AI领域领先竞争对手约两年,但随着市场份额被蚕食,ChatGPT的光环正在褪去。竞争对手如Anthropic和Google开发出性能接近的新模型,OpenAI的竞争优势正在减弱。尽管如此,作为用户,我们将成为这场变局中的最大赢家。

    最新!OpenAI发布发布o3及o3 mini推理模型

    本文链接:https://yeziwang.cc/openai_1570.html

    chatgpt测试员chatgpt有使用额度吗chatgpt内容总结保姆级chatgpt注册教程chatgpt怎样提取视频内容GPTsGPT4.0与3.5有哪些区别测试GPT-3.5GPT-3.5模型GPT的3.5和GPT4.0区别

    相关文章