OpenAI最新发布o3 - AGI真的不远了

chatgpt中文网2024-12-21 11:19:4952

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi

OpenAI 持续长达 12 天的直播活动缓缓步入最终篇章,在北京时间12月21日凌晨两点,在美国政府面临停摆,民间于满溢着圣诞氛围的时刻,奥特曼重磅回归,携带着令人期待已久的压轴精彩内容闪亮登场,为这场长达 12 天的直播盛会画上了一个独特的句点:OpenAI o3来啦,也就意味着AGI也不远了。
啥,o2都没发布直接o3了?是的,没错,据说是英国电信服务提供商o2版本存在版权或商标冲突,所以直接到o3了。这一看o2实际是发布了,只是服务范围有限制而已。
受到google Gemini的阻击,这几天相信大家感觉到OpenAI也不过如此嘛!这下奥特曼还像又可以重回巅峰了,这就是AI的速度,在擂台上停留的时间并不会很长。

o3在多个方面实现了显著的性能提升和技术创新。

OpenAI最新发布o3 - AGI真的不远了推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top 

o3 系列包含两款重磅模型:

  • OpenAI o3:旗舰版本,具备强大的性能表现
  • OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比

先别急着高兴,因为 o3 系列目前并不会向普通用户开放,OpenAI 计划先开放外部安全测试申请,正式发布时间预计要到明年 1 月。

现在,感兴趣的朋友可以提交申请:https://openai.com/index/early-access-for-safety-testing/

技术创新方面

  1. 推理能力的显著提升

    • o3模型在SweepBench Verified基准测试中达到了约71.7%的准确率,比前代o1模型高出20%以上。
    • 在编程竞赛平台Codeforces上,o3的得分可达2727,远超o1的1891。
    • 在美国数学竞赛AIME 2024测试中,o3的准确率达到90.67%,而o1为83.3%。
  2. 接近人类水平的推理

    • o3在ARC-AGI基准测试中得分高达87.5%,超过了人类水平的85%门槛。
    • 这一成绩标志着o3在适应新任务方面取得了重大突破,接近人类水平的性能。
  3. 多模态和多任务学习

    • o3模型能够处理包括软件工程、编程、数学和科学问题等多种任务。
    • 在GPQA Diamond测试中,o3取得了87.7%的成绩,而O1仅为78%。

应用场景方面

  1. 软件工程

    • o3在SWE-Bench Verified基准测试中的表现突出,准确率达到71.7%,显示出在软件工程领域的强大能力。
  2. 编程竞赛

    • 在Codeforces Elo评分中,o3的得分显著高于O1,显示出在编程竞赛中的卓越表现。
  3. 数学和科学问题解答

    • o3在AIME 2024数学竞赛中的高准确率,以及在GPQA Diamond测试中的表现,证明了其在解决复杂数学和科学问题上的能力。
  4. 通用人工智能(AGI)测试

    • o3在ARC-AGI测试中的表现,显示了其在通用人工智能领域的潜力。

性能改进方面

  1. 推理时间的可调节性

    • o3模型支持低、中、高三种推理时间模式,用户可以根据任务复杂度灵活调整模型的思考时间。
  2. 成本效益

    • o3-mini模型在性能与成本之间找到了平衡,提供了更低成本的高效服务。
    • 在Codeforces的评估中,o3-mini的性能超过了o1-mini,且成本更低。
  3. 即时响应能力

    • o3-mini模型在处理简单任务时能够实现接近即时的响应。
  4. 支持多种API功能

    • O3-mini模型支持函数调用、结构化输出和开发者指令等API功能。

OpenAI最新发布o3 - AGI真的不远了

本文链接:https://yeziwang.cc/openai_1573.html

o3 minio3openai o3 miniopenai o3chatgpt o3 minichatgpt o3o3 mini官网openai o3官网

相关文章