突发: OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。

chatgpt中文网2024-09-13 20:28:1117

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app

      OpenAI今日推出了其迄今为止最强大的AI模型o1,在物理、生物和化学三个领域已经展现出超越人类博士水准的能力。虽然价格昂贵,但o1的强大性能标志着人工智能研究的一次重大飞跃。这一模型不仅增强了ChatGPT的推理能力,还能够处理比之前的GPT-4o模型更复杂的问题。

突发:  OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。推荐使用ChatGPT中文版,国内可直接访问:https://ai.yeziwang.cc 

     今天,OpenAI正式宣布,o1模型将在ChatGPT和API用户中全面上线,这标志着一个更强大AI模型时代的开启。从今日起,ChatGPT Plus和Team用户可以选择在ChatGPT中使用o1-preview和o1-mini版本。这些版本可以通过模型选择器以手动方式访问,o1-preview的每周消息限制为30条,而o1-mini则为50条。

      OpenAI正积极努力提高这些限制,以便用户可以更广泛地使用这一技术。此外,Enterprise和Edu版的ChatGPT用户将在下周陆续获取这些功能,计划中甚至包括向所有ChatGPT免费用户开放o1-mini的访问权限,以扩大其潜在用户群。

突发:  OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。

      针对开发者,符合条件的API用户(API使用等级5)从今天起也能够在项目开发中运用o1模型,限制在每分钟20次请求(RPM)以内。这些测试将在经过更多的观察和调整后逐步放宽。然而,o1模型的使用成本显著高于GPT-4o,其中o1-preview的费用为每百万输入token 15美元,是GPT-4o输入成本的三倍;而每百万输出token为60美元,是前者的四倍。token是理解为模型处理的信息块,百万个token roughly 相当于75万个单词的处理规模。

突发:  OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。

      OpenAI的CEO Sam Altman已经在X平台(以前的Twitter)上展示了o1和GPT-4o在解决数学、编程和科学等具体问题上的对比试验。在编程问题(特别是Codeforces竞赛问题)中,o1已经超越了89%的其他成果,在美国数学奥林匹克预选赛(AIME)中,其表现堪比美国前500名的中学生,并且在物理、生物和化学问题的基准测试(GPQA)中,o1的准确性已超越了博士级的人类专家。

突发:  OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。

      数据显示,在2024年的美国中学数学邀请赛和Codeforces编程竞赛中,o1-preview相较于GPT-4o的解决问题能力提升了五到六倍,而o1的正式版本提升幅度更大,达到了八到九倍。在化学、物理和生物学专业知识的高难度基准测试GPQA-diamond中,o1-preview版和o1版均凌驾于GPT-4o之上,尤以人类博士水平为甚。OpenAI特别招聘了拥有博士学位的行业专家来解决GPQA-diamond的问题,最终的结果显示,o1在这一基准测试中的表现优于人类专家,成为首个在复杂科学领域中超越人类博士的AI模型。

     在其他机器学习基准测试中,o1也超越了现有的各种先进模型,尤其是在其视觉感知能力启用时。o1在MMMU(大规模多学科多模态理解与推理)基准测试中取得了78.2%的优异成绩,在57个MMLU子类别中的54个类别内,o1的表现都超越了GPT-4o。

      OpenAI还对人类评估员如何在多领域的开放式提示下选择o1-preview和GPT-4o的表现进行了全面评估。尤其是在数据分析、编程和数学等推理为主的类别中,o1-preview显然优势突出。然而,在一些自然语言处理任务上,例如文本编辑和个人创作,o1-preview尚未表现出足够的竞争力,因此并不适用于所有应用场景。    

      OpenAI指出,o1采用“思维链”这一类似于人类思维的模式处理复杂问题。通过强化学习,o1不仅优化了自己的思维链,还提升了识别和纠错错误的能力,即便在初始方法失效时能迅速调整策略。这一过程显著提升了模型的推理能力,应用潜力包括医疗研究中的细胞序列数据注释、物理学中的量子光学公式生成,以及多行业开发者工作的多步骤流程自动化等。      

     近期的传闻曾指出,OpenAI可能会在引入新模型后提高使用费用,甚至有消息称ChatGPT的订阅费用可能攀升至每月2000美元。然而,令人宽慰的是,尽管此次推出的o1模型价格更高,ChatGPT的费用并未因此上涨,这对很多用户来说不啻为一个好消息。尽管受限于推理成本,o1-preview和o1-mini的每周使用次数有限制,OpenAI却也指出,o1-mini在生成和调试复杂程序代码方面有着特别的精确性,使得开发人员能够以更经济的方式享受模型带来的便利。

OpenAI强调,作为一种较小的模型,o1-mini不仅在成本上更为实惠(便宜80%),而且对需要推理但不需要广泛世界知识的任务尤为适用。隐藏的思维链为监控模型行为提供了独特的机会,一旦该思维链被证明可被读取和解读,便可以帮助理解模型的推理过程,并通过其检测是否有误导性操作的迹象。

突发:  OpenAI发布最强AI大模型o1,在物理、生物、化学领域超越人类博士生,价格也更贵。

本文链接:https://yeziwang.cc/openai_312.html

OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介

相关文章