先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app
9月13日,OpenAI推出了其最新的模型OpenAI o1预览版。该模型最大的特点就是:通过复杂的任务推理解决困难的问题。从今天开始,ChatGPT Plus和Team用户将能够访问ChatGPT中的o1模型。以下面的题目为例,对于这种复杂数学,o1秒出答案。在编程方面,OpenAI o1可以根据提示轻松编写视频游戏。如果大家正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用o1来注释细胞测序数据。物理学家可以使用o1生成量子光学所需的复杂数学公式。所有领域的开发人员可以使用o1来构建和执行多步骤工作流程。不过需要注意,目前o1-preview的每周速率限制为30条消息,o1-mini的每周速率限制为50条。在刚才我们还提到了一个版本,OpenAI o1-mini。o1-mini版比o1-preview便宜80%。所以ChatGPT Plus、Team、Enterprise和Edu用户可以使用o1-mini作为o1-preview的平替。不过在基准测试中:o1-mini在需要非STEM事实知识的任务上表现较差。OpenAI o1 VS OpenAI o1-mini
OpenAI主要从4个方面对OpenAI o1和OpenAI o1-mini进行了比较。数学:在高中AIME数学竞赛中,o1-mini 为70.0%,o1为74.4%,并且表现优于o1-preview。编码:在Codeforces竞赛网站上,o1-mini达到了1650 Elo,o1为1673,o1-mini还高于o1-preview(1258)。STEM:在一些需要推理的学术基准上,例如GPQA(科学)和MATH-500,o1-mini的表现优于GPT-4o。但是在MMLU等任务上o1-mini的表现不如GPT-4o,并且由于缺乏广泛的世界知识,o1-mini在GPQA上落后于o1-preview。人类偏好评估:OpenAI让人类评分者在各个领域中具有挑战性的开放式提示上对o1-mini与GPT-4o进行比较。与o1-preview类似,o1-mini在推理密集型领域中优于GPT-4o,但在以语言为中心的领域中不如GPT-4o。GPT-4o、o1-mini和o1-preview
官方就单词推理问题,比较了GPT-4o、o1-mini和o1-preview的回答。而o1-mini生成答案的速度较慢,但o1-mini和o1-preview都能正确回答。上图的测试也反应出了OpenAI o1的优势:
OpenAI o1在回答之前会思考,并且可以在响应用户之前产生很长的内部思维链。
作为早期模型,它尚不具备ChatGPT的一些功能:例如浏览网页以获取信息,以及上传文件和图像。
对于许多常见情况,GPT-4o在短期内将优于o1模型。
END
本文链接:https://yeziwang.cc/openai_311.html
OpenAI-o1OpenAI o1OpenAI01chatgpt o1o1-minio1-previewOpenAI o1 miniOpenAI o1 previewOpenAI o1官网OpenAI o1官网入口OpenAI o1地址OpenAI o1中文版openai o1模型简介