OpenAI的Deep Research的产品实现细节

chatgpt中文网2025-02-07 11:35:31158

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi

1、Deep Research

目前Deep Research类产品相对于普通的AI搜索的差异是:可以多轮的进行搜索,而不只是限于最开始的一轮。目前符合该条件的产品有:Perplexity Pro Search、Gemini Deep Research、Kimi探索版、OpenAI Deep Research。

OpenAI的Deep Research的产品实现细节推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top 

前三者在之前靠LLM应用层团队自己就可以做,只是其成本很高。

OpenAI在2月3号发布了他们的Deep Research产品,该产品基于o3模型端到端强化学习微调,并能够使用搜索、Python解释器等工具。是第一个能让我们一窥最强推理模型+RFT能做到什么程度的产品。

凑齐了o3+RFT+常用tools,目前最豪华的LLM产品莫过于此。当然其成本也是超高的,即使是ChatGPT Pro会员,每月也只有100次使用额度。OpenAI官方表示他们正在开发更低成本的方案。

1.1、OpenAI的Deep Research

我本来还打算正经的比较下以上4款产品的能力差异,但很快便失去了耐心。OpenAI的Deep Research的输出结果上明显强于前三者。现在我已经不再去对比它与之前的产品差距有多大了,测试更多是看OpenAI的Deep Research的能力边界到底在哪里。

当然OpenAI的Deep Research仍然并非完美,但我从用户的角度上感觉它明显强于单轮搜索的产品,可以形成独立的用户心智生态位。

本文并不会向读者具象化的说明它的结果到底有多好。如果你对目前手头的搜索和调研工具不满意的话,那我非常推荐这个产品,考虑到Pro会员同时包括o1 Pro和Deep Research,这个价格真的不贵。

从产品设计的角度来说,OpenAI Deep Research会有一个二次确认的环节,向用户提问,要求补充一些信息,但大部分时候都仅此一次反问。我认为这个设计是很不错的,大部分用户确实需要一次反问来帮助深入思考,但也没有耐心回答太多轮的提问。(还有个意想不到的作用是防止用户误开,无谓地消耗次数)

从使用的角度来说,仍然要避免给一个横向过于宽的任务,可能会导致横向的各种内容不能完全覆盖。

1.2、OpenAI的Deep Research的产品实现细节

本文列举一些我观察到的产品实现细节表现。为方便起见,OpenAI Deep Research简称为ODR。

ODR在进行探索时,会在之前o1模型给思考过程的位置显示产品的探索过程,从其展示结果来看是一个串行的过程。并不是其他Deep Research产品那样只会有少数几轮搜索,但每轮会同时检索较多query的样子。看起来像是每次只检索一个目标、分析一个网页等,并且会在其中包含思考(只显示摘要)。

ODR在最后输出答案时是一次性快速输出的,不是流式进行的。

ODR的搜索query并不限于当前prompt语言,可以自动使用英语和prompt语言搜索。

ODR在探索过程中的展示的信息是经过摘要的,按OpenAI账户语言显示,可能并非内部实际推理语言,这点和o1模型一样。

ODR看起来可以进行很多轮的探索,不是其他Deep Research那样只进行少数几轮搜索。

从ODR的探索过程来看,似乎它也包含有对于网页的渲染和翻页等操作,并非简单对HTML的解析。

2、Agent构建的视角

最近一段时间我越来越多的在文章中使用Agent这个词,因为在我看来确实已经出现了一些不能归类为传统workflow构建的方案,这次的OpenAI Deep Research也是其中之一。

官方的发布会中提到,它不止使用了o3模型,还是经过端到端强化学习微调的,也就是跟o系列模型的训练方式类似。OpenAI也计划发布模型的强化学习微调(RFT)功能,不过目前已经delay。

一直以来,模型层公司(和模型能力为主体的公司)一直不擅长做上层逻辑太多的产品,它们擅长做的是通用Chatbot、Character.AI类、非文本模态生成(如视频生成类)等。在文本模态方面的工作一直都很简单,简单到了可笑的程度。

但从OpenAI Deep Research开始,OpenAI在应用层的成果不再那么可笑了,OpenAI Deep Research无法不靠模型层的配合来实现,而且还无法靠简单的SFT微调来实现。OpenAI找到了适合模型层的Agent应用构建方式,而且做出了成品。

从这个角度上说,我认为所有应用层开发者都应该去试用一下这个产品,并观察一下它的探索过程。

之前海外模型层公司大吹特吹Agent应用,但这方面的应用一直没有起色。目前来看,通用Agent还得是模型层公司来做,而且推理模型和RL是必须项。

没有领域壁垒的应用层公司的处境变得更加尴尬了,只能祈祷自己做的领域市场规模太小,模型厂看不上。所有市场规模较大的较为通用的场景都必然有模型厂进入,OpenAI Deep Research就是一个例子。

从这个角度上来说,RFT的难产可能未必是技术问题,也可能是OpenAI希望延长自己的技术优势,吃下更多场景。

本文的通用是一个相对概念,不是一个绝对的概念。未来在通用Agent构建时,“应用层的开发者堆workflow的开发成本”是否能够比“RFT自动构建应用方案的成本”要低,效果上限有没有后者高,似乎已经是一个值得担心的问题。

OpenAI的Deep Research的产品实现细节

本文链接:https://yeziwang.cc/openai_1834.html

油猴chatgpt怎么运行chatgpt有使用额度吗chatgpt内容总结保姆级chatgpt注册教程chatgpt怎样提取视频内容GPTsGPT4.0与3.5有哪些区别测试GPT-3.5GPT-3.5模型GPT的3.5和GPT4.0区别

相关文章