先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi
1、Deep Research
目前Deep Research类产品相对于普通的AI搜索的差异是:可以多轮的进行搜索,而不只是限于最开始的一轮。目前符合该条件的产品有:Perplexity Pro Search、Gemini Deep Research、Kimi探索版、OpenAI Deep Research。
推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top
前三者在之前靠LLM应用层团队自己就可以做,只是其成本很高。
OpenAI在2月3号发布了他们的Deep Research产品,该产品基于o3模型端到端强化学习微调,并能够使用搜索、Python解释器等工具。是第一个能让我们一窥最强推理模型+RFT能做到什么程度的产品。
凑齐了o3+RFT+常用tools,目前最豪华的LLM产品莫过于此。当然其成本也是超高的,即使是ChatGPT Pro会员,每月也只有100次使用额度。OpenAI官方表示他们正在开发更低成本的方案。
1.1、OpenAI的Deep Research
我本来还打算正经的比较下以上4款产品的能力差异,但很快便失去了耐心。OpenAI的Deep Research的输出结果上明显强于前三者。现在我已经不再去对比它与之前的产品差距有多大了,测试更多是看OpenAI的Deep Research的能力边界到底在哪里。
当然OpenAI的Deep Research仍然并非完美,但我从用户的角度上感觉它明显强于单轮搜索的产品,可以形成独立的用户心智生态位。
本文并不会向读者具象化的说明它的结果到底有多好。如果你对目前手头的搜索和调研工具不满意的话,那我非常推荐这个产品,考虑到Pro会员同时包括o1 Pro和Deep Research,这个价格真的不贵。
从产品设计的角度来说,OpenAI Deep Research会有一个二次确认的环节,向用户提问,要求补充一些信息,但大部分时候都仅此一次反问。我认为这个设计是很不错的,大部分用户确实需要一次反问来帮助深入思考,但也没有耐心回答太多轮的提问。(还有个意想不到的作用是防止用户误开,无谓地消耗次数)
从使用的角度来说,仍然要避免给一个横向过于宽的任务,可能会导致横向的各种内容不能完全覆盖。
1.2、OpenAI的Deep Research的产品实现细节
本文列举一些我观察到的产品实现细节表现。为方便起见,OpenAI Deep Research简称为ODR。
ODR在进行探索时,会在之前o1模型给思考过程的位置显示产品的探索过程,从其展示结果来看是一个串行的过程。并不是其他Deep Research产品那样只会有少数几轮搜索,但每轮会同时检索较多query的样子。看起来像是每次只检索一个目标、分析一个网页等,并且会在其中包含思考(只显示摘要)。
ODR在最后输出答案时是一次性快速输出的,不是流式进行的。
ODR的搜索query并不限于当前prompt语言,可以自动使用英语和prompt语言搜索。
ODR在探索过程中的展示的信息是经过摘要的,按OpenAI账户语言显示,可能并非内部实际推理语言,这点和o1模型一样。
ODR看起来可以进行很多轮的探索,不是其他Deep Research那样只进行少数几轮搜索。
从ODR的探索过程来看,似乎它也包含有对于网页的渲染和翻页等操作,并非简单对HTML的解析。
2、Agent构建的视角
最近一段时间我越来越多的在文章中使用Agent这个词,因为在我看来确实已经出现了一些不能归类为传统workflow构建的方案,这次的OpenAI Deep Research也是其中之一。
官方的发布会中提到,它不止使用了o3模型,还是经过端到端强化学习微调的,也就是跟o系列模型的训练方式类似。OpenAI也计划发布模型的强化学习微调(RFT)功能,不过目前已经delay。
一直以来,模型层公司(和模型能力为主体的公司)一直不擅长做上层逻辑太多的产品,它们擅长做的是通用Chatbot、Character.AI类、非文本模态生成(如视频生成类)等。在文本模态方面的工作一直都很简单,简单到了可笑的程度。
但从OpenAI Deep Research开始,OpenAI在应用层的成果不再那么可笑了,OpenAI Deep Research无法不靠模型层的配合来实现,而且还无法靠简单的SFT微调来实现。OpenAI找到了适合模型层的Agent应用构建方式,而且做出了成品。
从这个角度上说,我认为所有应用层开发者都应该去试用一下这个产品,并观察一下它的探索过程。
之前海外模型层公司大吹特吹Agent应用,但这方面的应用一直没有起色。目前来看,通用Agent还得是模型层公司来做,而且推理模型和RL是必须项。
没有领域壁垒的应用层公司的处境变得更加尴尬了,只能祈祷自己做的领域市场规模太小,模型厂看不上。所有市场规模较大的较为通用的场景都必然有模型厂进入,OpenAI Deep Research就是一个例子。
从这个角度上来说,RFT的难产可能未必是技术问题,也可能是OpenAI希望延长自己的技术优势,吃下更多场景。
本文的通用是一个相对概念,不是一个绝对的概念。未来在通用Agent构建时,“应用层的开发者堆workflow的开发成本”是否能够比“RFT自动构建应用方案的成本”要低,效果上限有没有后者高,似乎已经是一个值得担心的问题。
本文链接:https://yeziwang.cc/openai_1834.html
油猴chatgpt怎么运行chatgpt有使用额度吗chatgpt内容总结保姆级chatgpt注册教程chatgpt怎样提取视频内容GPTsGPT4.0与3.5有哪些区别测试GPT-3.5GPT-3.5模型GPT的3.5和GPT4.0区别