先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app
推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top
前言
北京时间2024年5月14日凌晨1点整,GPT-4o的发布会举行,该模型能够实时跨音频、视觉和文本进行推理。发布会当天,GPT-4o也正式对部分用户进行灰度测试发布。这标志着人工智能领域的一个新里程碑,为未来的多模态人机交互开辟了新的可能性。
同时, GPT-4o将在免费套餐中提供,并向 Plus 用户提供高达 5 倍的消息限制。Openai将在未来几周内在 ChatGPT Plus 中推出带有 GPT-4o 的新版本语音模式。
图 :发布会截图
什么是chatgpt4o?GPT-4o介绍
GPT-4o("o"代表"omni",意为"全方位的")是迈向更自然的人机交互的一大步——它能够接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。
GPT-4o主要特点:
GPT-4o 是OpenAI的新旗舰模型,能够实时跨音频、视觉和文本进行推理。GPT-4o将在ChatGPT和API中作为文本和视觉模型提供(ChatGPT将继续通过现有的Voice Mode功能支持语音)。 GPT-4 Turbo 与GPT-4o相比,GPT-4o在智能水平相同的情况下更快、更便宜,并且有更高的速率限制。 GPT-4o目前的上下文窗口为128k,并且知识库截止日期为2023年10月。 在API中使用GPT-4o:任何拥有OpenAI API账户的用户都可以使用这个模型,并且可以在Chat Completions API、Assistants API和Batch API中使用此模型。
发布会核心速览
·端到端训练的原生多模态模型,集成包含文本、图像、音频在内几乎全模态的输入输出,为用户提供更自然的交互体验。
GPT-4o中的o代表omnimodel,意为全能模型。在Google推出Gemini模型之后,端到端的架构也被OpenAI采用。此前用户使用GPT-4进行语音交互时,首先会有一个简单模型将音频转换为文本,然后GPT-4理解文本并输出文本,再由简单模型将该文本转换回音频,这意味着最智能的模型GPT-4在理解输入时丢失了很多信息,例如用户情感。所以与过往以文本为中介不同,OpenAI 跨文本、图像和音频端到端地训练了一个新模型,让所有输入和输出都由同一神经网络处理。
·超低延迟,响应速度直降一个数量级,与人类反应时间一致,让开发实时性要求高的应用场景成为可能。
由于端到端处理输入,GPT-4o最快可以在 232 毫秒(0.232秒)的时间内作出响应,平均响应时长 为320 毫秒,与人类相似。而此前通过语音模式与ChatGPT对话,GPT-3.5平均延迟为2.8秒,GPT-4为5.4秒。
·或为应对ChatGPT用户增长缓慢,GPT-4o免费向所有人开放。
1)体验GPT-4级别的智能;
2)联网;
3)分析数据并创建图表;
4)畅聊上传的照片;
5)帮助总结、撰写或分析上传的文件;
6)发现和使用GPTs和GPT Store;
7)用记忆构建更有用的体验。
·“性能上升+成本下降”趋势显著,GPT-4o的API调用价格减半,大模型竞争持续白热化。
基准测试中,GPT-4o在文本、推理和编码智能方面,达到了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新高。而性能增强的同时,GPT-4o的API相比GPT-4 Turbo,推理速度提升2倍,消息限制提高5倍,而且价格却降低50%。
·桌面版ChatGPT发布,将进一步嵌入用户日常生活和工作。
OpenAI推出了适用于macOS的新ChatGPT桌面应用程序。通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问,且还可以直接在应用程序中截取屏幕截图并与ChatGPT进行讨论。
如何查看自己是否有chatgpt4o的使用资格?
登录chatgpt官网,现在Plus用户可以直接使用GPT-4o,感受这一全能AI的强大功能。
本文链接:https://yeziwang.cc/openai_268.html
chatgpt用什么软件做的chatgpt把中文摘要翻译成英文chatgpt4.0最新最详细的安装教程mac的chatgpt为什么是白的chatgpt4中文版网页源码如何使用chatgpt设计一个网站正确向chatgpt发送指令怎么通过sms平台注册chatgpt怎样安装超级ai chatgpt对话使用chatgpt的注意事项