OpenAI 的最新 AI 模型 GPT-4o:这款多模态AI竟然还能听会看!

chatgpt中文网2024-07-06 14:45:5967

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app

今天我们来聊聊一个让人既兴奋又有点儿小紧张的新玩意儿——OpenAI 的最新 AI 模型 GPT-4o。相信不少朋友已经被它那令人眼前一亮的演示震撼到了。那么,这个 GPT-4o 究竟是什么来头?它到底能做些什么呢?咱们今天就好好唠唠!

OpenAI 的最新 AI 模型 GPT-4o:这款多模态AI竟然还能听会看!推荐使用ChatGPT中文版,国内可直接访问:https://ai.p6p6.cn 

GPT-4o是啥?

GPT-4o 是 OpenAI 的最新旗舰 AI 模型。OpenAI 大家肯定不陌生,它可是 ChatGPT 和 DALL·E 的幕后推手,也是这波 AI 热潮的核心力量。GPT-4o 是个多模态模型,听起来高大上,其实就是说它能处理文本、音频和图像,而且速度更快、成本更低。最重要的是,免费版的 ChatGPT 用户这次也能尝鲜用上这个新模型了,之前可是只有 GPT-3 和 GPT-3.5 Turbo 哦!

GPT-4o有啥特别的?

GPT-4o 中的“o”代表“omni”,就是全能的意思。它不仅能理解文本,还能听懂音频、看懂图像,而且还能用这些形式回复你。以前 ChatGPT 的语音模式是怎么工作的呢?你问它问题,它先用语音转文本的模型把你的话变成文字,再用 GPT-3.5 或 GPT-4 处理,最后再把回答转成语音。这一套下来,平均响应时间至少得 2.8 秒,用 GPT-4 就更慢了,得 5.4 秒。

GPT-4o 自己就能搞定这些事儿,处理速度大大提升,平均只要 0.32 秒。你想想,这速度简直是坐火箭啊!而且,它不仅速度快,性能也不打折扣,OpenAI 说它在英语文本和代码基准上和 GPT-4 一样牛逼,在非英语语言、视觉和音频方面甚至更胜一筹。特别是对于泰米尔语、印地语、阿拉伯语和越南语这些语言,新的标记器效率更高,翻译也更准。

GPT-4o怎么运作?

GPT-4o 的工作原理和其他 GPT 模型差不多,但它的神经网络是同时对文本、图像和音频进行训练的。所以,它能处理多模态的输入和输出。虽然 OpenAI 对细节守口如瓶,但咱们可以从其他类似的模型推测一二。

GPT-4o 还是基于生成式预训练 Transformer,这意味着它的开发方式和其他 GPT 模型相似。生成式预训练就是给 AI 模型一些基本规则和大量数据,让它自己去学习。除了文本数据外,GPT-4o 还训练了海量的图像和音频,这让它不仅知道“牛”这个词,还知道牛长啥样、怎么叫。

GPT-4o到底有多牛?

GPT-4o 的多模态功能有时很惊艳,有时也会掉链子。视觉和音频功能在 ChatGPT 的整体体验中变得更加重要,尤其是在移动设备上。虽然这也带来了新的问题,比如产生幻觉和错误,但一旦成功,效果非常棒。我在 iOS 应用程序上让 ChatGPT 把一匹著名的赛马 Red Rum 变成 Pokémon 角色,整个过程无需任何文本输入,真是让人眼前一亮。

GPT-4o 还是会犯一些不该犯的错误,这有点儿让人抓狂。比如过去 ChatGPT 总是搞不定数独难题,现在有了 GPT-4o 后,虽然它愿意尝试,但结果还是不尽如人意。尽管如此,它在理解我的潦草笔迹时表现得还不错。

GPT-4o 还能带着情感对话,并且能理解你的情绪,不过这个功能还在逐步推出中,我还没机会测试。

GPT-4o的价格

GPT-4o 可是有个大亮点,那就是——免费!没错,所有 ChatGPT 用户都能免费使用,不过有个速率限制。而每月 20 美元的 ChatGPT Plus 用户则享有五倍速率,还能优先体验新功能。开发者也可以通过 API 使用 GPT-4o,每百万个输入代币收费 5 美元,输出代币收费 15 美元,比 GPT-4-Turbo 便宜一半。

如何体验 GPT4o?

要想体验 GPT-4o 的强大功能,方法其实很简单。文本和视觉功能已经向许多 ChatGPT Plus 用户开放,并且很快就会向所有 ChatGPT 免费版和企业版用户推出。如果你还没有获得访问权限,耐心等待几天,再试试就行了。

如果你是开发者,现在就可以通过 API 使用 GPT-4o,准备好大展拳脚吧!另外,GPT-4o 将成为即将推出的 ChatGPT 桌面应用程序的重要组成部分,这个应用程序不仅可以使用键盘快捷键,还能利用视觉功能回答屏幕上发生的事情。

即便你现在还没体验到全部新功能,别灰心,精彩马上就来!GPT-4o 将为我们带来前所未有的体验,不仅能用眼看,能用耳听,还能用心去感受。是不是很期待呢?不妨多点耐心,静待这位多才多艺的小助手为你带来更多惊喜!

OpenAI 的最新 AI 模型 GPT-4o:这款多模态AI竟然还能听会看!

本文链接:https://yeziwang.cc/openai_281.html

chatgpt项目部署到云服务器chatgpt涉及哪些行业360内部使用的chatgpt效果如何chatgpt新功能或与人一致chatgpt账号可以用什么登录chatgpt会解数学题么怎么用chatgpt把word内容简化如何让chatgpt生成作品集怎么判断使用的chatgpt版本怎么使用chatgpt写sci

相关文章