强者处处是惊喜!铺垫了这么久的GPT-4o高级语音模式有点“Her”的味道了

chatgpt中文网2024-08-01 00:32:29108

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app

在“斯嘉丽·约翰逊语音侵权争议风波”趋于平静后,OpenAI终于宣布于本周开始推出“鸽了”许久的GPT-4o高级语音模式,让用户得以首次访问GPT-4o的超现实音频响应。

强者处处是惊喜!铺垫了这么久的GPT-4o高级语音模式有点“Her”的味道了推荐使用ChatGPT中文版,国内可直接访问:https://ai.p6p6.cn 

但由于目前该功能还处在Alpha测试阶段,仅向部分ChatGPT Plus用户提供,因此大部分用户并不能在第一时间上手尝试,好在社交媒体上已有部分“幸运儿”及时录制体验视频,从评论区几乎一边倒的“amazing”来看,GPT-4o高级语音模式的体验好像还真挺不赖。
来源:OpenAI

发音自然、可随时打断,高级语音模式距正式上线已不远

从部分内测资格用户的体验和评价上来看,对GPT-4o高级语音模式的好评主要集中在“发音自然”“情绪变化明细”以及“可以随时打断”上。
GPT-4o说中文(来源:X)
从中文发音来看,GPT-4o的口音已十分接近中文母语者,同时GPT-4o说话具有明显的抑扬顿挫,情绪饱满,几乎没有AI感,不足之处可能在于将“一口气”读成了“一口ki”,但总体瑕不掩瑜,讲故事水平即使现在就应用在有声绘本中也毫不突兀,比如下面这位网友让GPT-4o朗诵的静夜思:
李白《静夜思》(来源:X)
当然,如果非要再挑缺点的话,GPT-4o说中文时还是能感觉到一股“中文说得很好的老外”之感,这一点来自日本和阿拉伯语区的网友也深有同感。
GPT-4o说日语(来源:X)

GPT-4o说阿拉伯语(来源:X)

日本网友吐槽(来源:X)

并且从阿拉伯语演示来看,GPT-4o情绪可谓收放自如,能够在用户的语音提示之下一秒完成从愤怒到兴奋的转变,同时,在打断GPT-4o的话后,GPT-4o能够立马停止语音输出并及时调整响应,整个过程几乎没有延迟,就好像真的在和真人沟通一样。
可以无缝处理中断(来源:X)
对话基本没有延迟(来源:X)
也因此,好用的GPT-4o高级语音模式立马被开发出了一系列用法,比如AI外教:
GPT-4o教法语(来源:X)
在自然的对话中,GPT-4o就能挑出用户法语发音中的问题,并以正常沟通对话的方式给出正确的读音的发音调整建议,整个过程就像是真实的口语教学过程,有了GPT-4o谁还需要和外教一对一练口语啊!
也有用户让GPT-4o当起了足球赛事解说员,GPT-4o既知晓赛事解说的要点,同时还会调动情绪。

GPT-4o赛事解说(来源:X)

此外,结合同样还在内测的实时视频理解功能,GPT-4o还能实现对现实世界的“理解”,并根据“看到”的事物与用户交谈,是合格的AI助手没错了。
来源:X
从内测用户们的演示视频来看,GPT-4o的确没有让用户白等,大部分用户都认为GPT-4o表现出乎意料,也有少部分用户表达了一般的看法,并且认为过于接近“人声”的语音AI可能会助长语音诈骗。
图源:X
当然,还有不少用户表达的是“为什么只有我没有内测资格”?不过这些用户也并不用等待太久,虽然GPT-4o的高级语音模式目前仅向部分ChatGPT Plus付费用户推出,但OpenAI乐观估计,完整功能有望在今年秋天向所有ChatGPT Plus订阅者提供,届时,只要每月花费20美元ChatGPT Plus订阅费用,就能体验到无延迟的AI语音聊天机器人了。

备受争议的sky语音遭雪藏

从OpenAI公开的信息来看,GPT-4o高级语音模式将仅限于ChatGPT与付费配音演员合作制作的4种预设语音- Juniper,Breeze,Cove和Ember。
此前备受争议的“Sky”则完美隐身。
在今年5月份OpenAI展示GPT-4o语音功能之时,就有“耳尖”的网友听出展示的5种预设语音中的“Sky”听起来与2013年电影《Her》中斯嘉丽·约翰逊(Scarlett Johansson)扮演的的AI角色太接近。再加上在ChatGPT-4o版本和语音助手发布当天,OpenAI首席执行官萨姆·奥特曼(SamAltman)发了一条强调“Her”的推文,引起了部分网友对于OpenAI是否与约翰逊达成合作的疑问。
图源:X
显然,约翰逊的答案是否定的。事件发酵不久后,约翰逊方发表声明称,对OpenAI使用酷似她声音的Sky语音表示震惊、愤怒和难以置信。她指出,尽管拒绝了OpenAI提供声音的邀约,但ChatGPT最新发布的大模型GPT-4o使用了高度类似自己声音的Sky语音。
在收到斯嘉丽的律师函后,OpenAI宣布暂停使用Sky语音,并表示Sky的声音并非模仿约翰逊,而是属于另一位使用自己自然语音的专业女演员。虽然OpenAI以“保护公司语音人才的隐私很重要”为由尚未透露Sky背后的配音演员,但OpenAI强调,AI声音不应该刻意模仿名人独特的声音。
而从现在的测试版本来看,“Sky”基本可以宣告被雪藏的事实,这一语音后续也大概率不会再上线了。
斯嘉丽·约翰逊(图源:网络)
当然,Sky的争议并非原本应该在6月下旬发布的高级语音模式alpha版本推迟到现在的唯一原因,根据OpenAI的说法,alpha版本计划上线之初就面临着安全问题。
OpenAI对于“安全问题”的考量集中在提高模型检测和拒绝不适当内容的能力上,以便应付可能的安全政策审查,因此这种技术公布的暂停被认为是必要的。OpenAI发言人Taya Christianson称,在alpha版本推出前,语音模式已经经过100多名外部红色团队成员的测试,这些测试人员来自29个国家,总共包含45种语言。
同时,有了Sky和Suno、Udio AI的前车之鉴,OpenAI这次显然比以往更关注版权问题。
此前,Suno和Udio AI两家音乐AI生成公司被美国三大唱片公司环球音乐集团、索尼音乐娱乐公司、华纳唱片公司联合起诉,理由为非法使用版权音乐训练AI模型。唱片公司指控Suno复制了662首、Udio复制了1670首版权歌曲,并要求法院判处每首歌15万美元的法定赔偿金。
案件触及到了AI技术在艺术创作领域应用的法律边界,让如何界定原创性和版权归属成为了AI发展过程中一个亟待解决的难题。
也因此,OpenAI在这一问题上选择从源头解决。目前,OpenAI已经采用了过滤器来识别和阻止生成音乐或其他受版权保护的音频的请求,同时还将类似的安全机制应用于GPT-4o,防止其违反法律并生成有害内容。OpenAI还将在8月初分享一份详细报告,介绍公司最近为改进语音模式所做的工作。

强者处处是惊喜!铺垫了这么久的GPT-4o高级语音模式有点“Her”的味道了

本文链接:https://yeziwang.cc/openai_298.html

chatgpt 在财务领域的应用360内部使用的chatgpt效果如何chatgpt4.0怎么才能使用chatgpt广泛应用引发的担忧chatgpt4.0 快捷指令chatgpt如何不间断输出mac的chatgpt为什么是白的chatgpt移动端使用chatgpt账号申请详细流程注册chatgpt为什么显示拒绝访问

相关文章