先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app
春节假期即将结束,全球知名人工智能公司OpenAI在美国推出了一款令人瞩目的AI技术产品。这款新产品的技术水平大幅提升,引起众多行业从业人员的浓厚兴趣。
推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top
具体来说,2月16日OpenAI公布了名为Sora的重量级视频AI模型。
专家分析认为,Sora的面世将彻底改变传统影视制作流程,它可大幅降低产品成本,极大提升工作效率。同时,这也给相关行业,尤其是动画制作、后期特效处理等岗位带来不确定性。
Sora介绍
根据OpenAI的介绍,Sora可生成长达60秒的视频。视频可以呈现高清场景和复杂的镜头运作效果,支持多个虚拟角色的设置。
为了展示Sora的能力,OpenAI在社交媒体上分享了48个样例视频,时间长度从9秒至60秒不等。这些视频呈现出流畅自然的画面质量和叙事效果,明显超越此前在AI视频产品领域备受期待的Runway和Pika等公司的产品。这一突破性进展立即引起广泛关注。
这意味着AI在影视内容创作领域已有能力支撑长时间的叙事方式,为这个行业带来新的可能性。
可生成连贯逼真视频
根据OpenAI介绍,用户可通过使用自然语言提示来驱动Sora生成长达1分钟视频。Sora模型对语言输入具有很强的理解能力,能够准确理解提示内容,并生成虚拟人物。它还可以在一个视频中创建多个不同镜头,保持镜头之间角色和视觉风格的一致性。
Sora与其他AI视频相比,主要有以下几方面优势:
视频长度可达60秒
OpenAI在官网发布了48个Sora视频样例,其中一个长达1分钟的视频受到最广泛关注。在这个视频中,场景设定在东京街头,一个穿着红色裙子和黑色夹克的女子在人行道上行走。视频以第一人称视角展现,背景中街道两旁的霓虹灯牌和拥挤的行人衬托出东京都会的夜景风貌。镜头流畅而连贯,细节还原度高,给人一种深入其中地的真实体验感。
半年前,Runway曾将视频长度从原来的4秒提升至18秒,且提升至4K超高清质量,一度被视为该领域的“天花板”水平。然而,Sora模型将视频长度成功延伸至60秒,并呈现出生动逼真的细节表现,将该领域技术水平推向了一个前所未有的新高度。
单视频/多角度镜头切换。
"女子行走东京街头"视频样片中,后半段镜头由大范围全景切换至近距离特写,这一转换极其流畅自然。另一样片展现一只狼面向月亮长嚎,镜头同样从全景划分自如地切换至中详景面部表情镜头。
Sora模型生成的视频能在同一个画面内采用多种不同视角和视距进行分镜,这些镜头转换连贯流畅,几乎感知不到任何断裂感,这也正是许多观众讶异不已的重要原因之一。颠覆了传统AI视频能力有限的印象,在视觉效果和叙事体验上实现了质的飞跃。
超高清和超逼真
同时加长视频长度的同时,Sora模型生成的视频质量依旧保持在极高水平。视频中的人物面部表情、动物毛发细节等都极为逼真、栩栩如生。它在人物脸部皮肤的肌理特点描绘和动物皮毛特征等细节处理上表现惊人,水平领先其他AI视频创作工具。
Sora将视觉质量与叙事时间长度同时提升,全面突破了传统AI视频功能的限制,再次引证其在这一领域的领先地位。
OpenAI表示,Sora模型在某些方面还存在短板,如难以准确模拟复杂场景中的物理行为,且理解因果关系能力有限。
部分业内人士也对Sora表现结果提出质疑。伊利诺伊大学厄巴纳-香槟分校教授Ted Underwood在采访中指出,OpenAI在展示视频样品时可能进行了选择,仅展示表现最好的作品。
目前,Sora模型还未对公众开放。OpenAI的CEO山姆·奥特曼在社交平台透露,Sora现处于测试阶段,仅面向有限人群开放。OpenAI正与相关专家合作,对Sora可能产生的错误信息、有害言论等问题进行研究,以确保系统安全可靠,符合人类伦理标准。OpenAI的任务是通过不断优化,将Sora模型发展成一个可以为人类服务又不产生负面影响的工具。
本文链接:https://yeziwang.cc/openai_213.html
chatgpt辅助保险代理人的应用展望chatgpt科技进步英语阅读chatgpt推荐大学生读的10本书chatgpt开发者模式怎么关chatgpt如何培养孩子chatgpt能做学术ppt吗chatgpt短信验证教程链接chatgpt对客服的影响注册chatgpt需要什么条件如何使用chatgpt设计一个网站