先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi
作者|杨晓鹤
推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top
• 支持分辨率高达 1080p、时长最长 20 秒的视频,格式可选宽屏、竖屏或方形。这点没什么,国产AI都可以。相比国产最长的2分钟,Sora这项指标还落后了。
•但重要的是,Sora配备了分镜工具,故事板工具(Storyboard)能让用户能够精确指定每一帧的输入,用户可以通过在时间线上拖动和间隔卡片、添加字幕和上传源媒体来控制节奏,同时确保适当的间距以避免突然切换。
• 提供文本生成视频(text-to-video)、图像生成视频(text+image-to-video)、视频编辑生成(text+video-to-video)。这点也没什么,国产AI也都能实现。
• 觉得简单生成不太好玩,OpenAI加入了Remix和Blend两项新功能。这意味着用户可以选择自带素材进行扩展、混音和混合,或者从文本生成全新的内容。
换句话说,你可以使用Recut修剪和延长(重新剪辑)、重新混合以创建新变化、混合视频之间的过渡。直播演示中,猛犸象和机器人混合在了一起,走在了沙漠上。
• Sora可以添加很多帧,连接两个不相关的开头和结尾。据说测试中的许多艺术家都非常喜欢这个视频循环功能。
实际上这次短短的直播中,并没有过多呈现Sora生成的案例视频有多精彩,而是重点介绍了Sora产品的功能特点。
此前在日本艺术家创作的80年代年轻人舞蹈和OpenAI创意专家ChadNelson 在伦敦展示的 Sora V2 视频,体现了多主体,多视角、多变焦等环境中,Sora的画面逼真清晰、人物一致性、视频延展等能力。
大家可以在今天晚点时间开放后体验Sora,是否是对目前所有的视频生成模型的一次碾压。
当然,在Sora闭关迭代的这一年中,国内AI视频也经历了很多变化。
1.Runway:
Runway发布了第三代视频生成模型Gen-3,该模型在保真度、一致性和运动方面有了重大改进。
Gen-3 Alpha模型使用视频和图像联合训练,特色包括90秒内快速生成10秒视频、并行生成多个视频、模型驱动新的文本到视频(T2V)、图像到视频(I2V)和文本到图像(T2I)等功能。
2.可灵(快手):
快手可灵在6月份发布,也是类Sora的DiT架构,能够生成长达2分钟的视频,且帧率达到30fps。图生视频、文生视频、视频续写都可,每天有6次免费机会。
可灵AI以其生成时长、效率,以及视频质量位于AI视频生成产品的第一梯队,2分钟的生成时长是现在所有产品里的第一,尤其在真实风格场景上的表现更好。快手可灵应该是目前商业化做的最好的,此前公布过营收过千万。
最开始的即梦大概也是采用SDXL模型,当时鲸哥体验下觉得是runway1.0的水平。但是在10月份豆包发布视频生成-PixelDance模型后,其实已经进化到,一度让我们不再期待Sora了。
搭载这款模型的即梦AI 2.0,在对提示词的捕捉和理解方面展现出高一致性,精确控制多个主体,可对连续动作,连续镜头做高度控制。超写实效果媲美电影拍摄效果,还支持首帧到尾帧的变化动画,这功能Sora今天也发布了。
4.腾讯混元:
最近被热议的则是腾讯混元正式上线文生视频,并全面开源,参数量达到130亿,是当前最大的视频开源模型。
混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先,在人物、人造场所等场景下表现尤为出色。能够实现在画面主角保持不变的情况下自动切镜头。
综合来说,AI视频在影像创作、电影生成、短视频内容开发等领域都具有重大意义。
AI视频创作者“AI Talk”主理人汗青说道:“如果Sora能很快提供类似效果的民用服务,那确实是降维打击,其实对创作者来说,这个视频中多人物同屏,以及画面的表现力运镜才是最宝贵的,完全是另一个层面的东西。什么清晰度、镜头长度其实不太重要,这是真正做创作的人和技术狂热者看待事物的不同角度。”
Sora目前应该超出了很多人的预期,甚至是狂喜。
2023年好莱坞曾爆发上万名从业人员走上街头,他们抗议AI带来的挑战和工作机会减少。但现在随着Sora面世,尤其官方说道并不希望一键生成,而是希望促进创意发展。现实影响真的会是这样吗?
从实际来看,Sora这么延迟发布,很可能并不是技术上有很大难题,而是安全隐私保护等问题迟迟没有解决。
现在终于有了解决方案,OpenAI在官网中提到:
所有 Sora 生成的视频都带有元数据,元数据会将视频标识为来自 Sora,以提供透明度,并可用于验证来源。虽然不完善,但我们默认添加了可见水印等保护措施,并构建了一个内部搜索工具,该工具使用第2代的技术属性来帮助验证内容是否来自 Sora。
而对于用户很关心的价格,披露使用 openai plus 账户,您每月可获得 50 次生成。使用专业账户,每月可以获得 500 次快速生成(高分辨率下更少),并在较慢的生成模式下获得无限制生成。
Sam Altman在直播结束时说道:回到GPT-1的类比,现在还处于早期阶段,它会变得更好。Sora会引起GPT 4一样的浪潮吗?