“真Sora真来了。”
“真Sora真来了。”
12月10日凌晨,OpenAI在发布会第三天的直播中,终于将其AI视频生成产品Sora公测,首先在美国等地区正式推出。
过去一年中,我们见证了众多AI视频生成工具的亮相,其中多数以年初发布的Sora概念视频为标杆。现在,随着Sora的正式进入公测阶段,它是否能够与市场上其他同类产品拉开距离?它对动画产业是否能带来革命性的影响?
根据用户的试用反馈,Sora展现出的独特特点,为AI视频生成领域带来了新的思路。尽管AI视频生成技术日新月异,Sora与市场上的其他产品一样,还需要经历进一步的发展和完善,才能被广泛地应用于实际的工业流程中。
和其他AI视频生成工具类似,Sora提供了三种主要的视频生成模式,用于不同的应用场景:
文本转视频模式(Text-to-Video)通过输入文本描述,利用自然语言处理技术生成与描述相符的视频内容。其生成过程将文本语义映射为动态画面,适用于短视频创作及情节化内容制作。
文本+图像转视频模式(Text+Image-to-Video)在文本描述的基础上,添加辅助图像输入,以增强生成视频的语义一致性和视觉精确度。这一模式为需要嵌入特定元素的应用场景(如产品展示、品牌广告)提供了便利。
文本+视频转视频模式(Text+Video-to-Video)支持上传已有视频,并结合文本输入对其进行改编和扩展。该模式适用于现有素材的二次加工,包括新增情节、优化画面或实现差异化内容创作。
在输出选项上,Sora支持横屏(16:9)、竖屏(9:16)和正方形(1:1)三种视频比例,以及从480P到1080P的分辨率。此外,Sora包含多个后期处理功能:
Remix:基于文本描述修改生成视频的细节内容。如果用户在生成视频后对局部内容有不满,可以通过Remix进行微调。
Re-Cut:截取生成视频的片段并向前或向后延展。如果用户对生成的视频只满意一部分,则可以截取这一部分,并对这一部分前后进行重新生成。
Loop:生成首尾衔接流畅的循环视频。
Blend:融合两段视频内容,实现动态叠加效果,实现两段视频内容的生动融合。
值得一提的是,Sora内置的Storyboard(故事板)功能可通过串联多个输入提示(文本、图像或视频)生成多分镜视频。这个功能允许用户设计多段落内容,兼顾前后内容的同时,满足复杂叙事需求,尤其适合需要精确控制内容逻辑与视觉效果的创作任务。对于创作长内容的用户来说,故事板的开放使AI全流程创作更易用。对于有长视频创作需求的用户来说,Storyboard是Sora中最具亮点的功能。
因为有ChatGPT长期以来的积累,所以Sora基于自然语言处理和生成模型的深度结合,实现了较高的语义理解能力和视觉生成效果。此外,其内嵌的智能提示词优化算法,可对简单的输入文本进行扩展,甚至能够理解“落霞与孤鹜齐飞 ,秋水共长天一色”这样的中文诗句并进行AI视频的创作。这也降低了一部分苦于文字表达人士的创作门槛。
在内容安全方面,Sora生成的视频自带C2PA元数据,支持内容溯源与版权管理。此外,Plus会员版本输出的视频会携带水印,而Pro会员则可以去除水印。
当然,即便是Sora,在视频生成方面也存在与其他产品相似的局限性,包括物理一致性与细节表现上仍有改进空间:首先就是Sora对物理规律(如运动方向与速度)的理解不足;其次是生成视频的人物手部动作细节不够自然,某些静态内容的动态表现仍显生硬;另外,视频中包含文字的生成效果大概率会存在乱码问题。
在定价方面,Sora与ChatGPT同属于OpenAI的统一体系。Plus会员为每月20美元,每月最多可生成50支视频,720p分辨率的视频时长最多为5秒,480p分辨率的视频时长可达10秒;Pro会员为每月200美元,每月可生成500支视频,支持1080p分辨率和20秒的视频输出,并提供生成加速及无水印下载功能。与国内的AI视频产品相比,Sora的价格并不便宜。
目前看来,Sora在广告设计、品牌推广和教育等领域具有较高的应用潜力。对于一些对效率有要求,且对视频质量不太在意的场景下,Sora更能帮助到AI工具使用者更快地实现视频创作需求。
不过,在影视行业的许多人看来,Sora还是“迟到了”。
这一年,大家见识到了快手的可灵在全球的大规模商用,甚至已经到了李少红、贾樟柯、薛晓路等知名导演站台发片的程度。此外还有字节的即梦,智谱的清影,MiniMax的海螺,腾讯的混元等AI视频生成产品,它们都已经推出了面向消费者的版本,被不少创作者尝试和使用。
在这些创作者眼里,对于AI视频工具的定义,早已被面世数月的产品所影响。而早早公布,却姗姗来迟的Sora,更会被创作者用来和这些产品比较。
AI动画创作者老张向靠谱二次元表示,虽然他第一时间购买了Pro会员并试用了Sora,但是Sora目前在他手里并不如可灵和即梦好用。根据他常用的描述词进行视频生成来看,Sora的最终成像效果经常与他的预期不符,而可灵和即梦因为使用时间比较久,对每次结果已经有了一定的预期,所以更能生成他想要的内容。
但老张依然肯定了Sora的新功能。例如,Sora的Remix功能允许用户导入一段视频,并更换其中的部分元素进行重新生成,能够快速模仿热门视频梗,加速创作,“但Sora目前对热梗视频的理解比较差,这个Remix还得多多探索”。
此外,老张认为故事板功能也会让故事更方便创作,适合将一些零散的创作灵感,以及因为AI创作频繁的调整而忽略的关键镜头重点输出。
然而,Sora在对口型、抠图单修等功能上,仍需通过文字描述来完成,这对习惯使用国内AI视频工具的老张等创作者来说,显得有些“退化”。此外,国内AI视频创作者普遍对价格比较敏感,Sora的定价会让这些创作者望而却步。
所以,Sora的迟到,导致了创作者基本不会更换已经用顺手的AI创作工具,即使Sora有一些很有亮点的独特功能,但对创作者来说,这些功能并不足以让他们“叛变”。
从目前来看,用包括Sora在内的AI视频工具进行中国当下的主流动画番剧制作,依然不是一个可行的选择。这主要是因为动画番剧属于长篇叙事,涉及大量复杂的镜头调度、细腻的角色情感表达以及高要求的美术风格,现阶段的AI技术仍然难以胜任,能效比比较低。
然而,对于独立动画、同人动画、动画短片以及竖屏流量动画来说,Sora和国内相关的视频AI生成工具却展现出了巨大的发展潜力,尤其是在创作效率和成本控制方面。对于个人或是小型团队而言,利用这些工具,将脚本落实到视频,视频AI工具无疑是高性价比的选择。
例如在场景生成、空镜等方面,Sora的表现也超越了许多同类产品,生成的画面更加真实、生动,这为动画制作中需要高质量背景素材的创作者提供了全新选择。另外,Sora的Blend功能,也能让一些原本生硬的画面衔接,多一种可以参考的过渡方案。
当然,受到生产时长以及连贯性的限制,AI动画这种依赖连贯叙事的产品仍然需要大量后期调整和拼接工作才能面世。对于已经拥有丰富AI视频创作经验的团队或个人,Sora就是一个新的优质工具选项,可以在创作上获得更大的自由度。
2024年是AI视频技术快速发展的关键一年。在未来几年,AI内容大概率会成为动画产业的重要组成部分。乐观估计,不久之后市面会涌现出一批能够熟练掌握AI视频全流程创作的动画导演。当然,即使AI全流程动画没有大规模涌现,动画作品中也会逐渐融入越来越多由AI辅助生成的内容,例如通过AI创作的背景,一部分动态特效,以及片头片尾等短片动画。这些技术不仅可以帮助动画公司降低成本,还能推动动画美术新风格的发展。
然而,对于传统动画行业来说,全面掌握一门尚未成熟的技术绝非易事。许多老牌动画公司对AIGC的态度仍然停留在“观望”或者“积极拥抱”这种口头上的热情。只有AI动画技术在市场上真正体现出商业价值以后,这些公司才会全面投入行动。因此,对于渴望进入动画行业但缺乏突破口的公司或团队,AI动画开放了一个绝佳的机会窗口。
如今,OpenAI推出的Sora正式入局,为AI视频创作提供了更多可能性。在未来,谁能率先利用AI视频工具完成高质量、低成本的动画创作,谁就有可能在新一轮行业变革中占据先机。一场创意与技术的竞赛,已经在动画这条赛道悄然开赛。
本文作者:乌贼Nyan,由 < 靠谱编辑部 > 编辑