“是时候开始为AI热身了!”
“是时候开始为AI热身了!”
作者 / 「靠谱二次元」行研组
近年来,在经历了ChatGPT、Midjourney等国际AIGC产品的飞速发展,以及百度文心、阿里通义、Kimi等国内AIGC产品的激烈追赶后,2024年,几乎每位互联网用户都或多或少接触了AIGC技术产生的内容。从智能手机中的大模型助手,到日常所见的AI生成图片,再到职场中的AIGC工具辅助优化工作,AIGC内容已遍布人们的生活中。
尽管AIGC技术的应用仍存在一些争议,但其带来的极大便利已让人们难以拒绝。
2024年5月,我们重新梳理了现阶段泛娱乐产业——包括动漫、游戏、影视产业相关的AIGC技术发展现状,并对常用工具做出了盘点,综合行业内的认知与展望,出品了这份《2024年AIGC发展趋势报告》,并通过本文进行详细解读,以其为业界后续在AIGC投入及应用方面提供新参考。
注:本文AIGC的讨论范围多集中于文娱产业,不进行过多技术相关的深入探讨;另因产业迭代迅速,本报告具有一定的时效性。
AIGC,即人工智能生成内容,是近年来在人工智能领域兴起的一项重要技术。它通过使用机器学习和深度学习等技术,使得计算机能够自动生成各种形式的数字内容,如文本、图像、音频和视频等。
AIGC的发展可以追溯到上世纪80年代,但真正取得突破性进展是在过去的十年里。随着深度学习技术的发展和大数据的积累,AIGC技术在自然语言处理、计算机视觉和语音识别等领域取得了进步。
随着互联网和移动互联网的普及,用户对多样化、个性化内容的需求日益增长,这为AIGC技术的应用提供了强大的驱动力。AIGC技术在内容创作、个性化推荐、智能客服等领域的应用,能够有效提高生产效率、降低成本,并提升用户体验。
在国内,百度、腾讯、阿里、科大讯飞、字节跳动等科技巨头在AIGC技术的研究和应用方面取得了许多重要成果,推动了国内AIGC技术的发展。
AIGC技术在2023-2024年飞速发展,对多个行业产生了颠覆性的影响。其中AIGC已经在广告、游戏、自媒体等内容创作领域实现了广泛应用,教育、电商、软件开发、金融等领域也尝试扩大AIGC的应用范围。
从商业视角来看,AIGC技术可以提高生产效率,降低成本。例如,在内容创作领域,AIGC技术可以帮助创作者更快地生成高质量的内容;AIGC技术可以提供个性化的服务,提高用户体验;AIGC技术可以帮助企业进行创新,帮助领导者开拓新的商业模式。
AIGC技术的前景非常广阔。随着技术的不断进步,AIGC技术有望在更多的领域得到应用,并进一步提高生产效率和用户体验。同时,AIGC技术的发展也面临一些挑战,如数据隐私、算法偏见等问题,需要进一步的研究和解决。总体而言,AIGC技术的发展将对社会产生革命性影响,并成为未来科技发展的重要方向之一。
目前,大部分智能手机已经内置了先进的AI大模型。这些模型结合本地计算能力和云端资源,极大地提升了手机助手的功能。例如,文心一言、Kiwi等传统对话型AIGC产品已广受市场认可,这些产品的普及加速了AIGC技术在消费者市场的应用。同时,社交媒体平台如微博、快手、哔哩哔哩等也开始采用评论机器人等技术,通过AIGC的拟人化特性,增强用户体验并提升互动的趣味性。
在商业领域,AIGC技术已被广泛应用于办公流程优化和AI素材库的建立,有效提升了工作效率和专业性。例如,AIGC产品不仅帮助企业优化客服、美术和宣传发行等工作流程,还显著降低了人力成本。这些进展证明了AIGC技术在帮助企业实现降本增效方面的巨大潜力。
在短剧行业,部分内容生产者已开始尝试利用AIGC工具拓展海外市场。这包括使用AI换脸技术,将演员的面孔更换为目标市场观众熟悉的人种,以及利用AI配音和字幕转换为当地语言。然而,这些工具目前主要用于快速占领市场,往往不会优先考虑质量,因此这些技术将很快经历迭代更新。
在影视宣传领域,AIGC工具也开始被应用,主要用于生成部分美术物料,从而支持宣传设计师的创意工作。
至于内容制作本身,AIGC技术目前还未在真人影视制作流程中广泛应用。预计随着如Sora等AIGC产品的成熟和商用推广,未来将在这一领域看到更多的实际成果。
AIGC技术在独立游戏领域已广泛应用。自2023年起,部分大型游戏公司也开始逐步推进工业化的AIGC美术流程。尽管如此,这些公司在实际应用中仍保持了相当的克制。除了美术外,AIGC技术在声音和配音领域也已稳定使用,同时在市场推广和用户获取等方面,游戏行业同样展示了AIGC广泛应用的可能性。
虽然AIGC在游戏行业的发展速度非常快,但它也是目前游戏公司收到消费者投诉和争议最多的话题之一。
在漫画行业中,AI技术用于上色已非常成熟。许多流水线式的网文改编漫画项目已经开始采用AI上色技术,这项技术可以有效替代传统的手工上色过程,大幅提高生产效率。AI不仅能够快速匹配漫画的风格和色调,还能根据不同的情节和氛围自动调整颜色,以增强视觉效果和情感表达。
AI上色技术的使用还降低了制作成本,使漫画创作者能够将更多时间和精力投入到创作原创内容和质量需求较高的作品上。随着技术的进一步发展,预计AI将在漫画创作的其他环节,如分镜绘制、角色设计等前期工作中发挥更大的作用,进一步推动行业的创新和发展。
在动画行业中,AIGC逐渐成为创新工具。部分动画制作公司已经开始利用AI技术来生成动画的部分场景,或是基于原画生成道具模型。这不仅优化了前期流程,还显著降低了制作团队间的沟通成本。例如,通过AI自动生成的场景可以帮助快速传达视觉效果的风格需求,从而加速决策过程并提升效率。
到了2024年,动画领域已见证了「全AI流程」制作的动画作品的问世。这类作品虽然在表现形式上更接近于动态漫画,但它们的出现标志着AI技术在动画制作中的潜力和前景。尽管这些早期作品在视觉呈现和剧本上还有极大的提升空间,但它们已经展示了AI在动画创作中的初步应用,是比较实验性的结果。
展望未来,我们期待如Sora这样的技术产品的迭代,他们有可能为AI动画引入更丰富的镜头语言和表达手法。这将使AI不仅仅是动画制作的辅助工具,而是能够完全参与到创作的各个环节中,从而开启AI动画的新篇章。随着这些技术的成熟和普及,我们可以预见到一个更加多样化和创新的动画垂类产业的兴起。
在网文行业,AIGC的应用尽管面临一些技术和实践的挑战,但已经开始在辅助创作方面显示出其独特的价值。现阶段,完全由AIGC生成的网文还未能广泛实现,原因在于当前大型AI模型在长篇连续文本生成时会受到记忆持续性和深度理解方面的局限,这些问题限制了AI在理解复杂剧情和维持文本一致性方面的能力。
目前,AIGC技术已经在协助网络文学作者方面发挥了重要作用。AI可以帮助作者设计复杂的角色性格和背景故事,提供创意的剧情发展思路,以及生成与文本内容匹配的插图。这些工具不仅可以提升创作效率,还能激发作者的创新灵感,帮助他们突破创作瓶颈。
尽管AIGC在网文创作全自动化方面还有进步空间,它的辅助功能已经成为推动网络文学创新和发展的重要力量。未来,随着技术的进一步发展,我们可以期待AIGC在网文行业发挥更大的作用。
总的来看,受惠于OpenAI的可开发性和GPT4的易用程度,大量基于GPT4的AIGC工具诞生,国内在文心一言等大模型的API开放后也迎来了中文化AIGC产品潮。全球互联网迎来了移动互联网时代后的又一个产品爆发期,硬件厂商、云服务厂商、AI厂商也在爆发期中获得了新的机会,配合民用产品的百花齐放,得到了社会和资本的关注和垂青。
随着头部AI厂商不断推出可商业化使用的产品,大量开源技术也随之公布于众,学术界、商界就开源和闭源的AI发展发表出了不同的看法。就目前来看,开源和闭源AI产品都在为AIGC的普及做出积极的贡献,并未出现垄断的态势。
但与此同时,关于AIGC产品的伦理和版权风险在不断扩大,利用AI作恶的成本因为产品滥用而降低,这也是各家厂商需要迫切解决的风险点。
下面我们将从文字、图像、音频、视频、办公五个方向切入,例举现阶段AIGC常用的工具,并选择一款进行详细介绍。
工具名:ChatGPT
开发商:OpenAI
应用场景:目前大部分网民的AIGC入门产品,现阶段最实用的文字类AIGC工具。用户只要简单的了解,就可以通过对话完成知识检索、文本概括、创意获取等流程。
发展现状:GPT4已相对成熟,对中文兼容性比较好,可开发性高。
工具名:Midjourney
开发商:Midjourney
应用场景:场景创作、海报创作、人设创作
发展现状:开源图片AIGC工具Stable Diffusion在开发性上更强,但Midjourney的易用性更高,对于二次优化需求不强的美术环节更实用。
工具名:Suno
开发商:Suno
应用场景:为低成本剧集、广播剧、独立游戏等制作配乐,包括纯音乐和AI人声歌曲。
发展现状:能够满足对音乐品质要求不高的听众需求,但目前中文人声清晰度还不够,加工再创造的难度更高。
工具名:Dreamina
开发商:字节跳动
应用场景:基于图片或文字描述,生成3秒以上的视频。可用于部分图片的动态化,以及补足部分拍摄镜头的缺陷。
发展现状:目前国内可使用的文生视频/图生视频中生成效果比较好的产品,但和Sora仍存在差距,生成时长较短,视频稳定性不足,很难直接应用。
工具名:WPS AI
开发商:金山软件
应用场景:协助使用者完成文字、排版上的优化。
发展现状:综合功能完备,但仍与专业做文档调整、PPT优化的部分细分工具存在差距。
随着AI技术在文字、声音、图像和视频等多个领域的发展,其相关产品的普及程度持续提升。用户对这些大型AI模型的运用越来越熟练,将AIGC应用到文娱领域已经不再是一个新奇的概念。尽管在文娱产业全流程中引入AIGC还不现实,但越来越多的工具正在优化至可用。AI的应用使得企业在低端需求上降低了对专业人员的依赖,同时也降低了行业的入门门槛。
这种趋势预示着文娱内容生产的工业化过程将会迎来一系列创新的AIGC产品。这些产品不仅能够降低成本、提升效率,而且标志着行业对未来技术的积极拥抱。随着技术的进步,我们可以预见到AIGC将在创作、编辑、分发乃至营销等多个环节中发挥重要作用,极大地推动文娱产业的转型和升级。
总的来说,文娱行业,尤其是比较新的ACG相关领域,其工业化正处于一个由点到面的转型期,AIGC技术的融入无疑将为这一行业带来前所未有的创新机会和发展潜力。
随着AIGC技术的快速发展,开源与闭源产品之间的相互作用日益显著。由于训练一个大型AI模型需要巨大的成本投入,许多公司选择将其大模型闭源,以便专注于提升自身产品的性能和特色。然而,尽管这种趋势明显,如Meta、Google等公司仍然坚持推动开源技术的发展,这大大促进了AIGC技术的普及和创新,为中小规模的团队提供了接触和使用AIGC工具的机会。
在未来,随着AIGC技术门槛的逐渐降低,越来越多的个人开发者和初创团队将利用开源技术开发出创新且实用的AIGC应用。这些产品往往会在遵守开源协议的前提下维持开放状态。同时,闭源产品也从开源社区获得灵感,不断开发出商业性更强的功能。这些商业功能也有可能被开源社区借鉴,从而丰富了开源工具的功能性和易用性。
这种互补的关系创建了一个良性循环,不仅推动了技术的快速发展,也帮助商用AIGC产品逐步成熟。在这个过程中,开源和闭源产品的互动不断提升彼此的价值,共同促进了整个AIGC领域的创新和扩展。
在2022至2023年,虽然像ChatGPT和Midjourney这样的AIGC工具已能以自然语言进行交互,但大多数其他AIGC工具的使用便利性仍待提升。从2023年下半年开始,AIGC产品通过应用程序(APP)和硬件集成等方式取得了显著进步,使得绝大多数常用AIGC工具在使用上变得更加友好。
此外,市场上出现了大量“一键包”和“云机房”产品,极大地简化了用户的使用门槛。这些产品允许用户无需复杂的环境搭建,也不用受限于本地计算能力,即可轻松地开始使用相关工具。这种变化不仅提高了AIGC技术的可达性,也极大地扩展了其应用范围。
展望未来,随着AIGC技术栈的持续成熟和稳定化,我们可以预见到基于当前技术栈的AIGC产品将进一步拓展到更多领域。这些产品不仅会覆盖更广泛的应用场景,还将提供更加便捷的操作体验,使得各行各业的操作者都能轻松掌握并利用这些强大的工具。这种趋势不仅推动了AIGC技术的普及,也为各行各业带来了前所未有的创新机会。
随着2023年AI技术的热潮,许多IT和美术相关的培训机构开始察觉到机遇。到了2024年,为了吸引新学员,这些培训机构纷纷采取策略,邀请国内外著名的AIGC领域KOL担任客座讲师,并寻求大公司的背书以及职业认证,以增加其课程的吸引力和权威性。
然而,初期的培训机构并未能达到预期的培训效果,加之AIGC工具的快速迭代更新,这些因素导致不少潜在学员持观望态度。
在这种背景下,AIGC培训市场正在迎来竞争激烈的发展阶段。传统培训机构、KOL们都意识到,将AIGC培训作为一种盈利手段具有巨大的潜力。因此,这个领域正逐渐变成一个竞争红海,众多参与者都在努力占据一席之地,希望通过提供高质量的教育内容和服务来吸引并培养更多专业人才。这种趋势不仅显示了市场对AIGC技能的急切需求,也预示着培训领域将快速发展和变革。
在企业探索AIGC的过程中,许多通过AIGC生成的成品难以达到应用标准。然而,用户与AIGC的持续磨合逐步帮助双方找到了彼此的舒适区,优化了工具的应用方式和成效。
目前,虽然许多从业者已开始在日常工作中利用AIGC工具,但这些技术往往没有被广泛共享或加入到公司的核心业务流程中。从2024年开始,随着更多办公协同产品融合AI大模型和AI工作流程,这种局面开始改变。AIGC的引入不再是将员工与AI对立起来,而是成为提高工作效率和创造力的有力工具。
同时,随着公众对AIGC作品接受度的提高,企业和内容生产者越来越倾向于主动利用AIGC工具来提升产能和创新能力。这种趋势表明如何“体面”地运用AIGC工具,在保持产品品质和道德标准的前提下有效利用这些技术,已成为未来企业选用AIGC的重点。
自从AIGC产品面世以来,许多产品开始采用会员付费和按次付费等商业化模式进行尝试,尽管这些策略在短期内尚未彻底解决产品的盈利问题。然而,随着AIGC技术的不断进步和普及,各大AI厂商和互联网公司陆续推出了能够广泛应用的大模型,激烈的市场竞争已不可避免。
在这种背景下,用户对AIGC工具的价格敏感度提高,特别是那些对工具性能要求不太高的用户,他们更倾向于基于价格来选择产品。因此,随着市场上同类型工具的增多,价格竞争已成为AIGC商用工具争夺用户的重要战场。
面对即将到来的价格战,AIGC工具提供商需要找到合适的策略来平衡成本和收益,同时,通过不断升级和优化产品功能来形成竞争壁垒。如何在保持价格竞争力的同时提供独特的价值和优异的性能,将是AIGC工具厂商在未来市场上制胜的关键。这不仅需要技术创新,也需要对市场动态和用户需求有深入的理解和快速的响应。
随着开源大模型和开源技术的增多,越来越多的厂商已经开始组建自己的AIGC团队。虽然开源模型提供了一个良好的起点,但这些通用模型往往需要进行深度定制才能满足企业内部更为细致的需求。因此,在2024年,我们或将看到更多互联网和内容团队不仅在训练和优化现有模型上下功夫,而且也会努力开发更适合自己特定需求的AI大模型。
这些团队将采用更加策略性的方式,通过选择和组合现有的AIGC产品,开发出更加精细化的工具。这种方法不仅提高了工具的适用性,还增强了企业在其专业领域内的竞争力。例如,专注于生产内容的公司可能会开发一个特别擅长生成特定类型媒体内容的AI模型,而电商平台则可能开发一个优化产品描述和客户交互的模型。
随着AI技术的不断进步和边际成本的逐渐降低,这些定制化的大模型和工具变得更加易于实现,更多企业能够参与到这一领域中来。长远来看,这种趋势不仅会促使各个领域内的AIGC应用更加专业化和多样化,也会推动整个行业的创新和发展。
尽管AIGC相关的培训课程和视频教程已经相对普及,但市场上仍然缺乏能够深度并有效地将AIGC技术应用到实际内容创作中的专业人才。这种状况部分原因在于技术的快速迭代,使得即使是已经接受过培训的AIGC专家也需要不断学习,更新其知识储备以跟上技术的发展,否则很容易变得过时。这种快速的技术更迭,导致了AIGC应用在某些领域被视为“玩具”,未能被充分利用于更加专业的环境。
随着2024年更高质量、操作成本更低的AIGC产品陆续推出,市场对于能够熟练运用这些高端工具的人才需求将急剧上升。这些人才不仅需要掌握技术的应用,更要能够创造性地利用这些工具来优化内容创作、提升生产效率,乃至推动新产品的开发。在这样的背景下,具备高级AIGC技能的专家将成为各大企业争抢的宝贵资源。
因此,培养具备这些先进技能的人才不仅是教育机构的重要任务,也是企业内部培训的关键部分。预计企业和教育机构将会加大在AIGC领域的投资,通过提供更加深入和实用的培训,以满足日益增长的专业人才需求。这不仅会帮助缓解目前的人才缺口,也将推动整个AIGC领域向更成熟、更广泛的应用前进。
随着AI技术市场的竞争加剧,AIGC产品和相关AI算力的价格已经出现了明显的下降。这一趋势为企业和个人提供了更加经济的选择,使得初步接触和试用这些技术变得更为可行。然而,尽管单个产品的使用价格下降,对某些闭源产品的依赖以及对AI技术日益增长的需求可能导致企业和个人在综合上面临更高的成本。
这种“单品降价,整体涨价”的趋势表明,虽然单一工具变得更加便宜,但随着企业将AI集成到越来越多的业务流程中,对这些工具的总体需求和依赖性增加,进而可能增加整体的技术支出。此外,闭源产品可能因内容授权或独家技术而收取更高费用,增加了企业对特定功能的投入成本。
尽管面临这样的成本压力,许多企业还是会选择在更多领域投入使用AIGC产品,以期通过技术的助力来节省时间和人力成本。这种成本效益分析的结果,或许会推动企业在决策时更加倾向于利用AIGC工具。随着AIGC技术的深入应用,企业的运营效率和创新能力可能会显著提升,从而加速其业务发展,提升市场竞争力。
因此,未来AIGC产品的成本和收益将成为企业策略规划中的关键因素。通过精明的投资和有效的资源配置,企业可以在保持成本效率的同时,最大化地利用AIGC带来的优势。这不仅涉及对当前成本的管理,还包括对未来潜在收益的预测和策略布局。
尽管当前AIGC产品已形成一些相对固定的模式,但在实际应用和用户体验方面,不同产品之间的表现仍有显著差异。AIGC领域内的热门方向,如长文本分析、长视频处理、智能体交互、以及人声音乐创作等,都吸引了大量企业的关注和投资。然而,AIGC领域的技术和市场方向每隔几个月就经历一次快速迭代,技术和模型之间的差异也在不断扩大。
对于AIGC企业来说,准确识别并投资于最适合自身长期发展的技术赛道变得尤为关键。选择正确的方向不仅可以最大化资源的效用,还可以确保企业在激烈的市场竞争中保持领先。
对于那些利用AIGC产品来提升产能的用户而言,频繁更换工具所带来的成本是一个重要考量。在这个变化迅速的行业中,选择那些迭代次数少、升级成本低的AIGC工具成为他们的关键策略。这种选择不仅可以减少因技术升级导致的潜在中断,也能确保在技术快速发展的环境中,企业能够持续稳定地提升效率和产出。
因此,无论是AIGC企业还是用户,都需要对行业趋势保持高度的警觉和适应能力,以便在不断变化的AIGC领域中做出明智的决策,并最大化技术投资的回报。