AI抢声优饭碗成真,“花泽香菜们”会失业么?

【GameLook专稿,转载请注明出处】

GameLook报道/AI的崛起已经成为了不争的事实,从最广为人知的Siri再到围棋、电竞等偏专业的领域,AI凭借着远超普通人类的学习效率,高度数字化的存在等,在各行各业都大显身手,似乎科幻小说里AI取代人类的想法不再是天方夜谭,而是触手可及的现实。不过让人宽慰的是,创意和情感似乎是AI不可逾越的鸿沟。

但真的是这样吗?

CryPko:AI在美术设计上的应用

前不久,GameLook就曾报道过由日本公司开发的自动作画,生成角色立绘的AI项目CryPko,利用生成对抗网络,成功实现了高精度的二次元角色立绘。近日来自澳大利亚和英国的两个团队推出的AI语音产品,已经被运用到了黑曜石娱乐、虚幻引擎等公司和引擎的项目之中。

Replica Studios(澳大利亚)利用AI语音配音的微电影《卡西尼日志(Cassini Logs)》,在去年11月赢得了虚幻引擎的短片电影竞赛,而Sonantic(英国)则推出了“世界上第一个会哭的AI”Faith,并拉到了黑曜石娱乐前来站台,为游戏制作中配音等环节提供了可用方案。


世界上第一个会哭的AI Faith
从演示视频中我们也可以听到,虽然在特定情况下,AI生成的声音依然存在着机械音的问题,但不论是在情绪还是在语调,语速上,相比起现有的文字转语音方案,都已经有了质的提升。这时候同样的问题也就来了。

下一个面临失业威胁的,难道是配音演员吗。

抑扬顿挫,都可以有

要解答这个问题,首先我们要了解一下整个AI文字转语音的工作原理。

以Sonantic为例,公司事先会邀请专业的配音演员来录制各种情绪,各种情节的台词,AI通过深度学习这些语音Demo背后的情绪、声调、语速等特点,将每一位配音演员的声音转化为可供使用的模板,整合进Sonantic的服务当中。

Sonatic作为一个线性处理工具,不论是上手门槛还是使用门槛,都相对较低,用户只需要简单地拖动图标,或者是使用快捷键就可以实现增减台词,渐入渐出等效果。不论使用者是游戏开发人员还是影视行业从业者,用户只需要将剧本导入Sonatic当中,并为每一个角色安排好所需要使用的声音,就可以开始进行语音语调,以及情绪上的调整和编辑了。

对于每一句台词的情绪,Sonatic里都预设了“绘声绘色”、“愤怒”、“恐惧”、“悲伤”、“开心”、“喊叫”,“中性”等预选项,每一个选项都有低中高三个级别,以满足不同场合不同情绪角色声音的需要,搭配上语速的调整,能够通过AI实现的效果也丰富了起来。

并且对于一些发音奇怪的词,或者是用户自创的词汇,比如说各种人名或者是专有词汇,Sonatic也支持用户将其加入自定义词典当中,并设置词汇的大致发音以及重音的所在的音节,从而满足各种语言用户的使用需要。

除了大体情绪和语速上的调整,Sonatic还为玩家提供了更加细节的调整选项,比如同一句台词,AI会给出符合设定范围内但又略显不同的数个选择可供用户挑选。并且对每一句话的语调,玩家都可以一个一个音节地调整,在语调的调整界面,只需要将对应音节向上或向下拉,就可以决定整句话中,AI语音在语调上的变化。

对于大量的文本,Sonatic也提供了批量的解决方案。用户经过调整,得到了自己满意的AI语音之后,就可以将每一句台词的配音无损导出,并应用到自己的电影和游戏当中。一旦自己的声音被使用,配音演员也将从中获得一定的收入。

Sonatic被运用到了黑曜石的《天外世界》当中

除了声优,还有偶像明星

在《现代汉语通论》这本书里就曾明确表示过,语音的四要素分别是音高、音强、音长、音色,这四点在各种语言中都基本通用。除了音色与人有紧密的关联外,其他三点,音高(语调)、音强(重音轻音)、音长(发音的长短),在Sonatic当中基本上都可以进行调整,结合程序预设的情绪,这也为程序可输出的声音提供了无数的可能性。

虽然现阶段两个项目的AI语音都依然存在着相对机械音的问题,但后续在不断地训练和深度学习,程序内情绪的预设和调整进一步细化后,对于声优行业必然会带来较大的冲击。

但是在这种理想化的预想下,受影响的难道只有声优这一群体吗?当然不是。

今年春节期间,Epic向所有开发者展示了基于虚幻引擎驱动的MetaHuman Creator(MHC),为影视、游戏乃至互联网行业送上了一份重磅新年大礼。作为去年在虚幻引擎的短片电影竞赛中获奖的Replica Studios,在MHC推出后,成功地将自己的AI语音产品与MHC结合了起来。

EPIC MetaHuman 

虽然官方DEMO视频中的声音并不完美,电子风格十分明显,但是这种将虚拟人物和AI语音相结合的做法,仔细一想却又异常合理。MHC次世代的人物建模,加上未来可能出现的高还原度的AI声音,最先受到影响的必然是偶像行业。

近两年来,虚拟偶像已经成为各大互联网厂商、娱乐公司积极落子的领域,今年春节,虚拟歌手洛天依甚至登上了春晚的舞台,从二次元进入到了主流文化的圈层当中,根据爱奇艺的《2019虚拟偶像观察报告》,全国有近4亿人正在关注或走在关注虚拟偶像的路上,虚拟偶像正在打开青年群体的大门。

机器音的翘楚:初音未来

可以预见,在理想情况下,MHC加上AI语音,在未来必将迅速推动虚拟偶像行业的发展,甚至可以威胁到真人偶像的存在。

各种拥有着完美面容,优美音色的“小哥哥小姐姐”,不会有恋爱绯闻,不会有身材走样,不会违法犯忌,有相貌有实力,不会因为手指被割破了在微博热搜上挂一天,更不会突然出国代孕两个小孩,在个人素质上他们是完美的。

在商业上,他们同样也比三次元偶像更加优秀,作为数字人类,不会出现疫情期间出不了门无法进行工作的情况,不会因为个人状态问题影响工作质量。流量明星的代表人物杨幂就虚拟偶像,曾经就在一档节目中表示:“如果未来的舞台都像这样,我们是不是就可以下岗了?”

技术更多只是工具,而不是工人

最后来回答,文章开始的那个问题:下一个面临失业威胁的,难道是配音演员吗?

答案是否定的。任何以创意和情感为核心价值的工作,至少在未来较长的一段时间内,都不可能被AI完全取代。

的确AI具有极强的学习和模仿的能力,但在配音这一领域上,就和之前的自动绘画的AI一样,目前仅能起到辅助的作用,比如在开放世界中,游戏里一些不重要的依靠简单脚本触发的NPC,完全就可以使用AI生成的语音,这将大大减少游戏开发在这一环节的工作量。

但是主要角色的对话、剧情等内容,配音演员依然是无可替代的存在。首先,声音传达出来的情感是细腻,且极为丰富的,一句台词,往往不单单只有或愤怒、或开心一种情绪。就比如魔兽世界里希尔瓦娜斯的那一句“你们部落都是废物”,这背后的情绪是很难量化,通过机械地调整语速语调来实现的。

对于情感的传达,电影等行业相比起游戏内语音,它们的要求往往更高,AI来取代专业配音演员的可能性就更小了。

获奖的电影短片卡西尼日记

其次,声优同样具有明星效应。这一点在海内外的影视行业已经出现了许多年了,特别是动画电影,除了专业的声优,往往会请来偶像、演员等,为电影宣传造势。而在游戏行业,随着近几年国内二次元游戏的井喷式增长,日本市场的声优偶像化的现象对国内也产生了较大的影响,花泽香菜、福山润等知名声优已经成为了一些国内二次元游戏的标配,国内北斗企鹅、729声工场等配音团体近些年来也正在朝着偶像化的道路行进。

最后,对于偶像行业而言,AI和MHC同样无法威胁到他们的地位。偶像最吸引人的重点从来都不是完美,甚至都不需要是实力派,而“完美无瑕”的人设,在国内娱乐市场里,早就被时代抛弃了。

打个最简单的比方,杨超越,比她好看的,虽然不多但一定有,比她实力强的更是一抓一大把,可就是她火了。比起完美的人设,对于偶像而言,更重要的是他们身上那些让他们更加可爱、可怜的作为人的特点,这些都是AI无法通过学习学到的东西。

虽然AI有着明显的弱点,但是不得不承认的是,凭借着深度学习和可能存在的自我演化的能力,都代表着它将成为未来人类构建世界的重要工具之一,即使是在创意领域,AI都可以为人类完成许多具有重复性的工作,在AI的帮助下,游戏的开发,影视剧的后期、特效等,在效率和成本上都将获得明显的增益。但从辩证唯物主义的角度来看,觉得AI将取代人类的想法,无疑是走上了另一个极端。

如若转载,请注明出处:http://www.gamelook.com.cn/2021/03/435463

关注微信