米哈游《未定事件簿》实装AI配音,音质如真人,把玩家惊到了!

【GameLook专稿,未经授权不得转载】

GameLook报道/近些年AI技术的不断发展,对各行各业都产生了不小的影响,其中影响最为深远的显然非文娱产业莫属。像是在虚拟偶像、配音、电子竞技等等领域,多多少少都能看到AI的身影。

在表现形式更加单一的配音领域,由于可以较好地模拟真人的声音,也可以完成一些基础性工作,AI逐渐展露出了在配音方面极高的商业价值,并成为了许多广告主的选择,甚至大有取代真人配音演员的趋势。

此前,GameLook就报道过米哈游旗下的《未定事件簿》因配音演员出事,而需要更换角色配音一事。在官方的说明中,角色莫弈的新配音正是由米哈游的“逆熵AI”生成。

而在昨日(6号)更新后,官方也正式为角色实装了新语音。从实际反馈来看,此次AI配音的效果着实惊艳到了许多玩家。

点击视听《未定事件簿》AI配音片段:

“纸片人”有救了,以假乱真的逆熵AI

如果你是第一次透过这款游戏接触逆熵AI,你可能会被米哈游的技术所折服。若是用一句话来概括的话,那新的AI配音可以说几乎达到了“以假乱真”的地步。

比如在语调方面,逆熵AI的表现就相当不错,不仅说话的节奏会随着文本的不同而收放有度,而且在演绎一些例如“闻到了什么味道?”、“这样就觉得难了?”等带有疑问性质的语句时,音调还会很自然地上扬,如同真人说话一般。

而在更深一层的情感层面,逆熵AI也十分可圈可点。莫弈的人设是一名著名的心理医生,行为举止从容优雅,性格方面成熟稳重,因此该角色的声音也更多主打的是温柔成熟的风格。逆熵AI此次合成的音色偏向沉稳的男声,与莫弈人设的契合度颇高。

细节上,若仔细听可以很容易听出,逆熵AI其实是有通过分析文本的语境,从而对声音做出相应改变。一个典型的例子是,逆熵AI在演绎“听话的孩子才能得到最终奖励”时,为了表现出此时莫弈正捉弄主角的情境,而采用了挑衅意味十足的气声,在最后甚至还加入了一声略带坏意的嗤笑。

当然,尽管在一些方面表现得确实不错,但若要用放大镜去细究整段声音表现,逆熵AI也并非是完美的。像是在诠释一些情感比较激烈的句子时,逆熵AI就缺少了足够强硬的声音表现。而在整体上,相比起真人,逆熵AI在情感细节上也少了一点温柔和甜蜜的感觉。

但就像一位玩家所说,如果“你告诉我这是AI,我反而会去找瑕疵,但如果你不告诉我这是AI,这一段我是听不出来AI的感觉的”。这至少可以说明,逆熵AI的表现已经足够应付大多数情况。而这也引得一些玩家惊叹“怪不得米哈游一上来就敢放纯语音卡”。

 一直以来,我们都普遍认为真人配音比AI更有沉浸感,但部分玩家在体验完莫弈的AI配音后,却出现了与之相反的观点。在这部分玩家看来,尽管逆熵AI的配音比起真人少了真实感,但却是莫弈第一次打破次元壁与自己对话,这反而极大增加了代入感。

巨头云集,为何AI成了罗马斗兽场?

实际上,这并不是米哈游第一次使用逆熵AI来为角色配音。此前,米哈游所推出的虚拟偶像鹿鸣,其声音就是通过逆熵AI所合成,音色听起来十分自然,但缺点是有时反应会显得少许迟缓。

当然,《未定事件簿》也不是圈内第一款使用AI配音的游戏。同样是在今年8月份,网易旗下的乙女游戏《时空中的绘旅人》也遇到了需要更换配音演员的问题,而游戏中的角色叶瑄原本由姜广涛配音。

8月22日,时空中的绘旅人发布声明,表示将与网易互娱AI Lab合作,提取叶瑄角色原有配音的声纹特征,录制新的语音。换句话说,这波操作其实就相当于给叶瑄进行AI换声。

而在更早之前的2018年,互联网巨头微软其实也早早就对AI配音下手了,旗下的虚拟歌姬小冰凛菜在日本出道时,宣称首次实现了用人类歌手一样的充沛“中气”演唱,将人工智能虚拟歌声质量提升到了新的一个高度。

但问题是,为什么像米哈游、网易、微软这些巨头都对AI配音如此看重?关于这一点,米哈游总裁大伟哥(刘伟)2019年在他的母校上海交大的一次演讲中就有过解释。

在这次演讲上,大伟哥就展示对逆熵技术的极大期望,据他介绍,逆熵AI的目标是通过深度学习记录配音演员的声音和情感,做到输入文字就能输出对应的配音。未来还可以将声音塑造成IP,永久保留,甚至出售声音的版权。

今年7月,鹿鸣在B站开启了首次直播,二在直播简介中,鹿鸣的声音一栏赫然填写着“逆熵AI生成”。但令玩家震惊的地方在于,逆熵AI生成的声音居然可以实时对弹幕做出回应,并且还能带上真人特有的感情色彩。

直播时鹿鸣的AI生成语音究竟达到了大伟哥预期目标的哪一步,无人知晓。但结合此前的演讲,若米哈游真实现了只靠文字输入就能达到媲美真人的语音输出,并且还能附带感情色彩,这无疑是令人兴奋的技术突破。

从商业角度来看,AI配音相比真人配音无疑有着巨大优势,不仅成本低,且效率高。以往,配音行业一直都采用人工配音,人的不确定性便会导致耗时费力、准确度不够等问题。而AI则可以有效地降低人力成本。

不仅如此,由于AI配音是对目标声音的未排序数据进行训练的,所以可以简单、快速的生成一段流畅标准的完整音频,避免了人工配音时可能会出现的发音错误等问题,大大的提高了配音的效率。

更重要的是,从作品适配性上去看,AI由于能不断变化音色,故而能极大拓展自身对于作品的适配度。毕竟AI的声音通常是对数据的重复学习组成,因此只要有足够多的采集样本,它就可以随意的变换音色,结合不同的场景配出不同的声音。

此前,英国一家创业公司Sonantic曾发布过一段名为《Faith_ First AI That Can Cry》的视频。视频中的AI在吞噬大量数据,以及有目的去训练区分机械声与人声之间细微差别的能力后,能够逼真地模拟人声和表达情感。

你可能会认为这个AI所展现的情感可能是提前设定好的,但实际上,这种情感是AI通过对文本的分析理解得来,与作品的适配度极高。也正因如此,一旦AI技术足够成熟,很可能会出现AI比真人更理解作品,从而在配音表现上更优的情况。

除了上述优势外,AI配音还有一点是真人配音所无法企及的,那就是它可以模仿或者重现一个声音。从小的方面看,这种能力能够很好地规避、修补真人配音演员“塌房”的问题,从而极大减少了后者对游戏角色的影响。

而从大的方面看,利用AI复现逝者的声音,对于一些丧亲之痛的人而言,无疑是一种疗愈。而对于许多先天语言障碍的聋哑人,AI技术也能让其拥有自己的声音。由此可见,AI配音不仅对游戏行业有所影响,对游戏之外的领域也有着积极贡献。

当然,列举了AI如此多优势的同时,真人也并非没有一战之力。在作品表达时,真人往往比AI更容易突出作品的“神韵”。很多时候,神韵往往是人的一种主观判断,而AI即便表达出人所认为的神韵,也需要足够多的时间去吞噬足够多的数据。

而从结果来看,AI由于只是冰冷数据的综合体,其最终呈现的效果通常不会超出人的预期。而真人虽然不如AI表现稳定,但却会时不时出现神来之笔,利用自己对作品的理解和人生经历升华作品。这一点,或许AI永远也超越不了。

如若转载,请注明出处:http://www.gamelook.com.cn/2022/09/496739

关注微信