辛普森一家可以用AI取代其语音演员吗?

2021-03-11 04:57:57

2015年5月,辛普森一家语音演员哈利牧师 - 谁扮演了许多关键角色,包括伯恩斯和Waylon Smithers先生的伯恩斯先生 - 宣布他正在离开节目。

届时,动画系列已经运行了25多年,其声音的工资从1998年的30,000次发作量上升到2008年的40万美元。但是,辛普森一家的生产者福克斯希望削减成本 - 并且威胁要取消该系列,除非语音演员削减了30%。

他们中的大多数人都同意,但采煤机(谁一直批评秀质量的拒绝质量)拒绝签约超过二十年,他想突破金手铐,并赢回自由和追求自己的时间工作。 Showrunner Al Jean说,Shearer的标志性人物 - 谁还包括主人Skinner,Ned Flanders和Otto Mann-将是重铸的。

但你永远不会停止辛普森一家。几个月后,采煤机依赖并签署了一笔新的交易。该展示往往笑话动画中的语音演员的可换算,但随着它推动第四十年,它是笑声背后的标志性的声音,这可能会对其继续存在构成最大的威胁。玩斯普林菲尔德居民的演员正在接近退休年龄 - 他们主要是他们的六十年代或七十年代;采煤机是77 - 他们可能很快决定他们不想再做了。他们当然不需要旧的剧集和残留的费用,而不是旧的旧事件和残留物,他们坐在数百万美元上。

但也许显示的生产者实际上不再需要语音演员了。在最近的一集中,埃德纳·克拉巴达尔 - 巴特的长期痛苦的老师,其角色是在2013年的语音演员死亡之后从节目退休 - 使用了对以前发作的录音来回来的最终告别。

计算能力的进步意味着您可以将该原则扩展到任何角色。 DeepFake技术可以使令人信服的面值从有限的培训数据中令人信服,并且该节目的生产者拥有30年的音频来工作。所以辛普森一家可以用AI替换它的语音吗?

“你肯定会提出一个被角色的辛普森一章,这是一个可信的方式,”加拿大的AI研究人员和媒体制作人蒂姆麦克斯和媒体制作人建立了一个可以训练的语音模型来模仿任何人嗓音。 “这将是娱乐是另一个问题。”

在他的YouTube频道上,发言AI,McSmythurs从诺丁山重新播放荷马罗伯茨角色的标志性的场景;唐纳德特朗普代表着Ralph Wiggum,乔拜登将洋葱联系在一起,这是当时的风格。

McSmythurs建立了一个通用的AI模型,可以用英语将任何文本转换为音频语音。当他想制作一个新的声音时,他进一步调整模型,并使用这位特定人口的两小时或三个小时的新数据以及文本成绩单。 “它侧重于让荷马是荷马的声音,以及不同的频率,”他说。

之后,询问模型生成多个拍摄的问题,每个人都会略有不同 - 为您的目的选择最佳选择。输出是可识别的,但他们听起来有点平坦,好像他正在读出他并不真正理解的意义。 “它确实取决于培训数据,”麦克斯特斯说。 “如果模型没有暴露于那些相当宽的情绪范围,它无法从头开始创建它。所以它不会像荷马可能一样充满活力。“

英国初创公司宣传制定了一种使情绪范围带到AI声音的方式。他们与语音演员合作,获得广泛的培训数据 - 几个小时的演员通过不同的线条,具有不同的情感色调。 “我们知道讽刺和诚意之间的区别,以及声音的微小线索,”John Flynn,Sonantic Cofounder和CTO说。 “我们伸展那些自然点和细微差别和变形。”

Flynn表示,所需的培训数据量急剧下降,从30到50小时到达10或20分钟。基于布里斯班的副本工作室已经建立了一种型号,可以通过喂食20短但特定句子的录制来培训,可以训练以重新创建声音。 “您可以获得更高的性能的数据越多,但我们可以在几分钟内完成一些事情,”Shreyas Nivas,Coplica Cofounder和Ceo说。

单词由音节构成,该音节由音素构建 - 嘴巴能够制作的所有单独的声音。在理论上,培训模型可以从称为称号的单个句子中获得所需的一切,其中包含每个英语的每个音素,尽管在实践中,这取决于您的口音。 (例如,尝试思考所有不同的方式都有说:“在湖水中的水域上的米色色调在包括法国女王,在她听到那个交响曲再次,就像年轻的亚瑟想要的那样。”)

语音发电技术已经在视频游戏中发现了用于视频游戏 - Sonantic的使用者与黑曜石,辐射和外层世界的制造商合作,而副本有许多AAA和独立游戏工作室作为客户。在游戏中,AI声音可以用来填写一个具有更广泛的对话的开放世界,而不是表示由演播室中的语音演员记录的东西。

Nivas表示,该技术在开发阶段特别有用,其中AI版本的声音可以用作立场,使游戏的创造者能够在获得真正的演员之前尝试各种选项。它也可能是用于驱动更多的自定义 - 评论员尖叫您的实际名称,如FIFA这样的游戏可能是一个应用程序,而副本为Cyber​​Punk开发了一个更改主角名称的Mod,并启用与他们交互的每个角色。组合AI语音生成,语音识别和文本到语音算法,如GPT-3可以指播放器实际上可以与非播放器字符相反,具有在那里生成的对话框。

但是,除非福克斯也决定向AI交出编剧和动画,否则,您不需要任何这些功能,以便像辛普森一家脚本。事实上,使用AI重振角色可能比找到一个可以做一个非常好的荷马印象的人更麻烦。 “如果目标是产生另一集的节目,最好的方法是让行为与脚本一起演员,并让他们执行它 - 他们会提供更高的质量表现,因为他们已经成功地完成了数十年和数十年的成功他们可以完美地体现角色,“Nivas说。 “使用AI语音演员需要更多的迭代和更多的工作,而不是重新组装演员。”

还有一个法律雷区,用于导航任何寻求与AI重新革新不守规矩的语音演员的生产者。 “这一法律领域是棘手的,”宾夕法尼亚大学法律教授和宣传权的作者Jennifer Rothman说:隐私为一个公共世界重新制中。

一方面,合同可能会限制工作室允许使用录音。加入这是集体谈判问题 - 罗斯曼说,“演员联盟Sag-Aftra”表示,“一直非常活跃,试图规范语音演员和屏幕演员的再现和再利用。”

然而,在没有任何合同规定的情况下,版权法发挥作用。 “拥有辛普森一家拥有版权的人将持有重组的所有权利,他们已经制造了已制作的受版权保护的作品 - 包括行动者表演的捕获记录,以及版权法赋予衍生作品的权利,”Rothman说。

但这与另一组有关宣传权的法律,这在美国各不相同。 “这种宣传权给出表演者控制未经授权的姓名,肖像,表演,往往也是他们的声音,”Rothman说。

还有,Johanna Gibson表示,伦敦大学玛丽皇后大学知识产权法学教授 - 在虚假认可索赔中对演员的潜在追索者。如果辛普森一家使用Deepfake Homer宣传巧克力棒,它可以被视为演员Dan Castellaneta的个人认可。吉布森也可以说,吉布森说,即使在同一展会上的不同角色之间的不同角色之间也有所不同,她使用家庭家伙的Seth Macfarlane的例子,他的布莱恩的声音是他的实际说话的声音,很可能有更多的保护,虽然Stewie是一个专门为该节目创建的语音。 (当然在这种情况下,Macfarlane是节目的创造者,不太可能被AI对抗他的意志取代)。

1993年,来自Cheers-George Wendt和John Ratzenberger-起诉的两个演员使用它们的机器人版本在机场酒吧的角色。演员认为,宣传权给予他们控制自己的形象,工作室认为版权法允许他们根据情景组织创造衍生工程。这种情况拖过法院八年,工作室最终安顿下来的费用。 “法律尚不清楚,这表明,如果合同没有说工作室可以做到这一点,那么如果诉讼,这种争议会出现这种争议,”罗斯曼说。 “这是一个未解决的问题。解决这些案件的法律框架是一团糟。“

但是,声音演员可能不需要才能到达律师的律师。没有一个让这些语音生成工具的人在这样做的目的是更换演员的目的。 Sonantic和Replica都热衷于他们与演员合作,并且他们有收入分享模型,以便每次在游戏中使用他们的“声音”时赚钱。

由于这种技术改善了它,它创造出“不可思议的山谷”,他们可以说nivas可以帮助民主化内容创造 - 允许辛普森一家合法使用他们最喜欢的角色的声音,例如他们自己的项目,制作混搭,呼吸新生活的混音。

Zeena Qureshi,Sonantic的首席执行官和Cofounder,将目前的声音发电理解为CGI的早期。 “它复制了演员的声音,但它不会替换它们,”她说。 “CGI没有取代电影院,这不会取代演员,但它有助于他们亲自工作。如果有人退休他们的声音可以为他们工作。“

麦克斯曼斯还与CGI进行了比较,虽然您今天可以做出令人信服的辛普森一集(具有很多迭代和努力),但它可能会努力支出时间的考验 - 以与CGI电影相同的方式'90年代看起来像现代眼睛。他看到了一些技术为短片段的技术 - 像恢复死者演员播放的角色以获得最终告别的东西,但不认为AI演员将很快就会成为一个实用的路线。 “声音演员比只是一种声音,他们带来更多,他们带来了这种情绪内容,”他说。 “Dan Castellaneta以温暖,深度和所有让我们喜欢他的品质来实现这一角色。人类做得非常好。“

✨优化您的家庭生活与我们的齿轮队的最佳选择,从机器人真空到实惠的床垫到智能扬声器