像OpenAI的Jukebox这样的人工智能工具是如何被用来创作深度假音乐的,这可能会导致一系列道德和知识产权问题

2020-11-10 17:05:36

人工智能正在被用来创作新歌,看起来似乎是弗兰克·西纳特拉(Frank Sinatra)和其他已故明星演唱的。“Deepfake”是个可爱的小把戏--但它们可能永远改变流行音乐。

“圣诞节到了!”热水浴缸时间到了!“。弗兰克·辛纳特拉唱道。至少,听起来像他。轻松的挥杆,欢快的友善,以及低调的铜管和弦乐的繁荣,这几乎可以被认为是某种丢失已久的西纳特拉(Sinatra)的演示。就连它的声音--曾经被描述为“充满传奇和遗憾”的丰富音调--也出奇地熟悉,尽管它确实在音调之间摇摇晃晃,有时听起来就像是在游泳池底部录制的一样。

这首歌并不是一首真正的曲目,而是一首令人信服的赝品,由“研究和部署公司”OpenAI创造,该公司的Jukebox项目使用人工智能来生成各种流派和艺术家风格的带有歌词的音乐。除了辛纳特拉,他们还模仿了凯蒂·佩里、猫王、西蒙和加芬克尔、2Pac、塞琳·迪翁等等。通过使用从网络上抓取的120万首歌曲以及相应的歌词和元数据对该模型进行训练,它可以根据你输入的内容输出几分钟长的原始音频。比如说,输入Queen或Dolly Parton或Mozart,你会得到另一端的近似值。

“作为一项工程,它真的令人印象深刻,”电子音乐家、金匠学院的研究员兼学者马修·易-金博士(Dr.Matthew Yee-King)说。(OpenAI拒绝接受采访。)。“它们将音频信号分解成三个不同层次的音乐词条--如果你愿意,还可以是一本词典--给你一组足以重建输入的音乐的核心片段。”然后,算法可以根据你输入的刺激重新排列这些片段。比如,给它一些埃拉·菲茨杰拉德(Ella Fitzgerald)的作品,它就会找到并拼凑出《字典》中的相关片段,在她的音乐空间里创造一些东西。

尽管技术成就令人钦佩,但一些样品有一些可怕的东西,特别是那些早已去世的艺术家的样品--悲伤的幽灵迷失在机器里,喃喃地说着陈词滥调。西纳特拉样本下面的一条评论写道:“该死的尖叫声”;另一条评论写道:“听起来真他妈的邪恶。”我们现在在神秘谷。

随着越来越多的公司将算法应用于音乐,Deepfac音乐将对音乐产业产生广泛的影响。谷歌的Magenta项目--标榜为“探索机器学习作为创造过程中的一种工具”--已经开发了几个开源API,允许使用全新的机器产生的声音或人类与人工智能的共同创造进行合成。安珀音乐(Amper Music)等众多初创公司为媒体内容制作定制的、人工智能生成的音乐,并拥有全球版权。就连Spotify也在涉足;其人工智能研究小组由索尼音乐(Sony Music)计算机科学实验室前负责人弗朗索瓦·帕切特(François Pachet)领导。

然而,不难预见,这种深度造假会如何导致伦理和知识产权问题。如果你不想为在电影、电视节目或商业广告中使用某位知名艺术家的音乐而支付市场价,你可以创造自己的仿制品。与此同时,流媒体服务可以用听起来相似的不赚取版税的人工智能艺术家来填充流派播放列表,从而增加利润。最终,流媒体服务、广播电台和其他机构会越来越多地避免为音乐付费吗?

音乐行业的法律部门正在密切关注事态的发展。今年早些时候,Roc Nation向一名匿名YouTube用户提交了DMCA下线请求,原因是该用户使用人工智能模仿Jay-Z的声音和节奏来说唱莎士比亚和比利·乔尔。(两者都非常逼真。)。备案文件称:“该内容非法使用人工智能来模仿我们客户的声音。”虽然这些视频最终被恢复,“等待原告提供更多信息”,但这类案件--第一起--仍在隆隆作响。

Roc Nation拒绝就人工智能模仿的法律含义置评,英国《卫报》联系的其他几家主要唱片公司也拒绝置评。一位匿名人士表示:“作为一家上市公司,我们在讨论未来面临的话题时必须谨慎。”就连英国行业组织英国公众宣传局(BPI)也拒绝公开谈论该行业将如何应对这个美丽的新世界,以及可能采取哪些措施来保护艺术家及其作品的完整性。国际音乐贸易机构IFPI没有回复电子邮件。

或许原因是,至少在英国,人们担心实际上没有法律保护的基础。Beggars Group的法律部主管鲁珀特·斯凯利特(Rupert Skellett)说:“音乐有两种不同的版权。”Beggars Group旗下有独立唱片公司4AD、XL、Rough Trade等。“一个在乐谱和歌词中--即歌曲--另一个在录音中,这正是唱片公司所关心的。”如果有人没有使用过真实的录音“--如果他们用人工智能制作了一个模拟模型--”你就不会因为录音的版权而对他们提起法律诉讼。“。

斯凯利特说,“假冒”录音有潜在的诉讼理由,但举证责任繁重,这样的诉讼在美国更有可能成功,因为美国有法律保护,禁止出于商业目的冒充名人,而且在美国,马文·盖伊(Marvin Gaye)的遗产收购模糊线(Blurred Lines)等抄袭案件已经成功。英国法律没有这样的规定或先例,因此,如果创造者明确说明深伪的性质,即使是商业开采深伪也可能无法起诉。“这将取决于每个案例的事实,”斯凯利特说。

然而,一些人对这种创造性的可能性感到兴奋。“如果你有一个数百万首歌曲的统计模型,你可以问这个算法:你没看过的是什么?”怡景说。“你可以找到那个空白,然后创造一些新的东西。”马特·德莱赫斯特(Mat Dryhurst)是一位艺术家和播客,他多年来一直在研究和研究人工智能及其相关技术,他说:“我们看到的最接近采样的类比。这些模型提供了一个新的维度,代表了采样鲍伊的固定声音录音和让鲍伊随心所欲地演唱之间的区别--这是一种非凡的力量和责任。“。

深假也提出了更深层次的问题:是什么让某个特定的艺术家变得特别?为什么我们会对某些风格或类型的音乐做出回应,当这种风格或类型可以按需创作时会发生什么?Yee-King设想机器能够根据你选择的设置随时为你生成完美的音乐-这是初创公司Endel已经开创的-以及流行歌星使用人工智能收听模型来预测哪些歌曲会流行,或者不同的人口结构会做出什么反应。“只是给人们提供一个优化的声音流,”他说,“艺术家们完全被排除在圈子之外。”

但是,如果我们失去了对艺术家所做的一切--以及对创作的人性方面--的情感投资,我们就会失去一些音乐的根本意义上的东西。德莱赫斯特说:“这些系统是针对人类的表达进行训练的,并将增强人类的表达能力。”“但缺失的一块拼图是找到补偿人们的方法,而不是取代他们。”