关于人工智能和机器学习技术、构建它们的公司以及人工智能今天引发的道德问题的新闻报道。这包括生成式人工智能,包括大型语言模型、文本到图像和文本到视频模型语音识别和生成和预测分析。
今天这个故事,要从“披头士乐队的最后一张唱片”说起。
在保罗·麦卡特尼(Paul McCartney)所说的“披头士乐队的最后一张唱片”中,使用一种人工智能来修复复活约翰·列侬(John Lennon)的声音的决定引起了一些不满。他们所做的远非我们今天看到的杂乱无章的Soundcloud艺术家的粗略的AI模仿,并且与机器学习的一个更平淡无奇的应用有更多的共同点:降噪。听到人们谈论它,你会认为这是一场卑鄙的金钱掠夺,使用最新的语音合成技术来模仿有史以来最著名的词曲作者之一。但真实的故事比这更简单、更凄美,技术远没有那么奇妙。
正如乐队成员在一部关于这首歌制作的甜蜜短片中回忆的那样,“Now And Then”最初是列侬在1980年被杀前不久制作的钢琴演示。他的遗孀小野洋子(Yoko Ono)后来向乐队提供了录制这首歌的磁带,但录音质量并不好,甚至很糟糕。
正如他们所说的那样,MAL是音频隔离技术的一个版本,在过去几年中取得了长足的进步。机器学习模型可以在许多吉他轨道上进行训练,并了解吉他的波形或频谱特征是什么,并且可以以不同的成功将其从混合轨道中剔除。它现在也常用于视频通话,使用根据人声训练的模型。通过抑制所有不是说话者声音的东西,可以实时消除吠叫的狗或嘈杂的咖啡馆等背景噪音。这种较粗糙的版本有时用于制作歌曲的卡拉 OK 版本,识别和删除人声轨道。就列侬的演示而言,它就像一个魅力,正如你在制作短片中听到的这个时间戳一样。
“就是——约翰的声音,晶莹剔透,”保罗说。“现在我们可以混合它并对其进行适当的记录。
现在,随着四分之一个世纪的技术进步,这正是他们能做的,“这是我们最接近让他回到房间里的一次,”林戈说。