//再不认真就输了!
//致力于发现AIGC动态与教程。

外国小哥体验Pika Labs AI文本生成音效功能:现在免费公开所有人使用

人工智能视频平台Pika Labs现面向所有用户开放音效功能,使创作者能够便捷地为视频添加声音。音效功能首先面向Pro计划订阅者推出,利用Pika Labs内部的文本到音频模型,该模型能匹配视频提示文本以生成相应的声音效果。

这一新功能将AI视频的应用提升到了新的高度,并增强了Pika Labs平台已有的角色声音和口型同步工具。与此同时,其他公司如ElevenLabs和Runway也在AI视频音效领域进行了尝试,如ElevenLabs拥有音效库,而Runway则发布了唇形同步功能。综合来看,AI视频音效功能正成为行业的新趋势,为用户提供更丰富的创作体验。

工具箱:
https://heehel.com/ai-tools#ai-3d

PikaLabs专区内容:
https://heehel.com/topic/pikalabs-topic

>>官方网站直达<<

测试 Pika Labs 的音效

在 Pika Labs 中向视频添加音效有两种方法,通过切换音效开关作为初始提示的一部分,或者在事后使用单独的提示。我已经尝试了这两种方法来进行实际审查,发现除非您需要选择声音,例如指定一年中的某个时间或特定的噪音,否则第一种方法可以提供更好的结果。

这是基于我为之前有关 Suno AI 音乐应用程序的故事创建的图像,描绘了圣诞节期间月球上的酒吧。我将文本提示留空,并将声音效果开关切换到打开位置,看看它与图像的匹配程度。它做得非常好。有点吵,但一些最好的酒吧也是如此。它并没有真正捕捉到圣诞节元素,但唯一的迹象是角落里的一棵树。

在第一个测试中,我向 Pika Labs 提供了以下提示并启用了声音效果,使模型能够遵循提示和视频:“一辆时尚的红色跑车在夜间沿着城市街道行驶,在其后面留下了运动模糊痕迹”。它很好地捕捉到了运动,确实产生了发动机转速的声音效果,但出奇的安静。我必须调高 iMovie 中的声音才能正确听到它,但总体听起来不错。

这称为飞溅测试。它不仅可以很好地处理水声,还可以处理与视频同步的声音。我使用了提示:“一个人在半空中,在清澈的蓝天映衬下,即将跳入波光粼粼的游泳池。”它在视觉效果上并没有很好地遵循提示,尽管它看起来大致沿着提示的方向。它使角色比人更像美人鱼,但水花的声音和其他一般的水声一样好。

我在 MidJourney 中生成的这张图像给我留下了深刻的印象。它几乎让人感觉完全失焦,这对于人工智能模型来说是令人印象深刻的——但它对食物的关注恰到好处,将厨师置于后台。这使其成为测试 Pika Labs 音效的完美候选者。我只是给它图像和选择的声音效果,然后点击生成按钮。它能很好地捕捉运动并发出像工作厨房一样的声音。

最后的测试是迄今为止我在所有音效测试中都使用过的测试——烟花。这应该很容易,但挑战是将声音与爆炸同步。我使用了提示:“充满活力的烟花爆炸照亮了夜空,各种颜色的火花向外辐射。”考虑到根本没有手动同步,它的表现还不错,完全是由人工智能模型完成的。

音效为人工智能视频内容增添了重要的维度,事实上,它们为任何视频内容增添了重要的维度。只需查看图片,您几乎就可以听到汽车引擎运转的声音,因此至关重要的是,声音不仅正确,而且同步正确。

Pika Labs 似乎已经通过他们的工具实现了这一点。它并不完美,并不总能获得您想要的噪音,但它的设计具有足够的灵活性,可以用作一次性想法,也可以用于完整的、精心策划的制作。

版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《外国小哥体验Pika Labs AI文本生成音效功能:现在免费公开所有人使用》
文章链接:https://heehel.com/aigc/pika-sound-effects-2.html
本站资源仅供个人学习交流,未经许可不得用于商业用途,自行承担法律责任。
如有疑问,请联系微信:heehelcom

喜好儿——再不认真就输了!

致力于发现ai人工智能应用的新世界, 长期更新目前热门AI教程与动态!期待在这个工业变革时代中,希望你我都能发出一点光。

登录

找回密码

注册