首页 > 创作内容 > 创作内容 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

创作内容更多>>

小米17系列全球发布会定档:2月28日巴塞罗那见 Gemini 3.1:小小小小更新压过对手大迭代,Google卷飞了 2026年2月小米17怎么选:一文看懂小米17系列的全部卖点 游戏一打开就让你小心癫痫 真的有必要吗? 特斯拉:xAI Grok将上线欧洲市场,率先在9国推出 印度、爱尔兰成为最新有意设置社交媒体年龄限制的国家 OpenAI有望拿到1000亿美元,但也快被逼到墙角了 消息称Meta重启智能手表项目,“Malibu 2”机型今年内发布 五菱星光560上市,燃油/插混/纯电可选,6万级拥有15万级享受 元UP冠军续航401km 7万级越级纯电SUV 上年销量21万辆,2026北京现代直指“智启2030计划” 深耕者胜,长期者赢,smart的长期主义如何驱动“确定性增长”? 首发天玑AIOS 6.0 ,2026小鹏新品发布会上市多款新车 为高原注入绿色动能:宇通重工三电技术破解高原寒区作业困局 2025年中国乘用车销量首破3000万辆,今年预计增幅0.5% 本田官宣换标 新LOGO 2027年全面启用 李斌新年首次内部讲话:成立“人工智能技术委员会”,加大投入推动AI全业务链落地 雷军强调:新一代SU7所有信息以工信部官网公告、正式发布会为准 全球首个机器人租赁平台“擎天租”完成种子轮融资 众擎CEO:我们的T800机器人体能超90%正常男人 西贝闭店约4000名员工或将失业 网友:罗永浩一句话影响这么大 上汽集团:2025年整车批发销量超450万辆 净利同比预增438%-558% AI在美国“与民争电”,核电成了硅谷“全村的希望” 16亿只是保底,马斯克想给朱晓彤的是100亿 花旗:预计人民币兑美元在未来6-12个月内将升向6.8 片酬倍增、代言不断,2025短剧演员能年入千万?丨年终策划 2026,房地产罕见“猛药”来了! 机构:2025年北京甲级写字楼净吸纳33万平米,中关村占半数 2025年房企销售额排位赛出炉:前十门槛卡线千亿,谁进谁退? 新年楼市积极开局:北京新政效果初显,深圳元旦假期二手房签约量同比涨四成