首页 > 新车报道 > 新车报道 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

新车报道更多>>

一汽丰田RAV4荣放 搭载2.0L发动机+CVT无级变速箱,是否值得购入? 7座布局设计,搭载2.0L混动系统的广汽传祺E8,是否适合家用? 适合多孩家庭,大六座布局的东风奕派eπ008,是否值得购入? 外观颜值在线,纯电续航570km、支持800V快充的小鹏G9,适合家用 24.29万元起售,定位中大型SUV,空间宽敞,大众揽巡适合家用 用车成本低,空间宽敞,适合家用的SUV,传祺GS4 MAX值得一看? 降至7.98万起,配L2级智驾+2.0L动力,卡罗拉锐放实力表现如何? 想要一辆代步用车,外观可爱的长安Lumin,产品实力表现如何? 块头都不小呀!比亚迪腾势N9、全新“夏”MPV现身目录 苹果推出新款iPad mini 现在即可订购 10月23日在实体店开售 一汽红旗:交付 EH7 荣耀版,助力体育强国 中国车企正在“颠覆”欧洲老牌制造商?小鹏、广汽纷纷“安抚” 第100万辆汽车下线 理想汽车成国内首个“百万辆新势力车企” AION V 打头阵,广汽开始筹谋欧洲市场 广汽集团亮相巴黎车展,全新欧洲市场计划推动全球化战略 AI应用持续深化 打破游戏行业“不可能三角” 一线城市楼市:全面回暖,未来可期 政策大调整!楼市迎来巨变,官方态度明确,购房者需注意! 公认“低价高配”,4款16G+512G旗舰手机推荐,轻松流畅用五年 Counterpoint:2024年Q3全球智能手机市场同比增长2%,摩托罗拉和华为引领市场增长 为小米15全面让路,小米14售价再创历史新低,米粉终于等到了 15万内可选的纯电SUV,云海EV、元PLUS、银河E5,谁表现更均衡? 朋友8.5万买卡罗拉,总觉得哪里不对,你们说呢? 五菱惊世K-Car!侧滑门神车仅6万?国产车王再战江湖? 中法汽车新秀会师巴黎:零跑B10与雪铁龙C5 Aircross的同场竞技 新车外观调整/两种动力/最高续航415公里,新款雪铁龙-C4发布 比亚迪打响“清仓价格战”!从20多万降到10万,车长近5米 零百加速4.3秒,六七座可选,比亚迪唐dmp现在还能买吗? 丰田终于妥协了!从17万降至11万,油耗5L使用92号汽油 中年用户成消费主力,吉利该到“去年轻化”的时候了