谷歌 DeepMind 公布为无声视频配音 AI 模型
2024-06-21 15:28:30人工智能 卡饭网 夜夜
最新 6 月 21 日消息,据DeepMind新闻稿透露,DeepMind最新研发出一项“video-to-audio”AI模型技术,可为无声视频量身打造背景音乐。
最新 6 月 21 日消息,据DeepMind新闻稿透露,DeepMind最新研发出一项“video-to-audio”AI模型技术,可为无声视频量身打造背景音乐。
目前该AI模型仍存局限,需开发者以提示词预先“描绘”视频可能的声响,尚不能直接依据视频画面添加具体音效。
据悉,模型会先将用户输入的视频进行拆解,再结合用户提供的文字提示,通过扩散模型反复运算,最终生成与视频画面相协调的背景声音。
例如,输入一段“黑暗中行走”的无声视频,并添加“电影、恐怖片、紧张氛围、脚步声”等提示词,模型便能生成符合恐怖风格的背景音效。
DeepMind 同时表示,该“video-to-audio”模型可以为任何视频生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责