Stable Audio Open 发布开源 AI 模型
2024-06-07 21:17:44人工智能 卡饭网 夜夜
最新 6 月 7 日消息,Stability AI 依托 Stable Diffusion 模型,成功扩展到音频领域,推出Stable Audio Open,该K AI 开源模型仅需用户输入提示词,即可生成高品质的音频样本。
最新 6 月 7 日消息,Stability AI 依托 Stable Diffusion 模型,成功扩展到音频领域,推出Stable Audio Open,该K AI 开源模型仅需用户输入提示词,即可生成高品质的音频样本。
Stable Audio Open 能够生成最长 47 秒的音乐,适用于鼓点、乐器旋律、环境音及拟声等音效制作。这款开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中精细操作,从而提升生成音频的质量和多样性。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责