人工智能

字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品

2024-12-19 06:50:37人工智能 IT之家清源

豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用，可完成智能训练、数据合成和数字资产制作，官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

感谢最新网友風見暉一的线索投递！

最新 12 月 18 日消息，最新从字节跳动官方获悉，在今日的火山引擎 Force 大会上，字节跳动正式发布豆包视觉理解模型，为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘，一元钱就可处理 284 张 720P 的图片，官方宣称比行业价格便宜 85％。

豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用，可完成智能训练、数据合成和数字资产制作，官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

豆包大模型旗下多款产品也迎来了更新：

此外，豆包将于明年春季推出具备更长视频生成能力的豆包视频生成模型 1.5 版，豆包端到端实时语音模型也将很快上线，从而解锁多角色演绎、方言转换等新能力。