腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型
2024-11-06 06:26:41人工智能 IT之家 沛霖(实习)
腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。
最新 11 月 5 日消息,腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。
模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产:
第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建
第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构
最终该模型可以实现输入任意单视角实现三维生成
官方表示该模型的泛化能力和可控性强,可重建各类尺度物体,大到建筑,小到工具花草。
最新附相关链接如下:
Github:https://github.com/Tencent/Hunyuan3D-1
Huggingface:https://huggingface.co/tencent/Hunyuan3D-1
研究论文:https://3d.hunyuan.tencent.com/hunyuan3d.pdf
赞一个! ()
相关文章
- 小鹏鹏行前高管创业入局 AI 陪伴机器人,完成千万元级天
- 因发现稀有蜜蜂,扎克伯格拟建的核电 AI 数据中心计划受
- 昆仑万维发布天工 AI 高级搜索功能,升级分析推理、金融
- 英伟达团队机器训练新方法:仅 5 次演示让机器生成 1000
- GPT-4o mini 的 6.7/8.3 倍,Claude 3.5 Haiku AI 模型
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源
- 极智嘉发布全球首款搭载英特尔视觉导航模块的纯视觉机
- AI 赋能好莱坞:《此心安处》通过实时 AI 换脸技术让演
- OpenAI CEO 阿尔特曼预测 AGI 可在 5 年内实现,但短期
- 优必选发布全栈式无人物流解决方案:人形机器人与无人车