国产文生视频大模型 Vidu 发布 1.5 版本更新:可保证多不同视角下的一致性
2024-11-15 06:51:02人工智能 IT之家 清源
国产文生视频大模型厂商Vidu昨日宣布,Vidu 1.5新版本正式上线,其实现了“世界领先水平”的突破——能够理解多样化的输入,突破“一致性”的难题。
感谢最新网友 風見暉一 的线索投递!
最新 11 月 14 日消息,国产文生视频大模型厂商 Vidu 昨日宣布,Vidu 1.5 新版本正式上线,其实现了“世界领先水平”的突破 —— 能够理解多样化的输入,突破“一致性”的难题。
Vidu 方面称,其在上线之初就已具备角色一致性生成能力,通过锁定人物面部特征可解决视频生成的关键痛点,确保了人物面部特征的一致性。此次发布的更新中,Vidu 则首次展现了上下文学习的能力,提升了整体视频模型的可控性,通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。
最新获悉,其在三个方面直观呈现了“技术突破”:
复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。如造型复杂的 3D 动画风格角色,无论视角如何变化,其能够始终确保头型、服饰的全角度细节一致,避免了传统视频模型在复杂视角切换时产生的瑕疵。
人物面部特征和动态表情的自然一致:在人物特写镜头中,其能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。
多主体一致性:用户可上传多个主题图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。例如,用户可以上传主体、客体和环境的图片,创建定制角色身穿特定服装、在定制空间内自由动作的场景。
赞一个! ()
相关文章
- AI 开始“卷”智能体:OpenAI 被曝明年将推 Operator,可
- Red Hat 收购 Neural Magic 并开源其技术:优化通用设备
- 又一 OpenAI 研究员离职,称 AGI 使命无比艰难
- 腾讯大模型 App 元宝发布 2.0 版本:基于新一代大模型混
- 国产文生视频大模型 Vidu 发布 1.5 版本更新:可保证多
- 讯飞星火多模态交互大模型上线,数字人、语音、视觉支持
- 消息称生成式 AI 发展遇瓶颈,OpenAI CEO 阿尔特曼驳斥
- AI 助力脑瘤手术:10 秒内精准识别残留肿瘤
- 谷歌 Gemini 发布苹果 iOS 版 App:集成灵动岛,支持 AI
- OpenAI 呼吁建立“北美人工智能联盟”,好与中国竞争