腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿
2024-12-04 06:51:28人工智能 IT之家 沛霖(实习)
腾讯今日宣布,混元大模型上线并开源文生视频能力,参数量 130 亿。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。
最新 12 月 3 日消息,腾讯今日宣布,混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。
官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。
据介绍,腾讯混元视频生成大模型采用 DiT 架构,适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。
在“腾讯元宝 App”,进入“AI 应用”,选择“AI 视频”,可申请试用。
腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。
最新附相关链接如下:
主页:https://aivideo.hunyuan.tencent.com/
Github:https://github.com/Tencent/HunyuanVideo
Huggingface:https://huggingface.co/tencent/HunyuanVideo
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责