您现在的位置是：首页 > 智能时代 > 人工智能

人工智能

腾讯混元大模型上线并开源文生视频能力：支持中英文双语输入，参数量 130 亿

2024-12-04 06:51:28人工智能 IT之家沛霖（实习）

腾讯今日宣布，混元大模型上线并开源文生视频能力，参数量 130 亿。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。

最新 12 月 3 日消息，腾讯今日宣布，混元大模型上线并开源文生视频能力，参数量 130 亿，支持中英文双语输入。

▲ 提示词：肩摄视角平移切入，清晨阳光透过纱帘洒落。画面中央是一位老爷爷，正在木工台前专注雕刻。摄影机徐徐推近，特写他布满皱纹的手指和木屑纷飞。背景虚化的老房间里，木工工具整齐排列，墙上挂满完成的作品。

官方宣称，腾讯混元视频生成大模型可以生成“超写实的”高质量视频，生成的画面不容易变形；在镜面或镜子场景中，可以做到镜面反射动作和外面完全同步，光影反射基本符合物理规律。

腾讯混元大模型上线并开源文生视频能力：支持中英文双语输入，参数量 130 亿

▲ 提示词：超大水管浪尖，冲浪者在浪尖起跳，完成空中转体。摄影机从海浪内部穿越而出，捕捉阳光透过海水的瞬间。水花在空中形成完美弧线，冲浪板划过水面留下轨迹。最后定格在冲浪者穿越水帘的完美瞬间。

腾讯混元大模型上线并开源文生视频能力：支持中英文双语输入，参数量 130 亿

▲ 提示词：手持长焦跟拍，磨砂金属车厢在高速中留下光带。隧道灯光断续闪过，映照出乘客若隐若现的侧脸。防护玻璃上的水珠随速度扭曲变形，构建出城市地下的光影迷宫。

据介绍，腾讯混元视频生成大模型采用 DiT 架构，适配了新一代文本编码器提升语义遵循，更好地应对多个主体描绘，实现更加细致的指令和画面呈现。

腾讯混元大模型上线并开源文生视频能力：支持中英文双语输入，参数量 130 亿

▲ 提示词：超广角俯拍，热气球节。数百只彩色热气球缓缓升空，篝火在地面点亮黎明。云层被晨光染成粉色，构成壮观的空中景观。

在“腾讯元宝 App”，进入“AI 应用”，选择“AI 视频”，可申请试用。

腾讯混元大模型上线并开源文生视频能力：支持中英文双语输入，参数量 130 亿

腾讯表示，本次开源包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费使用和开发生态插件。

最新附相关链接如下：