人工智能

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

2024-09-14 07:39:30人工智能 IT之家沛霖（实习）

该模型总参数 255B，激活参数 36B，效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。

最新 9 月 13 日消息，元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。

该模型总参数 255B，激活参数 36B，官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。

MoE（Mixture of Experts）混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，在扩大模型规模的同时，保持模型性能最大化，甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。

在多个评测中，元象 MoE 超过多个同类模型，包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

计算机教程网

计算机教程网

人工智能

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

“AI 教母”李飞飞为新公司融资 2.3 亿美元，创业方向瞄准“空间智能”

美国银行谈 AI 热潮：当前仍处早期阶段，才相当于互联网的 1996 年

相关文章