Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o
2024-11-21 08:21:00人工智能 IT之家 故渊
Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
最新 11 月 19 日消息,Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。
Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。最新援引官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。
在 ChartQA 和 DocVQA 测试中,Pixtral Large 同样表现优异,超越了 GPT-4o 和 Gemini-1.5 Pro。
该模型配备了 123B 的多模态解码器和 1B 的视觉编码器,支持 128K 的上下文窗口,能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色,同时在复杂推理和图表理解方面也具备强大能力。
赞一个! ()
相关文章
- Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂
- 谷歌回应 Gemini 聊天机器人回复“人类去死吧”:已采取
- 《逆水寒》手游 2.2.2 新版本联动《葫芦兄弟》,还将推
- OpenAI 早有“造芯梦”:曾考虑收购晶圆级芯片企业 Cere
- 初创公司 Friend 预热人工智能吊坠硬件,上线对话平台可
- 德国音乐版权代理机构 GEMA、印度 ANI 通讯社起诉 Ope
- 云深处“山猫”全地形越野机器人发布:可爬 22 厘米台阶
- 谷歌成立 2000 万美元基金,支持利用人工智能促进跨学科
- 微软支持的硅谷初创企业 d-Matrix 首款 AI 芯片开始出
- 微软推出 Copilot Actions,使用人工智能自动执行重复性