月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o1
2024-11-17 07:25:57人工智能 IT之家 清源
基准测试显示,Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
感谢最新网友 西窗旧事 的线索投递!
最新 11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview。
月之暗面创始人杨植麟认为,最适合让 AI 去锻炼思考能力的场景就是数学场景。最新获悉,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。
杨植麟表示,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。
赞一个! ()
相关文章
- 欧盟发布《通用人工智能业务守则》初稿:明确 AI 风险管
- 可口可乐发布首个完全由 AI 生成的广告:致敬 1995 年经
- 微软 GraphRAG AI 提效:改善数据检索,tokens 成本降低 7
- 雷蛇发布 Gaiadex:矿物级 AI 分解产品组件,5 分钟内生成
- 遏制电话诈骗新招:AI 老奶奶“废话反击”,40 分钟搞崩诈
- SU 哈佛亚马逊最新研究:量化能让大模型“恢复记忆”,删
- 月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o
- Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
- 月之暗面创始人杨植麟:AI 的下一个重要方向是具备“思
- 编程利器:OpenAI 升级 ChatGPT 应用,可配合 Xcode 等工