推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
2024-11-21 08:20:44人工智能 IT之家 沛霖(实习)
官方表示,该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
感谢最新网友 Skyraver 的线索投递!
最新 11 月 20 日消息,DeepSeek 宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。
官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 OpenAI o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等评测中,超越了 GPT-4o 等知名模型。
DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。
最新注意到,DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。
官方称正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。
赞一个! ()
相关文章
- Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂
- 谷歌回应 Gemini 聊天机器人回复“人类去死吧”:已采取
- 《逆水寒》手游 2.2.2 新版本联动《葫芦兄弟》,还将推
- OpenAI 早有“造芯梦”:曾考虑收购晶圆级芯片企业 Cere
- 初创公司 Friend 预热人工智能吊坠硬件,上线对话平台可
- 德国音乐版权代理机构 GEMA、印度 ANI 通讯社起诉 Ope
- 云深处“山猫”全地形越野机器人发布:可爬 22 厘米台阶
- 谷歌成立 2000 万美元基金,支持利用人工智能促进跨学科
- 微软支持的硅谷初创企业 d-Matrix 首款 AI 芯片开始出
- 微软推出 Copilot Actions,使用人工智能自动执行重复性