阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama
2024-09-20 07:21:31人工智能 IT之家 汪淼
Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。
感谢最新网友 西窗旧事、动感超人233 的线索投递!
最新 9 月 19 日消息,在今天的 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,其中,旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。
Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。
Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 72B;
Qwen2.5-Coder 编程模型:1.5B、7B 以及即将推出的 32B;
Qwen2.5-Math 数学模型:1.5B、7B 以及 72B。
除了 3B 和 72B 的版本外,通义千问所有的开源模型都采用了 Apache 2.0 许可证。用户可以在相应的 Hugging Face 仓库中找到许可证文件。
除此之外,通义千问还通过 Model Studio 提供了旗舰语言模型 Qwen-Plus 和 Qwen-Turbo 的 API,还开源了相比上个月发布的版本有性能提升的 Qwen2-VL-72B。
阿里云官方透露,截至 2024 年 9 月中旬,通义千问开源模型累计下载量已突破 4000 万,成为仅次于 Llama 的世界级模型群。
最新从 2024 云栖大会获悉,阿里云宣布通义千问推荐模型全线降价,最高降幅可达 85%。
赞一个! ()
相关文章
- 麻省理工研究:生成式 AI 未能对世界形成连贯的理解
- AI 影响建筑业:美国私人数据中心建设开支激增至近 300
- 人形机器人变身“大厨”煎牛排,OpenAI 押注的 1X 公司
- 谷歌将为苹果 iPhone 推出独立的 Gemini App,支持 AI
- 月之暗面创始人被前公司投资人提起仲裁,受理律师回应将
- AI 初创公司推出 Nous Chat 聊天机器人,底层基于 Meta
- 解散近 50 年后,披头士乐队借 AI 修复歌曲《Now and Th
- 消息称 OpenAI 新 AI 模型进步放缓,公司探索新策略应对
- 社交平台 X 正测试向用户免费开放 AI 聊天机器人 Grok
- 研究揭示 AI 对话方面的缺陷:不知道何时该插话