超节点算力集群创新联合体成立:中国移动、浪潮、阿里云等参与,打造 GPU 卡间互联体系
最新 12 月 26 日消息,以“创新驱动智启新程”为主题的 2024 中国人工智能大会(CCAI)开幕式于本月在北京召开,超节点算力集群创新联合体揭牌仪式举行。
会上,北京市科委、中关村管委会、中国移动、浪潮集团、阿里云、清华大学、中国科学院等单位共同为“超节点算力集群创新联合体”揭牌。
据中国移动介绍,随着人工智能大模型的迅猛发展,其参数规模正向超万亿级别演进,模型的性能和泛化能力不断提升,对高性能智算基础设施的需求更为迫切。在此背景下,传统单台智算服务器仅能容纳 8 张 GPU 芯片的算力模式正被“超节点算力集群”这一形态所取代,以适应日益增长的算力需求。
“超节点算力集群创新联合体”的 GPU 卡间互联是基于中国移动原创的 OISA(全向智感互联)协议所构建,OISA 旨在打造一个高效、智能、灵活且开放的 GPU 卡间互联体系,该架构致力于支持大模型训练、推理、高性能计算等数据密集型的 AI 应用。
为了实现这一目标,OISA 采用了全向连接设计,确保大规模 GPU 之间对等通信;引入智能感知设计,通过定义流量感知标签,并结合流控和重传机制,优化数据传输效率。
在协议层面,OISA 采用精悍的报文格式、支持内存和消息的多语义融合、多层次流控重传以及预设集合通信加速等多个关键技术,实现高带宽、低时延和高可靠的 GPU 通信能力。
在当前 Gen1.1 版本下,OISA 支持超节点内任意 GPU 卡间的点对点读写互联带宽达到 896GB/s,每个 OISA-Switch 芯片支持 128 个端口、交换容量 51.2T。
最新从中国移动官方获悉,中国移动未来将全面支持超节点算力集群创新联合体发展,计划联合产业界优先完成在单层 Switch 条件下基于 OISA 互联技术的 32/64 卡超节点产品落地,并加速 128 卡超节点产品的输出。
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责