探秘全球最大 AI 集群 xAI Colossus:122 天建成,10 万张英伟达 H100 构筑马斯克 AI 愿景
2024-10-30 06:38:03人工智能 IT之家 故渊
科技媒体 servethehome 昨日(10 月 28 日)发布博文,应 xAI 公司邀请,参观了 Colossus 全球最大 AI 训练集群。
最新 10 月 29 日消息,科技媒体 servethehome 昨日(10 月 28 日)发布博文,应 xAI 公司邀请,参观了 Colossus 全球最大 AI 训练集群。
最新曾于今年 9 月报道,xAI 在 Supermicro 的帮助下,在短短 122 天时间内搭建 10 万张英伟达 H100,而该公司计划未来将再翻倍增加 10 万张 GPU,其中 5 万张为更先进的 H200。
xAI Colossus 配备了英伟达 HGX H100 服务器,每台服务器内含 8 张 H100 GPU,所有服务器都在 Supermicro 的 4U 水冷系统中运行,确保高效散热。
每个机架可容纳 8 台服务器,8 台服务器组成 1 个阵列,意味着每个阵列有 512 个 GPU。Colossus 集群内有超过 1,500 个 GPU 机架,支持高带宽的网络互联。
每个 GPU 配备 400GbE 的网络接口控制器,确保每台 HGX H100 服务器达到 3.6 Terabit 每秒的以太网带宽。
xAI 采用了 Supermicro 的 4U 通用 GPU 系统,这些系统具备先进的液冷技术,提升了散热效率,确保了高性能计算的稳定性。液冷设计使得系统在运行高负荷任务时,能够保持较低的温度,延长设备使用寿命。
此次展示获得了埃隆・马斯克及其团队的特别批准,由于构建全球最大 AI 集群的敏感性,部分内容在视频中进行了模糊处理,Supermicro 赞助了这次巡展,显示出其在行业中的重要地位。
赞一个! ()
相关文章
- 消息称 Meta 正开发自家 AI 搜索引擎:追赶 OpenAI,降低
- 谷歌扩展 AI 总结搜索结果功能至全球 100 多个市场,覆
- 国庆期间被 AI 雷军“骂了 7 天”,雷军本人呼吁网友不
- 微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒
- 智源推出全能视觉生成模型 OmniGen:支持文生图、图像编
- 神秘 AI 模型“小熊猫”一夜刷屏:排名超 Flux、Midjour
- 探秘全球最大 AI 集群 xAI Colossus:122 天建成,10 万张
- 全国首批人形机器人具身智能标准发布:按下肢运动、上肢
- 因使用生成式 AI 制作恶意软件,日本一 25 岁男子首次被
- Perplexity AI 搜索引擎每周处理 1 亿次查询,消息称微