英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交付延迟
最新 11 月 18 日消息,当地时间周日,据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对能否按计划部署 Blackwell 服务器感到担忧。
知情人士透露,Blackwell GPU 专为 AI 和高性能计算(HPC)设计,但在配置 72 个处理器的服务器中出现过热问题,此类服务器每个机架功耗最高可达 120 千瓦。过热问题迫使英伟达多次修改机架设计,不仅限制了 GPU 性能,还可能损坏硬件。客户因此担心,这些技术问题会延迟数据中心的处理器部署进程。
为应对这一难题,英伟达要求供应商调整机架设计,并与合作伙伴一起优化散热系统。尽管这种工程改进是大规模技术发布中的常规步骤,但也进一步推迟了产品交付时间。
英伟达发言人针对此事对路透社回应称,公司正与云服务提供商密切合作,设计调整属于正常研发流程的一部分。英伟达希望通过这种合作,确保最终产品在性能和可靠性方面达到预期,同时加紧解决技术瓶颈。
最新从报道中获悉,修订后的 Blackwell GPU 于今年 10 月底才进入量产,预计最快明年 1 月底出货。谷歌、Meta、微软等科技巨头依赖英伟达 GPU 训练其最强大的 AI 模型,其延期对这些客户的研发计划和产品发布造成的影响自然是不可避免。
今年 3 月,英伟达展示了 Blackwell 芯片,当时曾表示将在第二季度发货。
相关阅读:
《黄仁勋称英伟达 Blackwell 芯片曾存在设计缺陷,靠台积电力挽狂澜》
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责