英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交付延迟
最新 11 月 18 日消息,当地时间周日,据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中存在严重的过热问题。这些问题导致设计调整与项目延期,使谷歌、 Meta 和微软等主要客户对能否按计划部署 Blackwell 服务器感到担忧。
知情人士透露,Blackwell GPU 专为 AI 和高性能计算(HPC)设计,但在配置 72 个处理器的服务器中出现过热问题,此类服务器每个机架功耗最高可达 120 千瓦。过热问题迫使英伟达多次修改机架设计,不仅限制了 GPU 性能,还可能损坏硬件。客户因此担心,这些技术问题会延迟数据中心的处理器部署进程。
为应对这一难题,英伟达要求供应商调整机架设计,并与合作伙伴一起优化散热系统。尽管这种工程改进是大规模技术发布中的常规步骤,但也进一步推迟了产品交付时间。
英伟达发言人针对此事对路透社回应称,公司正与云服务提供商密切合作,设计调整属于正常研发流程的一部分。英伟达希望通过这种合作,确保最终产品在性能和可靠性方面达到预期,同时加紧解决技术瓶颈。
最新从报道中获悉,修订后的 Blackwell GPU 于今年 10 月底才进入量产,预计最快明年 1 月底出货。谷歌、Meta、微软等科技巨头依赖英伟达 GPU 训练其最强大的 AI 模型,其延期对这些客户的研发计划和产品发布造成的影响自然是不可避免。
今年 3 月,英伟达展示了 Blackwell 芯片,当时曾表示将在第二季度发货。
相关阅读:
《黄仁勋称英伟达 Blackwell 芯片曾存在设计缺陷,靠台积电力挽狂澜》
相关文章
- AI 可“听”出电池起火征兆,准确率达 94%
- 超 12000 公里,国产腔镜手术机器人完成远程手术、加速
- 英伟达新一代 Blackwell GPU 被曝存在过热问题,导致交
- 前谷歌 AI 研究员:ChatGPT 原本可以更早出现的
- 欧盟发布《通用人工智能业务守则》初稿:明确 AI 风险管
- 可口可乐发布首个完全由 AI 生成的广告:致敬 1995 年经
- 微软 GraphRAG AI 提效:改善数据检索,tokens 成本降低 7
- 雷蛇发布 Gaiadex:矿物级 AI 分解产品组件,5 分钟内生成
- 遏制电话诈骗新招:AI 老奶奶“废话反击”,40 分钟搞崩诈
- SU 哈佛亚马逊最新研究:量化能让大模型“恢复记忆”,删