Meta 推出 SPDL 工具:突破训练 AI 模型数据效率瓶颈,吞吐量提升 2-3 倍
最新 12 月 10 日消息,训练 AI 模型的瓶颈,目前不再仅仅是架构设计,数据管理效率也至关重要。Meta AI 最新推出了开源可扩展且高性能的数据加载(SPDL)工具,通过提升数据加载效率,最终加快 AI 训练速度。
SPDL 工具采用多线程技术,在常规 Python 解释器中(未启用 free-threading 选项)实现了高吞吐量,资源占用更低,并兼容 Free-Threaded Python。
核心优势
SPDL 包含任务执行器(流水线抽象)、构建流水线的实用工具以及高效且线程安全的媒体处理操作,其核心是异步事件循环,负责调度新任务和响应任务完成。SPDL 通过将同步操作委托给线程异步执行,实现真正的并发。
相比较传统基于进程(process)的处理方式,SPDL 工具升级改用基于线程(thread)的加载方式,有效避免了进程间通信的开销,显著提升了数据传输速度。
该工具的另一个亮点在于预取和缓存技术,确保 GPU 始终有数据可供处理,最大程度减少 GPU 空闲时间,提高系统整体效率。
无论是单 GPU 还是大型集群,SPDL 支持跨分布式系统工作,可以高效处理复杂任务;SPDL 工具还无缝兼容主流 AI 框架 PyTorch,方便团队快速采用。
性能
Meta 表示相比传统基于进程的方案,SPDL 吞吐量提升 2-3 倍;此外在禁用 GIL 的 Free-Threaded Python 环境中,SPDL 吞吐量提升 30%。
SPDL 提供性能监控和调优工具,方便用户深入了解数据加载过程并进行优化。
最新附上参考地址
Introducing SPDL: Faster AI model training with thread-based data loading
Meta AI Introduces SPDL (Scalable and Performant Data Loading): A Step Forward in AI Model Training with Thread-based Data Loading
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责