提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
2024-11-04 07:10:53人工智能 IT之家 沛霖(实习)
官方宣称,HybridFlow 是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。
最新 11 月 3 日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。
官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。
该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。
目前,该论文已被 EuroSys 2025 接收,代码仓库也对外公开,最新附相关链接如下:
论文链接:https://arxiv.org/abs/2409.19256
代码链接:https://github.com/volcengine/veRL
赞一个! ()
相关文章
- 支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星
- 普渡发布 11 自由度五指灵巧手 PUDU DH11:单手最大提拉
- 华西医院联合华为数据存储发布“华西黉医”医学大模型
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发
- AI 生成游戏引争议:Oasis 模型涉嫌抄袭《我的世界》,且
- GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东
- 迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技
- 苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等
- 谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设
- 马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读