豆包大模型发布各领域技术进展,首次披露 300 万长文本能力
2024-12-31 07:11:20人工智能 IT之家 清源
字节跳动旗下豆包大模型今日对外公布了2024年全领域的技术进展,宣称自5月15日首次亮相的7个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
最新 12 月 30 日消息,字节跳动旗下豆包大模型今日对外公布了 2024 年全领域的技术进展,宣称自 5 月 15 日首次亮相的 7 个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
据介绍,截至 2024 年 12 月,最新版豆包通用模型 Doubao-pro-1215 综合能力较 5 月提升 32%,已全面对齐 GPT-4o,在数学、专业知识等部分复杂场景任务中,效果表现甚至更好,同时其推理服务价格仅为 GPT-4o 的八分之一。其经过海量数据优化及模型架构的创新,包括提升模型稀疏度、引入强化学习等,从而使该模型理解精度、生成质量大幅提升。
豆包还首次对外披露了其大模型 300 万字窗口的长文本能力。据介绍,其能够一次轻松阅读“上百篇”学术报告,每百万 tokens 处理延迟仅 15 秒。据最新了解,其背后包括 STRING 等上下文关联数据算法,能够大幅提升 LLM 利用海量外部知识的能力,稀疏化及分布式方案将时延降到十秒级。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责