百度发布文心 iRAG 文生图技术“去除 AI 味”,推出无代码开发“秒哒”工具
最新 11 月 12 日消息,在今日的 2024 百度世界大会上,百度创始人李彦宏发布了两项新的 AI 技术 —— 检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
李彦宏表示,文心大模型最新的日均调用量已经来到 15 亿,较半年前(2 亿调用量)增长至 7.5 倍。
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是 RAG,即检索增强。李彦宏表示,过去 24 个月对于大模型行业而言,最大的变化是“大模型基本上消除了幻觉”,回答问题的准确性大大地提升了。“让 AI 从一本正经的胡说八道变得可用,可被信赖”,他说。
不过,目前基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了 AI 的实用性。
针对上述问题,百度开发了检索增强的文生图技术 iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心 iRAG 技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。
李彦宏还在大会上发布了无代码工具“秒哒”。该工具支持无代码编程、多智能体协作和多工具调用三大特性,号称用自然语言就能搭建一整套系统。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。最新附演示内容如下:
告诉“秒哒”需求
需求:“我要为萝卜快跑的新技术发布会做个嘉宾邀请和管理系统,并且能收集他们的猜测和想法。”
0 号智能体(小组长智能体)
作为小组长进行规划调度,会将任务拆解并召唤各智能体来完成任务。
1 号智能体(策划智能体)
将策划设计解决方案拆分成:核心需求、内容结构、开发需求、数据收集四个子任务。
2 号智能体(小编智能体)
编辑邀请函中的所有文字和媒体内容,包括发布展望、时间地点信息、封面图等。
3 号智能体(程序员智能体)
写代码来制作和部署网页。
4 号智能体(质检员智能体)
检查代码 bug 并修复、进行代码测试。
“秒哒”生成邀请函
“秒哒”生成了邀请函,还可以根据需求更换画风。
后台查看报名信息
查看后台,报名信息已经在后台统计表格中。
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责