聚焦多模态交互与机器人 科大讯飞发布三大AI交互平台升级
大模型正在重新定义智能硬件。
从“听懂一句话”,到“理解一个场景”,再到“完成一项任务”,AI交互正从单一语音能力演进为融合视觉、语言、Agent与具身智能的综合能力,成为智能硬件与机器人发展的核心基础设施。
7月2日,在2026科大讯飞智能交互生态发布会上,科大讯飞发布AIUI交互平台、AIUI多语种交互平台及机器人超脑平台三项核心升级。
![[MD:Title]](/d/file/p/2026/07-03/14886b8d788fcd0c75b9ffb7ed7b7878.png)
从多模态交互到全球化部署,再到机器人规模化落地,三大平台共同构建起面向智能硬件与机器人时代的新一代AI交互基础设施。
AIUI交互平台升级,从语音交互迈向多模态AI交互
伴随大模型发展,语音交互正在发生新的变化。
用户需要的不再只是"听懂一句话",而是能够理解上下文、识别眼前场景,并结合视觉信息完成连续交互。基于这一趋势,AIUI完成近年来最大的一次升级,正式迈向多模态AI交互平台。
![[MD:Title]](/d/file/p/2026/07-03/d7ab5333cac87f1445474ac9f0e48878.png)
在语音能力方面,平台持续优化底层能力。针对低算力RTOS设备,AIUI进一步降低接入门槛,实现在100MHz主频、140KB存储条件下即可稳定运行;多模态降噪与全双工能力同步升级,通过融合语音与视觉信息,在复杂噪声环境中进一步提升识别稳定性,让设备真正做到"听得清"。
与此同时,平台开放100余种超拟人音色,升级语音合成模型,支持轻笑、停顿等副语言表达,并支持Prompt生成不同角色声音。结合数字形象表情动作生成能力,设备能够实现语音、情绪与视觉表达协同,进一步提升交互的自然度。
相比以往,最大的变化来自多模态能力。
AIUI融合视觉理解、图像生成及视觉语言模型,让设备不仅能够理解语音,还能够理解图片、感知场景,并根据自然语言生成图像内容,实现从"听懂语音"向"理解世界"的升级,为教育陪伴、互动娱乐、内容创作等场景提供更加丰富的交互体验。
![[MD:Title]](/d/file/p/2026/07-03/e9338df75e5269cca18805451b82ab94.png)
此外,平台同步推出AIUI Code及声学检测工具,形成覆盖能力接入、开发调试、效果验证的完整开发闭环,进一步降低开发成本。
AIUI多语种交互平台开放,为智能硬件全球化提供AI底座
随着越来越多中国智能硬件企业走向海外,真正需要解决的问题已经不仅是语言翻译,而是本地化交互体验。
不同国家和地区在语言习惯、网络环境、部署方式及数据合规等方面存在差异,企业往往需要投入大量资源完成系统整合。
此次发布会上,AIUI多语种交互平台正式开放,以"一站式、多语种、高效果、成本可控"为核心,为智能硬件企业提供覆盖AI交互全链路的能力。
![[MD:Title]](/d/file/p/2026/07-03/5875642a2d903b34b52aac5381829123.png)
平台支持40余种语言,并打通聊天、设备控制、知识问答、多语种翻译、多模态交互五大核心场景,让设备能够以更加符合当地语言习惯的方式与用户交流。
目前,平台已完成新加坡、东南亚、中东、欧洲、北美等区域节点部署,支持公有云及私有化部署,并适配GDPR、CCPA、PDPA等不同地区的数据合规要求。同时推出按台付费模式,结合测试资源、开发支持等服务,帮助企业更低成本实现全球部署。
机器人超脑平台升级,加速机器人走向真实产业场景
随着具身智能快速发展,机器人正从简单对话迈向复杂任务执行,对感知、理解和执行提出了更高要求。
此次升级中,机器人超脑平台围绕多模态交互与场景落地持续完善能力体系。平台融合全景摄像头、环形麦克风阵列等硬件,实现360°视听融合感知,在多人、高噪环境下依然能够精准识别目标用户;结合人脸识别、人体追踪、手势识别等能力,使机器人能够完成更加自然的连续交互。
![[MD:Title]](/d/file/p/2026/07-03/3b15d08291f35e0358a4b824fa4f4ad8.png)
围绕产业应用,平台进一步完善"通用能力+行业方案"体系,提供裸板接入、降噪板、封装麦板、多模态软核授权等多种接入方式,帮助开发者根据不同产品形态快速完成部署。
针对陪伴机器人、扫地机器人、康养机器人、四足机器人及人形机器人,平台同步推出行业解决方案,将语音、视觉、多模态感知等能力深度融合,加速机器人在家庭、康养、服务等真实场景中的规模化应用。
与此同时,平台推出麦克风阵列封装及多模态一体机,将语音、视觉、感知与交互能力进行一体化集成,进一步缩短开发周期、降低产品落地门槛。
![[MD:Title]](/d/file/p/2026/07-03/ca6e4fef70f80a9e5b2b338037d778ba.png)
发布会现场,搭载机器人超脑平台的专业级服务导览机器人Guide01同步亮相。Guide01集成自主导航、多模态感知及自然语言交互能力,可应用于零售、展馆、文旅等场景,展示了机器人从"能交流"迈向"能服务"的新阶段。
目前,机器人超脑平台已连接120家机器人客户及400家泛机器人生态伙伴,并持续通过开发者大赛、AI服务市场等方式推动机器人产业生态建设。
随着大模型持续向智能硬件与机器人产业深入渗透,AI交互正从单一能力升级为产业基础设施。
此次AIUI交互平台、机器人超脑平台升级及AIUI多语种交互平台的开放,不仅进一步完善了从多模态交互、全球部署到机器人场景落地的完整能力体系,也为智能硬件企业和机器人开发者提供了更加完整的AI交互底座,加速大模型能力走向更多真实产业场景。
《聚焦多模态交互与机器人 科大讯飞发布三大AI交互平台升级》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
苹果秋季新品发布会前瞻:美版iPhone 18 Pro将使用高通基带 支持毫米波频段
一年一度的苹果秋季新品发布会被称为“科技界的春晚”,届时都会推出新一代iPhone等备受期待的产品。而在发布会正式举行之前,关于iPhone新品的各种信息层出不穷,引起了广泛的关注与... -
茉莉奶白被LV起诉 法院一审判赔1030万
快科技7月2日消息,综合多家媒体报道,近日,江苏省苏州市中级人民法院就路易威登马利蒂(LV)诉深圳市茉莉奶白餐饮管理有限公司、吴中经济开发区东侠饮品店商标侵权纠纷案作出一审判决。法院... -
LED幕墙现巨型空调 制冷16°C还上下扫风 网友:太会整活了
快科技7月2日消息,近期广东持续高温,多地闷热难耐,深圳一处户外大屏创意画面引发网友热议。有市民途经深南大道时发现,路边巨型LED幕墙循环播放着一台空调画面,视觉效果十分逼真。画面... -
AI已出现欺骗行为 联合国发出警告:超出监管能力
快科技7月2日消息,据媒体报道,联合国官网发布公告,由40位全球顶尖科学家及专业人士组成的联合国人工智能独立科学小组,正式发布首份专项报告。该报告系统梳理了人工智能的发展机遇与潜在风险... -
前方64874杯制作中!霸王茶姬0元购乌龙致歉 网友不买账
快科技7月2日消息,今日,多位网友在社交平台发帖称,霸王茶姬武汉多家门店出现0元购,突然涌入数万杯订单,引发热议。据多名网友反映,这些订单主要集中在7月2日凌晨1点多到2点之间,0元购涉...











