阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
2024-12-15 07:32:24人工智能 IT之家 浩渺
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
感谢最新网友 Skyraver、風見暉一 的线索投递!
最新 12 月 14 日消息,阶跃星辰昨日在公众号宣布推出 Step-1o 千亿参数端到端语音大模型,据称是“国内首个千亿参数端到端语音大模型”。
据阶跃星辰介绍,传统的语音模型采用级联方案,用户输入的语音信息需要先转化为文本,再二次转化成语音输出,这个过程不仅会降低传输效率、更会在过程中折损掉包括情绪在内的信息,导致语音模型时延长反应慢、回答质量和智能水平不足、情感表达空洞刻板的缺陷。但端到端的语音方案,可以实现语音理解和生成的一体化,提升模型智商和情商的上限。
最新从官方介绍获悉,Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征;
Step-1o 能够通过自学和模仿不断提升回复质量,既能提供解决问题的专业建议,也能作为提供高情绪价值的陪伴。此外,Step-1o 还传承了阶跃星辰语言大模型的创作能力。
阶跃星辰透露,近期,Step-1o 将接入跃问 App 端,为用户提供实时语音通话服务。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责