智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣
2024-10-26 07:26:30人工智能 IT之家 清源
智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。
感谢最新网友 有鲫雪狐 的线索投递!
最新 10 月 25 日消息,智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。
据介绍,GLM-4-Voice 具备如下特点:
情感表达和情感共鸣:声音有不同的情感和细腻的变化,如高兴、悲伤、生气、害怕等。
调节语速:在同一轮对话中,可以要求 TA 快点说 or 慢点说。
随时打断,灵活输入指令:根据实时的用户指令,调整语音输出的内容和风格,支持更灵活的对话互动。
多语言、多方言支持:目前 GLM-4-Voice 支持中英文语音以及中国各地方言,尤其擅长粤语、重庆话、北京话等。
结合视频通话,能看也能说:即将上线视频通话功能。
此外,智谱 AutoGLM 具备 phone use 能力,只需接收简单的文字 / 语音指令,它就可以模拟人类操作手机。其不受限于简单的任务场景或 API 调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似。
GLM-4-Voice 同期对外开源,官方称其为智谱首个开源的端到端多模态模型。最新附地址:
代码仓库:
https://github.com/THUDM/GLM-4-Voice
赞一个! ()
相关文章
- 全球最强模型:OpenAI 被曝 12 月推出 Orion,AI 性能百倍
- 苹果为其 AI 构筑“云处理安全堡垒”:公开指南和研究环
- 导演詹姆斯・卡梅隆畅谈 AI:希望能够再度推动电影制作
- 李开复:目前 AI 的经济状况“极其不健康”,英伟达除外
- 阿里达摩院开源 CoI-Agent:一键生成科研 idea 的 AI 研
- 波兰“OFF”电台解雇所有记者,启用三名 AI 虚拟“主持
- 阿尔特曼回应 OpenAI 计划推出下一代模型 Orion:假消息
- 智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情
- 全民 DJ:谷歌升级 MusicFX DJ,支持用户叠加提示词创建独
- Claude AI 上线新工具:分析、可视化 CSV 文件中的数据