告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频
2024-11-09 07:10:38人工智能 IT之家 清源
相比于原有模型,CogVideoX v1.5 将包含 5/10秒、768P、16 帧的视频生成能力,I2V模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。
感谢最新网友 HH_KK 的线索投递!
最新 11 月 8 日消息,智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力,I2V 模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。
官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合,“新清影”将具备如下特性:
质量提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
超高清分辨率:支持生成 10s、4K、60 帧超高清视频。
可变比例:支持任意比例,从而适应不同的播放场景。
多通道输出:同一指令 / 图片可以一次性生成 4 个视频。
带声效的 AI 视频:新清影可以生成与画面匹配的音效。
最新附开源地址如下:
代码:
https://github.com/thudm/cogvideo
模型:
https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责