OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍
2024-10-28 06:40:19人工智能 IT之家 漾仔
OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约 50 倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为 AI 文生图提供了新的方案。
最新 10 月 27 日消息,OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。
与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约 50 倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为 AI 文生图提供了新的方案。
目前业界通常使用扩散模型生成图片及音视频,但传统扩散模型的取样过程通常缓慢,通常需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们使用 SD“炼丹”绘图就需要等待特别长的降噪时间),这使得相应模型效率低下,不适合商业化应用。
虽然目前业界已出现一些技术以加快扩散模型的速度,但无非只是利用复杂训练过程“提纯”模型,或通过降低输出样本质量下降以提升效率。
而 OpenAI 研究团队则提出了一种名为 sCM 的文生图方案,这一生成模型方法绕开了传统扩散模型范畴,号称仅需两个取样步骤即可生成与扩散模型质量相当的高分辨率样本,极大缩短了生成时间。
最新获悉,sCM 训练方法主要利用预训练扩散模型蒸馏出来的知识直接打造模型,号称能够在缩短取样时间的同时保持高质量样本生成。
研究人员使用 ImageNet 512x512 数据集,利用 sCM 方法训练模型,号称能够生成细节丰富且高质量的图像,展示其在高分辨率生成方面的能力。尽管 sCM 只有两个取样步骤,生成样本的质量仍接近业界“最佳的扩散模型”,号称“差异不到 10%”。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责