阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
2024-12-01 07:23:43人工智能 IT之家 清源
该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义App。
最新 11 月 30 日消息,阿里云通义万相团队本周推出了全新的图像编辑模型 ACE,通过一句话,用户即可生成图片和修改图片。该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义 App。
据官方介绍,ACE 模型可同时支持文生图和图像编辑,用户输入口语化指令可完成可控视觉编辑、元素编辑、区域重绘编辑、分层编辑(最新注:如下图,将图中特定对象进行风格化处理)等任务,仅用对话的方式就能实现 PS 的功能,例如输入文字即可一键除水印、修改证件照背景等。
该团队提出了 Long-context Condition Unit 模块(LCU),能支持通用编辑任务所需的各种多模态条件输入,并且搭建了全面的编辑成对数据构造链路和指令集生成链路,最终达到精准、高质量的图像指令编辑效果。
开源地址:
魔搭社区:https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
Github:https://github.com/ali-vilab/ACE
Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责