谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
2024-12-18 07:01:45人工智能 IT之家 远洋
谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
最新 12 月 17 日消息,谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
使用 Whisk 时,用户可以为主题、场景和风格分别提供多张图像作为提示。(当然,用户仍然可以选择使用文字提示。)如果手头没有合适的图像,用户还可以点击骰子图标,由谷歌自动填充一些图像作为提示(这些图像似乎也是 AI 生成的)。此外,用户还可以在流程的最后阶段在文本框中输入一些文字,以添加关于目标图像的额外细节,但这并非必需步骤。
Whisk 随后会生成图像,并为每张图像生成相应的文本提示。如果用户对生成结果满意,可以选择收藏或下载图像;如果需要进一步调整,则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。
最新注意到,谷歌在一篇博文中强调,Whisk 的设计初衷是“快速的视觉探索,而非像素级的精细编辑”。该公司还表示,Whisk 可能会出现“偏差”,因此允许用户编辑底层的提示。
据体验者称,在短暂的使用过程中,Whisk 带来了有趣的体验。图像生成需要几秒钟的时间,虽然生成的图像有时会有些奇怪,但所有生成的内容都易于迭代修改。
谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 图像生成模型,该模型也于今日发布。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责