谷歌近日推出了一种新的AI工具Whisk,用户可以通过其他图片生成新的图像,而不再需要长篇文本提示。用户可以上传多张图片来指定图像的主题、场景和风格。 此外,用户还可以在过程中填入文字以增加图像的额外细节。谷歌强调,Whisk是为快速视觉探索而设计的,而非精确编辑。 Whisk使用的是公司最新的Imagen 3图像生成模型,而视频生成模型Veo 2也同时推出,具备更好的电影语言理解能力。 Veo 2将首先在Google VideoFX平台上线,并计划在明年扩展到YouTube Shorts等产品。