谷歌推出新AI模型Veo，瞄准电影制作人

2024-05-14 科技汇总

Source: The Verge

自OpenAI展示了引人入胜的文本到视频AI“Sora”以来已经过去了三个月，现在谷歌试图窃取一些风头。谷歌在周二的I/O开发者大会上宣布，他们的最新生成式AI视频模型Veo可以生成“高质量”的1080p分辨率视频，长度一分钟以上，采用各种视觉和电影风格。根据谷歌的新闻稿透露，Veo具有“先进的自然语言理解”，使该模型能够理解“延时摄影”或“航拍景观”等电影术语。用户可以通过文本、图像或视频提示指导所需的输出，谷歌称最终生成的视频“更加连贯和一致”，在镜头中展现人、动物和物体更真实的移动。

谷歌DeepMind首席执行官Demis Hassabis在周一的新闻预览会上表示，可以使用额外提示改进视频结果，谷歌正在探索更多功能，使Veo能够生成故事板和较长的场景。和许多这类AI模型预览一样，大多数希望尝试Veo的人可能会需要等待一段时间。谷歌称他们正在邀请一些电影制作人和创作者与该模型进行实验，以确定如何最好地支持创意，并将在这些合作中不断改进，以确保“创作者在谷歌开发的AI技术中发表自己的意见。一些Veo功能还将在未来几周内提供给“选择的创作者”在VideoFX中私下预览 — 您可以在此处等待列表中注册，提前尝试一下。

此外，谷歌还计划将一些功能添加到YouTube Shorts中。这是谷歌在过去几年中制作的几个视频生成模型之一，从Phenaki和Imagen Video — 后者产生粗糙、常常扭曲的视频剪辑 — 到今年1月展示的Lumiere模型。后者是我们在Sora 2月份发布之前看到的最令人印象深刻的模型之一，谷歌表示Veo甚至更擅长理解视频内容、模拟真实世界的物理，生成高清输出等。

与此同时，OpenAI已经将Sora推向好莱坞，计划于今年晚些时候向公众发布，该公司在3月份曾经预告，可能在“几个月内”就能推出该产品。该公司还已经在考虑将音频融入Sora，并可能使该模型直接在像Adobe的Premiere Pro这样的视频编辑应用程序中可用。鉴于Veo也被推测为电影制作人的工具，OpenAI的领先优势可能会加大谷歌项目的竞争难度。

在AI技术逐渐融入影视行业的今天，专注于影片生成的新模型竞争激烈，创新和先发优势或许能决定竞争的胜负。

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://www.theverge.com/2024/5/14/24156255/google-veo-ai-generated-video-model-openai-sora-io https://www.technologyreview.com/2024/03/28/1090266/how-three-filmmakers-created-soras-latest-jaw-dropping-videos/ https://www.technologyreview.com/2024/03/28/1090252/whats-next-for-generative-video/

更多阅读

谷歌推出新AI模型Veo，瞄准电影制作人

微软在最新Windows 11更新中终止混合现实支持

科学编辑质疑Meta关于社交媒体非极化主张的可信度

波音解雇高级管理人员，反映公司危机与新战略

Nvidia计划在2025年CES发布RTX 5070与RTX 5090同台亮相

亚马逊计划到2025年将同日处方药配送扩展至美国近一半地区

减少卡路里摄入可以延长寿命：大规模小鼠研究揭示原因（音频）

任天堂推出新款闹钟可用塞尔达和超级马里奥音效唤醒

三星与Ashley家具合作推出智能家居体验

Cheetos食物染料使小鼠变透明的研究发现

Nvidia RTX 5090将配备32GB显存和高功耗需求（音频）

谷歌限制俄罗斯用户新账户创建

OpenAI称与中国有关的团体试图对其员工进行网络钓鱼攻击

新JWST数据探讨宇宙膨胀率的‘哈勃常数’张力（音频）

美国如何在太阳能竞争中输给中国

微软将《光环》开发迁移至虚幻引擎5，开启新篇章（音频）

谷歌推出新AI模型Veo，瞄准电影制作人

微软在最新Windows 11更新中终止混合现实支持

科学编辑质疑Meta关于社交媒体非极化主张的可信度

波音解雇高级管理人员，反映公司危机与新战略

Nvidia计划在2025年CES发布RTX 5070与RTX 5090同台亮相

亚马逊计划到2025年将同日处方药配送扩展至美国近一半地区

减少卡路里摄入可以延长寿命：大规模小鼠研究揭示原因（音频）

任天堂推出新款闹钟 可用塞尔达和超级马里奥音效唤醒

三星与Ashley家具合作推出智能家居体验

Cheetos食物染料使小鼠变透明的研究发现

Nvidia RTX 5090将配备32GB显存和高功耗需求（音频）

谷歌限制俄罗斯用户新账户创建

OpenAI称与中国有关的团体试图对其员工进行网络钓鱼攻击

新JWST数据探讨宇宙膨胀率的‘哈勃常数’张力（音频）

美国如何在太阳能竞争中输给中国

微软将《光环》开发迁移至虚幻引擎5，开启新篇章（音频）

任天堂推出新款闹钟可用塞尔达和超级马里奥音效唤醒