简介
Google Veo是我们迄今为止最强大的视频生成模型。它可以生成超过一分钟的高质量 1080p 分辨率视频,具有多种电影和视觉风格。
它准确地捕捉提示的细微差别和基调,并提供前所未有的创意控制水平——理解各种电影效果的提示,例如延时或风景的空中拍摄。
我们的视频生成模型将有助于创建使每个人都可以进行视频制作的工具。无论您是经验丰富的电影制作人、有抱负的创作者,还是希望分享知识的教育家,Google Veo 都能为讲故事、教育等带来新的可能性。
在接下来的几周内,其中一些功能将通过 Labs.google 上的新实验工具 VideoFX 向选定的创作者开放。您现在可以加入候补名单。
将来,我们还将把 Google Veo 的一些功能引入 YouTube Shorts 和其他产品。
Google Veo功能特征:
更好地理解语言和视觉:
为了产生连贯的场景,生成视频模型需要准确地解释文本提示并将这些信息与相关的视觉参考相结合。
凭借对自然语言和视觉语义的深入理解,Google Veo 生成紧跟提示的视频。它准确地捕捉短语中的细微差别和语气,在复杂的场景中呈现复杂的细节。
电影制作控制:
当同时给出输入视频和编辑命令时,例如将皮划艇添加到海岸线的航拍照片中,Google Veo 可以将此命令应用于初始视频并创建新的编辑视频。
此外,它还支持遮罩编辑,当您向视频和文本提示添加遮罩区域时,可以更改视频的特定区域。
Google Veo 还可以生成一个视频,其中包含图像作为输入以及文本提示。通过提供参考图像与文本提示相结合,它可以让 Google Veo 生成遵循图像风格和用户提示说明的视频。
该模型还能够制作视频剪辑并将其延长至 60 秒甚至更长。它可以通过单个提示来完成此操作,也可以通过提供一系列提示来完成此操作,这些提示一起讲述一个故事。
视频帧之间的一致性
保持视觉一致性对于视频生成模型来说是一个挑战。角色、物体甚至整个场景可能会在帧之间闪烁、跳跃或意外变形,从而破坏观看体验。
Google Veo 的尖端潜在扩散变压器减少了这些不一致的出现,使角色、物体和风格保持在适当的位置,就像在现实生活中一样。
基于多年的视频生成研究
Google Veo 建立在多年的生成视频模型工作基础上,包括生成查询网络 (GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet 和 Lumiere,以及我们的 Transformer 架构和 Gemini。
为了帮助 Google Veo 更准确地理解和遵循提示,我们还在训练数据中的每个视频的字幕中添加了更多详细信息。为了进一步提高性能,该模型使用高质量的压缩视频表示(也称为潜在图像),因此也更加高效。这些步骤提高了整体质量并减少了生成视频所需的时间。
相关资讯
中国电信副总经理李峻:只有当人工智能成为公共基础设施,才能普惠大众
10月14日,在印度新德里举行的国际电信联盟(ITU)第五届全球标准研讨会上,中国电信副总经理李峻就“AI与元宇宙如何重塑我们的世界”议题分享了中国电信的实践与思考。李峻认为,只有当人工智能等革命性技术成为公
2025-02-06 14:56:59
中国海油“海能”人工智能模型发布
中国海油“海能”人工智能模型发布汪东进致辞 周心怀出席并讲话 俞进主持10月14日,中国海油“海能”人工智能模型发布会在集团总部召开。中国海油积极贯彻落实党和国家战略部署,推动数智技术与传统产业深度融合,与
2025-02-06 14:36:54
Adobe推出多款AI工具:可构建3D场景、消除路人、清洁镜头
据 The Verge 今天凌晨报道,Adobe 近期展示了多款实验性的 AI 工具,可用于动画制作、图像生成、照片及视频的优化等领域,未来有望被整合到 Creative Cloud 中。Project Scenic:该工具可让用户在使用 firefly
2025-02-06 14:16:51
媒体智能从人工智能到“专家”智能,大模型如何深度赋能智能媒体创新发展?
当前,全球大模型竞争日趋激烈,媒体智能化已经进入快速发展阶段。近一年来,我国智能媒体发展有何新动向、新实践与新趋势?10月15日,在2024中国新媒体大会“融合创新 智慧传播”技术应用论坛上,中国传媒大学新媒
2025-02-06 13:56:48
国安部提醒:AI融入生活,这些细节要警惕
央视网消息:据国家安全部微信公众号消息,当前,人工智能技术正以前所未有的速度融入我们生活的方方面面,在带来惊喜和便利的同时,也暴露出一系列风险隐患,如不注意防范,甚至可能危害国家安全。——AI工具泄露
2025-02-06 13:36:47