这篇文章主要讲什么？|在近期召开的 I/O 开发者大会上，谷歌正式对外发布了一系列针对 AI 创作工具的重要升级，核心目标非常明确

谷歌 I/O 大会新动作：AI 创作工具升级，多模态生成更“听劝”

3小时前6 阅读

在近期召开的 I/O 开发者大会上，谷歌正式对外发布了一系列针对 AI 创作工具的重要升级，核心目标非常明确：依托新一代 Gemini 模型家族，降低多媒体内容的创作门槛，让“创意落地”变得更高效。此次升级的重头戏在于全新的 Gemini Omni 模型。作为谷歌在多模态领域的最新成果，该模型具备极强的跨模态理解与处理能力，能够无缝整合文本、图像、音频

在近期召开的 I/O 开发者大会上，谷歌正式对外发布了一系列针对 AI 创作工具的重要升级，核心目标非常明确：依托新一代 Gemini 模型家族，降低多媒体内容的创作门槛，让“创意落地”变得更高效。

此次升级的重头戏在于全新的 Gemini Omni 模型。作为谷歌在多模态领域的最新成果，该模型具备极强的跨模态理解与处理能力，能够无缝整合文本、图像、音频及视频等多种输入源，并直接生成连贯的视频内容。

最令创作者感到兴奋的，是其引入了“对话式编辑”功能。以往复杂的视频剪辑工作，如今只需通过自然语言进行描述即可完成。例如，用户如果想更换视频中的角色、调整画面光线，或者切换整体场景风格，只需向模型发出指令，AI 便能自动识别并执行相应的编辑任务，极大地简化了后期制作流程。

谷歌此举无疑是在向全球创作者释放信号：AI 工具正从单纯的“内容生成者”向“智能协作伙伴”转型。通过让模型学会“听懂”人类的语言需求，谷歌希望进一步提升多模态内容生成的专业度与创作灵活性。随着这一系列工具的逐步普及，创作者将能够更专注于创意本身，将繁琐的技术操作交给 AI 去完成。

要点速读

在近期召开的 I/O 开发者大会上，谷歌正式对外发布了一系列针对 AI 创作工具的重要升级，核心目标非常明确：依托新一代

在近期召开的 I/O 开发者大会上，谷歌正式对外发布了一系列针对 AI 创作工具的重要升级，核心目标非常明确：依托新一代
更多细节仍在持续更新中
更多细节仍在持续更新中