热闻岛
返回全网热点

谷歌 I/O 大会新动作:AI 创作工具升级,多模态生成更“听劝”

3小时前6 阅读
谷歌 I/O 大会新动作:AI 创作工具升级,多模态生成更“听劝”配图
在近期召开的 I/O 开发者大会上,谷歌正式对外发布了一系列针对 AI 创作工具的重要升级,核心目标非常明确:依托新一代 Gemini 模型家族,降低多媒体内容的创作门槛,让“创意落地”变得更高效。 此次升级的重头戏在于全新的 Gemini Omni 模型。作为谷歌在多模态领域的 最新 成果,该模型具备极强的跨模态理解与处理能力,能够无缝整合文本、图像、音频

在近期召开的 I/O 开发者大会上,谷歌正式对外发布了一系列针对 AI 创作工具的重要升级,核心目标非常明确:依托新一代 Gemini 模型家族,降低多媒体内容的创作门槛,让“创意落地”变得更高效。

此次升级的重头戏在于全新的 Gemini Omni 模型。作为谷歌在多模态领域的 最新 成果,该模型具备极强的跨模态理解与处理能力,能够无缝整合文本、图像、音频及视频等多种输入源,并直接生成连贯的视频内容。

最令创作者感到兴奋的,是其引入了“对话式编辑”功能。以往复杂的视频剪辑工作,如今只需通过自然语言进行描述即可完成。例如,用户如果想更换视频中的角色、调整画面光线,或者切换整体场景风格,只需向模型发出指令,AI 便能自动识别并执行相应的编辑任务,极大地简化了后期制作流程。

谷歌此举无疑是在向全球创作者释放信号:AI 工具正从单纯的“内容生成者”向“智能协作伙伴”转型。通过让模型学会“听懂”人类的语言需求,谷歌希望进一步提升多模态内容生成的专业度与创作灵活性。随着这一系列工具的逐步普及,创作者将能够更专注于创意本身,将繁琐的技术操作交给 AI 去完成。

要点速读

在近期召开的 I/O 开发者大会上,谷歌正式对外发布了一系列针对 AI 创作工具的重要升级,核心目标非常明确:依托新一代

  • 在近期召开的 I/O 开发者大会上,谷歌正式对外发布了一系列针对 AI 创作工具的重要升级,核心目标非常明确:依托新一代
  • 更多细节仍在持续更新中
  • 更多细节仍在持续更新中