
告别“翻译腔”:Gemini 3.5 实时语音翻译模型正式发布
跨语言沟通正迎来一场技术范式的重塑。近日,谷歌发布了全新的音频模型 Gemini3.5Live Translate,旨在通过先进的实时语音到语音(Speech-to-Speech)技术,打破语言沟通的地理与文化藩篱。该模型现已集成至 Google AI Studio、Google 翻译以及 Google Meet 等核心产品矩阵中。 Gemini3.5Liv
跨语言沟通正迎来一场技术范式的重塑。近日,谷歌发布了全新的音频模型 Gemini3.5Live Translate,旨在通过先进的实时语音到语音(Speech-to-Speech)技术,打破语言沟通的地理与文化藩篱。该模型现已集成至 Google AI Studio、Google 翻译以及 Google Meet 等核心产品矩阵中。
Gemini3.5Live Translate 的核心突破在于对“自然度”的 极致 追求。与传统翻译工具那种“说完一句、翻译一句”的轮流式滞后体验不同,该模型能够实现近乎实时的同传效果。它在持续生成译文的同时,能够精准捕捉并还原说话人的原始语调、节奏和音高。通过巧妙平衡“等待更多上下文以提升准确性”与“实时输出以保持同步”之间的关系,Gemini3.5将沟通延时压缩至仅有几秒,大幅减少了对话中的尴尬停顿。
在应用场景上,谷歌赋予了该模型 极高 的灵活性。它支持超过70种语言的自动识别与互译,且无需用户手动进行繁琐的语言配置。即便是在嘈杂或复杂的声学环境中,该模型依然能够保持稳定的表现。对于开发者,谷歌开放了 Gemini Live API,便于将语音同传能力嵌入多语种电话、在线教育及直播解说等多元化场景中。目前,出行平台 Grab 已率先试用,在处理每月千万量级的司乘实时沟通中,验证了模型在翻译质量与低延迟上的出色表现。
针对企业协作,Gemini3.5Live Translate 即将全面重构 Google Meet 的翻译体验。未来,会议支持的语言对组合将从有限的几种扩展至2000多种,彻底告别“仅限英语枢纽”的单一模式。此外,面向移动端用户,谷歌翻译应用在支持耳机实时翻译的基础上,还新增了“听筒聆听模式”,让用户在不便佩戴耳机的公共场合,也能通过手机听筒低调、私密地获取译文。
在追求技术高效的同时,谷歌也未忽视安全与合规。所有由 Gemini 系列模型生成的音频内容均嵌入了 SynthID 数字水印,能够以不可感知的方式标识 AI 生成属性,从而有效防范信息误导与滥用风险。随着 Gemini3.5Live Translate 的逐步铺开,跨越语言障碍的实时沟通,正在从科幻构想变为触手可及的现实。
相关推荐
Prompt 该退环境了?未来属于 Loop Engineering
最近,AI 圈又被一个新词刷屏:Loop Engineering。 它不是换个英文名装高级。它背后说的是一件很现实的事:我们和 AI 的关系,正在从“我问一句,你答一句”,变成“我搭好系统,你持续干活”。 以前,高手比的是提示词。谁能把问题

皮肤问题心中没底?“AI问诊+医生复核”新模式上线
近日,健康类AI应用“蚂蚁阿福”对其“拍皮肤”功能进行了重磅升级,为用户带来了更专业、更安心的咨询体验。此次更新后,AI对皮肤病种类的识别能力从早期的50种大幅跃升至100多种,基本覆盖了99%的线上就医常见皮肤问题。 除了技术层面的迭代,该应用还引入了“医生把关”这一创新服务。用户在使用AI获取初步分析结果后,如果仍有疑虑,可以选择邀请全国三甲医院的专业医

豆包上线“任务模式”:支持多轮搜索与PPT自动化生成
字节跳动旗下AI对话助手豆包日前正式上线“任务模式”入口,这一升级标志着其从单一的文本交互工具向具备复杂工作流处理能力的AI Agent(智能体)演进。作为豆包在产品功能上的重要拓展,“任务模式”核心主打多轮搜索、深度推理、浏览器自动化操作以及多模态内容生成。 在实际运行中,该模式能够主动将用户的宏观目标拆解为多个子任务,随后通过联网搜索、调用浏览器实时抓取

雨果奖作家新书惹争议!主动承认AI写作比重竟占一半
近日,知名科幻作家、雨果奖得主郝景芳在接受媒体采访时透露,在其今年 最新 出版的少儿科幻小说系列《银河学院》中,人工智能写作的内容比例已经高达50%。这一公开表态随即在网络上引发了巨大震动,并在各大社交平台迅速发酵。 令人啼笑皆非的是,郝景芳还透露出版社的编辑此前曾对该书的质量赞不绝口,甚至一个劲地夸奖她今年写得好。同时她也坦言,在书籍出版进入市场后,普通读
《LangChain 系列》Long-term Memory:跨会话如何记住用户偏好?
1. 长期记忆到底是什么? 短期记忆解决“这轮对话怎么接上”。长期记忆解决“这个用户下次再来,我还认不认识他”。 在 LangChain / LangGraph 里,短期记忆通常跟 thread 绑定;长期记忆放在 Store 里,按 na

“AI教父”神预言?Anthropic因长期唱衰自家产品反遭美国出口管制
据商业内幕报道,人工智能巨头Anthropic因频繁警告自家产品的潜在风险而陷入困境。该公司首席执行官达里奥·阿莫代伊近期多次公开撰文,宣称其 最新 发布的模型对网络安全和国家安全构成了非常真实的风险。 然而这种长期的安全警告并未换来预期的理解,反而引发了美国政府的强烈反弹。就在上周五,特朗普政府突然下令对该公司实施严厉的出口管制,要求其必须立即阻止所有外国
阅读补充
一句话看懂
跨语言沟通正迎来一场技术范式的重塑。近日,谷歌发布了全新的音频模型 Gemini3.5Live Translate,旨在通过先进的实时语音到语音(Speech-
事件背景
热闻岛基于公开信息整理事件背景、主要进展与后续关注方向。
事件时间线
2026-06-10
相关信息进入公开传播
2026-06-10
热闻岛对内容进行整理与补充。
看点
- · 最新进展是什么
- · 相关主体如何回应
- · 后续影响还有哪些
后续关注
- · 权威信息更新
- · 相关主体回应
- · 事件后续影响
免责声明:本文仅代表作者观点,不构成投资建议、法律建议、医疗建议。财经类内容尤其需要注意风险;爆料类信息请以权威通报为准。
评论 (0)
登录后即可发表评论
去登录