热闻岛
AI 音频编辑迈入新纪元:腾讯混元联合多家顶尖机构发布 MMAE 基准,当前模型精准编辑能力不足 5%
AI新闻

AI 音频编辑迈入新纪元:腾讯混元联合多家顶尖机构发布 MMAE 基准,当前模型精准编辑能力不足 5%

2026年6月8日 18:072 阅读
人工智能在音频生成领域已取得显著进展,但“编辑”现有音频的能力仍面临巨大挑战。近日,腾讯混元(Tencent Hy)联合上海交通大学(SJTU)、新加坡南洋理工大学(NTU)、天津大学(TJU)、北京大学(PKU)、复旦大学(FDU)等多家 顶尖 科研机构,共同推出了 MMAE(Massive Multitask Audio Editing Benchmar

人工智能在音频生成领域已取得显著进展,但“编辑”现有音频的能力仍面临巨大挑战。近日,腾讯混元(Tencent Hy)联合上海交通大学(SJTU)、新加坡南洋理工大学(NTU)、天津大学(TJU)、北京大学(PKU)、复旦大学(FDU)等多家 顶尖 科研机构,共同推出了 MMAE(Massive Multitask Audio Editing Benchmark) ——首个针对通用指令驱动音频编辑的大规模多任务基准测试集。这一发布为 AI 音频编辑领域提供了系统性评估标准,凸显了当前技术在精准修改方面的明显短板。

从“生成”到“编辑”:AI 音频能力的真正考验

传统音频 AI 多聚焦于从文本或提示生成新内容,而 MMAE 基准的核心在于要求模型 理解现有音频片段,并根据自然语言指令进行精准修改 :仅改变需要调整的部分,保持其他内容完全不变。这种“编辑而非重构”的能力,对音频保真度、指令遵循性和上下文理解提出了更高要求,更贴近真实应用场景,如播客后期处理、音乐混音或语音个性化定制。

测试显示,当前主流模型在 ** 精确匹配率(Exact Match Rate, EMR)** 上普遍低于5%,揭示出可靠音频编辑技术仍存在重大差距。这意味着 AI 在实际编辑任务中容易出现过度修改、遗漏指令或破坏原始音质等问题。

MMAE 基准亮点:覆盖真实场景的多维度评估

MMAE 基准设计全面而严谨,主要包含以下核心要素:

AIbase 点评 :MMAE 不仅是技术评估工具,更是推动音频 AI 从“生成式”向“编辑式”转型的重要里程碑。它为研究者和开发者提供了统一标尺,有望加速下一代音频编辑模型的迭代。

未来展望:音频编辑或成 AI 多模态核心竞争力

随着多模态大模型的快速发展,精准音频编辑将在内容创作、影视后期、无障碍辅助等领域发挥关键作用。腾讯混元等机构的此次合作,展现了中国 AI 研究在音频领域的领先布局。业界期待更多开源资源和后续模型跟进,共同填补这一技术空白。

声明:本文仅代表作者观点,不代表本平台立场

评论 (0)

登录后即可发表评论

去登录
暂无评论,快来抢沙发

相关推荐

AI日报:微信开放平台发布AI生态接入指引;月之暗面再融资20亿美元;ChatGPT紧急上线封锁模式
AI新闻

AI日报:微信开放平台发布AI生态接入指引;月之暗面再融资20亿美元;ChatGPT紧急上线封锁模式

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、微信开放平台发布AI生态接入指引,小程序可支持微信AI直接调用 微信开放平台发布《关于开发者接入微信AI生态的指引》,为小程序开发者提供便捷接入微信AI生态的能力,标志着微信加速构建智能交互生态。 2、高

917 小时前
披着便利外衣的陷阱!国安部鸣枪警告:警惕“AI中转站”四大致命风险
AI新闻

披着便利外衣的陷阱!国安部鸣枪警告:警惕“AI中转站”四大致命风险

随着人工智能应用需求的爆发式增长,批量提供海内外大模型访问服务的“AI中转站”在网络上迅速走红。这类平台通过统一整合各大厂商的应用程序接口(API),充当起用户与大模型之间的“中介”。 它们凭借着无需切换模型、使用价格低廉以及支付方式便捷等特点吸引了大量用户,甚至还能帮助部分人绕过合规限制。然而,国家安全部近日发文特别提醒,当前该市场鱼龙混杂,其中暗藏的数据

717 小时前
月之暗面再度融资 20 亿美元,估值飙升至 300 亿
AI新闻

月之暗面再度融资 20 亿美元,估值飙升至 300 亿

在人工智能领域的竞争愈发激烈之际,知名初创公司 “月之暗面”(Moonshot AI)正在积极寻求新一轮融资,目标金额高达 20 亿美元。这一融资计划若成功实施,将使其估值达到 300 亿美元,相较于去年 12 月的估值暴涨七倍之多,令人瞩目。 根据彭博社的报道,这家开发了知名聊天机器人 Kimi 的公司,正在与多家潜在投资者进行初步接洽,预计至少将募集到

717 小时前
​谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划
AI新闻

​谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划

近日,有关谷歌 Chrome 浏览器在 最新 金丝雀版本中测试一项新功能的消息引发广泛关注。该功能允许用户在地址栏中输入搜索词时,直接进入 AI 模式,而不是跳转到传统的 Google 搜索页面。此消息最初由 Windows Report 报道,随后谷歌对此进行了回应。 谷歌确认,此项功能的测试实际上是一个错误,并且没有计划将其设为默认行为。根据谷歌的说明,

817 小时前