热闻岛
返回全网热点

两分钟上手生产级语音智能体:xAI 发布 Voice Agent Builder 测试版

1小时前3 阅读
两分钟上手生产级语音智能体:xAI 发布 Voice Agent Builder 测试版配图
在语音人工智能的应用开发领域,xAI 日前迈出了关键一步。该公司正式发布了 Voice Agent Builder 的测试版本,旨在将企业级语音智能体的搭建门槛大幅降低。这一零代码平台依托于 xAI 自研的 Grok Voice 模型,让开发者和运营者能够在短短两分钟内,便配置出一套功能完备的语音服务系统。 Voice Agent Builder 的核心优势

在语音人工智能的应用开发领域,xAI 日前迈出了关键一步。该公司正式发布了 Voice Agent Builder 的测试版本,旨在将企业级语音智能体的搭建门槛大幅降低。这一零代码平台依托于 xAI 自研的 Grok Voice 模型,让开发者和运营者能够在短短两分钟内,便配置出一套功能完备的语音服务系统。

Voice Agent Builder 的核心优势在于其高度集成的端到端架构。传统语音方案往往需要将语音转文字、大模型处理以及文字转语音等多个环节拼接而成,这不仅导致成本叠加,还增加了延迟与故障风险。相比之下,xAI 构建的是一条紧密耦合的统一路径,开箱即用地提供了包括电话通信、知识库检索、自动化工具接口、MCP 服务器连接以及全流程合规防护(Guardrails)在内的一站式能力。

两分钟上手生产级语音智能体:xAI 发布 Voice Agent Builder 测试版配图

在性能表现上,xAI 给出的数据极具说服力。在 τ-voice Bench 评测体系下,其核心模型 Grok Voice Think Fast1.0的得分达到了67.3%,显著领先于 Gemini3.1Flash Live(43.8%)与 GPT Realtime1.5(35.3%)。这一表现得益于该模型在面对复杂通话场景——如背景噪音、浓重口音及突发性打断时的针对性强化训练。

对于使用者而言,该平台的易用性是另一大亮点。用户只需用自然语言描述通话目标,并上传各类格式的文档,智能体便能自动完成知识整合。在业务执行层面,开发者可以轻松调用各类 API 连接器,实现诸如预约安排、订单状态查询甚至触发外部系统工作流等闭环操作。此外,平台支持80多种内置音色,并允许用户通过两分钟的音频样本进行个性化声音克隆。

两分钟上手生产级语音智能体:xAI 发布 Voice Agent Builder 测试版配图

在商业化定价方面,xAI 坚持了“透明且极简”的原则。平台不收取额外的平台使用费,仅按 API 计费,每分钟音频费用为0.05美元,如使用平台提供的电话服务,则额外收取0.01美元/分钟。每个账户还附赠一个免费电话号码,降低了从开发到生产阶段的门槛。

随着 Voice Agent Builder 的上线,xAI 正试图重塑语音智能体的商业价值链,通过 极致 的技术集成与透明的计费模式,为希望快速部署语音服务的企业提供了一个高效率的竞争选择。

要点速读

在语音人工智能的应用开发领域,xAI 日前迈出了关键一步。该公司正式发布了 Voice Agent Builder 的测

  • 在语音人工智能的应用开发领域,xAI 日前迈出了关键一步
  • 该公司正式发布了 Voice Agent Builder 的测
  • 更多细节仍在持续更新中