Voice Agent

产品概述

Voice Agent 是一款智能语音对话机器人。您可以通过本系统配置一个具有特定身份、声音和知识的AI客服,并为其分配电话号码。
当客户拨打该号码时,AI将自动接听,并利用内置工具与知识库,以拟人化的语音与客户进行自然流畅的对话,高效处理查询、订单、物流等常见客服场景。

模块详解

基础配置

在创建Agent前,需在 Voice Agent -> 【设置】中完成基础资源配置。

电话号码管理

  • 路径:设置 > 电话号码
  • 功能:管理可用于Voice Agent的电话号码。
  • 列表字段:名称、电话号码、描述、更新时间、关联的Agent。
  • 关键操作:
  • +添加号码:号码名称/描述:仅用于内部识别。电话号码:下拉列表仅显示已绑定到当前店铺且未被其他Agent占用的号码。
  • 号码名称/描述:仅用于内部识别。
  • 电话号码:下拉列表仅显示已绑定到当前店铺且未被其他Agent占用的号码。
  • Voice Agent分配:可在此处将该号码关联到特定Agent。(一个号码只能绑定一个Agent)
  • 编辑/删除:删除限制:若号码已被任何Agent指定为呼叫转移的目标,则不可删除,系统会提示“当前号码已被Agent指定为转接对象,暂不允许删除”。
  • 删除限制:若号码已被任何Agent指定为呼叫转移的目标,则不可删除,系统会提示“当前号码已被Agent指定为转接对象,暂不允许删除”。

SIP Trunk管理

  • 路径:设置 > SIP Trunk
  • 功能:配置SIP Trunk,用于更灵活的企业级语音通信对接。
  • 列表字段:名称、服务器地址、端口号、类型(呼入对接/外呼转接)、创建时间。
  • 关键操作:
  • 添加SIP Trunk:需填写名称、服务器地址、端口号和选择类型。SIP Trunk类型:外呼转接trunk、呼入对接trunk;目前仅作标识分类使用,暂无其他区分;
  • SIP Trunk类型:外呼转接trunk、呼入对接trunk;目前仅作标识分类使用,暂无其他区分;
  • 编辑/删除:删除限制同电话号码,需确保未被任何Agent的转接动作引用。

Webhook管理

  • 路径:设置 > Webhooks
  • 功能:将通话事件(开始、结束)实时推送到客户自有服务器或第三方系统;
  • 关键配置:
  • 适用Agent :哪些Agent的通话事件会被推送;
  • 端点URL:接收事件的服务器地址。
  • 订阅事件:必选,支持“通话开始”、“通话结束”。
  • Body/Headers:支持自定义推送内容格式和请求头。
  • 验证:可配置认证信息。
  • 测试功能:提供“测试Webhook”按钮,系统会使用模板数据(或者配置的body内容)来帮助使用者测试配置是否正确。
  • 日志查看:可查看每次推送的请求状态、事件ID和详细内容,便于排查问题。
Agent 创建与配置

Agent 创建与配置

Agent创建

  • 创建Agent:点击“+添加”,选择“空白模板”。
  • Agent卡片信息:展示名称、头像、描述、语言、关联号码数量、总通话数。
  • 操作:复制:快速克隆一个现有Agent,名称自动添加“-复制”后缀。删除:若Agent已绑定电话号码,则不可删除,需先解绑。
  • 复制:快速克隆一个现有Agent,名称自动添加“-复制”后缀。
  • 删除:若Agent已绑定电话号码,则不可删除,需先解绑。

Agent基本设置

  • 姓名/描述:Agent的标识。
  • 语言:作为Agent的第一语言/主语言。对话时优先使用,开始语优先使用,并在无法识别用户语言时兜底。
  • 时区:当对话内容中涉及时间时,会遵循Agent的时区;
  • 音色:从TTS支持的音色库中选择,支持试听。
  • 口音不限制语言,比如选择一个口音为英语的角色来说中文也是可以的,但效果可能不如口音为中文的角色效果好;(可根据实际测试选择对应的音色)

通话设置:

  • 最大通话时长:取值范围60-3600秒,默认3600秒;超时会播报完提示话术后,自动挂断。
  • 静音结束通话:取值范围10-600秒,默认60秒;检测到用户长时间静音后,若配置了挂断话术,则播完话术后自动挂断;

语音设置:

  • 背景音:可选择预设环境音(营造真实的客服服务环境),或保持“静音”。

Agent 提示词

提示词:这是Agent的“大脑”,定义其核心行为和对话规则。
  • 欢迎信息:AI代理启动(动态):由AI自由发挥开场白。AI代理启动(定义消息):使用固定的开场白,限300字符。联系人发起:AI保持沉默,等待用户先开口。
  • AI代理启动(动态):由AI自由发挥开场白。
  • AI代理启动(定义消息):使用固定的开场白,限300字符。
  • 联系人发起:AI保持沉默,等待用户先开口。
  • 提示词编辑:默认提示词:系统提供基础模板,可以支持一键恢复至默认(重置)
  • 默认提示词:系统提供基础模板,可以支持一键恢复至默认(重置)
  • 插入变量与动作:输入 /可插入:变量:系统变量(CDP-客户基础属性变量)或通过“提取信息”action获取的实体变量(格式:动作名_变量名)。action:所有“触发时机”为“大模型调用”的action。这是将工具能力融入对话流的关键。
  • 变量:系统变量(CDP-客户基础属性变量)或通过“提取信息”action获取的实体变量(格式:动作名_变量名)。
  • action:所有“触发时机”为“大模型调用”的action。这是将工具能力融入对话流的关键。
  • 编写:支持基础的markdown 格式

Agent-Actions 

动作是Agent的“工具包”,是其实现自动化的核心。
  • 触发时机:通话中:通话开始即自动执行。比如,通话一开始就给用户发一封邮件;通话后:通话结束后执行。比如,通话一旦挂断就给用户发一个短信;大模型调用:被Agent调用才会执行,灵活性最高。支持:插入到提示词,规定何时被调用
  • 通话中:通话开始即自动执行。比如,通话一开始就给用户发一封邮件;
  • 通话后:通话结束后执行。比如,通话一旦挂断就给用户发一个短信;
  • 大模型调用:被Agent调用才会执行,灵活性最高。支持:插入到提示词,规定何时被调用
  • 支持:插入到提示词,规定何时被调用
当用户咨询订单时,请先向用户索要用于查询订单状态的订单号,再调用「查询订单」工具,查询用户的订单情况
  • 动作来源:内部MCP工具:系统内置工具。MCP:从MCP管理模块中添加的工具。
  • 重点动作详解:
结束通话
系统内置动作,Agent调用;添加后可直接被提示词引用。Agent可调取该工具查询用户的订单情况。  如:在提示词中编写,“当用户表达挂断电话的诉求,如“你挂了吧”时,调用「结束通话」action来自动挂断电话”
呼叫转移
即“转接”;支持转接到配置好的SIP
  • 转接目标:可指定已配置的SIP
  • 转接延迟:0-10秒
  • 交接指令填写“交接指令”,转接时AI会向人工简要总结当前对话,转接总结的内容会在转接给人工时在对话卡片中展示
  • 填写“交接指令”,转接时AI会向人工简要总结当前对话,转接总结的内容会在转接给人工时在对话卡片中展示
订单查询
  系统内置动作,Agent调用;添加后可直接被提示词引用。在满足提示词约定的条件后,Agent可调取该工具查询用户的订单信息(同Email Agent)
提取信息(实体提取)
  • 核心配置:“应该提取哪些信息”字段是给AI的指令,需清晰描述要提取的内容(如“用户的订单号”)。
  • 信息类型:支持文本、数字、是/否、多选。
  • 触发时机影响:选择“通话后”,提取的信息会随Webhook推送。
  • 提取实体可以自行配置:
序号触发时机提取说明提取示例
1通话后在配置好需要提取的信息后,当对话结束转录完成,系统会根据提取实体的要求提取对话中符合要求的实体信息,这些信息会随着webhook一起推送;如:(多选)提取用户的情绪:【满意】【不满意】【中性】通话后提取到用户的情绪为【不满意】,则提取的信息会被随webhook一起推送(前提是webhook的触发时机是通话后)
2Agent调用在配置好需要提取的信息后,可以将该action根据需要插入到提示词中【示例提示词片段】:“...请实时监控对话,调用【提取实体-用户信息】工具,提取订单号、产品问题等实体。如果信息齐全,直接回答问题;如果缺失关键实体,请自然地进行追问...”
同时:Agent如果发生了转接,会将【Agen调用】提取到的实体内容,一同呈现给转接的人工,便于信息交接和防止重复询问;
通话后提取的内容,除了随webhook发送,还会在通话完成后,展示在详细的通话记录中
更新客户信息
  • 可以将通过实体提取的信息,赋值更新到CDP已有的客户属性信息上;
  • 通话中、通话结束、Agent调用均可
  如:在对话中提取了用户的邮箱,并将其更新到用户的【客户邮箱】字段
更新客户标签
  • 默认Agent调用;在满足提示词约束的条件后触发,可按配置好的内容来更新客户的标签;
  如:若用户多次表达了负面情绪,就调用「更新客户标签-投诉」来更新用户的标签
发送短信
在指定触发时机,给用户发一封短信;可由通话中、通话后、大模型调用 时机触发。
场景:
「通话开始」如:通话一旦开始,就给用户发一个短信
「通话后」如:通话结束后,给用户发送一个短信
「Agent调用」如:在提示词配置“当用户需要了解店铺的优惠活动时,调用【发送优惠短信】action来给用户发短信”
发送逻辑:
自动获取当前用户的拨号电话,发送短信
发送Email
同【发短信】;可以在通话开始、通话结束、Agent调用时触发给用户发一封提前配置好的邮件
发送逻辑:自动获取当前用户在CDP信息中的邮箱发送

Agent 知识库

  为Agent注入领域知识,确保其回答的专业性和准确性。为了满足Voice Agent的对响应速度的极致诉求,为此,我们独立构建了一套专用向量数据库,并优化了其索引与检索算法,以达成极致的召回速度,来用于voice agent召回;(已有的文本训练和召回保持不变;)
  • 可选知识库范围:在知识库管理中,在知识库中【适用对象】包含voice agent的知识库;
  • 在知识库管理中,在知识库中【适用对象】包含voice agent的知识库;
  • 选择方式:全部资源:关联整个知识库或商品库的所有内容。指定资源:可精细选择知识库下的特定文件、网站、问答对,或商品库下的特定商品。
  • 全部资源:关联整个知识库或商品库的所有内容。
  • 指定资源:可精细选择知识库下的特定文件、网站、问答对,或商品库下的特定商品。
  • 管理界面:可查看已关联知识的切片数、召回次数,并支持解除关联。解除关联:只是解除当前知识库、知识与agent的关联关系,并不会删除原本的知识库召回次数:仅统计当前文件/网站/QA在voice agent模块的统一召回次数;
  • 解除关联:只是解除当前知识库、知识与agent的关联关系,并不会删除原本的知识库
  • 召回次数:仅统计当前文件/网站/QA在voice agent模块的统一召回次数;

测试Agent

  • 功能:提供Webcall界面,模拟真实通话,全面测试Agent的语音交互、知识库召回、工具调用效果。
模拟测试,无法获取当前测试用户的真实电话、邮箱等信息,因此无法直接测试发邮件、发短信、更新客户信息、更新客户标签等依赖CDP用户信息的Action;若需要测试需要用户信息Action,需要用真实电话来测试
  • 展示对话文本、支持静音、挂断,并实时记录通话时长。
  • 对话过程若触发了Action会显示一条系统消息;若执行action超过1.5秒没有返回结果,则系统会播报过度话术,如“正在发送邮件”(大模型生成的话术)
上文记忆
目前支持50轮 (Q&A)

模型

为了达到更快的通话响应效果,目前voice agent的LLM模型内置,暂不支持切换;后续会根据对话效果继续增加;

IVR节点配置

当电话号码配置了Agent后,拨打该电话则会优先进入AI应答环节;若客户需要先有IVR流程再进入AI接待,可以写代码配置「自定义节点」
2026-04-26