4
0

config.md 11 KB

一、基础元信息

配置路径 名称 当前值 类型 解释 页面建议
version 配置版本号 1.0.36 string 当前配置版本,用于判断配置是否更新 只读显示
timestamp 配置生成时间 2026-05-13T11:18:28Z string/datetime 配置节点生成该配置的时间 只读显示
source 配置来源 config_node (mock) string 配置由哪个节点或模块生成 只读显示

二、ASR 语音识别配置

配置路径 名称 当前值 类型 解释 页面建议
asr.VAD_MODE VAD 灵敏度 2 int 语音活动检测灵敏度,通常数值越高越敏感或越严格,取决于 VAD 实现 数字输入 / 下拉
asr.sample_rate ASR 采样率 16000 int 录音音频采样率,单位 Hz,常用 16000 数字输入
asr.frame_duration_ms VAD 帧大小 30 int VAD 每帧音频长度,单位毫秒 数字输入
asr.use_oline_asr 是否使用在线 ASR false boolean 是否调用云端 ASR 识别;false 表示使用本地 ASR 开关
asr.mic_serial_port 麦克风串口 /dev/ttyUSB0 string 麦克风串口设备路径或别名 文本输入
asr.mic_index 麦克风索引 -2 int PyAudio/系统中的麦克风设备索引 数字输入
asr.language ASR 语言 zh string 系统语音语言,zh 表示中文,en 表示英文 下拉:zh/en
asr.regional_setting 区域版本 China string China 表示国内版,international 表示国际版 下拉

三、动作服务 action_service 配置

配置路径 名称 当前值 类型 解释 页面建议
action_service.Speed_topic 速度控制话题 /cmd_vel string ROS2 机器人速度控制 Topic,一般用于发布 Twist 速度指令 文本输入
action_service.text_chat_mode 文字交互模式 false boolean 是否启用文字聊天模式;true 表示文字交互,false 表示语音/动作交互为主 开关
action_service.image_topic 相机图像话题 /camera/color/image_raw string 视觉模型读取的 ROS2 图像 Topic 文本输入
action_service.useolinetts 是否使用在线 TTS true boolean 是否使用云端语音合成;false 表示使用本地 TTS 开关
action_service.language 本地 TTS 语言 zh string 本地语音合成语言,zh 中文,en 英文 下拉:zh/en
action_service.regional_setting 区域版本 China string China 表示国内版,international 表示国际版 下拉

四、模型服务 model_service 配置

配置路径 名称 当前值 类型 解释 页面建议
model_service.language 大模型接口语言 zh string 大模型交互语言,zh 中文,en 英文 下拉:zh/en
model_service.regional_setting 区域版本 China string China 表示国内版,international 表示国际版 下拉
model_service.text_chat_mode 文字交互模式 true boolean 模型服务是否以文字对话方式运行,通常用于调试或无语音场景 开关

五、大模型与语音云服务配置 large_model

5.1 阿里百炼 / 通义千问配置

配置路径 名称 当前值 类型 解释 页面建议
large_model.tongyi_api_key 通义 API Key sk-**** string/secret 阿里百炼/通义千问平台 API Key 密码框,加密存储,脱敏显示
large_model.tongyi_app_id 通义 App ID 6ed9f00173214e7883af7310731a5d7b string/secret 阿里百炼应用 ID 密码框或文本框,建议脱敏
large_model.multimodel 多模态模型名称 qwen-vl-max-2025-04-08 string 执行层视觉大模型,用于图片理解、安防识别、看图问答等 下拉 / 文本输入
large_model.tts_supplier TTS 供应商 aliyun string 在线语音合成供应商,目前支持 aliyun / baidu 下拉:aliyun/baidu
large_model.tts_language TTS 语言 zh string 语音合成语言,zh 中文,en 英文 下拉:zh/en
large_model.oline_tts_model 在线 TTS 模型 cosyvoice-v2 string 阿里云在线语音合成模型名称 文本输入 / 下拉
large_model.voice_tone 在线 TTS 音色 longwan_v2 string 阿里云 CosyVoice 音色名称 文本输入 / 下拉
large_model.oline_asr_sample_rate 在线 ASR 采样率 16000 int 在线 ASR 音频采样率,单位 Hz 数字输入
large_model.oline_asr_model 在线 ASR 模型 paraformer-realtime-v2 string 在线语音识别模型名称 下拉

5.2 百度语音配置

配置路径 名称 当前值 类型 解释 页面建议
large_model.baidu_API_KEY 百度 API Key Pppr**** string/secret 百度智能云语音合成 API Key 密码框,加密存储,脱敏显示
large_model.baidu_SECRET_KEY 百度 Secret Key 1jGl**** string/secret 百度智能云语音合成 Secret Key 密码框,加密存储,脱敏显示
large_model.CUID 百度设备标识 nLSB0tSszSlc2vxM9gQ96FksFuSrQ2cp string 百度语音接口设备唯一标识 文本输入
large_model.PER 百度发音人 103 int 百度 TTS 发音人编号,例如 103 为度米朵 数字输入 / 下拉
large_model.SPD 百度语速 5 int 百度 TTS 语速,通常范围 0-15,默认 5 滑块 / 数字输入
large_model.PIT 百度音调 5 int 百度 TTS 音调,通常范围 0-15,默认 5 滑块 / 数字输入
large_model.VOL 百度音量 5 int 百度 TTS 音量,通常范围 0-9,默认 5 滑块 / 数字输入
large_model.network_adapter 网络适配器 wlP1p1s0 string 用于网络状态检测或联网相关功能的网卡名称 文本输入 / 下拉

六、国际版 Dify 配置 international

配置路径 名称 当前值 类型 解释 页面建议
international.decision_AI_api_key 决策大模型 API Key app-**** string/secret Dify 决策大模型应用 API Key,负责复杂任务规划、任务拆解、意图判断 密码框,加密存储,脱敏显示
international.execution_AI_api_key 执行大模型 API Key app-**** string/secret Dify 执行大模型应用 API Key,负责动作生成、执行层回复等 密码框,加密存储,脱敏显示

七、本地模型路径 model_paths

配置路径 名称 当前值 类型 解释 页面建议
model_paths.zh_tts_model 中文 TTS 模型路径 /home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/zh/zh_CN-huayan-medium.onnx string/path 本地中文语音合成 ONNX 模型路径 文本输入
model_paths.zh_tts_json 中文 TTS 配置路径 /home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/zh/zh_CN-huayan-medium.onnx.json string/path 中文 TTS 模型对应的 JSON 配置文件 文本输入
model_paths.en_tts_model 英文 TTS 模型路径 /home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/en/en_US-libritts-high.onnx string/path 本地英文语音合成 ONNX 模型路径 文本输入
model_paths.en_tts_json 英文 TTS 配置路径 /home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/en/en_US-libritts-high.onnx.json string/path 英文 TTS 模型对应的 JSON 配置文件 文本输入
model_paths.local_asr_model 本地 ASR 模型路径 /home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/asr/SenseVoiceSmall string/path 本地语音识别模型路径,例如 SenseVoiceSmall 文本输入

八、系统配置 system

配置路径 名称 当前值 类型 解释 页面建议
system.tongyi_base_url 通义接口地址 https://dashscope.aliyuncs.com/compatible-mode/v1 string/url 阿里百炼 OpenAI 兼容接口地址,一般不需要修改 文本输入,默认高级配置
system.local_tts_enabled 本地 TTS 是否启用 true boolean 是否允许使用本地语音合成能力 开关
system.local_asr_enabled 本地 ASR 是否启用 true boolean 是否允许使用本地语音识别能力 开关

九、ROS2 Topic 配置 topics

9.1 action_service 相关 Topic

配置路径 名称 当前值 类型 解释 页面建议
topics.action_service.Speed_topic 速度控制 Topic /cmd_vel string 动作服务发布速度控制指令的 Topic 文本输入
topics.action_service.image_topic 图像输入 Topic /camera/color/image_raw string 动作服务或视觉模块订阅的相机图像 Topic 文本输入
topics.action_service.tts_topic TTS 播放 Topic tts_topic string 发布或订阅语音合成文本/播放指令的 Topic 文本输入
topics.action_service.reset_flag 重置标志 Topic reset_flag string 用于重置动作服务状态的 Topic 文本输入
topics.action_service.interrupt_flag 打断标志 Topic interrupt_flag string 用于打断当前语音、动作或任务执行的 Topic 文本输入
topics.action_service.arm_done_topic 机械臂完成 Topic /largemodel_arm_done string 机械臂动作完成反馈 Topic 文本输入
topics.action_service.wakeup_topic 唤醒 Topic wakeup string 麦克风或唤醒模块发布唤醒事件的 Topic 文本输入
topics.action_service.record_status_topic 录音状态 Topic record_status string 录音开始、结束、状态变化相关 Topic 文本输入

9.2 model_service 相关 Topic

配置路径 名称 当前值 类型 解释 页面建议
topics.model_service.actionstatus_topic 动作状态 Topic actionstatus string 接收动作执行状态反馈的 Topic 文本输入
topics.model_service.asr_topic ASR 识别结果 Topic asr string 接收语音识别文本结果的 Topic 文本输入
topics.model_service.seewhat_topic 看图处理 Topic seewhat_handle string 视觉问答、看图识别、图片处理相关 Topic 文本输入
topics.model_service.text_response_topic 文本回复 Topic text_response string 模型服务输出文字回复的 Topic 文本输入

9.3 environment_node 相关 Topic

配置路径 名称 当前值 类型 解释 页面建议
topics.environment_node.environment_topic 环境信息 Topic /ai/env string 环境节点发布环境状态的 Topic 文本输入

十、环境节点配置 environment

配置路径 名称 当前值 类型 解释 页面建议
environment.publish_topic 环境信息发布 Topic /ai/env string 环境节点统一发布机器人环境状态的 Topic 文本输入
environment.intervals.battery_seconds 电池信息发布间隔 1 int 电池状态采集/发布间隔,单位秒 数字输入
environment.intervals.temperature_seconds 温度信息发布间隔 1 int 温度状态采集/发布间隔,单位秒 数字输入
environment.intervals.weather_seconds 天气信息发布间隔 1 int 天气信息采集/发布间隔,单位秒 数字输入
environment.intervals.map_seconds 地图信息发布间隔 1 int 地图状态或定位信息发布间隔,单位秒 数字输入