# 一、基础元信息 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | version | 配置版本号 | `1.0.36` | string | 当前配置版本,用于判断配置是否更新 | 只读显示 | | timestamp | 配置生成时间 | `2026-05-13T11:18:28Z` | string/datetime | 配置节点生成该配置的时间 | 只读显示 | | source | 配置来源 | `config_node (mock)` | string | 配置由哪个节点或模块生成 | 只读显示 | # 二、ASR 语音识别配置 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | asr.VAD_MODE | VAD 灵敏度 | `2` | int | 语音活动检测灵敏度,通常数值越高越敏感或越严格,取决于 VAD 实现 | 数字输入 / 下拉 | | asr.sample_rate | ASR 采样率 | `16000` | int | 录音音频采样率,单位 Hz,常用 16000 | 数字输入 | | asr.frame_duration_ms | VAD 帧大小 | `30` | int | VAD 每帧音频长度,单位毫秒 | 数字输入 | | asr.use_oline_asr | 是否使用在线 ASR | `false` | boolean | 是否调用云端 ASR 识别;false 表示使用本地 ASR | 开关 | | asr.mic_serial_port | 麦克风串口 | `/dev/ttyUSB0` | string | 麦克风串口设备路径或别名 | 文本输入 | | asr.mic_index | 麦克风索引 | `-2` | int | PyAudio/系统中的麦克风设备索引 | 数字输入 | | asr.language | ASR 语言 | `zh` | string | 系统语音语言,zh 表示中文,en 表示英文 | 下拉:zh/en | | asr.regional_setting | 区域版本 | `China` | string | China 表示国内版,international 表示国际版 | 下拉 | # 三、动作服务 action_service 配置 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | action_service.Speed_topic | 速度控制话题 | `/cmd_vel` | string | ROS2 机器人速度控制 Topic,一般用于发布 Twist 速度指令 | 文本输入 | | action_service.text_chat_mode | 文字交互模式 | `false` | boolean | 是否启用文字聊天模式;true 表示文字交互,false 表示语音/动作交互为主 | 开关 | | action_service.image_topic | 相机图像话题 | `/camera/color/image_raw` | string | 视觉模型读取的 ROS2 图像 Topic | 文本输入 | | action_service.useolinetts | 是否使用在线 TTS | `true` | boolean | 是否使用云端语音合成;false 表示使用本地 TTS | 开关 | | action_service.language | 本地 TTS 语言 | `zh` | string | 本地语音合成语言,zh 中文,en 英文 | 下拉:zh/en | | action_service.regional_setting | 区域版本 | `China` | string | China 表示国内版,international 表示国际版 | 下拉 | # 四、模型服务 model_service 配置 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | model_service.language | 大模型接口语言 | `zh` | string | 大模型交互语言,zh 中文,en 英文 | 下拉:zh/en | | model_service.regional_setting | 区域版本 | `China` | string | China 表示国内版,international 表示国际版 | 下拉 | | model_service.text_chat_mode | 文字交互模式 | `true` | boolean | 模型服务是否以文字对话方式运行,通常用于调试或无语音场景 | 开关 | # 五、大模型与语音云服务配置 large_model ## 5.1 阿里百炼 / 通义千问配置 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | large_model.tongyi_api_key | 通义 API Key | `sk-****` | string/secret | 阿里百炼/通义千问平台 API Key | 密码框,加密存储,脱敏显示 | | large_model.tongyi_app_id | 通义 App ID | `6ed9f00173214e7883af7310731a5d7b` | string/secret | 阿里百炼应用 ID | 密码框或文本框,建议脱敏 | | large_model.multimodel | 多模态模型名称 | `qwen-vl-max-2025-04-08` | string | 执行层视觉大模型,用于图片理解、安防识别、看图问答等 | 下拉 / 文本输入 | | large_model.tts_supplier | TTS 供应商 | `aliyun` | string | 在线语音合成供应商,目前支持 aliyun / baidu | 下拉:aliyun/baidu | | large_model.tts_language | TTS 语言 | `zh` | string | 语音合成语言,zh 中文,en 英文 | 下拉:zh/en | | large_model.oline_tts_model | 在线 TTS 模型 | `cosyvoice-v2` | string | 阿里云在线语音合成模型名称 | 文本输入 / 下拉 | | large_model.voice_tone | 在线 TTS 音色 | `longwan_v2` | string | 阿里云 CosyVoice 音色名称 | 文本输入 / 下拉 | | large_model.oline_asr_sample_rate | 在线 ASR 采样率 | `16000` | int | 在线 ASR 音频采样率,单位 Hz | 数字输入 | | large_model.oline_asr_model | 在线 ASR 模型 | `paraformer-realtime-v2` | string | 在线语音识别模型名称 | 下拉 | ## 5.2 百度语音配置 | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | large_model.baidu_API_KEY | 百度 API Key | `Pppr****` | string/secret | 百度智能云语音合成 API Key | 密码框,加密存储,脱敏显示 | | large_model.baidu_SECRET_KEY | 百度 Secret Key | `1jGl****` | string/secret | 百度智能云语音合成 Secret Key | 密码框,加密存储,脱敏显示 | | large_model.CUID | 百度设备标识 | `nLSB0tSszSlc2vxM9gQ96FksFuSrQ2cp` | string | 百度语音接口设备唯一标识 | 文本输入 | | large_model.PER | 百度发音人 | `103` | int | 百度 TTS 发音人编号,例如 103 为度米朵 | 数字输入 / 下拉 | | large_model.SPD | 百度语速 | `5` | int | 百度 TTS 语速,通常范围 0-15,默认 5 | 滑块 / 数字输入 | | large_model.PIT | 百度音调 | `5` | int | 百度 TTS 音调,通常范围 0-15,默认 5 | 滑块 / 数字输入 | | large_model.VOL | 百度音量 | `5` | int | 百度 TTS 音量,通常范围 0-9,默认 5 | 滑块 / 数字输入 | | large_model.network_adapter | 网络适配器 | `wlP1p1s0` | string | 用于网络状态检测或联网相关功能的网卡名称 | 文本输入 / 下拉 | # 六、国际版 Dify 配置 international | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | international.decision_AI_api_key | 决策大模型 API Key | `app-****` | string/secret | Dify 决策大模型应用 API Key,负责复杂任务规划、任务拆解、意图判断 | 密码框,加密存储,脱敏显示 | | international.execution_AI_api_key | 执行大模型 API Key | `app-****` | string/secret | Dify 执行大模型应用 API Key,负责动作生成、执行层回复等 | 密码框,加密存储,脱敏显示 | # 七、本地模型路径 model_paths | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | model_paths.zh_tts_model | 中文 TTS 模型路径 | `/home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/zh/zh_CN-huayan-medium.onnx` | string/path | 本地中文语音合成 ONNX 模型路径 | 文本输入 | | model_paths.zh_tts_json | 中文 TTS 配置路径 | `/home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/zh/zh_CN-huayan-medium.onnx.json` | string/path | 中文 TTS 模型对应的 JSON 配置文件 | 文本输入 | | model_paths.en_tts_model | 英文 TTS 模型路径 | `/home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/en/en_US-libritts-high.onnx` | string/path | 本地英文语音合成 ONNX 模型路径 | 文本输入 | | model_paths.en_tts_json | 英文 TTS 配置路径 | `/home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/tts/en/en_US-libritts-high.onnx.json` | string/path | 英文 TTS 模型对应的 JSON 配置文件 | 文本输入 | | model_paths.local_asr_model | 本地 ASR 模型路径 | `/home/sunrise/opt/app/yahboom_ws/src/largemodel/MODELS/asr/SenseVoiceSmall` | string/path | 本地语音识别模型路径,例如 SenseVoiceSmall | 文本输入 | # 八、系统配置 system | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | system.tongyi_base_url | 通义接口地址 | `https://dashscope.aliyuncs.com/compatible-mode/v1` | string/url | 阿里百炼 OpenAI 兼容接口地址,一般不需要修改 | 文本输入,默认高级配置 | | system.local_tts_enabled | 本地 TTS 是否启用 | `true` | boolean | 是否允许使用本地语音合成能力 | 开关 | | system.local_asr_enabled | 本地 ASR 是否启用 | `true` | boolean | 是否允许使用本地语音识别能力 | 开关 | # 九、ROS2 Topic 配置 topics ## 9.1 action_service 相关 Topic | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | topics.action_service.Speed_topic | 速度控制 Topic | `/cmd_vel` | string | 动作服务发布速度控制指令的 Topic | 文本输入 | | topics.action_service.image_topic | 图像输入 Topic | `/camera/color/image_raw` | string | 动作服务或视觉模块订阅的相机图像 Topic | 文本输入 | | topics.action_service.tts_topic | TTS 播放 Topic | `tts_topic` | string | 发布或订阅语音合成文本/播放指令的 Topic | 文本输入 | | topics.action_service.reset_flag | 重置标志 Topic | `reset_flag` | string | 用于重置动作服务状态的 Topic | 文本输入 | | topics.action_service.interrupt_flag | 打断标志 Topic | `interrupt_flag` | string | 用于打断当前语音、动作或任务执行的 Topic | 文本输入 | | topics.action_service.arm_done_topic | 机械臂完成 Topic | `/largemodel_arm_done` | string | 机械臂动作完成反馈 Topic | 文本输入 | | topics.action_service.wakeup_topic | 唤醒 Topic | `wakeup` | string | 麦克风或唤醒模块发布唤醒事件的 Topic | 文本输入 | | topics.action_service.record_status_topic | 录音状态 Topic | `record_status` | string | 录音开始、结束、状态变化相关 Topic | 文本输入 | ## 9.2 model_service 相关 Topic | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | topics.model_service.actionstatus_topic | 动作状态 Topic | `actionstatus` | string | 接收动作执行状态反馈的 Topic | 文本输入 | | topics.model_service.asr_topic | ASR 识别结果 Topic | `asr` | string | 接收语音识别文本结果的 Topic | 文本输入 | | topics.model_service.seewhat_topic | 看图处理 Topic | `seewhat_handle` | string | 视觉问答、看图识别、图片处理相关 Topic | 文本输入 | | topics.model_service.text_response_topic | 文本回复 Topic | `text_response` | string | 模型服务输出文字回复的 Topic | 文本输入 | ## 9.3 environment_node 相关 Topic | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | topics.environment_node.environment_topic | 环境信息 Topic | `/ai/env` | string | 环境节点发布环境状态的 Topic | 文本输入 | # 十、环境节点配置 environment | 配置路径 | 名称 | 当前值 | 类型 | 解释 | 页面建议 | |---|---|---:|---|---|---| | environment.publish_topic | 环境信息发布 Topic | `/ai/env` | string | 环境节点统一发布机器人环境状态的 Topic | 文本输入 | | environment.intervals.battery_seconds | 电池信息发布间隔 | `1` | int | 电池状态采集/发布间隔,单位秒 | 数字输入 | | environment.intervals.temperature_seconds | 温度信息发布间隔 | `1` | int | 温度状态采集/发布间隔,单位秒 | 数字输入 | | environment.intervals.weather_seconds | 天气信息发布间隔 | `1` | int | 天气信息采集/发布间隔,单位秒 | 数字输入 | | environment.intervals.map_seconds | 地图信息发布间隔 | `1` | int | 地图状态或定位信息发布间隔,单位秒 | 数字输入 |