OmniTools 5月27日消息,Hugging Face 官方博客宣布,Reachy Mini 机器人现已支持全本地化语音对话功能。开发者无需依赖云端服务或 API 密钥,即可在本地设备上完整运行 VAD(语音活动检测)、STT(语音转文本)、LLM(大语言模型)和 TTS(文本转语音)级联流水线。
该方案基于开源库 speech-to-speech,推荐技术栈包括 Silero VAD、Parakeet-TDT STT、Qwen3-TTS,以及通过 llama.cpp 或 vLLM 本地部署的 Gemma-4 或 Qwen3-4B-Instruct 模型。所有组件均支持按需替换,适配多语言与不同硬件环境。
新功能支持在笔记本电脑运行语音后端、机器人端运行应用的分离部署模式,并提供详细的 CLI 配置示例及跨平台局域网连接指南。该全离线语音循环方案有效保障了用户数据隐私,并消除了持续的云端调用成本。