ruoyi-小智:基于若依的智能语音交互服务端
本项目为开源智能硬件项目 xiaozhi-esp32提供Java后端服务根据小智WebSocket通信协议使用RuoYi-Vue、Spring AI、轻量级Java-WebSocket、ffmpeg实现帮助您快速搭建小智服务器
·
一、项目描述
智能硬件飞速发展的今天,如何快速搭建一个稳定、高效、可扩展的语音交互服务端,成为许多开发者关注的焦点。今天为大家介绍一款开源项目——ruoyi-小智,它是基于 RuoYi-Vue 框架开发,为 xiaozhi-esp32 提供完整的 Java 后端支持,帮助你轻松实现语音控制与智能对话系统。
二、项目技术栈
- 后端框架:RuoYi-Vue 后端子项目(Spring Boot)
- 通信协议:小智 WebSocket 通信协议
- WebSocket 库:Java-WebSocket(轻量级嵌入式服务)
- AI 接口:Spring AI(OpenAI / 百度 / 阿里等大模型接入)
- 音视频处理:JavaCV-FFmpeg(音频编码、格式转换等)
备注:WebSocket 服务采用 轻量级 Java-WebSocket 实现,不依赖 Tomcat 或 Servlet 容器,启动更快、运行更轻量。
三、功能清单
| 模块名称 | 功能说明 | 状态 |
|---|---|---|
| 核心服务架构 | 基于 WebSocket 和 HTTP 提供控制台管理与认证系统 | ✅ 已实现 |
| 管理后台 | 提供 Web UI 管理,支持用户、配置和设备管理 | ✅ 已实现 |
| 语音交互系统 | 支持 ASR、流式 TTS、VAD,兼容多语言语音处理 | ✅ 已实现 |
| 智能对话系统 | 集成多种 LLM,实现上下文对话与响应 | ✅ 已实现 |
| 意图识别系统 | LLM + Function Call 实现插件化意图识别与调用 | ✅ 已实现 |
| 记忆系统 | 支持本地短期记忆 | ✅ 已实现 |
| IOT/MCP控制协议 | 支持设备注册、控制接口,兼容 IOT 与 MCP 协议 | 🔧 开发中 |
| 插件系统 | 支持插件扩展、热加载与自定义插件开发 | 🔧 开发中 |
四、 语音处理支持
VAD:集成 Silero VAD v5,适配边缘设备,低延迟处理;
ASR:支持 SenseVoice(本地离线模型),未来可扩展 Whisper、阿里、百度等;
TTS:支持 EdgeTTS(微软语音合成),也可对接火山引擎双流式语音。
五、项目地址
GitHub 项目主页:
👉 https://github.com/dbcjl/RuoYi-xiaozhi
如果你也在做智能语音、AI对话、IoT设备开发,ruoyi-小智将是一个优秀的开源起点,欢迎关注和参与!
更多推荐

所有评论(0)