一、项目描述

智能硬件飞速发展的今天,如何快速搭建一个稳定、高效、可扩展的语音交互服务端,成为许多开发者关注的焦点。今天为大家介绍一款开源项目——ruoyi-小智,它是基于 RuoYi-Vue 框架开发,为 xiaozhi-esp32 提供完整的 Java 后端支持,帮助你轻松实现语音控制与智能对话系统。

二、项目技术栈

  • 后端框架:RuoYi-Vue 后端子项目(Spring Boot)
  • 通信协议小智 WebSocket 通信协议
  • WebSocket 库:Java-WebSocket(轻量级嵌入式服务)
  • AI 接口:Spring AI(OpenAI / 百度 / 阿里等大模型接入)
  • 音视频处理:JavaCV-FFmpeg(音频编码、格式转换等)

备注:WebSocket 服务采用 轻量级 Java-WebSocket 实现不依赖 Tomcat 或 Servlet 容器,启动更快、运行更轻量。

三、功能清单

模块名称 功能说明 状态
核心服务架构 基于 WebSocket 和 HTTP 提供控制台管理与认证系统 ✅ 已实现
管理后台 提供 Web UI 管理,支持用户、配置和设备管理 ✅ 已实现
语音交互系统 支持 ASR、流式 TTS、VAD,兼容多语言语音处理 ✅ 已实现
智能对话系统 集成多种 LLM,实现上下文对话与响应 ✅ 已实现
意图识别系统 LLM + Function Call 实现插件化意图识别与调用 ✅ 已实现
记忆系统 支持本地短期记忆 ✅ 已实现
IOT/MCP控制协议 支持设备注册、控制接口,兼容 IOT 与 MCP 协议 🔧 开发中
插件系统 支持插件扩展、热加载与自定义插件开发 🔧 开发中

四、 语音处理支持

VAD:集成 Silero VAD v5,适配边缘设备,低延迟处理;
ASR:支持 SenseVoice(本地离线模型),未来可扩展 Whisper、阿里、百度等;
TTS:支持 EdgeTTS(微软语音合成),也可对接火山引擎双流式语音。

五、项目地址

GitHub 项目主页:
👉 https://github.com/dbcjl/RuoYi-xiaozhi

如果你也在做智能语音、AI对话、IoT设备开发,ruoyi-小智将是一个优秀的开源起点,欢迎关注和参与!

Logo

智能硬件社区聚焦AI智能硬件技术生态,汇聚嵌入式AI、物联网硬件开发者,打造交流分享平台,同步全国赛事资讯、开展 OPC 核心人才招募,助力技术落地与开发者成长。

更多推荐