大家好,我是siuser小伟

如果你是一个小白,又想玩一下硬件的话,那我一定推荐你去接触 AI 小智

因为他们的生态非常好,教程非常详细,你也可以跑一个专属于你自己的 AI 硬件。

这篇文章专门写给第一次部署小智 Go 后端的人。

最后面有视频演示,感兴趣的同学可以看看


我建议第一遍不要上来就拉源码、配 Go 环境、改依赖。先用作者打好的 Release 版本跑通。能连上设备、能听、能说、能走大模型,再回头折腾源码。

小智 Go 后端开源地址在这里:


   

https://github.com/AnimeAIChat/xiaozhi-server-go 

原项目已经提供了不同系统的可执行文件。你只想先体验的话,下载对应系统版本就行。

我这里先按 Windows 来写。

先下载两个东西

打开 Release 页面:


   

https://github.com/AnimeAIChat/xiaozhi-server-go/releases 

Windows 电脑直接下载:


   

windows-amd64-server.exe 

然后再把项目里的配置文件下载下来:


   

config.yaml 

注意下载完以后要把 config.yaml 改名成:


   

.config.yaml 

这个点很容易漏。少了前面那个点,程序可能就读不到配置。

最后把这两个文件放到同一个文件夹:


   

windows-amd64-server.exe 

.config.yaml 

到这里程序本体就准备好了。

先改本机 IP

后端跑在你的电脑上,小智硬件要连过来,所以配置里不能随便写一个地址。

在 Windows 上按:


   

Win + R 

输入:


   

cmd 

回车,打开命令行。

然后输入:


   

ipconfig 

找到你当前 Wi-Fi 或网卡对应的 IPv4 地址。

一般长这样:


   

192.168.1.23 

把配置文件里的服务地址改成你的这个 IP。

这里别写 localhost,也别写 127.0.0.1。那是电脑自己访问自己,小智硬件在局域网里找不到它。

配 ASR:让小智听懂你说话

ASR 就是语音识别。

这个后端默认可以用豆包 ASR,所以配置里一般保持:


   

DoubaoASR 

接下来去火山引擎控制台创建应用:


   

https://console.volcengine.com/speech/app 

创建应用的时候,名字和简介随便写一个能看懂的就行。

重点是勾选这两个能力:

  • 流式语音识别大模型

  • 语音合成大模型

后面一个给 TTS 用,顺手一起开了,省得来回点。

应用创建完成后,会拿到一个 APP ID。把它填进 .config.yaml 里对应的豆包 ASR 配置。

然后进入“流式语音识别大模型”,复制里面的 Access Token,也填到配置文件里。

这里提醒一句:Access Token 不要截图发群,也不要直接贴到公开文章里。你自己配置文件里填就行。

配 TTS:让小智开口说话

TTS 是语音合成。

配置里把 TTS 供应商设成:


   

DoubaoTTS 

还是用刚才火山引擎那个应用。

appid 和 ASR 用同一个。

然后点进“语音合成大模型”,找到:

  • Cluster ID

  • Access Token

把这两个填进 .config.yaml

ASR 和 TTS 都配完以后,小智就具备“听”和“说”的基础能力了。

配 LLM:先用智谱跑通

LLM 就是大模型对话。

用的是智谱,配置项填:


   

ChatGLMLLM 

打开智谱 API Key 页面:


   

https://bigmodel.cn/usercenter/proj-mgmt/apikeys 

新建一个 API Key。

名字随便填,比如:


   

xiaozhi-test 

创建后复制 API Key,填到 .config.yaml 的 LLM 配置里。

第一次部署别急着换一堆模型。

先用一个免费或低成本模型跑通流程。等硬件能正常连上、能识别、能回复,再考虑换更好的模型。

VLLM 也填智谱

配置里还有一段 VLLM。


   

ChatGLMVLLM 

这个地方也填智谱的 API Key,和上面 LLM 用同一个就行。

如果你只是先跑通,不用在这里想太多。

启动后端

配置保存好以后,双击:


   

windows-amd64-server.exe 

Windows 可能会提示“无法验证发布者”。

这是因为它不是常见商业软件签名,不代表一定有问题。

确认你是从项目 Release 页面下载的,就点运行。

如果弹出防火墙提示,选择允许访问。

这一步别点错。

小智硬件要从局域网访问你的电脑,防火墙不放行,后面设备可能连不上。

启动成功后,会弹出一个命令行窗口,里面会刷日志。

你主要看这几项:

  • ASR 初始化成功

  • TTS 初始化成功

  • LLM 初始化成功

如果看到 MCP 初始化失败,先不用慌。你没有配 MCP 的话,这个报错可以先不管。只要 ASR、TTS、LLM 这些关键模块正常,第一轮测试就能继续。

改小智硬件的 OTA 地址

后端跑起来后,还要让硬件知道去哪里找服务。

小智设备开机时按住 BOOT,进入配网模式。

然后用手机连接设备热点。

进入配网页面的高级选项,把 OTA 地址改成:


   

http://你的电脑IP:8080/api/ota/ 

比如你的电脑 IP 是:


   

192.168.1.23 

那就填:


   

http://192.168.1.23:8080/api/ota/ 

这里还有一个很容易忽略的前提:

小智硬件和你的电脑必须在同一个 Wi-Fi 下,最好也在同一个网段。

如果电脑连公司内网,硬件连手机热点;或者电脑挂了奇怪的网络隔离,设备就找不到后端。

很多人部署失败,不是配置错了,是网络没通。

第一次测试看什么

我建议按这个顺序测:

  1. 后端 exe 能不能启动。

  2. 日志里 ASR、TTS、LLM 有没有初始化成功。

  3. 小智硬件能不能连到 OTA 地址。

  4. 说一句话后,后端日志有没有收到请求。

  5. 小智能不能正常回复。

不要一上来就同时改模型、改语音、改硬件配置。

先让整条链路通。

链路通了,再慢慢换模型、换音色、调提示词。

跑通后的效果

配置没问题的话,后端日志和小智硬件大概会是下面这个状态。

公众号里这里插入演示视频。视频文件用这个:


   

media/xiaozhi-go-backend-demo-wechat.mp4 

本地演示视频:xiaozhi-go-backend-demo-wechat.mp4

常见坑

1. 配置文件名字不对

必须是:


   

.config.yaml 

不是:


   

config.yaml 

也不是:


   

.config.yaml.txt 

Windows 默认会隐藏文件扩展名,建议打开文件扩展名显示,不然很容易改成假名字。

2. IP 写错

配置里要写电脑在局域网里的 IPv4 地址。

不要写 localhost

不要写 127.0.0.1

不要写一个已经变掉的旧 IP。

如果你重连 Wi-Fi,电脑 IP 可能会变,变了就要重新改配置。

3. 防火墙没放行

Windows 第一次运行时会弹防火墙提示。

要允许访问。

如果当时点了拒绝,后面可以去 Windows 防火墙里重新放行这个 exe。

4. API Key 或 Token 填串了

豆包 ASR、豆包 TTS、智谱 LLM 都有自己的字段。

不要把智谱 API Key 填到豆包 Access Token 里,也不要把 TTS 的 Cluster ID 漏掉。

这类问题看日志一般能看出来。

5. MCP 初始化失败

没配置 MCP 的情况下,可以先不管。

第一轮部署只看 ASR、TTS、LLM 和硬件连接。等基础链路跑通,再回头研究 MCP。

这套部署方式最适合第一轮测试。

不用编译,不用配 Go 环境,也不用先理解整个后端代码结构。你只要下载 exe,改配置,启动,然后让硬件连过来。

等你确认小智能正常对话,再去折腾源码部署、服务器部署、模型替换,都会轻松很多。

第一次别贪多。

先跑起来。能跑起来,后面才有优化的意义。


Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐