# Linux部署
一、项目目标

在低成本普通 CPU 云主机上搭建完全本地化的 AI 聊天系统。
模型要求:中文支持优秀、智能回复、完全无道德约束(uncensored)。
提供类似 ChatGPT 的美观浏览器界面(Open WebUI)。
所有数据本地处理,隐私安全,可随意讨论任何话题。
适合个人长期使用、博客写作、角色扮演等场景。

最终效果:浏览器访问 http://你的IP:8080,即可与无限制 Qwen 模型对话。

二、环境准备

云主机:UCloud Ubuntu 24.04 LTS(推荐 8核 16G 内存,每月约 300-450 元)
最低配置:4核 8G(可用,但速度较慢)
公网 IP 已分配

三、详细部署步骤
步骤 1:更新系统并安装 Docker
Bashsudo apt update && sudo apt upgrade -y
sudo apt install curl wget git docker.io -y

sudo systemctl start docker
sudo systemctl enable docker
sudo usermod -aG docker $USER
newgrp docker
步骤 2:安装 Ollama 并配置服务
Bashcurl -fsSL https://ollama.com/install.sh | sh

# 创建 systemd 服务(推荐)
cat > /etc/systemd/system/ollama.service </dev/null
docker rm open-webui 2>/dev/null
docker volume rm open-webui 2>/dev/null

# 启动 Open WebUI
docker run -d \
–network=host \
-e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
-v open-webui:/app/backend/data \
–name open-webui \
–restart always \
ghcr.io/open-webui/open-webui:main
步骤 5:访问与配置

浏览器打开:http://你的服务器IP:8080
首次注册管理员账号
进入 设置 → 管理模型,确认 Ollama 地址为 http://127.0.0.1:11434
选择模型 huihui_ai/qwen3.5-abliterated:4b 开始使用

四、常用维护命令
Bash# 查看运行状态
docker ps
ollama list
netstat -ntlp | grep -E ‘11434|8080’

# 重启服务
docker restart open-webui
sudo systemctl restart ollama

# 查看日志
docker logs open-webui –tail 50

五、注意事项与优化

模型选择:4B 版本适合 CPU 主机,追求更强效果可后续升级到 7B/14B(需更高配置)。
回复速度:CPU 模式较慢(几秒到几十秒一句),可接受日常使用。
无限制特性:abliterated 系列已去除安全层,几乎无拒绝。
安全性:建议配置防火墙(sudo ufw allow 22,8080)、设置强密码。
后续升级:预算允许时切换到 GPU 机型,速度会提升数倍。
故障排查:端口占用或连接失败时,重启 Ollama + Open WebUI 通常可解决。

# Windows部署
一、项目目标

在 Windows 普通电脑上搭建完全本地、无需网络的 AI 聊天系统。
模型要求:中文流畅、智能回复、完全无道德约束(uncensored)。
使用美观浏览器界面(Open WebUI),操作像 ChatGPT 一样简单。
所有数据本地运行,隐私安全,可随意讨论任何话题。

本次推荐模型:huihui_ai/qwen3.5-abliterated:9b
(9B 参数,平衡智能度与资源占用,适合 RTX 3060 + 32G 配置)

二、电脑配置要求

推荐配置:i7-12700KF / RTX 3060 / 32GB 内存(你的配置完美匹配)
最低配置:16GB 内存 + 独立显卡
硬盘空间:剩余 50GB 以上

三、详细部署步骤
步骤 1:安装 Ollama(核心引擎)

打开浏览器,访问 https://ollama.com/download
下载 Windows 版本并安装(双击安装包,一路下一步)
安装完成后,Ollama 会自动在后台运行

步骤 2:下载无限制模型(推荐 9B 版本)
按 Win + R 键,输入 cmd,打开命令提示符,依次执行以下命令:
cmd# 下载推荐的无限制 9B 模型
ollama pull huihui_ai/qwen3.5-abliterated:9b

下载时间取决于网速,文件约 5-7GB,请耐心等待。
下载完成后,执行以下命令确认:

cmdollama list
步骤 3:安装 Open WebUI(浏览器聊天界面)

下载安装 Docker Desktop(官网:https://www.docker.com/products/docker-desktop/)
安装完成后打开 Docker Desktop(必须保持运行状态)
在命令提示符中执行以下命令:

docker run -d -p 3000:8080 –add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data –name open-webui –restart always ghcr.io/open-webui/open-webui:main
步骤 4:启动并使用

打开浏览器,访问地址:http://localhost:3000
首次进入会要求注册管理员账号,按提示注册
登录后,点击右下角 设置(齿轮图标)
在 管理模型 中确认 Ollama 地址为 http://host.docker.internal:11434 或 http://127.0.0.1:11434
在左侧模型列表中选择 huihui_ai/qwen3.5-abliterated:9b
开始愉快地聊天!

四、常用维护命令(在 CMD 中执行)
cmd# 查看已下载模型
ollama list

# 拉取其他模型
ollama pull 模型名称

# 重启 Open WebUI
docker restart open-webui

# 查看日志(排查问题时使用)
docker logs open-webui –tail 50

# 停止服务
docker stop open-webui

五、注意事项与优化

模型特点:huihui_ai/qwen3.5-abliterated:9b 是经过 abliteration 处理的无限制版本,拒绝率极低,中文能力优秀。
性能:你的 RTX 3060 会自动加速,回复速度较快。如果觉得慢,可以尝试 7B 版本。
显存管理:如果出现显存不足,可尝试更小的模型或关闭其他程序。
安全性:完全本地运行,无数据上传风险。
后续升级:
想体验更强模型可尝试 14B(需更多耐心等待下载)
可安装 LM Studio 作为图形化替代方案(更适合新手)

版权所有,转载注明来源