前言
Google 的 Gemma 4 是现在很值得折腾的一条线。
Gemma 4 当前公开有 4 个尺寸:E2B、E4B、26B A4B、31B。
Google 对这四个版本的定位很清晰:E2B 和 E4B 更偏向边缘设备与轻量本地运行 (手机和平板)。
26B 和 31B 更偏向个人电脑、IDE、代码助手和 agent 工作流。
配置:
内存小于16GB的电脑/手机/平板,适合E2B、E4B这两个。
内存大于24GB及以上电脑,适合26B A4B、31B这两个,如果你内存超过48GB,那肯定首选31B这个。
以上理论是官方给出的提醒,具体使用会受到上下文长度、运行框架以及系统环境所影响。
Mac电脑本地部署教程
要求:系统14或以上,磁盘预留至少40GB。
安装其实有两种方式,我这里以终端代码进行安装。
1,打开电脑终端,直接输入以下命令安装Ollama。
curl -fsSL https://ollama.com/install.sh | sh
2. 安装这个很快,安装完再输入下面代码查询是否安装成功。
ollama --version
3. 如果能正常返回版本号,就说明 Ollama 已经装好。
4. 拉取 Gemma 4 模型,你装哪个大模型,就安装以下哪个命令。
ollama pull gemma4:e2b
ollama pull gemma4:e4b
ollama pull gemma4:26b
ollama pull gemma4:31b
这个模型下载需要时间,各个模型大小约:E2B 3.2GB、E4B 5GB、26B A4B 15.6GB、31B 17.4GB
5. 下载完模型之后启动模型,直接运行以下命令,你是什么模型就输入哪个。
ollama run gemma4:E2B
ollama run gemma4:E4B
ollama run gemma4:26b
ollama run gemma4:31b
启动之后就可以直接对话了,Gemma 4 支持 thinking 模式,也就是深度思考,但是默认思考的过程文字也会显示出来。
我们可以通过以下命令关闭思考期间的文字,只显示答案。
ollama run gemma4:E2B --hidethinking
ollama run gemma4:E4B --hidethinking
ollama run gemma4:26b --hidethinking
ollama run gemma4:31b --hidethinking
要结束对话,直接打出结束两个字,或者直接关闭终端,下次需要启动,直接打开终端,输入上面代码就可以。
如果要清空上下文对话,输入 /clear 按回车即可,能开始新的对话,这个是基于本地部署,一旦部署成功,后续不再需要联网就可使用。
windows电脑本地部署教程:
要求:
Windows 10 22H2 或更新版本,Home 或 Pro 都可以。如果电脑有 NVIDIA 显卡,要求驱动版本 452.39 或更新;如果是 AMD Radeon,则需要安装 AMD 官方驱动。Windows 10 某些旧终端字体可能会把下载进度条显示成小方块,这是终端字体问题,不是安装失败。
1,安装 Ollama
打开windows电脑的powershell,不需要管理员模式。输入以下命令安装
irm https://ollama.com/install.ps1 | iex
2,安装完成后,先检查版本:
ollama --version
如果返回版本号,说明安装成功。
3,拉取 Gemma 4 模型,你是哪个就输入哪个
ollama pull gemma4:e2b
ollama pull gemma4:e4b
ollama pull gemma4:26b
ollama pull gemma4:31b
4,启动模型,你是哪个就输入哪个
ollama run gemma4:e2b
ollama run gemma4:e4b
ollama run gemma4:26b
ollama run gemma4:31b
启动之后就能聊天了,和mac一样
结束、重新对话、重新启动,都和mac一样的命令。
接下来接入微信:
1,在终端输入以下代码按回车等待安装完成。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
2,装完加载shell,输入以下命令执行。
source ~/.zshrc
hermes --version
其他步骤按照视频来操作,以下使用到的命令。
1,给微信配聊天入口命令
hermes gateway setup
2,大多数人本机地址,如果你没改过端口就用下面这个。
http://127.0.0.1:11434/v1
3,启动网关命令
hermes gateway
如果不想玩了,想卸载全部,复制下面整段代码到终端回车。
hermes gateway stop 2>/dev/null
pkill -f "hermes gateway" 2>/dev/null
pkill ollama 2>/dev/null
launchctl unload ~/Library/LaunchAgents/ai.hermes.gateway.plist 2>/dev/null
rm -f ~/Library/LaunchAgents/ai.hermes.gateway.plist
rm -rf ~/.hermes
rm -rf ~/.ollama
rm -rf ~/.cache/uv
rm -rf ~/.local/share/uv
sudo rm -f /usr/local/bin/ollama
rm -rf /Applications/Ollama.app
rm -f ~/.local/bin/hermes
rm -f /usr/local/bin/hermes
rm -f ~/.cargo/bin/hermes
删完后再检查有没有删干净,出现NO开头的说明全部删除干净
command -v hermes
command -v ollama
ls ~/.hermes
ls ~/.ollama
ls ~/Library/LaunchAgents | grep hermes
评论