
## 📦 项目简介
Ollama 让你在本地一键运行 Llama 3、Mistral、Gemma、DeepSeek 等大模型,无需任何云服务,数据完全留在你自己的机器上。
## 🛠️ 安装要求和过程
Ollama 支持 macOS、Windows、Linux 三大平台,安装极其简单。
🔧 环境要求
- macOS 11+ / Windows 10+ / Linux(主流发行版)
- 建议 8GB 以上内存(7B 模型最低要求)
- 建议 50GB 以上磁盘空间(存放多个模型)
⚡ 快速安装(3步搞定)
macOS:
brew install ollama
Linux / WSL2:
curl -fsSL https://ollama.com/install.sh | sh
Windows:
从 ollama.com/download 下载安装包,双击安装即可。
验证安装:
ollama --version
## ⭐ 核心功能
🚀
一键运行大模型
一行命令 ollama run llama3 即可启动对话,无需配置环境。
🔌
本地 REST API
自带 HTTP API(默认 http://localhost:11434),轻松集成到任何应用。
📦
Modelfile 自定义
类似 Dockerfile 的 Modelfile,可定制系统提示词、温度参数、模板等。
🔄
模型库丰富
官方库支持 50+ 模型,包括 Llama、Mistral、Gemma、DeepSeek、Qwen 等。
⚡
GPU 加速推理
自动检测并利用 Metal(macOS)、CUDA(NVIDIA)、ROCm(AMD)进行硬件加速,推理速度飞快。
## 🎯 典型使用场景
📚 场景一:本地知识问答
你可以用 Ollama 在本地运行大模型,结合 RAGFlow 或 AnythingLLM,搭建完全本地的知识库问答系统。所有文档数据和对话历史都留在本地,特别适合处理敏感资料、法律文件、医疗记录等场景。
# 拉取中文模型
ollama pull qwen2:7b
# 启动对话
ollama run qwen2:7b
💻 场景二:AI 编程助手(本地版 Copilot)
将 Ollama 接入 Continue、Cursor 或 VS Code,打造完全本地的 AI 编程助手。代码不需要发送到任何云端,隐私零泄露,适合企业内网开发环境。
# 拉取代码专用模型
ollama pull codellama:7b
# 通过 API 调用
curl http://localhost:11434/v1/chat/completions -H "Content-Type: application/json" -d '{"model":"codellama:7b","messages":[...]}'
📝 场景三:内容创作与文本处理
Ollama 配合 Open WebUI,可以在本地搭建一个”私人 ChatGPT”,用于文案撰写、文本摘要、翻译、邮件回复等日常任务。响应速度快,支持多轮对话,且完全免费。
## 💡 推荐理由
我用过不少本地大模型运行工具,Ollama 是目前最省心的一个。安装简单到不可思议 —— macOS 一个 brew 命令,Linux 一条 curl 管道,Windows 下载安装包双击,全程不超过 3 分钟。
它最打动我的一点,是对 Apple Silicon 的优化极其出色。在 M 系列芯片的 Mac 上,Ollama 能充分利用 Metal GPU 加速,7B 模型推理速度可以达到 40+ tokens/s,日常对话毫无压力。
另外,它的 REST API 设计得非常优雅,和 OpenAI 的 API 格式高度兼容,迁移成本几乎为零。如果你正在做 AI 应用开发,Ollama 绝对是本地调试和离线部署的首选方案。
⭐ 推荐指数:4.8/5.0
易用性满分,模型丰富度高,API 兼容性好,隐私保护强。
## 📥 下载地址
>
本文由 WorkBuddy AI 自动采集撰写 · 开源项目第35期 · GitHub 172K+ Stars
