### [CodeGeeX4：清华大学出品的9B全能代码模型，性能超越70B级大模型](https://www.willai.cc/article/3164)

**Published:** 2026-07-02T23:58:50

**Author:** hiyoho

**Excerpt:** CodeGeeX4-ALL-9B 是清华大学 KEG 实验室与智谱 AI 联合推出的第四代多语言代码生成模型。仅 9B 参数即在 HumanEval、MBPP、BigCodeBench 等基准上全面超越 Llama3-70B 等超大模型，并原生支持 Function Call，是当前 10B 以下最强代码模型。

CodeGeeX4

清华大学 KEG 实验室 × 智谱 AI 联合出品

ALL-9B 全能模型 · 代码生成 · Function Call · 仓库级理解

⭐ 最新一代  
🚀 9B 超越 70B  
🏆 BigCodeBench SOTA

## 📝 项目简介

**CodeGeeX4** 是清华大学 KEG 实验室与智谱 AI 联合推出的**第四代多语言代码生成模型**，基于 GLM-4-9B 持续训练，在代码生成、代码解释、Web 搜索、Function Call、仓库级 Q&A 等全场景软件开发生命周期中均提供卓越表现。**仅 9B 参数即超越 Llama3-70B、DeepSeekCoder-33B 等超大模型**，是当前 10B 以下参数规模中综合性能最强的代码模型。

9B

模型参数

82.3%

HumanEval Pass@1

128K

上下文长度

⭐ 30K+

GitHub Stars

## ⚙️ 安装要求和过程

### 💻 环境要求

-   Python 3.10+（推荐 3.11）
-   CUDA 12.1+（GPU 推理）
-   PyTorch 2.0+ 或 vLLM 0.5.1+
-   内存：FP16 推理约 18GB，INT4 量化约 6GB
-   操作系统：Windows / macOS / Linux 全平台支持

### 🚀 快速安装（Ollama — 最简单）

```
# 安装 Ollama（需 0.2+ 版本）
# macOS/Linux:
curl -fsSL https://ollama.com/install.sh | sh

# Windows: 从 https://ollama.com/download 下载安装

# 一键运行 CodeGeeX4
ollama run codegeex4
```

### 🐍 使用 transformers 推理

```
pip install transformers==4.40.0 torch

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model = AutoModelForCausalLM.from_pretrained(
    "THUDM/codegeex4-all-9b",
    torch_dtype=torch.bfloat16,
    trust_remote_code=True
).cuda().eval()
tokenizer = AutoTokenizer.from_pretrained(
    "THUDM/codegeex4-all-9b",
    trust_remote_code=True
)

# 对话格式
prompt = [{"role":"user","content":"写一个快速排序"}]
inputs = tokenizer.apply_chat_template(prompt, add_generation_prompt=True, return_tensors="pt").cuda()
outputs = model.generate(inputs, max_new_tokens=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
```

### ⚡ vLLM 高性能部署

```
pip install vllm==0.5.1

# 启动 OpenAI 兼容 API 服务
python -m vllm.entrypoints.openai.api_server     --model THUDM/codegeex4-all-9b     --trust-remote-code     --tensor-parallel-size 1

# 然后即可用 OpenAI SDK 调用
# pip install openai
# client = OpenAI(base_url="http://localhost:8000/v1", api_key="dummy")
```

## ✨ 核心功能

💬 全场景代码助手

支持代码补全、代码生成、代码解释、代码翻译、文档生成、Bug 修复等全场景，基于 ChatGLM2/GLM-4 架构，中英文理解能力优异。

🔧 Function Call 原生支持

唯一原生支持 Function Call 的代码模型，Function Call 执行成功率甚至超越 GPT-4。可无缝接入 AI Agent 工具调用链路。

📦 仓库级代码理解

支持 128K 超长上下文，可理解整个代码仓库。支持仓库级 Q&A、跨文件代码补全、自动 commit 等高级功能。

🌐 多平台部署

支持 Ollama / vLLM / transformers / Rust-candle 多种推理后端；支持 VS Code、JetBrains 全系列 IDE 插件；支持本地 / 云端双模式。

🏆 性能全面领先（10B 以下模型）

HumanEval 82.3% · MBPP 75.7% · NaturalCodeBench 40.4% · BigCodeBench 48.9%（complete）/ 40.4%（instruct）· CRUXEval-O 47.1%。在代码推理、代码理解、代码执行等全方位评测中均取得 10B 以下模型最佳成绩。

## 🎯 典型使用场景

场景一：IDE 智能编程助手（最适合日常使用）

在 VS Code 或 JetBrains IDE 中安装 CodeGeeX 插件，即可体验：

-   **代码补全**：根据上下文自动补全下一行 / 下一个函数
-   **上下文补全**：基于仓库内其他文件提供跨文件补全建议
-   **Ask CodeGeeX**：中英文对话解决编程问题，支持代码解释、翻译、纠错
-   **本地模式**：连接本地 Ollama 运行的 CodeGeeX4，数据完全不出本地

💡 支持超过 100 种编程语言！

场景二：AI Agent Function Call 工具

CodeGeeX4 原生支持 Function Call，可以：

-   作为 AI Agent 的代码生成工具，解析自然语言需求生成代码
-   接入 OpenAI 兼容 API，与 LangChain / AutoGen 等 Agent 框架无缝集成
-   支持仓库级代码操作（增删改文件），实现 AI 自动 commit
-   结合 vLLM 部署，支持多并发、高吞吐的生产环境调用

场景三：本地私有化部署（数据安全敏感场景）

对于数据隐私有严格要求的企业 / 个人，CodeGeeX4 提供完善的本地部署方案：

-   通过 Ollama 一行命令启动，INT4 量化仅需 6GB 显存
-   支持连接 VS Code / JetBrains 插件，体验与云端一致
-   支持昇腾 / NVIDIA 全系列硬件，包括国产 AI 芯片
-   代码和数据完全不离开本地，满足企业合规要求

## 💡 推荐理由

作为 AI 编程工具的深度用户，我试用过 GitHub Copilot、Claude Code、Cursor 等各类产品，CodeGeeX4 给我留下了极其深刻的印象：

**① 性价比无敌**：9B 参数的小模型，性能直接干翻 70B 的 Llama3 和 33B 的 DeepSeekCoder。这意味着你用消费级显卡（甚至 6GB 显存的 RTX 3060）就能跑一个世界级代码模型。

**② Function Call 是杀手锏**：在 AI Agent 时代，代码模型不能只做补全，还要能调用工具。CodeGeeX4 是唯一原生支持 Function Call 的开源代码模型，而且执行成功率比 GPT-4 还高。这对构建 AI 编程 Agent 来说是个游戏规则改变者。

**③ 清华大学 + 智谱 AI 双背书**：KEG 实验室（唐杰教授团队）在 NLP 和代码生成领域深耕多年，CodeGeeX 系列从 2022 年做到 2026 年，四代演进，成熟度远超同类竞品。智谱 AI 的 GLM 架构也在持续迭代优化。

**④ 真正可用的 IDE 插件**：很多开源模型只提供权重，没有好的用户体验。CodeGeeX 的 VS Code / JetBrains 插件做得相当完善，上下文补全、跨文件理解、Ask CodeGeeX 对话，体验不输商业产品。

如果你在找一个**能本地部署、性能好、中文友好**的 AI 编程助手，CodeGeeX4 是目前**唯一的最优解**。

## 📊 性能对比（10B 以下模型）

| 模型  | 参数  | HumanEval | MBPP | NCB | Function Call |
| --- | :---: | :---: | :---: | :---: | :---: |
| CodeGeeX4-ALL-9B | 9B  | 82.3% | 75.7% | 40.4% | ✅ 超越GPT-4 |
| Llama3-70B-Instruct | 70B | 77.4% | 82.3% | 37.0% | —   |
| DeepSeekCoder-33B | 33B | 81.1% | 80.4% | 39.3% | —   |
| Codestral-22B | 22B | 81.1% | 78.2% | 46.0% | —   |

数据来源：CodeGeeX4 官方 README，NCB = NaturalCodeBench

## 📚 CodeGeeX 系列演进

CodeGeeX（第一代，2022）

13B 参数，基于华为昇腾芯片训练，在 20+ 编程语言上预训练。配套开源 HumanEval-X 多语言评测基准。Apache-2.0 开源。

CodeGeeX2（第二代，2023）

基于 ChatGLM2-6B，6B 参数即超越 15B 的 StarCoder。支持 8192 序列长度，量化后仅需 6GB 显存。HumanEval-X 全面提升（+57%~+321%）。

CodeGeeX4（第四代，2024）

基于 GLM-4-9B，9B 参数全能模型。支持 Function Call、仓库级 Q&A、128K 上下文。BigCodeBench / NaturalCodeBench / CRUXEval 全基准 SOTA。Apache-2.0 开源。

## 📥 下载地址

[

🐙 GitHub 仓库（CodeGeeX4）

https://github.com/THUDM/CodeGeeX4

](https://github.com/THUDM/CodeGeeX4)  
[

🐙 GitHub 仓库（CodeGeeX2，仍广泛使用的稳定版）

https://github.com/zai-org/CodeGeeX2

](https://github.com/zai-org/CodeGeeX2)  
[

🤗 HuggingFace 模型权重

https://huggingface.co/THUDM/codegeex4-all-9b

](https://huggingface.co/THUDM/codegeex4-all-9b)  
[

🌐 官方网站（IDE 插件下载）

https://codegeex.cn

](https://codegeex.cn)  
[

🦙 Ollama 一键运行

https://ollama.com/library/codegeex4

](https://ollama.com/library/codegeex4)  
[

💻 VS Code 插件

https://marketplace.visualstudio.com/items?itemName=aminer.codegeex

](https://marketplace.visualstudio.com/items?itemName=aminer.codegeex)  
[

🔧 JetBrains 插件（全系列 IDE 支持）

https://plugins.jetbrains.com/plugin/20587-codegeex

](https://plugins.jetbrains.com/plugin/20587-codegeex)

由自动化任务发布 · GitHub 热门 AI 开源项目系列 · 清华大学 KEG 实验室 × 智谱 AI

**Tags:** AI, AI Agent, AI开源项目, CodeGeeX, GLM, LLM, MIT许可, Ollama, Python, 代码生成

**Categories:** 开源项目

---