Browser-Use:97.8K Stars!让AI Agent自动操控浏览器的开源神器
📝 项目简介
Browser-Use 是一个让AI智能体能够自动访问和操作网站的开源工具,通过简单的自然语言指令,AI就能自动完成表单填写、信息检索、网购下单等各类网页操作任务。
💻 安装要求和过程
环境要求
- Python >= 3.11
- 推荐使用包管理工具
uv - 可选:Playwright(用于浏览器自动化)
快速安装步骤
# 初始化项目并安装
uv init && uv add browser-use && uv sync
# 如果需要安装Chromium浏览器(首次使用)
uvx browser-use install
# 可选:使用实验性Rust核心(更快性能)
curl -fsSL https://browser-use.com/terminal/install.sh | sh配置API密钥(可选)
# 使用Browser Use Cloud(推荐)
export BROWSER_USE_API_KEY="your_api_key"
# 或使用其他LLM服务
export GOOGLE_API_KEY="your_google_key"
export ANTHROPIC_API_KEY="your_anthropic_key"
export OPENAI_API_KEY="your_openai_key"✨ 核心功能
1. 🤖 AI智能体浏览器自动化
通过自然语言指令让AI自动完成网页操作,无需编写复杂的自动化脚本。AI会智能识别页面元素,自动完成点击、输入、滚动、截图等操作。
2. 🌐 多场景任务支持
覆盖表单填写、生鲜采购、硬件选购、信息检索等各类线上任务。无论是自动化测试、数据采集还是日常办公,都能轻松应对。
3. 🔧 灵活部署方案
支持开源本地部署和云端托管两种使用方式。本地部署完全免费,云端版本提供指纹伪装、代理轮换、验证码破解等高级功能。
4. 🔌 强大的扩展能力
支持添加自定义工具、接入MCP工具、对接1000+第三方应用(Gmail、Slack、Notion等)。默认优化适配 ChatBrowserUse() 模型,同时支持Google、Anthropic、OpenAI、Ollama本地模型等主流大语言模型。
5. 💻 CLI命令行工具
提供命令行工具,支持快速导航、元素点击、文本输入、截图等浏览器操作,支持多命令间浏览器状态保持,非常适合脚本化和自动化场景。
🎯 典型使用场景
场景一:自动化表单填写
自动填写求职申请、各类线上登记表,可自动匹配简历信息,大大提升效率。对于需要重复填写类似表单的场景,可以节省大量时间。
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
agent = Agent(
task="打开求职网站,填写我的简历信息并提交申请",
llm=ChatBrowserUse(),
)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())场景二:电商自动化操作
自动将购物清单加入购物车、比价、下单等。可以编写脚本定期监控商品价格,在合适的时候自动下单。
场景三:信息查询与数据采集
自动查询GitHub仓库Star数、检索商品信息、收集公开数据等。配合定时任务,可以实现全自动的数据监控和采集。
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser(
# use_cloud=True, # 可选:使用Browser Use Cloud的云端隐身浏览器
)
agent = Agent(
task="查找browser-use仓库的Star数量",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())💡 推荐理由
作为一名开发者,我深刻体会到浏览器自动化在日常工作中的重要性。传统的Selenium、Playwright等工具虽然强大,但需要编写大量的代码来处理各种页面元素和交互逻辑。
Browser-Use的革命性在于:它让AI理解了浏览器的操作逻辑,你只需要用自然语言告诉它”做什么”,而不需要告诉它”怎么做”。
我个人使用Browser-Use的几个心得:
- 学习曲线平缓:不需要深入学习Playwright的API,只需要会写Python基础的异步代码即可上手
- 智能元素识别:AI会自动识别页面上的按钮、输入框、链接等元素,即使页面结构发生变化也能适应
- 云端版本值得尝试:如果需要大规模部署,云端版本的指纹伪装和代理轮换功能非常实用
- 社区活跃:97.8K的Stars数量说明了项目的热度,Issue响应速度快,文档完善
如果你正在寻找一个让AI帮你操作浏览器的工具,Browser-Use绝对是2026年最值得关注的开源项目之一!
📥 下载地址
🌐 官方网站:https://browser-use.com
☁️ 云端服务:https://cloud.browser-use.com
📦 GitHub仓库:https://github.com/browser-use/browser-use
📚 官方文档:https://docs.browser-use.com
💬 Discord社区:https://discord.gg/browser-use
📌 本文是《GitHub热门AI开源项目》系列的第17期,每期介绍一个热门的AI开源项目。欢迎关注本栏目,获取更多优质开源项目介绍!
