暂无菜单项

Browser-Use:97.8K Stars!让AI Agent自动操控浏览器的开源神器

发布于
3

Browser-Use:97.8K Stars!让AI Agent自动操控浏览器的开源神器

📝 项目简介

Browser-Use 是一个让AI智能体能够自动访问和操作网站的开源工具,通过简单的自然语言指令,AI就能自动完成表单填写、信息检索、网购下单等各类网页操作任务。

🌐 官网:https://browser-use.com

📦 GitHub:https://github.com/browser-use/browser-use

⭐ Stars:97.8K+

📄 开源协议:MIT License

💻 安装要求和过程

环境要求

  • Python >= 3.11
  • 推荐使用包管理工具 uv
  • 可选:Playwright(用于浏览器自动化)

快速安装步骤

# 初始化项目并安装
uv init && uv add browser-use && uv sync

# 如果需要安装Chromium浏览器(首次使用)
uvx browser-use install

# 可选:使用实验性Rust核心(更快性能)
curl -fsSL https://browser-use.com/terminal/install.sh | sh

配置API密钥(可选)

# 使用Browser Use Cloud(推荐)
export BROWSER_USE_API_KEY="your_api_key"

# 或使用其他LLM服务
export GOOGLE_API_KEY="your_google_key"
export ANTHROPIC_API_KEY="your_anthropic_key"
export OPENAI_API_KEY="your_openai_key"

✨ 核心功能

1. 🤖 AI智能体浏览器自动化

通过自然语言指令让AI自动完成网页操作,无需编写复杂的自动化脚本。AI会智能识别页面元素,自动完成点击、输入、滚动、截图等操作。

2. 🌐 多场景任务支持

覆盖表单填写、生鲜采购、硬件选购、信息检索等各类线上任务。无论是自动化测试、数据采集还是日常办公,都能轻松应对。

3. 🔧 灵活部署方案

支持开源本地部署和云端托管两种使用方式。本地部署完全免费,云端版本提供指纹伪装、代理轮换、验证码破解等高级功能。

4. 🔌 强大的扩展能力

支持添加自定义工具、接入MCP工具、对接1000+第三方应用(Gmail、Slack、Notion等)。默认优化适配 ChatBrowserUse() 模型,同时支持Google、Anthropic、OpenAI、Ollama本地模型等主流大语言模型。

5. 💻 CLI命令行工具

提供命令行工具,支持快速导航、元素点击、文本输入、截图等浏览器操作,支持多命令间浏览器状态保持,非常适合脚本化和自动化场景。

🎯 典型使用场景

场景一:自动化表单填写

自动填写求职申请、各类线上登记表,可自动匹配简历信息,大大提升效率。对于需要重复填写类似表单的场景,可以节省大量时间。

from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    agent = Agent(
        task="打开求职网站,填写我的简历信息并提交申请",
        llm=ChatBrowserUse(),
    )
    await agent.run()

if __name__ == "__main__":
    asyncio.run(main())

场景二:电商自动化操作

自动将购物清单加入购物车、比价、下单等。可以编写脚本定期监控商品价格,在合适的时候自动下单。

场景三:信息查询与数据采集

自动查询GitHub仓库Star数、检索商品信息、收集公开数据等。配合定时任务,可以实现全自动的数据监控和采集。

from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser(
        # use_cloud=True,  # 可选:使用Browser Use Cloud的云端隐身浏览器
    )
    agent = Agent(
        task="查找browser-use仓库的Star数量",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

if __name__ == "__main__":
    asyncio.run(main())

💡 推荐理由

作为一名开发者,我深刻体会到浏览器自动化在日常工作中的重要性。传统的Selenium、Playwright等工具虽然强大,但需要编写大量的代码来处理各种页面元素和交互逻辑。

Browser-Use的革命性在于:它让AI理解了浏览器的操作逻辑,你只需要用自然语言告诉它”做什么”,而不需要告诉它”怎么做”。

我个人使用Browser-Use的几个心得:

  • 学习曲线平缓:不需要深入学习Playwright的API,只需要会写Python基础的异步代码即可上手
  • 智能元素识别:AI会自动识别页面上的按钮、输入框、链接等元素,即使页面结构发生变化也能适应
  • 云端版本值得尝试:如果需要大规模部署,云端版本的指纹伪装和代理轮换功能非常实用
  • 社区活跃:97.8K的Stars数量说明了项目的热度,Issue响应速度快,文档完善

如果你正在寻找一个让AI帮你操作浏览器的工具,Browser-Use绝对是2026年最值得关注的开源项目之一!

📥 下载地址

🌐 官方网站:https://browser-use.com

☁️ 云端服务:https://cloud.browser-use.com

📦 GitHub仓库:https://github.com/browser-use/browser-use

📚 官方文档:https://docs.browser-use.com

💬 Discord社区:https://discord.gg/browser-use


📌 本文是《GitHub热门AI开源项目》系列的第17期,每期介绍一个热门的AI开源项目。欢迎关注本栏目,获取更多优质开源项目介绍!

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600