Magentic-UI是微软开源的以人为中心的网页代理研究原型,基于多代理系统实现网页浏览与操作、代码生成执行、文件分析等功能。支持Python/Docker部署,提供透明可控的人机协作界面。
浏览次数
5
收藏次数
0
点赞次数
0
Magentic-UI
Magentic-UI是微软开源的以人为中心的网页代理研究原型,基于多代理系统实现网页浏览与操作、代码生成执行、文件分析等功能。支持Python/Docker部署,提供透明可控的人机协作界面。
标签: Magentic-UI 微软开源 人机交互网页代理 AI网页自动化 AutoGen 多代理系统
介绍详情

Magentic-UI 简介

Magentic-UI是微软研究院开源的人机交互网页代理研究原型,采用多代理系统架构,具备以下核心能力:

  • üîÜ 网页自动化:自动浏览网页并执行表单填写等交互操作
  • üö¥ 代码生成执行:根据需求动态生成并执行代码
  • üîë 文件分析处理:支持上传文件进行内容分析与修改
  • Ô≠è 多代理协作:基于AutoGen框架构建的智能体协作系统

核心特性

  1. 透明可控的交互界面

    • üßëü§ù 协同规划:通过聊天和计划编辑器共同制定任务流程
    • ü§î 任务中断:可随时干预代理执行过程
    • üõ° 操作防护:敏感操作需人工确认执行
  2. 先进技术架构

    • 采用Docker容器化部署
    • 支持Python 3.10+环境
    • 可扩展的MCP代理系统
  3. 多模型支持

    • OpenAI API集成
    • Azure OpenAI兼容
    • Ollama本地模型支持

安装指南

# 基础安装
python3 -m venv .venv
source .venv/bin/activate
pip install magentic-ui

# 启动服务
magentic-ui --port 8081

üî∂ 系统要求

  • Docker运行环境
  • Python 3.10+
  • Windows用户推荐使用WSL2

应用场景

  • ‚é∑ 深度网页导航(如航班筛选、个人网站链接查找)
  • üí™ 网页数据可视化(在线数据生成图表)
  • üìö 复杂表单自动化处理
  • üîØ 跨网站工作流整合

技术评估

在o4-mini模型下的基准测试表现:

  • GAIA测试集:42.52%
  • WebVoyager测试:82.2%
  • WebGames测试:45.5%

开源信息

  • üîå 许可证:MIT
  • üîÜ GitHub星标:7.5k
  • üî≠ 主要语言:Python(71.3%)/TypeScript(25.8%)

资源链接