Mobile-Agent 是由阿里巴巴通义实验室开发的强大的 GUI 代理家族,专注于跨平台和多模态代理技术,广泛应用于移动设备和 PC 的自动化任务。
浏览次数
3
收藏次数
0
点赞次数
0
MobileAgent
Mobile-Agent 是由阿里巴巴通义实验室开发的强大的 GUI 代理家族,专注于跨平台和多模态代理技术,广泛应用于移动设备和 PC 的自动化任务。
标签: Mobile-Agent GUI 代理 阿里巴巴 多模态代理 移动设备自动化 跨平台 人工智能
介绍详情

Mobile-Agent: 强大的 GUI 代理家族

简介

Mobile-Agent 是由阿里巴巴通义实验室开发的 GUI 代理家族,专注于跨平台和多模态代理技术。它广泛应用于移动设备和 PC 的自动化任务,具有强大的感知、规划和执行能力。

功能特点

  1. 跨平台交互:支持移动设备和 PC 的自动化操作。
  2. 多模态支持:结合视觉感知和语言理解,实现复杂任务自动化。
  3. 动态任务分解:能够动态分解任务并进行规划和进度管理。
  4. 异常处理:具备强大的异常处理和反思能力,提高稳定性。

最新动态

  • 2025.9.10:开源了 Mobile-Agent-v3 代码。
  • 2025.8.29:开源了 AndroidWorld 基准测试代码。
  • 2025.8.20:发布了全新的 GUI-Owl 和 Mobile-Agent-v3。

应用场景

  • 移动设备:自动化操作如搜索、保存内容等。
  • PC:自动化创建 PPT、插入文本等任务。
  • Web:自动化搜索航班信息等。

研究与引用

Mobile-Agent 系列工作已被多个顶级会议接受,包括 NeurIPS 2024 和 ICLR 2025。

获取与支持