
3
0
0
介绍详情
Mobile-Agent: 强大的 GUI 代理家族
简介
Mobile-Agent 是由阿里巴巴通义实验室开发的 GUI 代理家族,专注于跨平台和多模态代理技术。它广泛应用于移动设备和 PC 的自动化任务,具有强大的感知、规划和执行能力。
功能特点
- 跨平台交互:支持移动设备和 PC 的自动化操作。
- 多模态支持:结合视觉感知和语言理解,实现复杂任务自动化。
- 动态任务分解:能够动态分解任务并进行规划和进度管理。
- 异常处理:具备强大的异常处理和反思能力,提高稳定性。
最新动态
- 2025.9.10:开源了 Mobile-Agent-v3 代码。
- 2025.8.29:开源了 AndroidWorld 基准测试代码。
- 2025.8.20:发布了全新的 GUI-Owl 和 Mobile-Agent-v3。
应用场景
- 移动设备:自动化操作如搜索、保存内容等。
- PC:自动化创建 PPT、插入文本等任务。
- Web:自动化搜索航班信息等。
研究与引用
Mobile-Agent 系列工作已被多个顶级会议接受,包括 NeurIPS 2024 和 ICLR 2025。
获取与支持
- GitHub 仓库:X-PLUG/MobileAgent
- 许可证:MIT

数智AI导航是专业的AI工具导航平台,每日精准收录了前沿又好用的各种人工智能工具,在这里你可以发现和使用最酷的AI工具!
Copyright©2024-2026 数智AI
浙ICP备2024109125号-1