智能体AppAgentX：西湖大学发布自我进化手机游戏达人，引领科技新潮流 —— 大浪资讯报道

admin392025-03-09 13:12:19

在人工智能领域，我们正见证一场前所未有的变革。其中，大语言模型（LLM）的崛起成为推动智能系统从信息处理向自主交互迈进的强大动力。

以DeepSeek为代表的LLM，凭借其强大的语言理解和推理能力，在文本创作、编程辅助、复杂任务规划等多个领域展现出令人瞩目的表现。这些模型不仅能够生成高质量的文本内容，还能在编程和任务规划中提供智能的辅助。

然而，LLM的潜力远不止于此。它们正在塑造一种全新的智能体形态——GUI代理（GUI Agents）。这类智能体不仅能够理解指令，还能像人类一样直接操作计算机和手机，摆脱对预设规则或API的依赖，带来更自然、高效的交互方式。这使得AI真正融入软件生态，成为智能操作系统的一部分。

尽管LLM代理在推理能力上表现出色，但在任务执行效率上却存在明显瓶颈。为了解决这一问题，西湖大学AGI实验室的张驰团队推出了AppAgentX——一款具备自我进化能力的GUI代理。

AppAgentX的核心创新在于：

过去，计算机的自动化操作主要依赖RPA（机器人流程自动化），通过预设规则或API进行固定任务的执行。然而，这种方式需要大量手动配置，缺乏灵活性。GUI代理的出现，改变了这一局面，被誉为软件世界中的具身智能。

GUI代理不依赖后端API，而是像人类一样，通过屏幕视觉、鼠标和键盘直接操作软件界面。这意味着，智能体可以自主学习如何操作各种应用程序，甚至能够在不同软件之间切换，执行复杂的跨应用任务。

以下是一些AppAgentX的应用场景示例：

AppAgentX作为一项创新的移动终端交互技术，通过构建链式知识存储架构与动态匹配执行机制，在保持大型语言模型代理灵活性的同时显著提升执行效能，实现了无需后端访问的图形界面智能操作系统。这项技术突破性地解决了传统智能体在响应速度与认知能力间的平衡难题，为移动端AI应用开辟了新的技术路径。

本文来自微信公众号：量子位（ID：QbitAI），作者：西湖大学，原标题《AI 玩手机越玩越6！西湖大学发布新智能体：会自我进化的AppAgentX》。

随机文章

侧栏广告位