Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。系统通过 ADB(Android Debug Bridge) 来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。用户只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。
![Open-AutoGLM[ai 手机部署] Open-AutoGLM[ai 手机部署]](https://blog.ydzl.fun/wp-content/uploads/2026/01/image.png)
先将代码拉取到本地
![Open-AutoGLM[ai 手机部署] Open-AutoGLM[ai 手机部署]](https://blog.ydzl.fun/wp-content/uploads/2026/01/image-1.png)
然后安装所需要的环境和库
即可使用
使用第三方模型服务
1. 智谱 BigModel
- 文档: https://docs.bigmodel.cn/cn/api/introduction
--base-url:https://open.bigmodel.cn/api/paas/v4--model:autoglm-phone--apikey: 在智谱平台申请你的 API Key
先申请 key
使用第三方服务的示例:
python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "这里请输入你的 kye" "打开抖音模拟用户正常养号三十分钟"
开源地址:https://github.com/zai-org/Open-AutoGLM?tab=readme-ov-file
![Open-AutoGLM[ai 手机部署] Open-AutoGLM[ai 手机部署]](https://blog.ydzl.fun/wp-content/uploads/2026/01/image-2.png)
正常可以奔放
正文完