Open-AutoGLM – 智譜開源的手機端AI Agent
發(fā)布日期:2025/12/10 8:44:09 瀏覽量:
Open-AutoGLM 是智譜開源的手機端智能助理框架,基于 AutoGLM 構(gòu)建,能通過自然語言指令實現(xiàn)手機操作的自動化。Open-AutoGLM通過 Phone Use 能力框架,將自然語言指令轉(zhuǎn)化為實際操作,如點擊、滑動、輸入等,可在外賣、社交、客服等場景中自動完成任務(wù)??蚣芙柚剖謾C技術(shù)保障隱私安全。Open-AutoGLM 開源目的是推動行業(yè)共同進步,保護用戶隱私,加速 Agent 技術(shù)爆發(fā)。目前支持 50 多款主流中文應(yīng)用,提供完整工具鏈和詳細文檔,助力開發(fā)者快速上手和二次開發(fā)。
Open-AutoGLM的主要功能
-
自然語言理解與任務(wù)執(zhí)行:用戶能用自然語言描述需求,AI 自動解析意圖、執(zhí)行操作。
-
多模態(tài)界面理解:通過視覺語言模型理解手機屏幕內(nèi)容,識別界面元素進行操作。
-
自動化操作:支持點擊、滑動、輸入文本、長按、雙擊等多種操作,模擬真實用戶行為。
-
敏感操作確認與人工接管:在涉及隱私或敏感操作時,AI 會請求人工確認或接管,確保安全性。
-
遠程調(diào)試與控制:支持通過 WiFi 或網(wǎng)絡(luò)進行遠程 ADB 調(diào)試,無需物理連接設(shè)備即可操作。
-
支持多款應(yīng)用:覆蓋 50 多款主流中文應(yīng)用,包括社交通訊、電商購物、美食外賣、視頻娛樂等場景。
-
云手機環(huán)境部署:在云端虛擬設(shè)備中運行,保障用戶隱私和數(shù)據(jù)安全。
如何使用Open-AutoGLM
-
準(zhǔn)備工作
- 安裝 Python:確保電腦上安裝了 Python(推薦 3.10 及以上版本)。
- 安裝 ADB:下載并安裝 ADB https://developer.android.com/studio/releases/platform-tools。安裝完成后,將 ADB 的路徑添加到系統(tǒng)環(huán)境變量中。
- 配置安卓設(shè)備:確保安卓設(shè)備已啟用開發(fā)者模式和USB調(diào)試,并連接到電腦。
-
下載和安裝
-
下載 Open-AutoGLM:
- 訪問 Open-AutoGLM GitHub 倉庫 https://github.com/zai-org/Open-AutoGLM。
- 點擊頁面右上角的 “Code” 按鈕,選擇 “Download ZIP”,下載項目代碼。
- 解壓下載的文件到本地一個方便的目錄(如 C:\Open-AutoGLM 或 ~/Open-AutoGLM)。
-
安裝依賴:
- 打開命令行工具(Windows 的命令提示符或 PowerShell,Mac/Linux 的終端)。
- 切換到解壓后的項目目錄:
- cd path/to/Open-AutoGLM
- 輸入以下命令安裝依賴:
- pip install -r requirements.txt
-
啟動模型服務(wù):
- 輸入以下命令啟動模型服務(wù)(這是必須的步驟,但不需要理解代碼):
- python3 -m vllm.entrypoints.openai.api_server --model zai-org/AutoGLM-Phone-9B --port 8000
- 如果看到服務(wù)啟動成功的提示,就可以進行下一步。
-
下載 Open-AutoGLM:
- 運行任務(wù):打開一個新的命令行窗口,輸入以下命令執(zhí)行任務(wù)(只需要替換任務(wù)描述即可):python main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b" "任務(wù)描述"
Open-AutoGLM的項目地址
- GitHub倉庫:https://github.com/zai-org/Open-AutoGLM
- HuggingFace模型庫:https://huggingface.co/zai-org/AutoGLM-Phone-9B
Open-AutoGLM的應(yīng)用場景
- 外賣點餐:用戶只需用自然語言描述需求,Open-AutoGLM 能自動打開美團應(yīng)用、搜索肯德基、選擇全家桶套餐并完成下單操作。
- 社交媒體互動:在微信、微博等社交應(yīng)用中,用戶可指令 AI“點贊好友的最新動態(tài)”或“評論抖音視頻”,AI 將自動識別相關(guān)內(nèi)容,執(zhí)行點贊、評論等互動操作。
- 辦公自動化:在辦公軟件(如 WPS、Microsoft Office)中,用戶通過語音或文字指令“創(chuàng)建一個名為‘項目計劃’的文檔并寫入會議內(nèi)容”,AI 能完成文檔創(chuàng)建和內(nèi)容編輯。
- 智能家居控制:通過智能家居應(yīng)用(如小米智能家居),Open-AutoGLM 能精準(zhǔn)識別、控制相應(yīng)設(shè)備,實現(xiàn)家居場景的自動化切換。
- 交通出行:在地圖或打車應(yīng)用(如高德地圖、滴滴出行)中,AI 將實時規(guī)劃路線,完成叫車操作,方便快捷。
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生