Multi-Agent下的GUI-Agent:Mano-P
發(fā)布日期:2026/4/26 9:18:32 瀏覽量:
Mano-P 是什么

核心能力包括:
復(fù)雜 GUI 自動化:自主完成含數(shù)百交互元素的界面操作
跨系統(tǒng)數(shù)據(jù)整合:通過純視覺交互提取多源數(shù)據(jù),無需 API 接口
長任務(wù)規(guī)劃執(zhí)行:支持?jǐn)?shù)十至數(shù)百步驟的企業(yè)級業(yè)務(wù)流程自動化
智能報告生成:自動生成數(shù)據(jù)分析報告、工作總結(jié)等結(jié)構(gòu)化文檔
項目地址:https://github.com/MININGLAMP-AI/MANO-P
實用場景
官方給出的幾個實際案例演示,覆蓋了日常開發(fā)、工作、娛樂等幾大場景。
1)Mano-afk 全自動應(yīng)用構(gòu)建
輸入一段自然語言需求,系統(tǒng)自動完成架構(gòu)設(shè)計、代碼生成、本地部署。
測試不通過,會自動定位問題、修復(fù)、重新部署,全程無需人工介入。
2)商業(yè)級視頻智能系統(tǒng)
從接收指令開始,自動完成視頻生成、上傳、分析、剪輯,再到二次評測。
過程中可自主操作網(wǎng)頁與剪輯軟件,最后輸出完整的分析報告。
3)麻將博弈
Mano-P 不只是一個工作工具,官方還給出了生活娛樂場景的演示。
通過純視覺理解麻將游戲界面,自主完成識牌、分析和出牌決策,驗證了模型在非結(jié)構(gòu)化場景下的通用能力。
快速安裝
想使用 Mano-P 來完成 GUI 自動化任務(wù),有兩種方式。
方式一:CLI 命令行工具
在終端上,通過 Homebrew 安裝 mano-cua 命令行工具:
brew tap HanningWang/tap
安裝完成后,就能直接在終端下達(dá)執(zhí)行任務(wù)指令:
mano-cua run "在小紅書整理 AI 最新資訊,按熱度排名并展示第一條帖子"
方式二:以 Skill 方式安裝
有 Claude Code、OpenClaw 等 Agent 工具,可通過 ClawHub 一鍵安裝 mano-skill:
clawhub install mano-cua
重啟會話后,Agent 遇到需要操控界面的任務(wù),會自動調(diào)用,不用手動觸發(fā)。
一臺 M4 芯片 Mac 電腦,兩行命令,Mano-P 1.0 這個 GUI Agent 模型就能直接順滑跑起來。
目前相關(guān)代碼已開源 Mano-CUA Skill 部分,本地模型預(yù)計四月底開源。
需要注意的是,如果沒有配置本地模型,工具默認(rèn)會走云端模式。
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生