-
首個國產(chǎn)“手機(jī)智能體”問世,智譜補(bǔ)位Manus
(文/陳濟(jì)深 編輯/張廣凱)
8月20日,智譜在iOS安卓,PC三端同步推出AutoGLM 2.0,并首次面向公眾全面開放,無需邀請碼即可使用。
作為一款純國產(chǎn)智能體,AutoGLM的發(fā)布也給了中國用戶一個在Manus退出中國后可以合規(guī)便利體驗(yàn)智能體的選擇。
不同于Manus等網(wǎng)頁端原生的智能體產(chǎn)品,智譜AutoGLM 2.0作為全球首個手機(jī)通用Agent,被定位為“執(zhí)行型助手”。相比目前主流AI產(chǎn)品和智能體助手多停留在“對話”層面,只能實(shí)現(xiàn)信息查詢和整理回答,AutoGLM則實(shí)現(xiàn)了質(zhì)的飛躍——它不再只是“說”,而是真正能夠“做”。
3月AutoGLM1.0發(fā)布時,AI盡管也可以操作手機(jī),但是在AI做事期間人不能切屏,不能打斷,只能看著干瞪眼。本次AutoGLM2.0則給每個用戶預(yù)制了一臺虛擬手機(jī)和電腦,直接解決了AI和人搶屏幕的操作痛點(diǎn),讓AI從只能在人眼皮子底下干活變成了“你干你的,我干我的”的異步處理模式。
在實(shí)際測試中,盡管部分功能的執(zhí)行效率和優(yōu)化程度依然有待提升,但目前AutoGLM已經(jīng)可以較好地執(zhí)行包括購物、訂餐、買機(jī)票、自動寫文案等大眾場景,智能體不再是極客們的工具,開始步入了更加大眾的群體。
作為全球首個通用手機(jī)智能體,AutoGLM的發(fā)布也代表著AI從能說會道到真能干活的技術(shù)躍遷,而AI不再需要和人類爭搶手機(jī)開啟“自動駕駛模式”,不僅有效地解放了真人諸多日常繁瑣操作的時間,能夠24小時執(zhí)行任務(wù)的數(shù)字“牛馬”也直接打開了Agent發(fā)展的無數(shù)可能性。
用嘴真能操作手機(jī)
Agent毫無疑問是AI行業(yè)2025年最炙手可熱的關(guān)鍵詞,Manus的出現(xiàn)一度讓Linux底座+調(diào)用外部API“套殼”成為了行業(yè)的主流選擇。但隨著Claude加緊對中國的限制,Manus“跑路”新加坡退出中國后,“套殼”智能體模式在中國顯然難以為繼。
同時,中國用戶側(cè)重移動端的特點(diǎn)也和傳統(tǒng)Agent重PC端輕移動端的思路有所沖突,對于AI智能體到底應(yīng)該是什么產(chǎn)品形態(tài),顯然需要更加了解中國用戶的中國公司去探索開發(fā)。
智譜總裁張鵬對觀察者網(wǎng)表示:“早在2023年底,(智譜)就決定一定要讓Agent有能力去使用手機(jī),有能力去使用電腦,有能力去使用設(shè)備?!?
他表示,一方面目前互聯(lián)網(wǎng)上,很多基礎(chǔ)設(shè)施都隱藏在各種網(wǎng)站和數(shù)據(jù)庫中,如果不采用類似人工點(diǎn)擊瀏覽器登錄的模式,也沒有辦法充分發(fā)揮個人所擁有的生產(chǎn)資料和數(shù)據(jù)帶給你的價值。
另一方面,如果AI不能自己操作設(shè)備,那么很多定時任務(wù)就需要人工點(diǎn)擊開始,而不能類似鬧鐘一般自動執(zhí)行,也難言智能。
相比傳統(tǒng)的問答式和信息輔助式的手機(jī)智能助手主要通過AI輸出文本答案讓用戶自己根據(jù)指示操作,本次新發(fā)布的AutoGLM內(nèi)置了智譜GLM4.5模型,不僅全部國產(chǎn)還實(shí)現(xiàn)了端到端操作設(shè)備的能力,讓AI真的長出了“手”,替用戶自動操作設(shè)備。
在我們的測試任務(wù)中,諸如在趙露思微博超話打卡,點(diǎn)開B站熱門視頻發(fā)布彈幕,美團(tuán)下單奶茶等單一任務(wù),AutoGLM都能迅速在無需干預(yù)的情況下一氣呵成,而傳統(tǒng)多模態(tài)模型的任務(wù)更是信手拈來。
AI生成莫奈風(fēng)格雨中路人圖
面對稍微復(fù)雜一點(diǎn)的單一APP全鏈路操作,AutoGLM也能勝任。
在向AI提出“搜索知乎今日最熱門的話題,總結(jié)一下高贊評論的核心觀點(diǎn),然后關(guān)注點(diǎn)贊數(shù)前三的博主”的需求后,AutoGLM直接登陸了知乎并看到了今日最熱門的話題《黑神話:鐘馗》的官宣,隨后整理了高贊內(nèi)容的核心并順利的關(guān)注點(diǎn)贊了前三的答主。
而隨著任務(wù)進(jìn)一步復(fù)雜涉及長鏈路,多應(yīng)用交互的行為,AutoGLM也能做到常用場景下基礎(chǔ)操作層面的游刃有余。
再給出“播放QQ音樂,搜索今日熱門歌曲播放,然后搜索B站東方明珠大戰(zhàn)蜜雪冰城熱門視頻播放并一鍵三連”的提示后,AutoGLM成功播放了排行榜第一的熱門歌曲時代少年團(tuán)“I Like U Like”,然后打開了B站搜索并播放了“在上海隨便喝蜜雪冰城,故鄉(xiāng)會保護(hù)你”的視頻
值得注意的是,AutoGLM并沒有在搜索結(jié)果中選擇標(biāo)題中明確帶有東方明珠和蜜雪冰城字樣的內(nèi)容,而是似乎理解了這個主題,選擇了播放量最高的相關(guān)內(nèi)容。
不過在測試過程中,在支付、發(fā)布帖子等環(huán)節(jié),依然需要人類接管確認(rèn),我們不止一次遇到在自動發(fā)布文案時觸發(fā)風(fēng)控/系統(tǒng)連接限制等情況無法發(fā)帖的情況。
而想要使用云手機(jī)和云電腦,用戶需要提前在虛擬設(shè)備上登錄賬號。對于用戶安全和隱私問題,智譜表示,其云服務(wù)與阿里云合作,智譜并不會讀取用戶的登錄信息。但是如何贏得用戶的信任顯然并不是一個簡單的問題,也不是智譜一家企業(yè)能夠自行解決的痛點(diǎn)。本次智譜沒有在默認(rèn)程序中內(nèi)置微信這個國民應(yīng)用的理由,恐怕也是出于這方面的用戶顧慮。
在初步體驗(yàn)后,可以發(fā)現(xiàn)AutoGLM除了讓普通用戶也能體驗(yàn)到AI智能體的便捷外,它的出現(xiàn)也顯著的幫助了另一個很容易被忽視的群體——中老年用戶。
互聯(lián)網(wǎng)時代,隨著數(shù)字化和智能化的發(fā)展,無論是銀行,醫(yī)院,還是政務(wù)類業(yè)務(wù),在線或者掃碼辦理成為了司空見慣的日常,而很多APP的交互設(shè)計(jì)對于老年人群體來說難度顯而易見。
另一方面,中老年群體在自主學(xué)習(xí)如何下載APP時,也很容易在安裝各類APP軟件的過程中無意間下載廣告乃至詐騙軟件而不自知。
AutoGLM的出現(xiàn)給出了一個可行的解決方案,讓人適應(yīng)APP轉(zhuǎn)變成了AI代人操作APP,用嘴操作手機(jī),讓AI來實(shí)現(xiàn)萬物互聯(lián)的愿景,方便各類人群使用。
Agent“云端執(zhí)行”的戰(zhàn)略拐點(diǎn)
相比Manus等Agent采用Linux+VSCode的配置范式,智譜本次采用了云端手機(jī)+電腦的技術(shù)新范式。
對于為何選擇云端執(zhí)行的戰(zhàn)略,智譜總裁張鵬分享了AutoGLM的「3A 原則」:
Around-the-clock(全時),是指AI 必須能夠 24 小時待命并持續(xù)執(zhí)行任務(wù)。無論用戶是在工作、睡覺還是娛樂,AI 都應(yīng)在云端持續(xù)產(chǎn)出價值。
Autonomy without interference(自運(yùn)轉(zhuǎn)、零干擾),官方也稱之為 Asynchronous (異步),其核心是 Agent 在云端設(shè)備的獨(dú)立運(yùn)行,不占用用戶的本地屏幕和算力。
Affinity(全域連接),則意味著Agent 的能力不能局限于瀏覽器對話框,必須能連接手機(jī)、電腦、手表、眼鏡等多種設(shè)備與服務(wù),打通數(shù)字世界與物理世界。這三大原則,共同構(gòu)成了 AutoGLM 對一個成熟 Agent 形態(tài)的定義,也解釋了其當(dāng)前產(chǎn)品架構(gòu)。
而為了實(shí)現(xiàn)這個愿景,選擇云手機(jī)和電腦不僅能解決用戶和AI搶屏幕的痛點(diǎn),也解決了軟件適配的難度,成為了順理成章的選擇。
AutoGLM技術(shù)負(fù)責(zé)人、算法研究員劉瀟對觀察者網(wǎng)解釋道:“如果智能體為滿足用戶需求諸如點(diǎn)外賣,發(fā)微信都需要搶占手機(jī)屏幕,AI在做事時真人就不能插手,這種讓人類二選一的情況既不智能也不合理,因此通過本地調(diào)用APP搶占用戶屏幕并不是一個合適的解決方案?!?
搶屏幕帶來的一個副作用便是執(zhí)行中斷的可能,鎖屏、網(wǎng)絡(luò)波動、切換應(yīng)用等任何用戶行為都可能中斷 Agent 的長任務(wù)流。AI難以在用戶非關(guān)注時段(如睡眠、娛樂時)持續(xù)工作,其價值被大打折扣。
采用云手機(jī)/電腦的另一個動機(jī)則在于減少適配難度,尤其是安卓設(shè)備的適配難度,盡管每家基于安卓廠商的系統(tǒng)看著大差不差,實(shí)際上底層可謂大相徑庭,在這個系統(tǒng)生態(tài)下,自家的軟件能在哪個系統(tǒng)跑已經(jīng)屬于玄學(xué)范疇,存在巨大的適配成本門檻。
具體到技術(shù)細(xì)節(jié),過去,許多 Agent 的訓(xùn)練依賴于監(jiān)督微調(diào)(SFT),即學(xué)習(xí)人類專家的操作軌跡。這種方法的弊端是「泛化能力差」——AI 只會模仿它見過的操作,對于未見過的場景或界面改動,往往束手無策。
為了讓 Agent 在復(fù)雜多變的真實(shí)環(huán)境中(數(shù)千個并發(fā)的手機(jī)、電腦、瀏覽器環(huán)境)真正具備完成任務(wù)的能力,AutoGLM 團(tuán)隊(duì)選擇了端到端在線強(qiáng)化學(xué)習(xí)的技術(shù)路線。
其核心思想是,在經(jīng)過少量專家數(shù)據(jù)「冷啟動」后,讓模型在數(shù)千個并行的真實(shí)云環(huán)境中,像人類一樣去「試錯」。系統(tǒng)不再告訴模型「下一步該點(diǎn)哪里」,而是只在任務(wù)最終完成時給予一個「成功」的獎勵信號(Reward)。模型必須自己探索出最優(yōu)的決策路徑。
從底層開始的原生設(shè)計(jì),使得 AutoGLM 在多個公開基準(zhǔn)測試中表現(xiàn)出色。比如,在考察電腦操作能力的 OSWorld Benchmark 中,AutoGLM 獲得 48.1 分,超越了 ChatGPT Agent 和 Anthropic 的模型。
而在跑分之外,智譜模型即Agent的模式也帶來了巨大的成本優(yōu)化空間。
傳統(tǒng)基于第三方大模型API構(gòu)建的Agent,單次復(fù)雜任務(wù)(如 Deep Research)的成本高達(dá) 3-5 美元。而 AutoGLM 借助自研模型和一體化架構(gòu),將包含模型調(diào)用和虛擬機(jī)資源的單次任務(wù)成本,壓縮到了約 0.2 美元(約 1.5 元人民幣)。這已經(jīng)與谷歌單次搜索約 0.02 美元的成本相差不到一個數(shù)量級。
這種數(shù)量級的成本降低,讓智譜有底氣在此次發(fā)布中不用邀請碼,直接向所有 C 端用戶開放。
智能體背后的生態(tài)布局
除了在手機(jī)端布局,智譜對于AutoGLM的定位超越了單一的效率工具,開始構(gòu)建一個連接多設(shè)備和服務(wù)的生態(tài),這也是其將AutoGLM從智譜清言中獨(dú)立出來單獨(dú)做一個APP的理由之一。
智譜透露,除了已經(jīng)展示的跨應(yīng)用操作,AutoGLM的云電腦目標(biāo)是支持 Office、Photoshop 等更專業(yè)的生產(chǎn)力工具。
而在后續(xù)的更新中AutoGLM將添加定時任務(wù)功能,即AI從被動接受命令執(zhí)行響應(yīng)轉(zhuǎn)變成半主動規(guī)劃,從每天早上根據(jù)自己的消費(fèi)記錄買一杯合適口味的咖啡,到辦公室自動總結(jié)未讀郵件,也將從夢想走進(jìn)現(xiàn)實(shí)。
而對智能硬件生態(tài)的賦能才是智譜真正的殺手锏。
目前的智能設(shè)備中,存在明顯的算力、續(xù)航和交互的不可能三角,如蘋果的Vision Pro存在續(xù)航短板,Meta Quest 2則存在顯著的算力短板,蘋果即將發(fā)布的桌面機(jī)器人更是在預(yù)告公布后因?yàn)樵愀獾慕换ツ芰︼柺茉嵅 ?
對于很多智能設(shè)備,堆大電池和復(fù)雜系統(tǒng)的解決方案并不合適,如何在性能合格情況下控制成本也成為了制約硬件廠商的痛點(diǎn)。
智譜AutoGLM對此提出的一個解法——讓這些端側(cè)硬件「輕量化」,只負(fù)責(zé)感知和發(fā)起指令,而將復(fù)雜的應(yīng)用操作和任務(wù)執(zhí)行全部交由云端的Agent完成。
智譜對觀察者網(wǎng)展示了若干案例,如體重秤接入智能體后,在檢測體重超標(biāo)后自動下單減肥代餐,而氣體傳感器在接入了智能體后,一旦檢測到鞋柜發(fā)愁就會下單除臭腳墊。
打印機(jī)接入Agent實(shí)現(xiàn)缺墨自動購買
這條物理傳感器—云端 Agent—現(xiàn)實(shí)世界服務(wù)的鏈路,打開了智能體實(shí)現(xiàn)對物理世界的連接和操作的可能性。
對于AI和智能體發(fā)展的未來時,AutoGLM技術(shù)負(fù)責(zé)人劉瀟提出了一個關(guān)于 AGI(通用人工智能)的階段性定義,他稱之為“AGI 的下限”——當(dāng)一個 Agent 能自主穩(wěn)定地運(yùn)行一整天(24小時),作為你的同事或秘書,協(xié)同完成工作與生活任務(wù),使你的綜合效率提升超過 2 倍時,AGI 的曙光初現(xiàn)。
AutoGLM 的這次進(jìn)化,或許離這個下限還有距離。它仍處于早期形態(tài),對指令的理解還很初級,也存在一些Bug。但通過構(gòu)建云端分身這一核心架構(gòu),它確實(shí)開始在為Agent的獨(dú)立行走鋪平道路。
從同步操作轉(zhuǎn)變?yōu)楫惒轿校蛟S是人機(jī)協(xié)作范式的轉(zhuǎn)變的開始,未來的個人競爭力可能取決于自身能力+N 個 AI 智能體模式,用戶通過下達(dá)指令,讓多個 AI 并行完成任務(wù),從而根本性地改變個人處理日常與工作事務(wù)的方式。
而當(dāng)智譜與一些手機(jī)廠商達(dá)成更系統(tǒng)級的合作后,這個Agent的想象空間將徹底打開,成為我們真正期待的數(shù)字助理。
- 責(zé)任編輯: 陳濟(jì)深 
-
曾刷爆朋友圈的網(wǎng)紅咖啡,再傳閉店
2025-08-20 19:55 觀網(wǎng)財經(jīng)-消費(fèi) -
頻繁召回、被告侵權(quán),“充電寶一哥”要去香港上市?
2025-08-20 19:21 觀網(wǎng)財經(jīng)-科創(chuàng) -
開辟中東第二站,美團(tuán)國際化業(yè)務(wù)Keeta上線卡塔爾
2025-08-20 17:42 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
大中華區(qū)增長42%,但始祖鳥增速放緩,“運(yùn)奢”賽道是否面臨天花板???
2025-08-20 15:18 觀網(wǎng)財經(jīng)-消費(fèi) -
連虧四年,臺積電稱美國廠盈利
2025-08-20 11:30 觀網(wǎng)財經(jīng)-科創(chuàng) -
母嬰界的瑞幸?孩子王旗下門店擴(kuò)至1165家
2025-08-20 11:08 觀網(wǎng)財經(jīng)-消費(fèi) -
KKV母公司再起訴名創(chuàng)優(yōu)品不當(dāng)競爭
2025-08-20 11:04 觀網(wǎng)財經(jīng)-消費(fèi) -
-
泡泡瑪特上半年賺翻了!營收利潤均趕超2024全年
2025-08-19 22:54 觀網(wǎng)財經(jīng)-消費(fèi) -
又被傳造手機(jī)?字節(jié)跳動火速否認(rèn)
2025-08-19 21:22 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
美團(tuán)滴滴,海外開戰(zhàn)
2025-08-19 20:20 觀網(wǎng)財經(jīng)-海外 -
168000元,智元表演機(jī)器人開賣
2025-08-19 20:16 觀網(wǎng)財經(jīng)-科創(chuàng) -
小米與格力開撕,誰是空調(diào)線上銷售的“二哥”
2025-08-19 20:08 觀網(wǎng)財經(jīng)-消費(fèi) -
東方甄選股價突然大跳水,公司盤后辟謠“新東方CEO被調(diào)查”
2025-08-19 19:12 觀網(wǎng)財經(jīng)-消費(fèi) -
手機(jī)收入下滑2%,小米營收仍連續(xù)三季超千億
2025-08-19 18:28 觀網(wǎng)財經(jīng)-科創(chuàng) -
H20還沒證明“清白”,英偉達(dá)又要在華推新版特供?
2025-08-19 17:26 觀網(wǎng)財經(jīng)-科創(chuàng) -
飆升15倍后,智元“殼資源”發(fā)布風(fēng)險提示
2025-08-19 13:34 觀網(wǎng)財經(jīng)-科創(chuàng) -
辛巴又又又退出直播行業(yè),他賣的“毒”衛(wèi)生巾怎么辦?
2025-08-19 12:48 觀網(wǎng)財經(jīng)-消費(fèi) -
生育高峰沒來,但愛嬰室仍在靠擴(kuò)張?jiān)鲩L
2025-08-19 12:44 觀網(wǎng)財經(jīng)-消費(fèi) -
華為增資58億
2025-08-19 11:04 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
被解職后,佩通坦發(fā)聲:接受裁決 評論 145法軍總參謀長:面對中美俄,歐洲要成“桌上菜” 評論 198最新聞 Hot
-
“意在制衡中國”,中方警告美日
-
鳩山將出席九三閱兵,日本政府回應(yīng)
-
白忙活了?“特朗普大發(fā)雷霆,怒噴烏歐不切實(shí)際”
-
莫迪在日本提到中國
-
“很高興受邀,中國戰(zhàn)勝日本是值得慶祝的歷史事件”
-
特朗普對哈里斯下手了
-
“已和以色列徹底決裂,包括經(jīng)濟(jì)”
-
“收獲季到了,美國大豆卻又遭‘當(dāng)頭一棒’”
-
美國又一毒計(jì)生效,中國商家表示:問題不大
-
“如何對待英雄,猶太人要向中國老大哥學(xué)習(xí)”
-
“美防長想通話,中方已讀未回”
-
被解職后,佩通坦發(fā)聲:接受裁決
-
報復(fù)美國,巴西走程序了
-
“中國風(fēng)機(jī)有個根本優(yōu)勢,西方學(xué)不來”
-
加州州長:他到處被人耍,真丟臉
-
萬斯稱:已準(zhǔn)備好接班
-