-
阿里國際副總裁張凱夫:人類跟AI交流,告訴它不要做什么特別重要
-
周毅是故意的還是不小心?
“雖然OpenAI的Deep Research能力很強,但其適合做廣泛的搜索和很長的報告。對于出口商品HS Code這樣一個具體要求精確答案的任務(wù),正確率卻只有5%。我們在垂直數(shù)據(jù)庫上,做了工具的減法,以及上下文工程。這個垂直Deep Research范式的HS Code判定工具,準確率可以做到80%。”
在2025世界人工智能大會期間跟媒體交流的時候,阿里國際副總裁、阿里國際AI Business負責(zé)人張凱夫如是說。
近半年來,包括Deep Research和Manus在內(nèi)的各類智能體產(chǎn)品紛紛涌現(xiàn),AI Agent儼然已經(jīng)成為人工智能賽道的“必爭之地”。近期以來,面向跨境貿(mào)易、跨境電商等實際場景,阿里國際數(shù)字商業(yè)集團推出了多款智能體應(yīng)用產(chǎn)品,如智能退款agent、海關(guān)編碼HScode agent以及在線招商agent等,在行業(yè)里獲得關(guān)注。
7月26日,2025世界人工智能大會卓越人工智能引領(lǐng)者SAIL獎公布,阿里國際跨境電商AI解決方案Marco斬獲本屆SAIL之星,成為該領(lǐng)域的首個獲得者。在同觀察者網(wǎng)等媒體交流時,張凱夫多次談到了AI Agent的發(fā)展。張凱夫認為,在很多實際功能上,垂直Agent的機會可能比垂直模型的機會還要大。
為了服務(wù)更多出海貿(mào)易商家,阿里國際AI Business開始做中國商家自己的“Deep Research”和垂直AI Agent。
“海關(guān)編碼HScode agent,商家自己去匹配的準確率比較低,我們自己的Agent的正確率能到80%?!闭劦窖邪l(fā)經(jīng)驗,張凱夫表示,“先做減法,把數(shù)據(jù)限制好。只讓Agent去關(guān)注相關(guān)部門的數(shù)據(jù),而不是去互聯(lián)網(wǎng)上亂搜;在Agent的思考進程里(thinking process),我們也使用了較為領(lǐng)先的模型和優(yōu)質(zhì)的案例。”
“人跟AI交流,給它定好約束條件,告訴它不要干什么特別重要?!?
人類跟AI交流,告訴它不要做什么特別重要
“通用”和“垂直”的路線之爭,一直是人工智能領(lǐng)域的母命題。
2023年,國內(nèi)業(yè)界、學(xué)界圍繞“做基礎(chǔ)大模型,還是做垂直/行業(yè)大模型”進行了不少討論。有的從業(yè)者認為,要抓緊基礎(chǔ)大模型的研究,在底座模型上奮力追趕,尤其是要擺脫對國外開源模型的依賴;也有從業(yè)者認為,中國市場巨大、數(shù)據(jù)豐富,應(yīng)用場景多元,可以用應(yīng)用發(fā)展來帶動模型進步,走一條“農(nóng)村包圍城市”的路線。
從DeepSeek攪動全球風(fēng)云,到各行各業(yè)的專業(yè)大模型集體涌現(xiàn),事實上,中國在這兩條路上走得其實都不錯。
近年來,人工智能領(lǐng)域的競爭開始從類GPT式的問答對話,向具體場景的智能體Agent遷移。從OpenAI的Deep Research,到轟動一時的Manus,能夠調(diào)用多種能力,解決具體問題的智能體,成為行業(yè)競相追逐的焦點。這也讓“通用”和“垂直”的路線差異,再一次顯現(xiàn)。
此時此刻,恰如彼時彼刻。
談到行業(yè)觀察,阿里國際副總裁、阿里國際AI Business負責(zé)人張凱夫?qū)τ^察者網(wǎng)等媒體表示,AI應(yīng)用領(lǐng)域已經(jīng)隨著行業(yè)從AIGC(生成式人工智能)走向了Agent(智能體):以前的應(yīng)用很多是AIGC,比如生成圖、搞翻譯、弄創(chuàng)意;今年更多是智能體,比如硅谷很火的BD agent,去找中小企業(yè)的聯(lián)系方式;合規(guī)Agent,從厚厚的法律材料中尋找合規(guī)相關(guān)內(nèi)容;比如營銷Agent,根據(jù)客戶需要去各種社交媒體發(fā)帖等等——這些過程都是自動的。
正如上文中所舉的“海關(guān)編碼案例”一樣,在張凱夫看來,在Agent時代,很多專業(yè)領(lǐng)域的垂直Agent更有機會給人們帶來的巨大收益;相反,通用型的AI Agent,表現(xiàn)反而沒有那么好——OpenAI Deep Research不能搞定的專業(yè)工作,一個更加接近行業(yè)的垂直Agent可能就能處理得很好。
“最近硅谷很火的概念是context engineering(語境工程,或上下文工程),我們用一個模型,語境(context)非常重要。現(xiàn)在我們做智能體也是一樣,語境的約束特別重要,有時候你喂給它(Agent)的東西越多越不好,你一定要非常有針對性地喂給它一些內(nèi)容。”
張凱夫進一步表示,現(xiàn)在人類和AI交流,給它定好約束條件,告訴它不要干什么特別重要——包括AI coding(用AI寫代碼)。“想讓AI干嘛,大家都可以表達,但真正地核心在于讓AI明確,解決這個問題的時候不是要新建代碼文件,而是找到對應(yīng)的具體代碼去修改。如果沒有這個約束條件,代碼庫就會越來越大,到后面一塌糊涂?!?
“我們做一個Agent也是一樣的,語境縮減和精準選擇是非常重要的一件事情?!?
阿里國際AI Business算法負責(zé)人駱衛(wèi)華補充道,Deep Research等通用性Agent,在解決很多通用性問答時是沒問題的。甚至通過底座模型能力,可以通過prompt(關(guān)鍵提示詞)調(diào)優(yōu)來獲得更好的結(jié)果。但是真正落地到非常專業(yè)、垂直的領(lǐng)域,通用型Agent是不夠用的,比如在海關(guān)編碼HScode上,它就是只有個位數(shù)的正確率。
“但是,如果我們通過引入更多的知識庫——既包括我們收集的規(guī)則,也包括一些判例,甚至包括一些已有的case(案例)——有一些歷史的、標注過的,正確的或者錯誤的case,用這些具體的專業(yè)知識去強化Agent。后面我們發(fā)現(xiàn),他們對agent效果的提升是非常大的,是幾十個點的提升?!?
張凱夫認為,整體來看,垂直Agent的發(fā)展,對當(dāng)前的國內(nèi)外AI Agent生態(tài)是一個非常好的事情。在一些不需要那么精確的問題上,ChatBot或者Deep Research提供的能力,其實也夠了;但在具體的問題上,在細分的領(lǐng)域上,實際上還有千千萬的問題可以通過垂直Agent解決——這也是垂直Agent的機會。
日均10億次調(diào)用,中國跨境電商成為第一個實現(xiàn)規(guī)模級AI應(yīng)用的行業(yè)
相比于通用模型談概念、講參數(shù),更貼近中國普通人經(jīng)營實際的是,海關(guān)編碼HScodeAgent等國產(chǎn)垂直Agent,正在增強中國中小企業(yè)的競爭力。數(shù)據(jù)顯示,僅阿里國際旗下的AI Business團隊,其提供的AI能力,可以幫中小企業(yè)解決60多個電商場景中遇到的問題,并在不同環(huán)節(jié),帶來1%-30%不等的顯著提升。
正如我們之前訪談中所觀察到的一樣:越是中小企業(yè),越能從AI的應(yīng)用中獲益。
公開資料顯示,阿里國際的所有電商平臺均已應(yīng)用AI,已服務(wù)了超50萬賣家,形成了以服務(wù)中小企業(yè)出海為核心,覆蓋全球多元市場、多種電商模式的規(guī)模級AI應(yīng)用。截至本月(2025年7月),阿里國際AI服務(wù)的調(diào)用量每兩個月就會翻一番,平均日調(diào)用量已突破10億次。這使得跨境電商成為第一個實現(xiàn)規(guī)模級AI應(yīng)用的行業(yè)。
內(nèi)部報告顯示,過去一年,國內(nèi)商家使用頻次最高的AI功能分別是:圖文翻譯、圖像識別并完善商品信息、營銷文案生成。其中,翻譯在去年底實現(xiàn)了全面從小模型向大模型的轉(zhuǎn)換。在歐洲TOP語種中,因為翻譯效果的提升,消費者滿意度提升了30%;在SEO場景下,AI提供的SEO占到了整體SEO的近4成,未來有望達到一半甚至更高。
Agent時代,國產(chǎn)自研的AI產(chǎn)品,進一步完善了普通中國商家應(yīng)對風(fēng)險和變化的能力。
以海關(guān)編碼HS code(Harmonized System Code)為例。HS Code是國際通用的商品分類編碼體系,由世界海關(guān)組織(WCO)制定并維護。它通過統(tǒng)一的分類規(guī)則,將全球貿(mào)易商品分為5000多種品目,每個商品類別由6位數(shù)字編碼表示,是國際貿(mào)易、海關(guān)清關(guān)、關(guān)稅征收和貿(mào)易統(tǒng)計的基礎(chǔ)工具。
HS Code在國際貿(mào)易中極其重要,關(guān)系到商家的合規(guī)和效率。但并非每個企業(yè)都能擁有自己的HS Code顧問。
AI Agent無疑為這個問題提供了更多解。例如阿里國際旗下的海關(guān)編碼HS code agent,可以利用Reasoning模型(推理模型)的Planning(任務(wù)拆解&步驟規(guī)劃)、Tool Use(工具調(diào)用)、Reflection(自我迭代)能力,通過多輪調(diào)用工具不斷自主探索,從工作環(huán)境中獲取更為精確的信息,并不斷更新步驟,以得到導(dǎo)向正確答案的路徑。
數(shù)據(jù)顯示,在HS code agent的幫助下,跨境商家們對10位HS code填寫準確率提升了23%。
不過,談到AI Agent的“未來”,張凱夫表示,做“最通用的”和“最垂直的”,其實都是可以的——最重要的是研發(fā)者和使用者明確人類使用AI的場景。“做非常通用的智能體,類似OpenAI ChatBot,沒有任何問題;或者做特別垂直的,把自己專業(yè)領(lǐng)域的知識弄得非常明白——比較讓人害怕的是夾在中間,因為夾在中間沒有壁壘。”
和大模型時代,很多從業(yè)者堅信“全球競逐基礎(chǔ)大模型的,最終只有個位數(shù)玩家”的研判類似;在對話的最后,張凱夫也關(guān)注理性競爭和投入的問題?!艾F(xiàn)在的行業(yè)格局,能做出特別通用的AI Agent的,全世界只有少數(shù)幾家企業(yè)。龐大的機會依然在垂直領(lǐng)域?!?
- 責(zé)任編輯: 周毅 
-
居然智家實控人汪林朋在家中不幸身故
2025-07-28 21:21 觀網(wǎng)財經(jīng)-房產(chǎn) -
“WAIC里技能大舞臺”:我國人形機器人如何從“實驗室”加速走向“應(yīng)用場”
2025-07-28 20:58 2025世界人工智能大會 -
對話蜜度研發(fā)副總裁:AI智能體正重塑辦公校對新范式
2025-07-28 16:06 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
三星與特斯拉簽下千億芯片代工大單,馬斯克發(fā)聲
2025-07-28 14:53 觀網(wǎng)財經(jīng)-科創(chuàng) -
長和計劃邀請內(nèi)地投資人加入財團,央企或談判尋求進入
2025-07-28 13:40 -
中國乳業(yè)數(shù)智化再進階,伊利牽頭發(fā)起首個乳業(yè)AI生態(tài)圈
2025-07-28 13:14 觀網(wǎng)財經(jīng)-消費 -
家居頭部企業(yè)董事長跳樓身亡?回應(yīng)來了
2025-07-28 11:46 -
連續(xù)兩個周末,淘寶閃購日訂單超9000萬
2025-07-28 11:05 觀網(wǎng)財經(jīng)-消費 -
剛解除留置4日的居然智家實控人汪林朋被傳墜亡,家居寒意遠超預(yù)期
2025-07-28 10:29 -
-
-
數(shù)學(xué)之問 | 當(dāng) AI 與數(shù)學(xué)在上海相遇:WAIC 2025 背后的智慧革命
2025-07-26 23:00 -
-
OPPO刷新端側(cè)AI性能上限,峰值出字速度200token/s
2025-07-26 21:34 觀網(wǎng)財經(jīng)-科創(chuàng) -
證監(jiān)會:5萬元以內(nèi)小額遺產(chǎn)繼承可免公證
2025-07-26 14:55 觀網(wǎng)財經(jīng)-金融 -
樓面價20萬元/平方米,徐匯衡復(fù)地塊刷新全國單價地王記錄
2025-07-26 13:04 觀網(wǎng)財經(jīng)-房產(chǎn) -
在華售價腰斬后,OATLY想要剝離中國市場了
2025-07-26 09:50 觀網(wǎng)財經(jīng)-消費 -
年內(nèi)裁員超2萬人,英特爾CEO稱“必須糾正方向”
2025-07-25 23:12 觀網(wǎng)財經(jīng)-科創(chuàng) -
雅下工程令世界驚嘆,但它的意義仍被很多人低估了
2025-07-25 22:08 觀網(wǎng)財經(jīng)-宏觀 -
5418mAh!中國智能手機平均電池容量居全球首位
2025-07-25 21:52 觀網(wǎng)財經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
美國又下黑手:撤銷三星、SK海力士在華工廠豁免 評論 119外媒又炒作中國赴烏維和部隊,白宮回應(yīng) 評論 156白忙活了?“特朗普大發(fā)雷霆,怒噴烏歐不切實際” 評論 133被解職后,佩通坦發(fā)聲:接受裁決 評論 152最新聞 Hot
-
美國上訴法院裁定關(guān)稅非法,特朗普:你們在摧毀美國
-
英國“準備好介入臺?!??英防相否認
-
外媒又炒作中國赴烏維和部隊,白宮回應(yīng)
-
美國又下黑手:撤銷三星、SK海力士在華工廠豁免
-
美歐持續(xù)重壓,最后一刻西班牙“毀約”
-
對華問題,普京最新表態(tài)
-
投訴“魯迅夾煙墻畫”當(dāng)事人,道歉了
-
民生銀行半年報:凈利潤下降4.87%、資產(chǎn)總額下降0.59%
-
光大銀行半年報:營收下降5.57%,但凈利潤增長0.55%
-
俄方:普京與金正恩會晤正在醞釀中
-
“意在制衡中國”,中方警告美日
-
鳩山將出席九三閱兵,日本政府回應(yīng)
-
女子上廁所多次遭偷窺,西安警方通報
-
白忙活了?“特朗普大發(fā)雷霆,怒噴烏歐不切實際”
-
莫迪在日本提到中國
-
“很高興受邀,中國戰(zhàn)勝日本是值得慶祝的歷史事件”
-