界面新聞記者 | 佘曉晨 伍洋宇 李如嘉
界面新聞編輯 | 劉方遠
7月26日,上海WAIC2025(世界人工智能大會)開幕這天上午,高溫將地面的雨水不斷蒸發(fā),一層薄薄霧氣籠罩整個世博園區(qū),行人絡繹不絕穿過。
世博展覽館內(nèi),大模型公司“階躍星辰”和具身智能公司“青心意創(chuàng)”的團隊還在一起做著最后的調(diào)試。?
這兩家同樣來自上海市徐匯區(qū)的企業(yè),即將在幾小時后場館正式開放時,合作展出一款能隨歌聲起舞的機器人——Orca。此時,距離雙方真正開始合作才一個多月。?
事實上,開展之后Orca成了今年大會期間人氣最高的機器人之一。它通過實時語音識別和肢體語言配合音樂節(jié)奏,并用AI音樂創(chuàng)作能力現(xiàn)場PK了一名真人說唱歌手,場面幾度沸騰。

這項能力來自雙方合作的具身智能多模態(tài)交互解決方案,它結合了青心意創(chuàng)的多模態(tài)具身算法與階躍星辰端到端語音大模型,可讓機器人完成?“語言指令-動作軌跡-情緒表達”的低延遲閉環(huán)響應。
這成為具身智能與AI大模型彼此促進的一次合作范例。
在科技加速演進的浪潮中,一場“具身智能+大模型”的創(chuàng)新風暴正在上海蓄力成型。機器人“大腦+小腦+本體”的融合故事背后,暗藏上海具身智能與大模型產(chǎn)業(yè)協(xié)同演進的線程。
7月28日,上海市經(jīng)濟信息化委印發(fā)《上海市進一步擴大人工智能應用的若干措施》,明確提出要降低智能算力使用成本,發(fā)放6億元算力券,加強算力調(diào)度平臺建設,體系化支持企業(yè)研發(fā)和應用大模型,加快大模型生態(tài)空間集聚。
其中針對具身智能還提出,“支持本市人工智能企業(yè)的軟硬件產(chǎn)品加快研發(fā)與量產(chǎn),對具身智能機器人等產(chǎn)品銷售或租用達到一定規(guī)模的,按核定合同額的5%給予最高500萬元獎勵?!?/span>
“本體+大腦”
在今年的WAIC展館中,吸引眾多觀眾圍觀的,無一例外都是正在表演的機器人們。今年大會展出的人形機器人超過了150臺。
人形機器人所代表的具身智能被視為通往AGI(通用人工智能)的必由之路,其核心就在于它為人工智能系統(tǒng)提供了一個與真實世界進行多維交互的機制。?
華興資本投資銀行事業(yè)部業(yè)務合伙人秦川將具身智能大致分為“本體派”與“大腦派”兩大派別。?
“本體派”以硬件驅(qū)動,機器人本體運動控制技術為主,其核心競爭力是硬件設計、工程能力,同一時期內(nèi)可達到更低的硬件成本和更高的硬件性能,商業(yè)化上更容易取得進展。?
“大腦派”則以AI驅(qū)動,聚焦背后模型能力以及機器人本體泛化性。這一路線目前要攻克的難題更多,例如解決數(shù)據(jù)收集問題、算法問題等,但它的能力上限也更高。當前,以VLA(Vision-Language-Action)典型架構為代表的具身智能基座大模型,在很大程度上呈現(xiàn)了機器人理解世界的跨任務泛化潛力。
兩派疊加,就是機器人“大腦+小腦+本體”的融合之路。這也是具身智能與大模型形成產(chǎn)業(yè)協(xié)同的機會。
生數(shù)科技CEO駱怡航對界面新聞解釋稱,無論是數(shù)字信息還是物理信息,本質(zhì)上都是時空信息,并且都采用信息輸入、決策輸出的交互邏輯,因此多模態(tài)模型對于物理世界規(guī)律的理解與具身智能是通用的。
對于重視科創(chuàng)產(chǎn)業(yè)并已有相關資源積累的城市而言,這是一個托舉初創(chuàng)團隊、鞏固本土科創(chuàng)勢能的重要契機。2023年,上海發(fā)布《促進智能機器人產(chǎn)業(yè)行動方案》,鼓勵“大腦+小腦+本體”協(xié)同攻關。?
2024年10月,智元機器人與上海浦江實驗室低調(diào)展開了一場合作。雙方在張江機器人谷組建了一個4000平米的機器人訓練場,場內(nèi)包含三千多種真實物品,復刻了家居、餐飲、工業(yè)、商超和辦公等核心場景,并部署100臺機器人,開啟了為時3個月的大規(guī)模數(shù)據(jù)捕捉與采集。
智元機器人合伙人、具身業(yè)務部總裁姚卯青全程參與了這個項目。他告訴界面新聞記者,彼時,全球從學術界到工業(yè)界還沒有一個合格的工業(yè)級真實高質(zhì)量數(shù)據(jù)集供科研人員和企業(yè)參考,這場合作的主要原因之一就是補足這一空缺。
2024年年底,機器人數(shù)據(jù)集AgiBot World(智元世界)正式開源。在其包含的100種真實場景中,80%為長程任務,時長集中在60s-150s之間。AgiBot World的長程數(shù)據(jù)規(guī)模、場景范圍覆蓋面已超越谷歌Open X-Embodiment,成為被業(yè)界引用的主流數(shù)據(jù)集之一。
2025年3月,基于該數(shù)據(jù)集訓練的通用具身基座模型——智元啟元大模型(GO-1)發(fā)布,搭載該模型的機器人在倒水、清理桌面、補充飲料等任務成功率上相較行業(yè)已有模型均有所提升。
智元是上海最知名的具身智能初創(chuàng)企業(yè),創(chuàng)始團隊包括來自華為的“天才少年”稚暉君等。智元選擇的發(fā)展路線一定程度上展現(xiàn)了上海對于具身智能的追求方向,那就是不僅僅是要做出一個機器人的軀殼,同時要賦予它AI的大腦,成為最有“人味”的機器人。

產(chǎn)業(yè)鏈優(yōu)勢
在上海,張江作為承載科技創(chuàng)新的重要土壤之一,以往最突出的產(chǎn)業(yè)是生物醫(yī)療和半導體。如今,張江具身智能產(chǎn)業(yè)鏈相關企業(yè)已集聚70余家,包括10多家整機企業(yè)及50多家零部件及關鍵軟件、功能型平臺企業(yè)等。
傲意科技是一家成立于2015年、總部位于張江高科園區(qū)的公司。作為國內(nèi)唯一同時掌握無創(chuàng)腦機接口與機器人靈巧手核心技術的企業(yè),公司產(chǎn)品已服務全球近萬名終端用戶。
同為張江企業(yè),傲意科技和智元機器人是“面對面”的鄰居。在一些產(chǎn)品項目上,傲意科技為智元供應靈巧手部件。姚卯青表示,和傲意合作的首要考量是其出貨量較為領先,產(chǎn)品在同類產(chǎn)品里也具有競爭力,再加上距離的相近,達成合作就順理成章。
從上海出發(fā),經(jīng)過一小時不到的車程可以到達杭州、蘇州、常州。這幾個城市提供的電子元器件、精密機械加工、模具制造能力支撐起重要的供應鏈,在具身智能產(chǎn)品的快速迭代中發(fā)揮重要作用。

秦川向界面新聞總結稱,從產(chǎn)業(yè)鏈上來看,長三角是一個緊密聯(lián)動的城市體,比如蘇州、常州等都具備高端制造能力。?
擎朗智能CEO李通就是考慮到這個原因把公司總部放在了上海。李通曾在微軟亞洲工程院工作,2010年,他放棄了微軟的高薪創(chuàng)立了上海擎朗智能科技有限公司,專注于室內(nèi)無人配送機器人的自主研發(fā)和生產(chǎn)。
李通告訴界面新聞,他當初就是看中了長三角作為機電供應鏈核心的位置,這對生產(chǎn)機器人至關重要。目前擎朗旗下已擁有多款智能機器人產(chǎn)品遠銷海內(nèi)外,包括送餐機器人,酒店機器人等等。
具身智能產(chǎn)業(yè)涉及多個軟件和硬件環(huán)節(jié),上下游企業(yè)實際上都處于“試驗”階段。在這樣的狀態(tài)下,工廠和研發(fā)總部距離更近是一個巨大的優(yōu)勢,一切都會變得更加高效。?
姚卯青向界面新聞分析稱,很多成熟的產(chǎn)業(yè)可以做到設計和生產(chǎn)制造完全解耦,比如蘋果手機——在加州進行設計、再在中國生產(chǎn),這已經(jīng)是司空習慣的流程。但機器人產(chǎn)業(yè)當下仍處于早期發(fā)展階段,許多產(chǎn)品都未成熟,因而很多時候,研發(fā)和生產(chǎn)制造要共同完成整個流程,一起做優(yōu)化、解決問題。?
據(jù)界面新聞了解,為了追求“激進”的生產(chǎn)目標,智元機器人團隊在產(chǎn)品交付后期時常需要持續(xù)駐扎在代工廠。從智元機器人所在的上海張江到蘇州的靈猴公司,只需要一個半小時的車程。后者是智元長期合作的一家核心零部件供應商。在交付后期,智元機器人的團隊基本上全部駐扎在了靈猴。
智元也曾試過和珠三角地區(qū)的代工廠合作,但過程中出現(xiàn)了更多問題:無論是在周期,還是返工層面,遠距離都給研發(fā)增加了困難。
尤其是對于機器人行業(yè)來說,“關節(jié)”至關重要。智元的關節(jié)供應商一家來自于蘇州,一家來自于常州。生產(chǎn)過程往往需要快速調(diào)試,而這些供應商的員工也時常被智元“搖過來”駐場。
今年7月,智元機器人和宇樹科技中標中國移動旗下公司1.2億元人形機器人采購訂單。市場加速時,產(chǎn)業(yè)協(xié)同的重要性愈發(fā)突顯。
早期,具身智能企業(yè)或依賴場景開放和補貼獲得市場份額,但真正決定比賽終局的,仍為核心技術的突破。因此在這一過程中,越來越多的企業(yè)開始從追求單點技術優(yōu)勢轉(zhuǎn)向謀求產(chǎn)業(yè)鏈上的協(xié)同。?
浪潮之中,何以立足?
在前沿技術浪潮的奔涌中,資金和人才缺一不可。對于具身智能產(chǎn)業(yè)來說亦是如此。
上海擁有包括復旦大學和上海交通大學在內(nèi)的多所知名院校,為各個機器人公司輸送了大量具有專業(yè)知識背景的人才。
復旦大學計算機科學技術學院教授、博士生導師張奇告訴界面新聞,以研究生實驗室為例,據(jù)他觀察,畢業(yè)后留在上海的學生超過90%。他坦言,這是因為幾乎所有押注AI的互聯(lián)網(wǎng)大廠都在上海設立了辦公室。
值得一提的是,上海科創(chuàng)產(chǎn)業(yè)此前的沉淀,給具身智能產(chǎn)業(yè)也提供了巨大的人才池。
姚卯青表示,在大模型層面,不同城市的人才差距已經(jīng)不大,但在硬件層面,深圳的人才密度的確更高。不過,智元在上海招聘了不少有自動駕駛、掃地機器人和服務機器人的員工,這是上海在過往產(chǎn)業(yè)發(fā)展中積累的優(yōu)勢。
據(jù)智聯(lián)招聘統(tǒng)計,今年1-5月國內(nèi)機器人產(chǎn)業(yè)招聘職位數(shù)同比增長6%,其中人形機器人領域招聘需求同比激增409%,技術崗位占比超6成。?
由于上海周邊的制造業(yè)較為發(fā)達,在蘇州、常州、無錫,可以招聘到的制造業(yè)人才也不少。姚卯青認為,綜合來看,上海的軟硬件實力較為領先。上海市經(jīng)信委主任張英曾透露,近四年來,上海的人工智能人才從10萬增加到了現(xiàn)在的25萬。

擎朗智能目前近千名員工,研發(fā)人員占比接近一半。李通提到,中國的理工科畢業(yè)生基本上占到全球的一半,對于理工科的重視,可能是中國今天能成為“世界工廠”的重要原因。
李通稱,隨著公司業(yè)務規(guī)模的擴大,機器人公司對于國際化人才的需求也逐步加深。擎朗智能的公司總部在上海,但在全球五個國家和地區(qū)設立了子公司及辦公室?!霸谏虾#菀渍衅傅絿H化人才,這是其他城市沒有的優(yōu)勢?!?/span>
人才的聚集并非一蹴而就。上海政府、高校和企業(yè)正在從各個層面打響人才競賽。今年7月,上海交大發(fā)布AI未來基金,重點關注全球青年AI人才鏈接。作為上海徐匯推出的全國首個大模型創(chuàng)新生態(tài)社區(qū),模速空間近兩年著力的重點之一就是人才服務。
除了人才,長期且穩(wěn)定的資金支持也至關重要。
秦川直言,被投企業(yè)選擇城市落地,核心還是在錢。無論是硬件在創(chuàng)新、算法訓練還是場景驗證,具身智能的進化都是一場“燒錢戰(zhàn)”。?
從投資機構的視角來看,除了主流美元基金,政府基金在這一輪具身智能產(chǎn)業(yè)的發(fā)展中顯示出了極高的參與度。?
秦川的觀察是,除了美元基金外,政府基金、產(chǎn)業(yè)基金,尤其是是國企、央企牽頭的基金機構,會加速全行業(yè)對于具身智能認知的提升。
具身智能對于場景探索有獨特的需求,政府及產(chǎn)業(yè)基金能在這一層面提供資金之外的支持,這也更有利于產(chǎn)業(yè)發(fā)展。
秦川舉例稱,上海某頭部汽車主機廠旗下創(chuàng)投業(yè)務的各分支基金,目前都已參與了多個具身智能項目的投資。這將不僅為其帶來資本層面收益,也有機會促進被投企業(yè)在投資方的業(yè)務場景的協(xié)同落地。
據(jù)智東西統(tǒng)計,今年第一季度,國內(nèi)具身智能相關的融資事件共37筆,涉及33家企業(yè)。其中上海的企業(yè)達到大約10家。?
就在剛剛過去的這個周末,到WAIC現(xiàn)場前來“找項目”的投資人同樣絡繹不絕,他們都渴望在具身智能等新領域找到下一個“DeepSeek”。
還沒有評論,來說兩句吧...