-
具身智能訓(xùn)練利器!谷歌斯坦福論文感謝了一家杭州六小龍
(文/張睿佳 編輯/張廣凱)
2025年3月6日,在谷歌DeepMind與斯坦福聯(lián)合發(fā)表的一篇論文中,讓AI學(xué)會像人類一樣布置房間:沙發(fā)不懸空、臺燈必放桌面、書架與墻保持合理間距。而在論文的背后,團(tuán)隊專門感謝了群核科技SpatialVerse團(tuán)隊提供的物理級真實(shí)3D場景數(shù)據(jù)。
群核科技正是前段時間出圈的“杭州六小龍”之一,其業(yè)務(wù)聚焦空間智能探索,而論文中提到的SpatialVerse是群核面向具身智能等行業(yè)開放的虛擬數(shù)字道場。
上述論文主要構(gòu)建了一個名為FirePlace的框架,旨在讓多模態(tài)大語言模型更好地理解3D空間中的幾何關(guān)系。通過這個框架,大語言模型能夠更好地將對象放置在具有復(fù)雜幾何形狀的復(fù)雜場景中。
論文指出,現(xiàn)有的3D圖形基礎(chǔ)模型往往使用邊界框表示每個對象,因此無法表達(dá)對象各部分之間的細(xì)粒度約束,導(dǎo)致約束只能解釋盒狀對象的位置(而不是將書籍放在書架上,或?qū)⒚q玩具放在帶有靠背和扶手的椅子上)。
FirePlace不僅希望克服上面的問題,還希望讓AI能夠選擇最符合美學(xué)、功能和常識性的對象放置方式。
顯然,想要實(shí)現(xiàn)這個目的,首先要有足夠的真實(shí)3D場景數(shù)據(jù)供AI學(xué)習(xí)。但是3D空間數(shù)據(jù)的成本比語言數(shù)據(jù)要高得多,數(shù)據(jù)來源成為困擾空間理解大模型和具身智能發(fā)展的最大難題之一。
而群核科技擁有著國內(nèi)用戶量最大的室內(nèi)裝修設(shè)計工具酷家樂,無疑在數(shù)據(jù)層面擁有天然優(yōu)勢。
酷家樂能夠擁有如今的市場份額,背后是對計算機(jī)渲染能力的深耕。通過對GPU并行算力的充分開發(fā),酷家樂渲染出圖的成本大幅降低,速度大幅提升,因此受到設(shè)計師的廣泛歡迎。
面向大模型的爆發(fā),群核科技也順勢推出了“群核空間智能平臺 SpatialVerse”,通過精準(zhǔn)模擬真實(shí)世界的多樣化場景,匯集了海量的3D模型與場景數(shù)據(jù)資源,為 AIGC、具身智能、AR/VR 等前沿科技領(lǐng)域提供了強(qiáng)大且高效的空間數(shù)據(jù)支撐與定制化服務(wù)。
SpatialVerse可以基于3D場景的數(shù)據(jù)生成更多的物理真實(shí)場景,并在這些虛擬的場景中,訓(xùn)練機(jī)器人避障、抓取、緊急制動,可以有效地提升訓(xùn)練成本和效率。
除了SpatialVerse,在GTC 2025大會上,群核科技開源了他們的最新模型SpatialLM。
目前,SpatialLM已在HuggingFace、GitHub、魔搭社區(qū)等平臺面向全球開發(fā)者開源。
SpatialLM是一個空間理解模型,僅憑一部手機(jī)拍攝的視頻,即可生成帶物理規(guī)則的的3D場景布局。
例如,在整理房間這個命題中:利用傳統(tǒng)的2D視頻數(shù)據(jù)標(biāo)注,機(jī)器人無法自動匹配物體的名字與具體的位置、大小、移動方向。如果使用專業(yè)的的激光雷達(dá)掃描形成3D點(diǎn)云,又會帶來高昂的成本和較長的制作周期。SpatialLM的出現(xiàn),有效地克服了這兩個問題。
當(dāng)SpatialLM幫助機(jī)器人跨過“空間理解”后,SpatialVerse這個“數(shù)字道場”,讓機(jī)器人實(shí)現(xiàn)在海量仿真環(huán)境中完成技能學(xué)習(xí)。將SpatialLM和SpatialVerse組合起來使用,能夠推動具身智能訓(xùn)練完成從認(rèn)知到行動的鏈路閉環(huán)。
同時,群核的這套方案將空間智能訓(xùn)練徹底平民化,只要有手機(jī)和電腦,任何開發(fā)者都能接入這套系統(tǒng),為機(jī)器人創(chuàng)建物理正確的訓(xùn)練環(huán)境,有利于推動具身智能實(shí)現(xiàn)降本增效。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 張睿佳 
-
擴(kuò)管理面積、拉增值服務(wù),越秀服務(wù)去年營收超38億元
2025-03-20 22:57 觀網(wǎng)財經(jīng)-房產(chǎn) -
王石代言528元一碗的燕窩,3天賣了30盒
2025-03-20 22:57 -
茶咖日報|“云南咖啡是代表中國的”
2025-03-20 20:20 觀網(wǎng)財經(jīng)-消費(fèi) -
俄烏談和平,特朗普“金主”暴跌
2025-03-20 18:01 觀網(wǎng)財經(jīng)-海外 -
美聯(lián)儲不降息,“美國經(jīng)濟(jì)前景的不確定性在增加”
2025-03-20 17:47 觀網(wǎng)財經(jīng)-海外 -
-
樓市“寒冬”之下,貝殼營收935億創(chuàng)下歷史新高
2025-03-20 17:33 觀網(wǎng)財經(jīng)-房產(chǎn) -
華為“想不到的新機(jī)”7499元起售,鴻蒙電腦5月見
2025-03-20 15:10 觀網(wǎng)財經(jīng)-科創(chuàng) -
京東為超萬名全職騎手繳納五險一金
2025-03-20 14:44 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
營收利潤新高后,小米發(fā)出8344萬股獎勵股份
2025-03-20 13:56 觀網(wǎng)財經(jīng)-科創(chuàng) -
華為與廣汽聯(lián)手,成立華望汽車
2025-03-20 13:44 -
-
AMD總裁蘇姿豐:DeepSeek的成就令人非常興奮
2025-03-20 08:13 觀網(wǎng)財經(jīng)-科創(chuàng) -
BOSS直聘因求職者太多崩了?官方回應(yīng)
2025-03-20 07:53 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
把數(shù)字人成本從數(shù)萬元打到幾十塊,京東斬獲這項唯一特等獎
2025-03-20 07:52 觀網(wǎng)財經(jīng)-科創(chuàng) -
《刺客信條》新作,能否救育碧于水火之中?
2025-03-20 07:51 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
去年營收1789億元的招商蛇口,想用資管、物業(yè)拉增長
2025-03-19 21:32 觀網(wǎng)財經(jīng)-房產(chǎn) -
凱利泰新一屆董事會名單出爐 現(xiàn)任董事長及總經(jīng)理落選
2025-03-19 20:25 -
-
一場數(shù)學(xué)競賽背后的中俄科技與教育合作
2025-03-19 20:03 觀察者頭條
相關(guān)推薦 -
最新聞 Hot
-
“全球都將研究,中國與西方最強(qiáng)大武器直接對決”
-
英方拿到了,“簡直像在平行宇宙,中國太超前了”
-
微軟:從中企學(xué)到,誰先一步拿下,誰就難被取代
-
美國農(nóng)民發(fā)愁:雞爪、魚頭...除了中國,好難找到買家
-
首位“美國教皇”利奧十四世是誰?
-
許紅兵,主動投案
-
美國官員:殲-10擊落陣風(fēng),沒用F-16
-
特朗普:對華關(guān)稅145%到頂了,要降
-
美大使污蔑“中國不是好盟友”,我駐巴拿馬使館駁斥
-
印度稱軍事基地遭巴基斯坦襲擊,巴方否認(rèn)
-
特朗普:可能找中國幫忙
-
大搞家庭式腐敗,甘肅省原副省長趙金云被決定逮捕
-
蓋茨怒懟:馬斯克就是在殺死兒童
-
微軟總裁瞎操心:不讓員工用DeepSeek
-
特朗普:美國與烏克蘭達(dá)成稀土協(xié)議
-
特朗普祝賀:歷史性時刻,美國的莫大榮耀
-