正式出炉!重磅发布|日韩精品无码一区二区三区不卡|国产SUV精品一区二AV18款|18av爱库网千部影片|超帅小鲜肉套小蓝GAY|精选国产一区二区三区|daching

首頁(yè) 商業(yè) > 正文

今日熱文:從實(shí)驗(yàn)室到真實(shí)場(chǎng)景 數(shù)據(jù)為具身智能落地關(guān)鍵

在近期具身智能企業(yè)的發(fā)布活動(dòng)中,數(shù)據(jù)成為高頻詞匯。隨著具身智能從實(shí)驗(yàn)室走入真實(shí)場(chǎng)景,數(shù)據(jù)成為影響具身智能落地部署的關(guān)鍵。近日,覓蜂科技、帕西尼發(fā)布具身智能數(shù)據(jù)與數(shù)據(jù)服務(wù)平臺(tái),多家企業(yè)發(fā)布更低成本的數(shù)據(jù)采集方案,圍繞物理AI數(shù)據(jù)規(guī)模、質(zhì)量與成本的競(jìng)賽全面開(kāi)啟。

數(shù)據(jù)成為模型能力關(guān)鍵


(資料圖片)

“機(jī)器人其實(shí)硬件到位了,但是大腦沒(méi)有跟上,就像空有一身漂亮的肌肉。”自變量機(jī)器人CEO王潛在4月21日舉辦的發(fā)布會(huì)上說(shuō)。

如今,業(yè)內(nèi)普遍認(rèn)為具身智能數(shù)據(jù)是提升機(jī)器人“大腦”能力的關(guān)鍵,這種能力對(duì)應(yīng)著更強(qiáng)的具身模型能力,通常指機(jī)器人執(zhí)行任務(wù)的泛化性。自變量機(jī)器人CTO王昊將具身智能模型訓(xùn)練所用的數(shù)據(jù)分為“糖水?dāng)?shù)據(jù)”和“牛奶數(shù)據(jù)”:“糖水?dāng)?shù)據(jù)”來(lái)自實(shí)驗(yàn)室,與現(xiàn)實(shí)世界有較大差距,難以提升模型的泛化性;“牛奶數(shù)據(jù)”來(lái)自真實(shí)環(huán)境,充滿(mǎn)隨機(jī)性,對(duì)模型訓(xùn)練更有益。

為了獲得高質(zhì)量的“牛奶數(shù)據(jù)”,自變量機(jī)器人將機(jī)器人部署到100個(gè)志愿者的真實(shí)家庭中進(jìn)行訓(xùn)練。“真實(shí)的混亂和不可預(yù)測(cè)的場(chǎng)景、畫(huà)面,這些才是能驅(qū)動(dòng)數(shù)據(jù)飛輪真正轉(zhuǎn)起來(lái)的因素。”王昊稱(chēng),以實(shí)驗(yàn)室數(shù)據(jù)打底,真實(shí)環(huán)境的數(shù)據(jù)提質(zhì),自變量機(jī)器人發(fā)布新一代基于世界統(tǒng)一模型架構(gòu)的具身智能基礎(chǔ)模型WALL-B。公司還宣布,今年5月25日,部署WALL-B模型的新一代機(jī)器人將入駐真實(shí)家庭,邊做邊學(xué)。

具身數(shù)據(jù)已經(jīng)成為今年行業(yè)發(fā)展的關(guān)注焦點(diǎn)。“機(jī)器人的跑跳等運(yùn)動(dòng)能力,前兩年已經(jīng)很大程度得到解決,下一步要解決機(jī)器人能干活的問(wèn)題,這需要機(jī)器人‘大腦’能感知、能做規(guī)劃,需要數(shù)據(jù)來(lái)訓(xùn)練模型。”祥峰投資管理合伙人夏志進(jìn)對(duì)記者表示,對(duì)具身模型和數(shù)據(jù)的高關(guān)注度,正是當(dāng)前行業(yè)推動(dòng)機(jī)器人落地部署的真實(shí)需求。

覓蜂科技董事長(zhǎng)姚卯青認(rèn)為,2026年是具身智能產(chǎn)業(yè)數(shù)據(jù)元年,具身智能是萬(wàn)億元級(jí)賽道,但行業(yè)面臨數(shù)據(jù)荒漠。“文本大模型語(yǔ)料規(guī)模達(dá)百億小時(shí)級(jí),具身智能高質(zhì)量數(shù)據(jù)規(guī)模僅為50萬(wàn)小時(shí)級(jí),差距巨大。”他表示,百億小時(shí)是通用智能的基礎(chǔ)門(mén)檻。阿里云高級(jí)算法專(zhuān)家張民英也表示,要讓具身智能模型能力實(shí)現(xiàn)突破,需要100億小時(shí)數(shù)據(jù)量級(jí)。

頭部企業(yè)積極布局

4月16日,帕西尼聯(lián)合京東云、騰訊云、百度智能云共同推出全模態(tài)具身智能數(shù)據(jù)云商城,即日起全面對(duì)外開(kāi)放。同日,智元機(jī)器人控股的具身智能數(shù)據(jù)平臺(tái)公司覓蜂科技在上海發(fā)布一站式物理AI數(shù)據(jù)服務(wù)平臺(tái),并上線覓蜂數(shù)據(jù)商城,公司計(jì)劃到2026年和2030年,分別實(shí)現(xiàn)千萬(wàn)小時(shí)級(jí)、百億小時(shí)級(jí)數(shù)據(jù)產(chǎn)能。今年3月光輪智能宣布完成近10億元融資,成為首個(gè)具身數(shù)據(jù)領(lǐng)域的“獨(dú)角獸”企業(yè),并宣布在今年一季度獲得5.5億元訂單。

“當(dāng)下處于數(shù)據(jù)‘軍備競(jìng)賽’的起點(diǎn)。”姚卯青表示,行業(yè)頭部數(shù)據(jù)需求方,普遍有全年百萬(wàn)小時(shí)的數(shù)據(jù)需求。

此前,北京、上海、天津、武漢、無(wú)錫等多地已經(jīng)建立起大規(guī)模的具身智能數(shù)據(jù)采集工廠,行業(yè)探索發(fā)現(xiàn),傳統(tǒng)數(shù)據(jù)采集模式依賴(lài)大量機(jī)器人本體,由人工遙操作采集,采集成本高、花費(fèi)時(shí)間長(zhǎng)。如今,更多企業(yè)開(kāi)始探索更低成本的數(shù)據(jù)采集方式。

夏志進(jìn)介紹:“近期比較受關(guān)注的是采用UMI(通用操作接口)方案,通過(guò)人類(lèi)穿戴采集設(shè)備采集數(shù)據(jù),再將采集到的數(shù)據(jù)部署至機(jī)器人。”如今年3月鹿明機(jī)器人發(fā)布FastUMI無(wú)本體數(shù)采產(chǎn)品,該方案將單條數(shù)據(jù)采集時(shí)間從傳統(tǒng)遙操作所需的50秒縮短至10秒,效率大幅提升,同時(shí)將綜合成本降至原來(lái)的五分之一。

今年4月,覓蜂科技發(fā)布MEgo系列無(wú)本體采集硬件,包括夾爪造型的手持輕量化采集設(shè)備MEgo Gripper,以及穿戴在頭部、手部的MEgo View采集終端。這些搭載著傳感器、攝像頭的采集設(shè)備會(huì)將穿戴者的周?chē)h(huán)境與動(dòng)作軌跡采集、還原。“隨著無(wú)本體采集方案普及,預(yù)計(jì)采集效率會(huì)達(dá)到真機(jī)采集的兩三倍,數(shù)據(jù)成本也將下降。”姚卯青稱(chēng)。

專(zhuān)家認(rèn)為,另一個(gè)降低數(shù)據(jù)采集成本的方案是使用部分視頻數(shù)據(jù)與仿真合成數(shù)據(jù),與真實(shí)數(shù)據(jù)相印證,幫助降低模型訓(xùn)練成本、提升效率。例如極佳視界2025年12月發(fā)布并開(kāi)源的具身世界模型GigaWorld-0,將世界模型生成數(shù)據(jù)在VLA訓(xùn)練中的占比提升至90%。千尋智能聯(lián)合創(chuàng)始人高陽(yáng)介紹,公司選擇基于海量人類(lèi)互聯(lián)網(wǎng)視頻進(jìn)行預(yù)訓(xùn)練,通過(guò)自研設(shè)備將數(shù)據(jù)采集成本降低了90%。

夏志進(jìn)表示,目前市場(chǎng)上,具身智能相關(guān)數(shù)據(jù)仍存在較大缺口,與此同時(shí),關(guān)于具身智能數(shù)據(jù)的選用標(biāo)準(zhǔn)、用量規(guī)模以及采集方式,行業(yè)內(nèi)尚未形成統(tǒng)一共識(shí),企業(yè)仍處于探索階段。另有業(yè)內(nèi)投資人表示,當(dāng)下資本更看好具備低成本、高效率的數(shù)據(jù)獲取方式的企業(yè)。

需盡快建立標(biāo)準(zhǔn)

在提升具身數(shù)據(jù)規(guī)模的同時(shí),具身數(shù)據(jù)標(biāo)準(zhǔn)、質(zhì)量問(wèn)題成為行業(yè)挑戰(zhàn)。“首先是行業(yè)標(biāo)準(zhǔn)缺失,各家企業(yè)生產(chǎn)數(shù)據(jù)的格式、標(biāo)注都自成體系,難以互通和復(fù)用;二是數(shù)據(jù)質(zhì)量參差不齊,數(shù)據(jù)標(biāo)注不規(guī)范、數(shù)據(jù)質(zhì)量粗糙問(wèn)題普遍存在。”姚卯青表示,大模型由數(shù)據(jù)驅(qū)動(dòng),如果輸入“垃圾數(shù)據(jù)”,產(chǎn)出的就是“垃圾模型”。

為解決數(shù)據(jù)標(biāo)準(zhǔn)問(wèn)題,行業(yè)企業(yè)正在各自探索。如覓蜂科技通過(guò)數(shù)據(jù)治理引擎對(duì)采集到的數(shù)據(jù)進(jìn)行處理,其中包括數(shù)據(jù)預(yù)處理、空間感知信息提取、數(shù)據(jù)質(zhì)量評(píng)估等。“從數(shù)據(jù)硬件層面的同步、標(biāo)定,再到語(yǔ)義的標(biāo)注,再到采集操作的規(guī)范,以及數(shù)據(jù)場(chǎng)景、任務(wù)的多樣性,這些都構(gòu)成了高質(zhì)量數(shù)據(jù)的必要元素。”姚卯青稱(chēng)。

帕西尼則建立了一套標(biāo)準(zhǔn)化的數(shù)據(jù)全生命周期閉環(huán)管理系統(tǒng),降低數(shù)據(jù)清洗成本,確保數(shù)據(jù)的一致性與高質(zhì)量。北京人形機(jī)器人創(chuàng)新中心設(shè)立的具身智能機(jī)器人數(shù)據(jù)與訓(xùn)練基地也建立了標(biāo)準(zhǔn)化項(xiàng)目管理體系,制定數(shù)據(jù)采集、標(biāo)注、質(zhì)檢等系列規(guī)范,實(shí)現(xiàn)全流程的質(zhì)量把控。

光輪智能創(chuàng)始人兼CEO謝晨表示,具身智能數(shù)據(jù)呈現(xiàn)為“真機(jī)數(shù)據(jù)、仿真數(shù)據(jù)、互聯(lián)網(wǎng)視頻數(shù)據(jù)”三層金字塔結(jié)構(gòu),三類(lèi)數(shù)據(jù)都是實(shí)現(xiàn)行業(yè)泛化的必要條件。除了數(shù)據(jù)的缺失,當(dāng)前行業(yè)痛點(diǎn)還在于缺少模型評(píng)價(jià)體系。謝晨說(shuō):“如果沒(méi)有評(píng)價(jià)體系,大家就不知道用什么樣的數(shù)據(jù)能夠使模型表現(xiàn)得更好。”從業(yè)者普遍認(rèn)為,行業(yè)需要建立統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn)和模型評(píng)價(jià)體系。

關(guān)鍵詞: 數(shù)據(jù) 機(jī)器人 智能 模型

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - m.jxytsy.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3