記者日前從北京市經(jīng)濟(jì)和信息化局了解到,北京人形機(jī)器人創(chuàng)新中心數(shù)據(jù)采集與訓(xùn)練基地投用4個(gè)月以來(lái),內(nèi)部研發(fā)數(shù)據(jù)采集量已經(jīng)超過(guò)300萬(wàn)條,開(kāi)源數(shù)據(jù)超30萬(wàn)條,已為多家頭部企業(yè)及科研機(jī)構(gòu)交付超數(shù)萬(wàn)小時(shí)高質(zhì)量數(shù)據(jù)。這些數(shù)據(jù)究竟有什么用途?
作為全國(guó)最齊全場(chǎng)景覆蓋的機(jī)器人數(shù)據(jù)訓(xùn)練基地之一,北京人形機(jī)器人創(chuàng)新中心數(shù)據(jù)基地一期建筑面積近5000平方米,包括約200平方米的專業(yè)光學(xué)動(dòng)作捕捉場(chǎng)地。記者在現(xiàn)場(chǎng)看到,120多臺(tái)機(jī)器人分別在家居、商超、辦公、工業(yè)、醫(yī)藥、康養(yǎng)等領(lǐng)域30余個(gè)典型場(chǎng)景中,進(jìn)行現(xiàn)場(chǎng)的數(shù)據(jù)采集與訓(xùn)練。這些場(chǎng)景并非靜態(tài)的“樣板間”,其光照條件、物體擺放、人員動(dòng)線均可按需調(diào)整,確保采集數(shù)據(jù)具備充分的泛化能力。

總臺(tái)記者 馬欣欣:在搭建的“兒童房”的場(chǎng)景中,模型訓(xùn)練師正在操控機(jī)器人去把這個(gè)反了的襪子給翻過(guò)來(lái)。完成這些動(dòng)作的同時(shí),也會(huì)實(shí)時(shí)采集這些機(jī)器人關(guān)節(jié)角度值、運(yùn)行軌跡等多個(gè)數(shù)據(jù),一共300到1000次才能完成一個(gè)動(dòng)作的數(shù)據(jù)采集。

針對(duì)初期機(jī)器人數(shù)據(jù)采集存在的場(chǎng)景碎片化、不同構(gòu)型機(jī)器人適配難、數(shù)據(jù)質(zhì)量參差不齊等瓶頸問(wèn)題,基地也通過(guò)制定標(biāo)準(zhǔn)化的采集流程規(guī)范,確保整體數(shù)據(jù)合格率穩(wěn)定在95%以上。截至目前,內(nèi)部研發(fā)數(shù)據(jù)采集量已超300萬(wàn)條,開(kāi)源數(shù)據(jù)超30萬(wàn)條。