Barion Pixel

- Hirdetés -

- Hirdetés -

A Microsoft új robotikai modellt villantott fizikai AI alkalmazásokhoz

A robotika évtizedeken át főleg csak strukturált környezetekben, például gyártósorokon volt hatékony, ahol a feladatok előre meghatározott és kiszámítható módon zajlanak. A Microsoft szerint a kevésbé strukturált környezetek új megközelítést igényelnek, különösen akkor, ha a robotok emberek mellett dolgoznak. Ebbe az irányba illeszkedik a fizikai AI koncepciója, amely az agentikus mesterséges intelligenciát (AI-ügynököt) fizikai rendszerekkel kapcsolja össze.

A vállalat e gondolat mentén alkotta meg és mutatta be a Rho-alpha modellt, amely a Microsoft Phi sorozatának látás–nyelv modelljeiből kiinduló első robotikai megoldás.

A modell célja, hogy természetes nyelvű utasításokat alakítson át olyan vezérlőjelekké, amelyekkel a robotok kétkezes manipulációs feladatokat hajtanak végre. A cég VLA+ modellként írja le a Rho-alphát, mert az eddigi látás–nyelv–cselekvés (VLA) rendszerekhez képest további érzékelési és tanulási modalitásokat integrál.

„A fizikai rendszerekhez készült VLA modellek megjelenése lehetővé teszi, hogy a rendszerek egyre nagyobb önállósággal érzékeljenek, gondolkodjanak és cselekedjenek az emberek mellett olyan környezetekben is, amelyek jóval kevésbé strukturáltak” – magyarázta Ashley Llorens, a Microsoft Research Accelerator vállalati alelnöke és ügyvezető igazgatója.

Mindennapi munkára szánja a Microsoft

A Rho-alpha egyik megkülönböztető eleme az, hogy tapintásérzékelést integrál a vizuális és nyelvi megértés mellé. A Microsoft emellett azon is dolgozik, hogy a modell olyan további érzékelési módokat kezeljen, mint az erőérzékelés.

A tanulási oldalon a cél az, hogy a rendszer az üzembe helyezés után is fejlődjön, valamint tanuljon az emberek által adott visszajelzésekből.

A megközelítés szerint azok a robotok, amelyek képesek alkalmazkodni a változó helyzetekhez és az emberi preferenciákhoz, jobban használhatók a mindennapi munkakörnyezetekben. A Rho-alpha fejlesztése során a Microsoft a tanítási folyamat és az adatkészletek végponttól végpontig történő optimalizálásán dolgozik, különös tekintettel a kétkezes manipulációs feladatokra.

A modellt jelenleg kétkaros rendszereken és humanoid robotokon értékelik, a műszaki leírást a következő hónapokban tervezik közzétenni – áll a közleményben.

A modell betanítása fizikai bemutatókból és szimulált feladatokból származó mozgássorozatok, valamint nagyléptékű, online vizuális kérdés–válasz adatok alapján történik.

A Rho-alpha fejlesztése mellett a Microsoft olyan eszközökön és modellalkalmazkodási technikákon is dolgozik, amelyek lehetővé teszik, hogy a rendszer működés közben tanuljon az építő jellegű visszajelzésekből. A vállalat a robotikai gyártók, integrátorok és végfelhasználók számára is elérhetővé kívánja tenni ezeket az alaptechnológiákat, hogy saját adataikkal és saját környezetükben fejleszthessék tovább a felhőben futó fizikai AI-megoldásaikat.

Gábor János, NEW technology

NEW technology