AI nuėjo ilgą kelią vizualinio suvokimo ir kalbos apdorojimo srityje. Tačiau šių gebėjimų neužtenka kuriant sistemas, kurios gali sąveikauti su fiziniu pasauliu. Žmonės valdo daiktus arba atlieka kontroliuojamus judesius lytėjimo pojūčiu. Mes jaučiame tekstūrą, temperatūrą ir matuojame svorį, kad kiekvienas veiksmas būtų tiksliai nukreiptas. Šis apčiuopiamas grįžtamasis ryšys leidžia valdyti trapius daiktus, valdyti įrankius ir sklandžiai atlikti sudėtingas užduotis.
Meta, gerai žinoma dėl savo darbo virtualioje ir papildytoje realybėje, dabar imasi iššūkio sukurti AI, galintį sąveikauti su fiziniu pasauliu panašiai kaip žmogus. Vykdydama iniciatyvą FAIR Robotics, Meta kuria atvirojo kodo įrankius ir sistemas, kad pagerintų robotų lytėjimo jausmą ir fizinį judrumą. Šios pastangos gali padėti sukurti įkūnytą AI – sistemas, kurios ne tik mato, bet ir gali jausti objektus bei jais manipuliuoti taip, kaip tai daro žmonės.
Kas yra įkūnytas AI?
Įkūnytas AI sujungia fizinę sąveiką su dirbtiniu intelektu, todėl mašinos gali jausti, reaguoti ir natūraliai bendrauti su aplinka. Užuot tiesiog „matę“ ar „girdėję“ įvestis, tai leidžia dirbtinio intelekto sistemoms jausti ir veikti pasaulis. Pagalvokite apie robotą, kuris gali pajusti slėgį, kurį daro objektui, reguliuoti jo sukibimą ir judėti. Įkūnytas AI perkelia dirbtinį intelektą iš ekranų ir garsiakalbių į fizinį pasaulį, todėl jis gali manipuliuoti objektais, atlikti užduotis ir prasmingiau bendrauti su žmonėmis.
Pavyzdžiui, robotas, sukurtas naudojant įkūnytą AI, galėtų padėti pagyvenusiam žmogui pasiimti trapius daiktus jų nepažeisdamas. Sveikatos priežiūros srityje jis galėtų padėti gydytojams, laikydamas instrumentus tiksliai operacijos metu. Šis potencialas neapsiriboja robotų ginklais laboratorijose ar automatizuotais ginklais gamyklose; tai yra apie mašinų, kurios supranta ir reaguoja į savo fizinę aplinką realiu laiku, kūrimą.
„Meta“ požiūris į įkūnytą AI
„Meta“ daugiausia dėmesio skiria trims pagrindinėms sritims, kad įkūnytas dirbtinis intelektas būtų arčiau žmogaus prisilietimo. Pirma, bendrovė kuria pažangias lytėjimo jutimo technologijas, kurios leidžia mašinoms aptikti tokius dalykus kaip slėgis, tekstūra ir temperatūra. Antra, Meta kuria prisilietimo suvokimo modelius, leidžiančius AI suprasti šiuos signalus ir į juos reaguoti. Galiausiai „Meta“ kuria lytėjimo kūrimo platformą, kuri su šiais suvokimo modeliais sujungia kelis jutiklius ir siūlo visą sistemą, skirtą lietimui įgalintam AI kurti. Štai kaip Meta skatina įkūnyto AI pažangą kiekvienoje iš šių sričių.
Meta Digit 360: žmogaus lygio lytėjimo jutimas
„Meta“ pristatė „Digit 360“ piršto galiuką – lytėjimo jutimo technologiją, sukurtą suteikti įkūnytam AI žmogui panašų lytėjimo pojūtį. Turėdamas daugiau nei 18 jutimo funkcijų, jis gali aptikti vibraciją, šilumą ir net chemines medžiagas ant paviršių. Įrengtas dirbtinio intelekto lustas, pirštų galiukais akimirksniu apdoroja prisilietimo duomenis, todėl galima greitai reaguoti į įvestis, pvz., viryklės karštį ar aštrų adatos dūrią. Ši technologija įkūnytame AI veikia kaip „periferinė nervų sistema“, imituojanti refleksines reakcijas, panašias į žmogaus reakcijas. „Meta“ sukūrė šį piršto galą su unikalia optine sistema, kurioje yra daugiau nei 8 milijonai takselių, galinčių užfiksuoti prisilietimą bet kuriuo kampu. Jis jaučia mažytes detales, net iki vieno miltinio gabalo, suteikdamas įkūnytai AI tiksliai suderintą jautrumą aplinkai.
Meta Sparsh: Lytėjimo suvokimo fondas
Meta tobulina prisilietimo suvokimo galimybes, kad padėtų AI suprasti fizinius pojūčius ir į juos reaguoti. Pavadintas pagal sanskrito žodį „lietimas“, „Sparsh“ veikia kaip „lietimo smegenys“ įkūnytam AI. Šis modelis leidžia mašinoms interpretuoti sudėtingus lytėjimo signalus, tokius kaip slėgis ir sukibimas.
Viena iš išskirtinių „Sparsh“ savybių yra jos universalumas. Tradicinėse lytėjimo sistemose kiekvienai užduočiai naudojami atskiri modeliai, labai priklausomi nuo pažymėtų duomenų ir specifinių jutiklių. Sparsh visiškai pakeičia šį požiūrį. Kaip bendros paskirties modelis, jis prisitaiko prie įvairių jutiklių ir užduočių. Jis mokosi prisilietimo modelių naudodamas savarankišką mokymąsi (SSL) didžiulėje daugiau nei 460 000 lytėjimo vaizdų duomenų bazėje, nereikalaujant pažymėtų duomenų.
„Meta“ taip pat pristatė „TacBench“ – naują etaloną su šešiomis lietimu pagrįstomis užduotimis, skirtomis įvertinti „Sparsh“ sugebėjimus. „Meta“ teigia, kad „Sparsh“ 95,1% pralenkė tradicinius modelius, ypač esant mažai duomenų. „Sparsh“ versijos, sukurtos ant „Meta“ I-JEPA ir DINO architektūrų, pademonstravo puikius sugebėjimus atliekant tokias užduotis kaip jėgos įvertinimas, slydimo aptikimas ir sudėtingas manipuliavimas.
Meta Digit Plexus: lytėjimo sistemos kūrimo platforma
„Meta“ pristatė „Digit Plexus“, kad integruotų jutimo technologijas ir lytėjimo suvokimo modelius, kad sukurtų įkūnytą AI sistemą. Platforma sujungia pirštų galiukų ir delnų jutiklius vienoje robotinėje rankoje, kad būtų galima labiau koordinuoti prisilietimo atsakus. Ši sąranka leidžia įkūnytam AI apdoroti jutiminį grįžtamąjį ryšį ir pritaikyti savo veiksmus realiuoju laiku, pavyzdžiui, kaip žmogaus ranka juda ir reaguoja.
Standartizuodamas lietimo grįžtamąjį ryšį per ranką, „Digit Plexus“ padidina įkūnyto AI tikslumą ir valdymą. Ši plėtra ypač svarbi tokiose srityse kaip gamyba ir sveikatos priežiūra, kur būtinas kruopštus tvarkymas. Platforma sujungia jutiklius, tokius kaip piršto galiukas ir ReSkin, su valdymo sistema, supaprastindama duomenų rinkimą, valdymą ir analizę – visa tai vienu kabeliu.
„Meta“ išleidžia „Digit Plexus“ programinės ir techninės įrangos dizainą atvirojo kodo bendruomenei. Tikslas – skatinti bendradarbiavimą ir paspartinti įkūnyto AI tyrimus, skatinant inovacijas ir pažangą šiose srityse.
Įkūnyto dirbtinio intelekto tyrimų ir plėtros propagavimas
„Meta“ tobulina ne tik technologijas, bet ir išteklius, siekdama skatinti įkūnytus AI tyrimus ir plėtrą. Pagrindinė iniciatyva yra dirbtinio intelekto modelių vertinimo etalonų kūrimas. Vienas iš tokių etalonų, PARTNR (Planning And Reasoning Tasks in human-Robot bendradarbiavimas), įvertina, kaip dirbtinio intelekto modeliai sąveikauja su žmonėmis atliekant namų ūkio užduotis. Naudodamas „Habitat 3.0“ simuliatorių, PARTNR sukuria tikrovišką aplinką, kurioje robotai padeda atlikti tokias užduotis kaip valymas ir maisto gaminimas. Su daugiau nei 100 000 kalbomis pagrįstų užduočių siekiama paspartinti įkūnyto AI pažangą.
Be vidinių iniciatyvų, „Meta“ bendradarbiauja su tokiomis organizacijomis kaip „GelSight Inc.“ ir „Wonik Robotics“, kad paspartintų lytėjimo jutimo technologijų pritaikymą. „GelSight“ platins „Digit 360“ jutiklius, o „Wonik Robotics“ gamins „Allegro Hand“, kurioje integruota „Digit Plexus“ technologija. Suteikdama šias technologijas prieinamas per atvirojo kodo platformas ir partnerystes, „Meta“ padeda sukurti ekosistemą, kuri galėtų paskatinti naujoves sveikatos priežiūros, gamybos ir buitinės pagalbos srityse.
Esmė
„Meta“ tobulina įkūnytą AI, perkeldama jį ne tik į vaizdą ir garsą, bet ir į lytėjimo pojūtį. Su naujovėmis, tokiomis kaip „Digit 360“ ir „Sparsh“, AI sistemos įgyja galimybę tiksliai jausti aplinką ir į ją reaguoti. Dalindamasi šiomis technologijomis su atvirojo kodo bendruomene ir bendradarbiaudama su pagrindinėmis organizacijomis, „Meta“ padeda paspartinti lytėjimo jutimo plėtrą. Ši pažanga gali lemti lūžius tokiose srityse kaip sveikatos priežiūra, gamyba ir pagalba namuose, todėl dirbtinis intelektas gali būti pajėgesnis ir reaguoti į realaus pasaulio užduotis.