Dirbtinis intelektas (AI) yra visur, keičiantis sveikatos priežiūrai, švietimui ir pramogoms. Tačiau už visų šių pokyčių slypi sunki tiesa: AI darbui reikia daug duomenų. Keletas didelių technologijų įmonių, tokių kaip „Google“, „Amazon“, „Microsoft“ ir „OpenAI“, turi didžiąją dalį šių duomenų, todėl joms suteikiamas didelis pranašumas. Užtikrindami išskirtines sutartis, kurdami uždaras ekosistemas ir supirkdami mažesnius žaidėjus, jie dominuoja dirbtinio intelekto rinkoje, todėl kitiems sunku konkuruoti. Ši galios koncentracija yra ne tik inovacijų ir konkurencijos problema, bet ir etikos, sąžiningumo ir taisyklių problema. Kadangi AI daro didelę įtaką mūsų pasauliui, turime suprasti, ką ši duomenų monopolija reiškia technologijų ir visuomenės ateičiai.
Duomenų vaidmuo kuriant AI
Duomenys yra AI pagrindas. Be duomenų net sudėtingiausi algoritmai yra nenaudingi. AI sistemoms reikia daug informacijos, kad išmoktų modelius, prognozuotų ir prisitaikytų prie naujų situacijų. Naudojamų duomenų kokybė, įvairovė ir apimtis lemia, koks bus AI modelio tikslumas ir pritaikymas. Natūralios kalbos apdorojimo (NLP) modeliai, tokie kaip „ChatGPT“, yra parengti naudojant milijardus teksto pavyzdžių, kad suprastų kalbos niuansus, kultūrines nuorodas ir kontekstą. Taip pat vaizdų atpažinimo sistemos yra apmokytos naudojant didelius, įvairius pažymėtų vaizdų duomenų rinkinius, kad būtų galima identifikuoti objektus, veidus ir scenas.
„Big Tech“ sėkmę dirbtinio intelekto srityje lemia jos prieiga prie patentuotų duomenų. Patentuoti duomenys yra unikalūs, išskirtiniai ir labai vertingi. Jie sukūrė didžiules ekosistemas, kurios generuoja didžiulį duomenų kiekį per naudotojų sąveiką. Pavyzdžiui, „Google“ naudoja savo dominavimą paieškos sistemose, „YouTube“ ir „Google Maps“ elgsenos duomenims rinkti. Kiekviena paieškos užklausa, žiūrėtas vaizdo įrašas ar aplankyta vieta padeda patobulinti jų AI modelius. „Amazon“ elektroninės prekybos platforma renka išsamius duomenis apie apsipirkimo įpročius, pageidavimus ir tendencijas, kuriuos ji naudoja optimizuodama produktų rekomendacijas ir logistiką per AI.
„Big Tech“ išskiria renkami duomenys ir tai, kaip jie integruoja juos į savo platformas. Tokios paslaugos kaip „Gmail“, „Google“ paieška ir „YouTube“ yra sujungtos, sukuriant save sustiprinančią sistemą, kurioje naudotojų įsitraukimas generuoja daugiau duomenų ir pagerina dirbtinio intelekto funkcijas. Tai sukuria nuolatinio tobulinimo ciklą, todėl jų duomenų rinkiniai yra dideli, turtingi ir nepakeičiami.
Ši duomenų ir AI integracija sustiprina „Big Tech“ dominavimą erdvėje. Mažesni žaidėjai ir startuoliai negali pasiekti panašių duomenų rinkinių, todėl konkuruoti tame pačiame lygyje neįmanoma. Galimybė rinkti ir naudoti tokius nuosavybės teise priklausančius duomenis šioms įmonėms suteikia didelį ir ilgalaikį pranašumą. Tai kelia klausimų apie konkurenciją, naujoves ir platesnes koncentruotos duomenų kontrolės pasekmes dirbtinio intelekto ateičiai.
„Big Tech“ duomenų kontrolė
„Big Tech“ įtvirtino savo dominavimą dirbtinio intelekto srityje, naudodama strategijas, suteikiančias išskirtinę kritinių duomenų kontrolę. Vienas iš pagrindinių jų požiūrių yra išskirtinių partnerysčių su organizacijomis formavimas. Pavyzdžiui, „Microsoft“ bendradarbiavimas su sveikatos priežiūros paslaugų teikėjais suteikia jai prieigą prie jautrių medicininių įrašų, kurie vėliau naudojami kuriant pažangiausius AI diagnostikos įrankius. Šie išskirtiniai susitarimai veiksmingai riboja konkurentų galimybes gauti panašių duomenų rinkinių, todėl susidaro didelė kliūtis patekti į šias sritis.
Kita taktika – glaudžiai integruotų ekosistemų kūrimas. Tokios platformos kaip „Google“, „YouTube“, „Gmail“ ir „Instagram“ sukurtos taip, kad saugotų vartotojų duomenis savo tinkluose. Kiekviena paieška, el. laiškas, žiūrėtas vaizdo įrašas ar įrašas, kuriam patiko, generuoja vertingus elgsenos duomenis, kurie skatina jų dirbtinio intelekto sistemas.
Įmonių, turinčių vertingų duomenų rinkinių, įsigijimas yra dar vienas būdas „Big Tech“ sustiprinti savo kontrolę. „Facebook“ įsigijus „Instagram“ ir „WhatsApp“ ne tik išplėtė savo socialinės žiniasklaidos portfelį, bet ir suteikė bendrovei prieigą prie milijardų vartotojų bendravimo būdų ir asmeninių duomenų. Panašiai „Google“ įsigijus „Fitbit“ buvo suteikta prieiga prie daugybės sveikatos ir kūno rengybos duomenų, kuriuos galima panaudoti dirbtinio intelekto maitinamiems sveikatingumo įrankiams.
Naudodama išskirtines partnerystes, uždaras ekosistemas ir strateginius įsigijimus, „Big Tech“ įgijo reikšmingą pranašumą dirbtinio intelekto kūrimo srityje. Šis dominavimas kelia susirūpinimą dėl konkurencijos, sąžiningumo ir didėjančio atotrūkio tarp kelių didelių įmonių ir visų kitų dirbtinio intelekto srityje dirbančių asmenų.
Platesnis Big Tech duomenų monopolio poveikis ir kelias pirmyn
„Big Tech“ duomenų kontrolė turi didelį poveikį konkurencijai, naujovėms, etikai ir AI ateičiai. Mažesnės įmonės ir pradedančios įmonės susiduria su didžiuliais iššūkiais, nes negali pasiekti didžiulių duomenų rinkinių, kuriuos „Big Tech“ naudoja mokydama savo AI modelius. Neturėdami išteklių išskirtinėms sutartims ar unikaliems duomenims įsigyti, šie mažesni žaidėjai negali konkuruoti. Šis disbalansas užtikrina, kad tik kelios didelės įmonės išliks svarbios kuriant dirbtinį intelektą, o kitas atsilieka.
Kai DI dominuoja vos kelios korporacijos, pažangą dažnai lemia jų prioritetai, orientuoti į pelną. Tokios įmonės kaip „Google“ ir „Amazon“ deda daug pastangų tobulindamos reklamos sistemas arba didindamos elektroninės prekybos pardavimus. Nors šie tikslai atneša pajamų, jie dažnai nepaiso svarbesnių visuomenės problemų, tokių kaip klimato kaita, visuomenės sveikata ir teisingas švietimas. Šis siauras dėmesys sulėtina pažangą srityse, kurios gali būti naudingos visiems. Konkurencijos trūkumas vartotojams reiškia mažiau pasirinkimų, didesnes išlaidas ir mažiau naujovių. Produktai ir paslaugos atspindi šių pagrindinių įmonių interesus, o ne įvairius jų vartotojų poreikius.
Taip pat yra rimtų etinių problemų, susijusių su tokia duomenų kontrole. Daugelis platformų renka asmeninę informaciją aiškiai nepaaiškindamos, kaip ji bus naudojama. Tokios įmonės kaip „Facebook“ ir „Google“ renka didžiulius duomenų kiekius, apsimesdamos tobulėjančiomis paslaugomis, tačiau didžioji jų dalis yra skirta reklamai ir kitiems komerciniams tikslams. Tokie skandalai kaip „Cambridge Analytica“ rodo, kaip lengvai šiais duomenimis gali būti piktnaudžiaujama, o tai kenkia visuomenės pasitikėjimui.
AI šališkumas yra dar viena svarbi problema. Dirbtinio intelekto modeliai yra tiek geri, kiek jie yra mokomi duomenų. Patentuotiems duomenų rinkiniams dažnai trūksta įvairovės, todėl gaunami šališki rezultatai, kurie neproporcingai veikia konkrečias grupes. Pavyzdžiui, buvo įrodyta, kad veido atpažinimo sistemos, parengtos naudojant daugiausia baltos spalvos duomenų rinkinius, klaidingai atpažįsta žmones su tamsesniu odos tonu. Tai paskatino nesąžiningą praktiką tokiose srityse kaip samdymas ir teisėsauga. Duomenų rinkimo ir naudojimo skaidrumo trūkumas dar labiau apsunkina šių problemų sprendimą ir sistemines nelygybes.
Taisyklės buvo lėtai sprendžiamos šiais iššūkiais. Nors privatumo taisyklės, tokios kaip ES Bendrasis duomenų apsaugos reglamentas (BDAR), nustato griežtesnius standartus, jos nesprendžia monopolinės praktikos, leidžiančios Big Tech dominuoti dirbtiniam intelektui. Norint skatinti sąžiningą konkurenciją, padaryti duomenis prieinamesnius ir užtikrinti, kad jie būtų naudojami etiškai, reikia griežtesnės politikos.
Norint sulaužyti „Big Tech“ duomenų gniaužtus, reikės drąsių ir bendradarbiavimo pastangų. Atvirų duomenų iniciatyvos, pvz., „Common Crawl“ ir „Hugging Face“, siūlo kelią į priekį, nes sukuria bendrus duomenų rinkinius, kuriuos gali naudoti mažesnės įmonės ir mokslininkai. Viešasis finansavimas ir institucinė parama šiems projektams galėtų padėti sudaryti vienodas sąlygas ir skatinti konkurencingesnę dirbtinio intelekto aplinką.
Vyriausybės taip pat turi atlikti savo vaidmenį. Politika, kuri įpareigoja dalytis duomenimis dominuojančioms įmonėms, galėtų atverti galimybes kitoms. Pavyzdžiui, anoniminiai duomenų rinkiniai galėtų būti prieinami viešiesiems tyrimams, kad mažesni žaidėjai galėtų diegti naujoves nepažeidžiant vartotojų privatumo. Tuo pačiu metu griežtesni privatumo įstatymai yra būtini siekiant užkirsti kelią piktnaudžiavimui duomenimis ir suteikti asmenims daugiau galimybių valdyti savo asmeninę informaciją.
Galiausiai įveikti „Big Tech“ duomenų monopoliją nebus lengva, tačiau sąžiningesnė ir novatoriškesnė AI ateitis įmanoma naudojant atvirus duomenis, griežtesnius reglamentus ir prasmingą bendradarbiavimą. Spręsdami šiuos iššūkius dabar galime užtikrinti, kad dirbtinis intelektas būtų naudingas visiems, o ne tik keliems galingiesiems.
Esmė
„Big Tech“ duomenų kontrolė suformavo AI ateitį taip, kad būtų naudinga tik nedaugeliui, o kitiems sukuriama kliūčių. Ši monopolija riboja konkurenciją ir inovacijas bei kelia rimtą susirūpinimą dėl privatumo, sąžiningumo ir skaidrumo. Kelių įmonių dominavimas nepalieka vietos mažesniems žaidėjams ar pažangai visuomenei svarbiausiose srityse, pavyzdžiui, sveikatos priežiūros, švietimo ir klimato kaitos srityse.
Tačiau šią tendenciją galima pakeisti. Atvirų duomenų iniciatyvų rėmimas, griežtesnių taisyklių vykdymas ir vyriausybių, tyrėjų ir pramonės bendradarbiavimo skatinimas gali sukurti labiau subalansuotą ir įtraukesnę DI discipliną. Tikslas turėtų būti užtikrinti, kad dirbtinis intelektas veiktų visiems, o ne tik keletui išrinktųjų. Iššūkis yra didelis, tačiau turime realią galimybę sukurti teisingesnę ir novatoriškesnę ateitį.