Prema najnovijim analizama vodećih istraživača, na horizontu se pojavljuje neočekivana prepreka u radu veštačke inteligencije – nestašica podataka. Iako se najčešće govori o mikročipovima, energiji i računskoj moći, upravo su podaci – sirovina za obuku AI modela, postali usko grlo sledeće faze razvoja, piše Goldman Sachs.
Veštačka inteligencija (AI) napreduje neverovatnom brzinom, a svakog meseca pojavljuju se novi modeli sposobni da pišu, prevode, dizajniraju, kodiraju ili analiziraju. Međutim, prema najnovijem izveštaju Goldman Sachsa, taj razvoj bi uskoro mogao da uspori ne zato što nema dovoljno čipova ili struje, već zato što nema dovoljno novih podataka. AI sistemi su već „progutali“ skoro ceo javni internet, uključujući tekstove, slike, video zapise i kodove koje su ljudi ikada objavili. Sada više nema dovoljno svežeg, kvalitetnog sadržaja da se modeli dalje treniraju. Drugim rečima, mašine su naučile skoro sve što im je bilo dostupno.
Svaki napredan AI sistem zavisi od tri ključna sastojka: struje, koja napaja ogromne data centre, računskih resursa, tj. naprednih čipova koji obrađuju bilione operacija u sekundi, i podataka, koji služe kao gorivo za učenje. Dok svi pričaju o čipovima i energiji, podaci ostaju tihi, nevidljivi heroji AI industrije. Bez njih, čak i najbrži procesor ne vredi mnogo.
Kako „organski internet“ (javne informacije) nestaje, velike kompanije počinju da traže nove izvore podataka. AI firme poput OpenAI i Google-a već plaćaju izdavačima, univerzitetima i medijima da bi koristile njihove sadržaje. Pored toga, zatvoreni (proprietary) podaci iz privatnih baza kompanija, bolnica ili državnih institucija postaju novi „zlato“. AI takođe počinje da stvara veštačke primere za obuku, kao što su simulacije saobraćaja, medicinski scenariji ili laboratorijski eksperimenti. Ubrzano se formira novo tržište podataka, gde će svaka kompanija morati da odluči da li će svoje podatke čuvati, prodavati ili deliti pod određenim uslovima.
Nije više važno imati „puno podataka“, već imati prave podatke – precizne, stručno organizovane i pouzdane. Na primer, kompanije koje poseduju stručno znanje, kao što su inženjerske firme, izdavači udžbenika, laboratorije i istraživački centri, imaju ogroman potencijal da svoj sadržaj iskoriste za obuku specijalizovanih AI sistema. U isto vreme, pitanja vlasništva, privatnosti i porekla podataka postaju ključna tema zakonodavstva. Države će morati da odluče kako da zaštite korisnike, a da ne uspore inovacije.
Za kompanije širom sveta, poruka je jasna: podaci postaju novi strateški resurs. Nekada je najvrednije bilo imati fabriku, a danas je najvrednije imati znanje i dobro strukturirane podatke. Organizacije koje već sada sređuju svoje baze podataka, prave jasne politike o vlasništvu i koriste AI alate za analizu, biće u najboljoj poziciji da iskoriste sledeći talas AI razvoja.
Veštačka inteligencija menja svet, ali se sada i sama suočava sa ograničenjima. Kao što su nafta i čelik nekada pokretali industrijsku revoluciju, podatak je gorivo digitalne revolucije. Svet možda ostaje bez „besplatnih“ podataka, ali ne i bez mogućnosti, jer ko nauči da pravilno prikuplja, čuva i koristi svoje podatke, taj će vladati novom ekonomijom znanja.
U doba kada je inovacija ključna, važno je napomenuti da kompanije moraju biti proaktivne u upravljanju svojim podacima. Razvijanje strategija za prikupljanje, skladištenje i korišćenje podataka može značiti razliku između uspeha i neuspeha u novoj digitalnoj eri. S obzirom na to da se tržište podataka brzo menja, prilagođavanje i inovacija će biti od suštinskog značaja za sve koji žele da ostanu konkurentni. U ovom novom pejzažu, sposobnost da se prepozna vrednost podataka i njihovo efikasno korišćenje postaje ključno za budućnost.



