Svet kompjutera

DRUGA FAZA AI MODELA JE VEĆ POČELA

Panična borba za podatke

Prva faza razvoja, zasnovana na „struganju veba” (eng. web scraping) i prikupljanju ogromnih količina teksta, uglavnom javno dostupnog, približava se kraju. Sa jedne strane, podstaknuti neverovatnim investicijama, dostupni modeli postali su sve sposobniji.

Sa druge, iscrpeli su ono što je takav skup podataka mogao da ponudi. Problem ne leži samo u kvantitetu, već je u ovoj fazi ključan kvalitet. Naime, ispostavlja se da je veb prepun duplikata, sadržaja koji bismo mogli da okarakterišemo kao spam, te zastarelih informacija. Ono što zaista vredi, konkretni, kontekstualni podaci iz stvarnog života, gotovo da je nedostupno za otvoreno preuzimanje. To su prepoznali svi vodeći igrači u industriji. Zajednički imenitelj njihovih poteza je jasan. Preživljavanje sledeće faze razvoja veštačke inteligencije zavisi od podataka „stvarnog sveta”, a razlike u strategijama jesu ono što trenutno definiše dinamiku tržišta. Koliko su oči konkurenata u ovom prostoru usmerene jedne na druge, jasno govori odabir pojedinih kompanija da pronađu izvore podataka iz kojih će „nahraniti” najnovije mogućnosti modela i rešenja. Sagledali smo dominantne ponuđače i uporedili njihove planove i shvatili da su vrlo komplementarni. Svakako, ne slučajno. Pohod na slobodne izvore Lider na tržištu, OpenAI, odlučio je da svoju sposobnost ne gradi samo u širinu, već da uđe i duboko u vertikale, gde podaci imaju najveću vrednost…