Piše: Amal El Mekki, thebosniatimes.ba
Kada sam pročitala Homo Deus: Kratka historija sutrašnjice, jednostavno se nisam mogao složiti sa proročanstvom historičara Yuvala Noa Hararija da će algoritmi i podaci postati “najviši autoritet”. Tada sam pomislila: “Radije, podaci na određenim jezicima.”
Bojala sam se da će čak i u borbi čovečanstva protiv upada vještačke inteligencije neke jezičke grupe ostati izvan bitke i van igre.
Kada sam počela koristiti ChatGPT-4, shvatila sam da su moji strahovi već ostvareni. Bitka sada bjesni, a arapski jezik nije “pozvan da učestvuje”.
Kao novinar i trener zainteresirana za umjetnu inteligenciju, ne mogu a da ne primijetim kako današnji alati za umjetnu inteligenciju revolucionarno produciraju industriju sadržaja, istraživanja i komunikacijskih kanala.
Međutim, sa žaljenjem primjećujem i kako ti isti alati promjene otkrivaju duboki jezički ponor koji govornike arapskog jezika ostavlja u nepovoljnom položaju u odnosu na njihove kolege koji govore engleski.
Provela sam dosta vremena eksperimentirajuući sa alatima kao što je ChatGPT. Davala sam mu upute i na arapskom i na engleskom i vidjela skako njegovi rezultati rastu i padaju u smislu kvaliteta promjenom jezika.
AI i jezički jaz
Nije samo formulacija ili sintaksa ono što uzrokuje da rezultati ChatGPT arapskog jezika budu lošeg kvaliteta, već i same informacije. “Malo sam se zabavio” eksperimentirajući sa ChatGPT-ovim “prompt inženjeringom” na dva različita jezika i gledajući kako se mijenja poput nestašnog kameleona ili “šizofrenika”.
U svojim rezultatima na engleskom, ChatGPT mi se činio kao istraživač u ranim godinama svoje karijere: marljiv radnik koji obraća posebnu pažnju na detalje, strukture i tačnost.
Što se tiče njegovih arapskih rezultata, sugerirali su da je utjelovljenje stereotipne slike dokonog službenika arhivskog menadžmenta koji ne želi razbijati glavu tražeći reference na prašnjavim policama ili obraćajući pažnju na svoje jezičke strukture dok mi neoprezno govori: ” Ovo je sve što imam. Sad samo odlazi.”
Alat kao što je ChatGPT tek treba biti obučen na ogromnoj količini visokokvalitetnih, raznolikih i reprezentativnih arapskih pisanih podataka. Nedostatak podataka čini da rezultati alata na arapskom jeziku ne mogu razlikovati nijanse, tačnost i dubinu potrebne za generiranje kvalitetnog sadržaja.
Mnogi će reći: “Ali problem je što je arapski jezik složen i teško je razumjeti svu njegovu jedinstvenu gramatiku, sintaksu i vokabular.”
A ja kažem: “Čovječanstvo je moglo poslati čovjeka na Mjesec, a mi ne može naučiti četbota arapskim gramatičkim pravilima?”
Utjecaj na korisnike koji govore arapski
Osim frustracije, korisnici AI alata koji govore arapski suočavaju se s dubokim posljedicama jezičke podjele. Na vrhu liste je ograničen pristup informacijama, jer je velika većina referenci i obima podataka koje ovi alati skeniraju da bi generirali svoje rezultate uglavnom dostupna na engleskom jeziku.
Ova neusklađenost ometa sposobnost korisnika koji govore arapski da iskoriste AI za profesionalni i lični rast i održava digitalni jaz sa dugotrajnim posljedicama.
Sada se AI alati mogu “skratiti” pružanjem upita na engleskom, dobijanjem rezultata na tom jeziku, a zatim ih prevesti na arapski. Ali čak i ovo rješenje otvara još jedan problem, a to je prijevod.
Kvalitet prevodilačkih alata dostupnih na internetu, kao što je Google Translate, sa engleskog na arapski je također nizak i može uzrokovati ozbiljne posljedice za one koji ne vladaju izvornim jezikom i stoga ne mogu razumjeti nedostatke u prijevodu.
Nedostatak arapske verzije AI alata ima još jednu posljedicu. Mnogi novinari i kreatori sadržaja koji rade na arapskom imaju potrebne vještine za proizvodnju visokokvalitetnog sadržaja, ali neadekvatnost velikog dijela alata umjetne inteligencije za arapski jezik predstavlja im veliku prepreku.
Neki alati za pravljenje videa vođeni umjetnom inteligencijom, na primjer, još uvijek nisu u stanju pravilno regulirati smjer pisanja na arapskom. Zamislite ekstremnu frustraciju koju osjeća svaki novinar ili kreator sadržaja kada želi naslov članka započeti brojem, samo da bi otkrio da su se riječi preklapale, njihove pozicije postaju obrnute što naslov čini nerazumljivim.
Ovi nedostaci uzrokuju manje mogućnosti korištenja ovih alata za kreiranje visokokvalitetnog sadržaja, manje mogućnosti za postizanje značajnog dosega i manje mogućnosti doprinosa rastu i razvoju ekosistema arapske industrije sadržaja.
Ove mogućnosti se tiču kako pojedinaca tako i kompanija i institucija. Kako loš kvalitet alata vođenih umjetnom inteligencijom u arapskoj verziji znači da će profesionalci i poduzetnici morati nastaviti svoju borbu u kontekstu nelojalne konkurencije koja karakterizira globalno tržište.
Što se tiče kulturoloških nesporazuma, ovo je još jedan aspekt nedostataka alata umjetne inteligencije u njihovoj arapskoj verziji u smislu razumijevanja kulturnih specifičnosti i razlika. Ovi botovi, obučeni na ograničenoj količini podataka u poređenju sa svojim kolegama na drugim jezicima, mogu imati tendenciju generiranja kulturno neprikladnog ili agresivnog sadržaja, što povećava osjećaj otuđenosti korisnika i smanjuje njegovo povjerenje prema njemu.
Ovdje ne govorim o kulturološkim specifičnostima grupa koje govore arapski u odnosu na druge koji govore drugim jezicima, već radije o specifičnim i različitim grupama unutar kruga samih zajednica koje govore arapski.
Premošćavanje jaza
Šta znači premostiti jaz u jeziku umjetne inteligencije? To znači postojanje stvarne volje da se investira u obuku ovih alata na masivnim, raznolikim i reprezentativnim arapskim podacima. Samo visokokvalitetni data podaci mogu efikasno poboljšati performanse AI.
Premošćavanje jaza također će zahtijevati razvoj istraživačkih alata podržanih umjetnom inteligencijom koja je sposobna za bolje i preciznije razumijevanje arapskog jezika. Ako priznamo da je arapski težak i složen jezik, jedino rješenje leži u razvoju nadograđenih istraživačkih alata koji su sposobni razumjeti njegovu složenost i varijable.
Konačno, premošćavanje jezičkog jaza u umjetnoj inteligenciji može se postići zajedničkim naporima između AI programera, lingvista i stručnjaka u ovoj oblasti. Samo zajednički napori između akademske zajednice, tehnološke industrije i sudionika zajednice mogu osigurati da korisnici koji govore arapski imaju pristup istom visokokvalitetnom sadržaju generisanom umjetnom inteligencijom kao i njihove kolege koje govore engleski.
Stavit ću se u kožu programera AI alata kao što je ChatGPT i postaviti sljedeća pitanja: “Zašto moram opskrbiti svoj alat sa obimnijim i boljim podacima na arapskom? Šta mi to koristi?”
Možda već postoji spreman odgovor na to: broj govornika arapskog, koji iznosi oko 400 miliona ljudi, čini arapski dobrim tržištem u koje je važno ulagati.
Ali uvjerena sam da bi inteligencija AI programera bila zadovoljna sa mnogo dubljim odgovorom.
„Tehnologija oblikuje nas, a mi oblikujemo nju“, kaže Mira Murati, CTO OpenAI, koje je razvila ChatGPT.
Što se mene tiče, arapska verzija ChatGPT tehnologije tjera me da brinem da društvo koje će formirati neće biti samo u stanju da uđe u post-informaciono društvo, jednostavnoneće imati pristup informacijama.
Ovo je osim aksioma da mi, govornici arapskog jezika, ne oblikujemo tu tehnologiju.
Pozdravljam činjenicu da je Murati, žena koja stoji iza ChatGPT-a, zagovornica regulacije i upravljanja umjetnom inteligencijom. Samo nisam sigurna da upravljanje na koje misli uključuje princip jednakih mogućnosti.
Jednake mogućnosti znači da sva ljudska bića širom svijeta mogu imati koristi od vještačke inteligencije i koristiti je za sebe, tako da Hararijevo proročanstvo neće biti „prokletstvo“ samo za one koji govore arapski.
(TBT, MEE)