U nedavno objavljenom tekstu razmatrali smo pozitivne učinke i probleme rodno osjetljivog jezika, zaključivši da, u konačnici, jezik nije taj kojem se može prigovoriti da je seksistički, već je seksistička njegova uporaba. Kao dobar primjer za ilustraciju ove tvrdnje poslužit će slučajno otkriven svijet nejednakosti.

Hrvatski jezik, svi to, dakako, znaju ima tri gramatička roda – muški, ženski i srednji. Za te rodove postoje posebne osobne zamjenice, on, ona i ono, a na drugim se vrstama riječi rod izražava flektivno, nastavcima: lijep-Ø, lijep-a, lijep-o, radi-o, radi-la, radi-lo. Engleski jezik ima posebne zamjenice za sva tri roda, he, she i it, kao i zamjenice poput his, her, its, no na glagolima flektivno ne može izraziti rod – bez obzira na to radi li se o njemu, njoj ili njemu, mora se reći loves, hates, sings, runs.

Mnogo se u lingvistici sporova vodilo o tome koliko jezik determinira pogled na svijet pojedinca. Kontroverzna Sapir-Whorfova hipoteza, iskorištena u znanstveno-fantastičnom filmu "Dolazak", drži da jezik determinira pojedinčev pogled na svijet. Drugim riječima, jezične kategorije određuju u kojim će kategorijama i na koji način čovjek percipirati svijet.

U korpusu rečenica žene češće vole, a muškarci češće jako vole

Lingvisti su mnogo skloniji blažoj verziji ovakve pretpostavke – uvjerenja su da jezik ima nekakvog utjecaja na svjetonazor, ali ipak ne toliko snažnog da potpuno determinira čovjekovu spoznaju. Slijedeći takvu postavku, može se reći da su svojevrsni svjetonazor, horizont jezičnih očekivanja većini Hrvata (i Europljana) oblikovali jezici koji su im poznati. Zbog toga uzimamo zdravo za gotovo da rod u svakom jeziku, na ovaj ili onaj način, mora biti jasno i morfološki prozirno iskazan.

No, ne treba se odmaknuti daleko da se vidi kako postoje mnogi jezici koji nemaju kategorije roda kakvu očekujemo. Mađarski jezik, primjerice, nema rod. Nema ga ni finski – u tom jeziku, primjerice, "hän" znači i "on" i "ona". Rod ne postoji ni u jezicima koji se govore u udaljenijim dijelovima svijeta, primjerice, u malajskom jeziku ili u tagalogu.

Jedan je od takvih jezika i u suvremeno doba sapunica popularni turski jezik. U turskom se jeziku za zamjenice "on", "ona", "ono" koristi tek jedna riječ: o. Primjerice, rečenica "Onu çok seviyorum" na hrvatskom bi značila "Jako ga/ju volim".

No, veoma se zanimljiva stvar događa kada tu rečenicu kopirate i zalijepite u najpopularniji program za strojno prevođenje – Google Translate. Na hrvatskom će prevedena ona glasiti samo "Volim je jako". Ako se osjetite osobito vragolastima, dosjetit ćete se da biste u rečenici mogli izbrisati prilog "çok". Rečenica bi tada trebala glasiti "Volim ga/je". Očekujete, s obzirom na prethodni prijevod, da će glasiti "Volim je". I u pravu ste. No, osjetite li se potpuno vragolasto, možete promijeniti ciljni jezik iz hrvatskog u engleski i svjedočit ćete pravoj čaroliji – rečenica ne glasi, očekivano, "I love her", nego "I love him". Zalijepite li originalnu rečenicu s prilogom "çok", novo iznenađenje – "I love her so much".

Korpus Google Translatea čine različiti tekstovi, dokumenti, djela koja su opterećena stoljetnom tradicijom opresije žena i reflektiraju sve one nadvladane koncepte kojih se u modernosti pokušavamo otarasiti, samo da bi nas ti tobože nepristrani strojevi podsjetili da ipak nismo odmaknuli onoliko daleko koliko smo mislili

Daj, Google Translate, u čemu je trik? Mi volimo svoje žene više nego oni iz anglofonih zemalja? Anglofone žene vole, ali samo muškarci vole jako?

Prijevodi na Google Translateu, kao i većini alata za strojno prevođenje, generiraju se prema čestoti kojom se neka riječ pojavljuje u kolokaciji s drugom riječi. U ovom konkretnom primjeru, to bi značilo da se ženski ili muški rod u određenim rečenicama dodjeljuje rodno neutralnim zamjenicama na temelju toga kojom se čestotom pojavljuju u točno tom spoju riječi u korpusu. Drugim riječima, u korpusu rečenica žene češće vole, a muškarci češće jako vole.

Ona je učiteljica, a on je inženjer, ona je bolničarka, a on je liječnik, on je prijatelj, ona je ljubavnica...

Ovo se može činiti simpatičnom distinkcijom, no kad se uzme u obzir sljedeći popis prijevodnih faux pasova GT-a, stvari postaju mnogo kompleksnije.

Događa se da GT, zapravo, sudjeluje u promicanju društvenih stereotipa jezikom. Ona je učiteljica, a on je inženjer. Ona je bolničarka, a on je liječnik. On je prijatelj, ona je ljubavnica. Ona je udana, on je samac. On je sretan, ona je nesretna. On je marljiv, ona je lijena.

GT_turski-engleski

Za ovakve sramotne rečenice, ne možemo, dakako, okriviti sam program – on jednostavno generira prijevode na temelju uputa koje su u njega unesene. Ne možemo nikako kriviti ni jezik – on ima vlastita pravila kojih se, u ovom slučaju, GT nije dosljedno držao.

Pitanje postaje mnogo šire, dodir između jezika i jezičnih pravila te društvene stvarnosti. Strojni prijevod sudjeluje u perpetuiranju rodnih stereotipa zato što se napaja izvorima iz predrasudama zasićenog diskursa. Korpus Google Translatea čine različiti tekstovi, dokumenti, djela koja su opterećena stoljetnom tradicijom opresije žena i reflektiraju sve one nadvladane koncepte kojih se u modernosti pokušavamo otarasiti, samo da bi nas ti tobože nepristrani strojevi podsjetili da ipak nismo odmaknuli onoliko daleko koliko smo mislili.

Lingvisti su uvjerenja da jezik ima nekakvog utjecaja na svjetonazor, ali ipak ne toliko snažnog da potpuno determinira čovjekovu spoznaju. Stoga se može reći da su svojevrsni svjetonazor, horizont jezičnih očekivanja većini Hrvata (i Europljana) oblikovali jezici koji su im poznati. Zbog toga uzimamo zdravo za gotovo da rod u svakom jeziku, na ovaj ili onaj način, mora biti jasno i morfološki prozirno iskazan

Postavlja se pitanje zašto programeri, znajući za svojstva turskog i drugih jezika, ne unesu dodatni korak u algoritme koji bi naprosto ostavljali "he/she" u prijevodima jer u ovom se slučaju ne radi o političkoj korektnosti; radi se naprosto o tome da je svesti tursko o na jedan rod izvan konteksta, u diskurzivno neuključenim rečenicama pogrešno.

Još jednom vidimo nedovoljnu razinu svjesnosti o realnim pitanjima. Prevladavajuće je uvjerenje da će statistika i kvantitativne metode uvijek biti neutralne i vjerodostojne pa se lako previđa da je statistika, u slučaju diskursa, zapravo niz stereotipa i ideoloških, hegemonijskih vjerovanja koja se jezikom propagiraju, zbog čega se on ne može uzimati mehanicistički.

Valjalo bi sagledati sve nepravde koje se iz društva, pa potom i jezika, nastoje iskorijeniti i, s obzirom na to da ipak nismo stigli u fazu gdje bi korpus reprezentirao jednakost, diskriminaciju iz jezika barem "ručno" ukloniti.

* Ovaj tekst sufinanciran je sredstvima Fonda za poticanje pluralizma i raznovrsnosti elektroničkih medija.

Najčitanije u tjednu

Cookies make it easier for us to provide you with our services. With the usage of our services you permit us to use cookies.