петак, 15.08.2025, 17:15 -> 17:31
Извор: РТС, BBC/Future
Kako jezik koji koristimo skriva pravi internet od nas
Veći deo interneta je van našeg domašaja, ali barijera nisu samo algoritmi. Na drugom jeziku, iste platforme se pretvaraju u potpuno druge svetove, navodi Rajan Mekgrejdi istraživač u Inicijativi za digitalnu javnu infrastrukturu Univerziteta Masačusets
Kada se povežete na internet, osećate se kao da pristupate svim informacijama sveta. Ipak, na društvenim mrežama vezu uspostavljamo na zajedničkom jeziku. Pretražujete Gugl jezikom na kojem govorite. A algoritmi napravljeni da maksimiziraju pažnju nemaju razloga da preporučuju ono što nećete razumeti. Dakle, veći deo interneta nam ostaje van vidokruga, sa druge strane jezičkog filtera – i tako propuštate mnogo više sadržaja.
Većina internet aktivnosti je koncentrisana na mali broj velikih platformi, i iz naše lingvistički izolovane perspektive, lako je pretpostaviti da ih svi koriste na sličan način. Ali zašto bi to trebalo da bude istina? Očekujemo da se muzika, književnost i kuhinja razlikuju između kultura, na kraju krajeva, pa zašto ne i internet, ističe Mekgrejdi.
Tim istraživača Inicijative za digitalnu javnu infrastrukturu Univerziteta Masačusets otkrio je velike razlike u načinu na koji različite kulture koriste internet. Uz više istraživanja, to bi moglo da promeni način na koji razmišljamo o uslugama koje dominiraju vebom.
Isto, ali različito
Istorija interneta nudi nekoliko primera. Ako se pogleda ruska platforma za društvene medije/blogere LiveJournal koja je bila popularna sredinom dvehiljaditih, korisnici koji govore engleski jezik poznavali su je kao prostor za mlade ljude na kome mogu da dele svoja osećanja ili da se zabavljaju sa Harijem Poterom. Ali oni koji govore ruski, verovatno poznaju LiveJournal sasvim drugačije – kao važno mesto javnog intelektualizma i političkog diskursa, koje kao izolovana oaza čuva opoziciona mišljenja.
Sa najvećim tehnološkim kompanijama sa sedištem u SAD, pojavila se kulturna slepa tačka gde često pretpostavljamo da je engleski internet reprezentativan za ostatak sveta. Jutjubu posebno ima značajnu pristrasnost prema engleskom jeziku – obično su nazivi napisani na engleskom jeziku, objavljeni u zemljama engleskog govornog područja i fokusirani na video-zapise na engleskom jeziku.
Vodeće internet platforme je teže proučavati nego što se misli. Računari mogu da prođu kroz tekst, ali je video teže analizirati u velikim razmerama. Platforme poput Jutjuba, najpopularnijeg video-servisa na svetu, ne nude alate za kreiranje velikih reprezentativnih uzoraka neophodnih za razumevanje platforme u celini, ili njenih velikih delova poput jezičkih zajednica.
Kao rezultat toga, Jutjub se često posmatra kroz lako dostupan vrh ledenog brega: njegove najpopularnije video zapise. Između jezičke pristrasnosti i ove pristrasnosti popularnosti, kada korisnici, kreatori, akademici, edukatori, roditelji, nastavnici, pa čak i kreatori politike govore o platformama poput Jutjuba, obično govore samo o delu koji je najvidljiviji – malom, nereprezentativnom delu platforme.
Kako proučiti šta je ispod površine?
Tim Univerziteta Masačusets je pre nekoliko godina osmislio način kako da urade ono što Jutjubovi alati nisu mogli: nasumično su pogađali URL-ove video-snimaka – više od 18 biliona puta – dok nisu imali dovoljno video-snimaka kako bi stekli sliku o tome šta se zaista dešava na Jutjubu.
Ono što su sastavili bio je prvi pogled na unutrašnje funkcionisanje jedne od najuticajnijih veb-stranica na svetu. Sa dovoljno velikim reprezentativnim uzorkom, mogli su da počnu sa širim poređenjima.
Kako se video-snimci otpremljeni 2019. godine porede sa video snimcima otpremljenim 2021. godine? Da li video-snimci životinja dobijaju više komentara od sportskih video-snimaka? Kakve stvari se mogu videti kada se uporede popularni video-snimci sa onima sa samo nekoliko pregleda?
Istraživači su pre svega, želelida istraže jezičke razlike: kako jezik i kultura oblikuju učešće na mreži na globalnom nivou.
Zato su 2024. godine ispitali jezičke specifične uzorke engleskog, hindu, ruskog i španskog Jutjuba, radeći sa izvornim govornicima kako bi validirali svoje alate za detekciju jezika. Cilj im je bio da sagledaju Jutjub na svakom jeziku na višem nivou kako bi pronašli opšte obrasce. Morali su da pretpostave da je Jutjub možda upravo toliko jednostavan koliko mnogi ljudi pretpostavljaju: manje-više isti u svim jezicima. Ali to nije ono što su pronašli.
Jezičke razlike
Svaki jezik se razlikuje u više dimenzija, ali jedan ugao platforme se izdvojio. Ukratko, hindu Jutjub se radikalno razlikuje od svojih pandana.
Čini se da se korisnici hindu jezika međusobno povezuju ritmovima i dinamikom koju nisu videli ni u jednom drugom bloku, a sudeći po brojkama, istraživači su mogli otkriju i priču o velikom geopolitičkom sukobu.
U periodu od 2014. do 2023. beleži se stalni ubrzani rast objava na Jutjubu na sva četiri jezika, ali više od polovine svih hindu Jutjub video-snimaka otpremljeno je samo u 2023. godini.
U pogledu dužine video-snimaka, na španskom su bili nešto duži od ostalih, prosečno oko dva i po minuta. Na engleskom skoro dva minuta, a ruski minut i 38 sekundi. Ali prosečan hindu Jutjub video traje samo 29 sekundi.
Ovaj podatak je zapravo odraz istorije indijskog interneta. Tik-tok je bio neverovatno popularan u Indiji, mnogo pre nego što je aplikacija eksplodirala u SAD i Evropi, ali sve se to promenilo pošto je Indija zabranila aplikaciju zbog graničnih sukoba sa Kinom 2020. godine. Preko noći, stotine miliona korisnika je odsečeno od svojih video-snimaka, komentara i poslovanja.
Jutjub je požurio da popuni prazninu, čineći Indiju prvim tržištem za Jutjub šorts, funkciju koju je kompanija napravila da istakne kratki vertikalni video format koji je proslavio Tik-tok. Izgleda da se ovaj potez isplatio. U mnogim zemljama, šorts je samo klon Tik-toka, ali je postao mnogo veći ekosistem u Indiji.
I opis video-snimka ima značaja
Takođe, istraživači su pronašli i značajnu razliku u načinu na koji ljudi opisuju svoje video-zapise. Jutjub traži od korisnika da kategorizuju svoje video-zapise. Većina korisnika se ne trudi da promeni podrazumevanu postavku – Ljudi i blogovi. Ali kada se to isključili iz analize, razlike između jezika su postale oštrije.
Na ruskom jeziku dominiraju video-snimci igara. To je najpopularnija kategorija i na engleskom i španskom jeziku. Ali na hindu jeziku, zabava i obrazovanje su na vrhu. I uprkos pažnji koju politički sadržaj na engleskom jeziku dobija u popularnom diskursu, engleski jezik ima najmanji broj video snimaka u kategoriji Vesti i politika.
Ove oznake kategorija su više od metapodataka. One su pogled na to kako različite kulture koriste platformu u različite svrhe. Ono što se zapaža su paralelni interneti oblikovani lokalnim potrebama, očekivanjima i normama. Ali ovi podaci ukazuju na nešto drugo: ljudi u različitim jezičkim zajednicama ne samo da prave različite video-snimke i drugačije se angažuju sa njima, već možda koriste Jutjub iz potpuno različitih razloga.
Metrika popularnosti
Na kraju, istraživači su pogledali i metrike popularnosti – preglede, lajkove i komentare – i još jednom, Jutjub na hindu jeziku je bio izuzetak. Pokazala se ekstremna nejednakost. Samo 0,1% video-snimaka na hindu jeziku činilo je 79% pregleda (ostali jezici su se kretali od 54% do 59%). Ali postoji zanimljiv obrt. Ti manje popularni video-snimci su mnogo češće dobijali lajkove.
Istraživači pretpostavljaju da se Jutjub u Indiji često koristi kao servis za video-poruke za razgovor sa prijateljima i porodicom, pri čemu su javni video-snimci često namenjeni privatnoj publici.
Rajan Mekgrejdi ističe da ono što je već jasno iz ovog istraživanja jeste da jezik ne samo da oblikuje naš pogled na digitalni život – on može da zamagli različite, kulturno specifične načine na koje ljudi koriste ove platforme.
Gradimo poslovanje, novinarstvo i regulaciju na veštački ograničenom pogledu na internet, koji se često filtrira kroz engleski jezik, popularnost i praktičnost.
Vreme je da pogledamo malo dublje, savetuje Mekgrejdi.
Коментари