Како језик који користимо скрива прави интернет од нас

Већи део интернета је ван нашег домашаја, али баријера нису само алгоритми. На другом језику, исте платформе се претварају у потпуно друге светове, наводи Рајан Мекгрејди истраживач у Иницијативи за дигиталну јавну инфраструктуру Универзитета Масачусетс

Како језик који користимо скрива прави интернет од нас Како језик који користимо скрива прави интернет од нас

Када се повежете на интернет, осећате се као да приступате свим информацијама света. Ипак, на друштвеним мрежама везу успостављамо на заједничком језику. Претражујете Гугл језиком на којем говорите. А алгоритми направљени да максимизирају пажњу немају разлога да препоручују оно што нећете разумети. Дакле, већи део интернета нам остаје ван видокруга, са друге стране језичког филтера – и тако пропуштате много више садржаја.

Већина интернет активности је концентрисана на мали број великих платформи, и из наше лингвистички изоловане перспективе, лако је претпоставити да их сви користе на сличан начин. Али зашто би то требало да буде истина? Очекујемо да се музика, књижевност и кухиња разликују између култура, на крају крајева, па зашто не и интернет, истиче Мекгрејди.

Тим истраживача Иницијативе за дигиталну јавну инфраструктуру Универзитета Масачусетс открио је велике разлике у начину на који различите културе користе интернет. Уз више истраживања, то би могло да промени начин на који размишљамо о услугама које доминирају вебом.

Исто, али различито

Историја интернета нуди неколико примера. Ако се погледа руска платформа за друштвене медије/блогере LiveJournal која је била популарна средином двехиљадитих, корисници који говоре енглески језик познавали су је као простор за младе људе на коме могу да деле своја осећања или да се забављају са Харијем Потером. Али они који говоре руски, вероватно познају LiveJournal сасвим другачије – као важно место јавног интелектуализма и политичког дискурса, које као изолована оаза чува опозициона мишљења.

Са највећим технолошким компанијама са седиштем у САД, појавила се културна слепа тачка где често претпостављамо да је енглески интернет репрезентативан за остатак света. Јутјубу посебно има значајну пристрасност према енглеском језику – обично су називи написани на енглеском језику, објављени у земљама енглеског говорног подручја и фокусирани на видео-записе на енглеском језику.

Водеће интернет платформе је теже проучавати него што се мисли. Рачунари могу да прођу кроз текст, али је видео теже анализирати у великим размерама. Платформе попут Јутјуба, најпопуларнијег видео-сервиса на свету, не нуде алате за креирање великих репрезентативних узорака неопходних за разумевање платформе у целини, или њених великих делова попут језичких заједница.

Као резултат тога, Јутјуб се често посматра кроз лако доступан врх леденог брега: његове најпопуларније видео записе. Између језичке пристрасности и ове пристрасности популарности, када корисници, креатори, академици, едукатори, родитељи, наставници, па чак и креатори политике говоре о платформама попут Јутјуба, обично говоре само о делу који је највидљивији – малом, нерепрезентативном делу платформе.

Како проучити шта је испод површине?

Тим Универзитета Масачусетс је пре неколико година осмислио начин како да ураде оно што Јутјубови алати нису могли: насумично су погађали URL-ове видео-снимака – више од 18 билиона пута – док нису имали довољно видео-снимака како би стекли слику о томе шта се заиста дешава на Јутјубу.

Оно што су саставили био је први поглед на унутрашње функционисање једне од најутицајнијих веб-страница на свету. Са довољно великим репрезентативним узорком, могли су да почну са ширим поређењима.

Како се видео-снимци отпремљени 2019. године пореде са видео снимцима отпремљеним 2021. године? Да ли видео-снимци животиња добијају више коментара од спортских видео-снимака? Какве ствари се могу видети када се упореде популарни видео-снимци са онима са само неколико прегледа?

Истраживачи су пре свега, желелида истраже језичке разлике: како језик и култура обликују учешће на мрежи на глобалном нивоу.

Зато су 2024. године испитали језичке специфичне узорке енглеског, хинду, руског и шпанског Јутјуба, радећи са изворним говорницима како би валидирали своје алате за детекцију језика. Циљ им је био да сагледају Јутјуб на сваком језику на вишем нивоу како би пронашли опште обрасце. Морали су да претпоставе да је Јутјуб можда управо толико једноставан колико многи људи претпостављају: мање-више исти у свим језицима. Али то није оно што су пронашли.

Језичке разлике

Сваки језик се разликује у више димензија, али један угао платформе се издвојио. Укратко, хинду Јутјуб се радикално разликује од својих пандана.

Чини се да се корисници хинду језика међусобно повезују ритмовима и динамиком коју нису видели ни у једном другом блоку, а судећи по бројкама, истраживачи су могли открију и причу о великом геополитичком сукобу.

У периоду од 2014. до 2023. бележи се стални убрзани раст објава на Јутјубу на сва четири језика, али више од половине свих хинду Јутјуб видео-снимака отпремљено је само у 2023. години.

У погледу дужине видео-снимака, на шпанском су били нешто дужи од осталих, просечно око два и по минута. На енглеском скоро два минута, а руски минут и 38 секунди. Али просечан хинду Јутјуб видео траје само 29 секунди.

Овај податак је заправо одраз историје индијског интернета. Тик-ток је био невероватно популаран у Индији, много пре него што је апликација експлодирала у САД и Европи, али све се то променило пошто је Индија забранила апликацију због граничних сукоба са Кином 2020. године. Преко ноћи, стотине милиона корисника је одсечено од својих видео-снимака, коментара и пословања.

Јутјуб је пожурио да попуни празнину, чинећи Индију првим тржиштем за Јутјуб шортс, функцију коју је компанија направила да истакне кратки вертикални видео формат који је прославио Тик-ток. Изгледа да се овај потез исплатио. У многим земљама, шортс је само клон Тик-тока, али је постао много већи екосистем у Индији.

И опис видео-снимка има значаја

Такође, истраживачи су пронашли и значајну разлику у начину на који људи описују своје видео-записе. Јутјуб тражи од корисника да категоризују своје видео-записе. Већина корисника се не труди да промени подразумевану поставку – Људи и блогови. Али када се то искључили из анализе, разлике између језика су постале оштрије.

На руском језику доминирају видео-снимци игара. То је најпопуларнија категорија и на енглеском и шпанском језику. Али на хинду језику, забава и образовање су на врху. И упркос пажњи коју политички садржај на енглеском језику добија у популарном дискурсу, енглески језик има најмањи број видео снимака у категорији Вести и политика.

Ове ознаке категорија су више од метаподатака. Оне су поглед на то како различите културе користе платформу у различите сврхе. Оно што се запажа су паралелни интернети обликовани локалним потребама, очекивањима и нормама. Али ови подаци указују на нешто друго: људи у различитим језичким заједницама не само да праве различите видео-снимке и другачије се ангажују са њима, већ можда користе Јутјуб из потпуно различитих разлога.

Метрика популарности

На крају, истраживачи су погледали и метрике популарности – прегледе, лајкове и коментаре – и још једном, Јутјуб на хинду језику је био изузетак. Показала се екстремна неједнакост. Само 0,1% видео-снимака на хинду језику чинило је 79% прегледа (остали језици су се кретали од 54% до 59%). Али постоји занимљив обрт. Ти мање популарни видео-снимци су много чешће добијали лајкове.

Истраживачи претпостављају да се Јутјуб у Индији често користи као сервис за видео-поруке за разговор са пријатељима и породицом, при чему су јавни видео-снимци често намењени приватној публици.

Рајан Мекгрејди истиче да оно што је већ јасно из овог истраживања јесте да језик не само да обликује наш поглед на дигитални живот – он може да замагли различите, културно специфичне начине на које људи користе ове платформе.

Градимо пословање, новинарство и регулацију на вештачки ограниченом погледу на интернет, који се често филтрира кроз енглески језик, популарност и практичност.

Време је да погледамо мало дубље, саветује Мекгрејди.

петак, 15. август 2025.
32° C

Коментари

Da, ali...
Како преживети прва три дана катастрофе у Србији, и за шта нас припрема ЕУ
Dvojnik mog oca
Вероватно свако од нас има свог двојника са којим дели и сличну ДНК
Nemogućnost tusiranja
Не туширате се сваког дана – не стидите се, то је здраво
Cestitke za uspeh
Да ли сте знали да се најбоље грамофонске ручице производе у Србији
Re: Eh...
Лесковачка спржа – производ са заштићеним географским пореклом