Dibaji: Makala haya ya Maoni yanajumuisha faharasa ya maneno ili kuelezea misemo inayotumiwa ili isaidie msomaji kuelewa yaliyomo. Ikiwa wewe ni mgeni wa uchambuzi wa nyanja mbalimbali za teknolojia, lugha na nguvu, ningependa kukuhimiza uangalie faharasa ya istilahi.

Tusipodumisha urafiki muhimu, tunalazimisha watu wawe huru. Je, tunapea kipaumbele maneno ya nani, lugha gani tunaposhughulikia AI Inayoaminika?

Mwishoni mwa Februari, Maarifa ya nani?, Kituo cha Intaneti na Jamii (India) na Taasisi ya Intaneti ya Oxford ilizindua Ripoti ya Hali ya Lugha za Mtandao (STIL). Kama mhakiki wa ripoti hiyo, nilivutiwa na nilifurahi sana kuona hadithi za jamii za lugha zikiwasilishwa kwa heshima, na katika lugha zao za asili.

Ripoti ya STIL inapinga jinsi nguvu inavyochangia katika mchakato wote wa kujumuisha na kutojumuisha lugha zinazozungumzwa na lugha za ishara kwenye mtandao. Wachangiaji wa STIL wanachambua vipengele vya kutojumuisha lugha kwa usawa mtandaoni: kutoka Msimamo wa katiwa MSIMBOSARE wa Kilatini hadi kutenga watu wasio wa kawaida na ulemavu katika injini za utaftaji hadi ukosefu wa maudhui ya mashirika na isimu jamii katika utengenezaji wa zana, data na programu.

Sikia kutoka kwa Ishan, wakishiriki mambo waliyopitia katika Uzinduzi wa Ripoti ya Hali ya Lugha za Mtandao (Muda: 31: 44)

Uzinduzi wa Ripoti ya Hali ya Lugha za Mtandao

Ripoti hiyo pia inatoa picha ya kiasi cha ukosefu wa usawa wa lugha katika majukwaa ambayo watu ulimwenguni kote hujihusisha nayo. Uchambuzi ulionivutia sana ulikuwa:

  • "Zaidi ya asilimia 90 ya Waafrika wanahitaji kutumia lugha ya pili ili wazungumze katika jukwaa – na watu wengi watatumia lugha ya kikoloni ya Ulaya".
  • "Kati ya lugha 10 zinazozungumzwa sana, Kihindi na Kibengali huwa hazijajumuishwa sana kama lugha nyingine, licha ya kwamba kwa pamoja lugha hizo zinawakilisha idadi kubwa ya watu ya takriban bilioni moja."
  • "Hata katika mikoa yenye uwakilishi mkubwa wa lugha, tofauti kati ya lugha za Ulaya Mashariki na lugha nyingine za Ulaya zinaonyeshakuwa huenda lugha nyingine zimetengwa hata katika mikoa inayoungwa mkono vizuri."

Takwimu zinaonyesha hali hii katika matumizi ya teknolojia za sauti ya lugha za watu wachache, kama inavyoonyeshwa na mchango wa Claudia katika STIL. Kabla hata ya kuzungumza kuhusu ikiwa Alexa au Siri hutumia lugha - je, kuna “hata kibodi” ya kuandika kwa kutumia herufi za lugha fulani? Na isitoshe teknolojia iliyoendelea sana kama vile tafsiri ya mashine "(Claudia, STIL)

Maendeleo ya teknolojia ya sauti hutegemea sana upatikanaji wa vyombo vya habari vya kidijitali, nguvu ya kompyuta na kuelewa isimu jamii ili kujenga programu za sauti zinazowafaa watu. Kwa mfano, kusaidia katika uundaji wa mkusanyo wa maandishi kwa ajili ya Seti ya data ya Sauti ya Jamii, chini ya matumizi ya haki, baadhi ya lugha zimetumia Mkusanyo wa Wikipedia kupitia mkusanyo wa sentensi zetu.

Mradi wa Mozilla wa Common Voice ni mojawapo ya mipango mingi ya kusaidia utofauti wa lugha katika teknolojia za kidijitali. Seti yetu ya data hutengenezwa na watu halisi, ambao mara nyingi wana uzoefu sawa na hadithi na uchambuzi wa STIL. Kwa mfano, wenzetu wa Sauti ya Jamii wa Kiswahili na Kinyarwanda wameshiriki umuhimu wa kuunda zana za usemi za kumsaidia mzungumzaji asitegemee lugha za kikoloni.

Ninaiona ripoti ya Hali ya Lugha za Mtandao kama mwaliko wa urafiki muhimu. Katika jamii zinazohusika, "marafiki muhimu" ni watu ambao wana shirika katika jamii la kukosoa desturi za kawaida, mazoea au tabia zinazotokea katika jamii kwa uwazi au "kwa matendo". Urafiki muhimu ni mambo ya kimahusiano kati ya watu wawili au zaidi au vikundi vinavyodumisha mawasiliano ya uaminifu na uwezo wa kujifunza kutoka kwa kila mmoja.

Seti za data zinajumuisha mambo mengi kuliko vitu vilivyobuniwa kwa ajili ya mifano ya kujifunza kwa mashine bali pia ni mambo yanayopima maisha yetu; Kwa hiyo sisi sote tuna masilahi katika kujihusisha na uumbaji, matumizi na matengenezo ya seti za data kama Sauti ya Jamii.

Ninafikiri kuhusu uchambuzi wa Claudia wa jinsi vifungu vya teknolojia vinatengenezwa kwa Jamii zenye Lugha zilizotengwa;

"Mkakati wa juu-chini katika makampuni makubwa, na ushiriki mdogo au ukosefu wa ushiriki wa jamii za wasemaji. Katika hali hii, mbinu ya kudhalilisha pia inaweza kuonekana: kwa kuwa kuna mambo machache sana yanayopatikana, kitu chochote kinachotolewa lazima kiwe kizuri na kiwe na ufafanuzi mzuri"

Claudia Soria, Teknolojia ya Lugha ya Wachache ya Kuondoa za Lugha za Kikoloni, Ripoti ya Hali ya Lugha za Mtandao ya 2022

Hii haipaswi kuwa kawaida - idhini, rasilimali na uhuru wa kweli unapaswa kuwa jambo la kawaida.

Ninakuhimiza uendelee kusoma ripoti ya Hali ya Lugha za Mtandao. Mwishoni mwa muhtasari wa ripoti ya Hali ya Lugha za Mtandao, waandishi wanashiriki hatua maalum za kushughulikia usawa wa nguvu katika usawa wa lugha ya kidijitali. Kutoka kwa miradi Inayoweza kutumiwa na mtu yeyote hadi katika serikali hadi kwa wachapishaji, sisi sote tunaweza kuwa mawakala wa mabadiliko - lakini ni mabadiliko gani tunayokimbilia na tutayapata vipi?

Soma ripoti mara kwa mara ukizingatia kila silabi na kila herufi ya ripoti - kama vile bado ninavyofanya. Safari ya kupata mtandao wenye faragha, ufumbuzi na ushirikiano sio mbio ya masafa mafupi bali marefu na huwezi kimbia peke yako.

Faharasa ya Istilahi

MSIMBOSARE

"Kiwango cha Msimbosare hutoa nambari ya kipekee kwa kila mhusika, bila kujali jukwaa, kifaa, programu au lugha. Kama kompyuta kimsingi inavyotumia namba, fikiria 0 na 1. MSIMBOSARE imepitishwa na watoa huduma wote wa kisasa wa programu na sasa inaruhusu data kusafirishwa kupitia majukwaa mengi, vifaa na programu bila rushwa” (MSIMBOSARE)

Isimu jamii

"Isimu jamii inakusudia kujua athari za matumizi ya lugha katika jamii na athari za matumizi ya lugha katika shirika la kijamii na miktadha ya kijamii" (Mallison, 2015).

Lugha zenye "data nyingi na data kidogo"

Lugha zenye data kidogo na lugha zenye data nyingi ni maneno ya kujadilika. Kwa ujumla, yanarejelea kiwango ambacho data inapatikana kwa ajili ya shughuli za Kuchakata Lugha ya Asili. Upatikanaji unahusu mchakato wa kupata data pia. Kwa mfano; Je, zana kama vile injini za utafutaji zinaweza hata kupata data? Ufafanuzi uliongozwa na usomaji kutoka "Lugha Zilizo Hatarini sio Zenye Data Kidogo!, Mika Hämäläinen”

Kutengwa

Mchakato wa kujenga na kuimarisha michakato na mazoea ya kimuundo ambayo hutenga na kuondoa nguvu kutoka kwa watu na jamii ya kujieleza au kuzuia matukio yao ya kibinadamu. Lugha iliyotengwa "inatengwa na miundo ya kihistoria na inayoendelea na michakato ya nguvu na upendeleo, ikiwa ni pamoja na ukoloni na ubepari, badala ya idadi ya watu au idadi ya wasemaji" (STIL, Ufafanuzi)

Tafadhali jua kwamba. Ripoti ya Hali ya Lugha za Mtandao pia inajumuisha ufafanuzi wa kukusaidia kupitia ripoti hiyo.


Maudhui yanayohusiana