Katika mkutano uliofanyika hivi majuzi wa Mozilla All-Hands 2022, kongamano la kila mwaka la mfumo mzima wa ikolojia la Mozilla, timu ya Common Voice ilipata fursa ya kuonyesha vipengele mbalimbali vya kazi yetu katika kongamano lililo wazi kwa mtu yeyote ndani ya shirika.

Tulipewa nafasi ya 'warsha ya kimkakati', kipindi ambacho lengo lake kuu ni uchavushaji wa timu mbalimbali, uunganisho na ushirikiano kuhusu mada muhimu kwa kundi kubwa la Wanamozilla. Vipindi hivi vilikusudiwa kuwezesha muunganisho wa maana wa timu mbalimbali, kuwafanya watu kujihusisha na watu ambao kwa kawaida hawafanyi kazi nao (hivyo kusisitiza wazo kwamba sote ni timu moja). Lengo la pili ni watu binafsi kupata uelewa wa kina wa mada hizi kwa kushirikiana na watu ambao kwa kawaida hawafanyi kazi nao. Vipindi hivi ni fursa ya kipekee kwa kundi kubwa kujihusisha kikamilifu na baadhi ya mawazo haya makubwa.

Kipindi chetu kilikusudiwa kuwa ziara ya mfumo kamili wa ikolojia wa Common Voice!

Sabrina Ng na Gabriel Habayeb, mbunifu na mhandisi wa programu mtawalia, wote wawili wanaofanya kazi katika Common Voice walishughulikia sehemu ya kwanza ya kipindi wakiwasilisha kwa waliohudhuria jinsi jukwaa linavyoonekana na kuonyesha jinsi watumiaji wa jukwaa wanavyochangia kuchangia seti ya data. Walijadili baadhi ya mikakati inayotumika kufungua michango ya lugha nyingi zaidi. Mbinu moja ni kupunguza mahitaji ya ingizo kama vile idadi ya sentensi zinazohitajika katika lugha kabla ya kuanza kwa michango ya sauti. Nyingine ni kazi iliyofanywa ili kuboresha jukwaa ili kuwezesha michango katika mazingira yenye vikwazo vya rasilimali, kama vile katika miktadha yenye kipimo data cha chini au isiyo na ufikiaji wa mtandao. Unaweza kusoma zaidi juu ya suluhisho zilizojengwa hapa.

Pia walijadili baadhi ya mikakati ya kuongeza ufikiaji, na matumizi, ya seti za data kwenye jukwaa. Matoleo ya seti ya data sasa hufanyika mara nyingi zaidi, kila baada ya miezi miwili. Seti za data sasa pia zina maelezo ya data ya ziada ambayo tunatumai yataongeza matumizi yao kwa wasanidi programu, kwa mfano hivi majuzi tulifanya maelezo ya data ya lafudhi kupatikana, ambayo kwa hiari inaweza kuripotiwa binafsi na wachangiaji kwenye mfumo.

Rebecca Ryakitimbo, mshirika wa ushiriki wa jamii, alishughulikia sehemu ya pili ya kipindi ambapo aliangazia shughuli zetu za ushirikishwaji wa jamii haswa kwa Kiswahili. Alizungumza kuhusu majukumu mbalimbali ambayo wanajamii wanaweza kutekeleza, kama waundaji wa sentensi na wathibitishaji na pia wafadhili wa sauti na wathibitishaji. Kisha aliangazia jukumu kuu ambalo ujumuishaji wa wanawake unashikilia. Miongozo yetu shirikishi inahakikisha kwamba tunafanya kazi ya kuwajumuisha wanawake katika hatua zote za kazi, kuanzia mawazo, ukusanyaji wa seti ya data, ukuzaji wa matumizi kifani, uundaji wa kielelezo hadi hatua za mwisho za ukuzaji wa programu.

Hatimaye, aliangazia jukumu la kutoa ruzuku katika kufanya rasilimali hizi kupatikana kwa umma. Nia yetu kama Mozilla ni rasilimali hizi zipatikane kwa uwazi kwa matumaini kwamba mashirika ya ndani yatapata matumizi kwa ajili yao katika shughuli zao za biashara na/au katika maombi yao. Ili kuchochea matumizi ya rasilimali, tulitoa wito ambao uliweka ufadhili wa ruzuku wa hadi dola 50,000 kwa kila tuzo. Wito huo ulibainisha maslahi katika miradi kwenye nyanja za kilimo na fedha. Ombi moja lililopendeza zaidi ndani ya kitengo cha sheria pia lilichaguliwa. Unaweza kusoma zaidi kuhusu miradi iliyotunukiwa hapa.

Niliwezesha sehemu ya mwisho ya kipindi, nikiangazia jinsi tunavyounda miundo ya AI kwa lugha zenye nyenzo ya chini, haswa kwa Kiswahili. Nilizungumza kuhusu umuhimu wa seti ya data katika mchakato wa ujenzi wa muundo na jinsi ilivyo thamani kwangu kama msanidi kuhusika na kuweza kushawishi shughuli zetu za ukusanyaji wa data. Tunafuatilia na kuchanganua seti zetu za data mara kwa mara ili kuhakikisha kwamba tunadumisha usawa katika vipengele ambavyo ni muhimu kwetu. Hivi ni umri, jinsia, lahaja na lafudhi, na vitatusaidia kwa kiasi kikubwa kuhakikisha mifano inayotokana na kutoonyesha upendeleo kwa watu binafsi wa vikundi tofauti vya idadi ya watu.

Tulijadili miundo ya utambuzi wa sauti, fursa za upendeleo zilizopo na jinsi tunavyofanya kazi ili kuimarisha miundo iliyofunzwa awali kutoka lugha tofauti.

Tulihitimisha kipindi kwa maswali ya kuibua yaliyokusudiwa kuwafanya washiriki wafikirie kwa kina kuhusu kazi tunayofanya na athari mbalimbali kwa jamii zinazozungumza lugha hizi, athari zake chanya na hasi. Unaweza kuangalia maswali hapa chini.

Ikiwa una maswali au mawazo yoyote ambayo unadhani yanaweza kufaidi kazi yetu, tunakuhimiza uwasiliane nasi.

  • Je, tunawezaje kushirikisha jumuiya mbalimbali ili kuchangia sauti zao?
    • Muktadha: Ufikiaji mdogo au usio na mtandao
    • Muktadha: Lugha iliyo hatarini (nyenzo kidogo au isiyopo)
    • Muktadha: Jinsia na demografia zingine za kiwango cha chini ambazo hazijawakilishwa ili kujumuika zaidi
  • Je, ni hatari/wasiwasi gani zilizopo wakati wa kuhimiza michango?
    • Muktadha: Matumizi ya data na mashirika
    • Muktadha: Utoaji leseni
    • Muktadha: Faragha
  • Je, tunawezaje kuhimiza/kujenga umiliki mkubwa zaidi wa jumuiya wa seti zao za data za lugha?
  • Ni nani anayefaidika zaidi kutokana na kuwepo kwa seti ya data hizi? Na jinsi gani?
  • Je, ni uwekezaji gani mwingine unapaswa kufanywa pamoja na kujenga seti za data ambazo zinaweza kuleta manufaa makubwa kwa jumuiya za wenyeji?