Common Voice

Common Voice is the most diverse open voice dataset in the world. Most voice datasets are owned by companies, which stifles innovation. They also under-represent almost every language in the world, as well as people of colour, disabled people, women and LGBTQIA+ people. We want to change that by mobilising people everywhere to share their voice.

Platfoarm en gegevensset

Common Voice is de grutste crowdsourcete meartalige spraakgegevensset yn de wrâld

oer Common Voice

Wêrom Common Voice?

Spraakstjoerde technology wurdt hieltyd mear brûkt – fan snoadfoan-assistinten oant draachbere apparaten foar sûnenssoarch oant taalpraktyksoftware. It lit ek in soad minsken efter. Spraakassistinten stypje op it stuit minder as 1% fan de wrâldtalen! Foar guon mienskippen, sels as har taal stipe wurdt, kinne se miskien net begrepen wurde, omdat AI-trainingsgegevens regelmjittich ûnderfertsjintwurdigje binne fan genderdiverske mienskippen, minsken fan kleur, en minsken mei marginalisearre of net-memmetaal aksinten.

Wy binne hjir om dat te feroarjen! Troch it maklik te meitsjen foar minsken lykas jo om jo stim te dielen.

Hoe wurket Common Voice?

  • Stap 1. Immen freget om in taal ta te foegjen.
  • Stap 2. De websidetekst wurdt troch frijwilligers yn dy taal oerset.
  • Stap 3. Sinnen wurde sammele dy’t minsken hurdop foarlêze kinne.
  • Stap 4. Wy lansearje de Common Voice-website yn dizze taal.
  • Stap 5. Minsken komme harren spraak bydrage.
  • Stap 6. Oaren falidearje dy spraakfragminten.
  • Stap 7. Wy jouwe de gegevensset elke trije moannen frij.
  • Stap 8. De syklus giet troch! Mear sinnen, mear fragminten, mear falidaasjes! Wy hawwe altyd jo help nedich!

Hoe doch ik mei?

Tank foar it freegjen! Kontrolearje op it platfoarm om te sjen oft jo taal mear fragminten, mear falidaasjes of mear sinnen nedich hat.

As jo net wis binne, gean dan jo gong en draach wat fragminten by! It duorret mar in pear mominten om AI foar elkenien better te meitsjen.

As jo djipper belutsen wurde wolle, wêrom dan net in mienskipsmobilisator wurde – fan in online oplieder oer AI-ynklúzjeproblemen oant it útfieren fan lokale eveneminten yn jo mienskip – der binne in protte manieren om te helpen! Nim gewoan kontakt op en wy sille jo yn kontakt bringe mei de krekte minsken om te helpen.

Wat der oan sit te kommen foar it Common Voice-platfoarm!

Wat de ûnderfining fan bydragers oanbelanget, wurkje wy der op dit stuit oan om it platfoarm brûkersfreonliker te meitsjen foar minsken dy’t beskikke oer in lege bânbreedte en om it foar nije minsken ienfâldiger te meitsjen om fluch mei te dwaan. Foar app-arsjitektuer en -ynfrastruktuer meitsje wy it platfoarm mear skealber en de gegevensset better segmentearber foar gegevenskonsuminten.

Takom jier sille wy wurkje oan guon grutte platfoarmevolúsjes, ynklusyf útwreidzjen nei spontane spraak. As jo in yngenieur of gegevenswittenskipper binne dy’t helpe wol, nim dan kontakt op!

Platfoarm en gegevensset

Common Voice is de grutste crowdsourcete meartalige spraakgegevensset yn de wrâld

oer Common Voice

Wêrom Common Voice?

Spraakstjoerde technology wurdt hieltyd mear brûkt – fan snoadfoan-assistinten oant draachbere apparaten foar sûnenssoarch oant taalpraktyksoftware. It lit ek in soad minsken efter. Spraakassistinten stypje op it stuit minder as 1% fan de wrâldtalen! Foar guon mienskippen, sels as har taal stipe wurdt, kinne se miskien net begrepen wurde, omdat AI-trainingsgegevens regelmjittich ûnderfertsjintwurdigje binne fan genderdiverske mienskippen, minsken fan kleur, en minsken mei marginalisearre of net-memmetaal aksinten.

Wy binne hjir om dat te feroarjen! Troch it maklik te meitsjen foar minsken lykas jo om jo stim te dielen.

Hoe wurket Common Voice?

  • Stap 1. Immen freget om in taal ta te foegjen.
  • Stap 2. De websidetekst wurdt troch frijwilligers yn dy taal oerset.
  • Stap 3. Sinnen wurde sammele dy’t minsken hurdop foarlêze kinne.
  • Stap 4. Wy lansearje de Common Voice-website yn dizze taal.
  • Stap 5. Minsken komme harren spraak bydrage.
  • Stap 6. Oaren falidearje dy spraakfragminten.
  • Stap 7. Wy jouwe de gegevensset elke trije moannen frij.
  • Stap 8. De syklus giet troch! Mear sinnen, mear fragminten, mear falidaasjes! Wy hawwe altyd jo help nedich!

Hoe doch ik mei?

Tank foar it freegjen! Kontrolearje op it platfoarm om te sjen oft jo taal mear fragminten, mear falidaasjes of mear sinnen nedich hat.

As jo net wis binne, gean dan jo gong en draach wat fragminten by! It duorret mar in pear mominten om AI foar elkenien better te meitsjen.

As jo djipper belutsen wurde wolle, wêrom dan net in mienskipsmobilisator wurde – fan in online oplieder oer AI-ynklúzjeproblemen oant it útfieren fan lokale eveneminten yn jo mienskip – der binne in protte manieren om te helpen! Nim gewoan kontakt op en wy sille jo yn kontakt bringe mei de krekte minsken om te helpen.

Wat der oan sit te kommen foar it Common Voice-platfoarm!

Wat de ûnderfining fan bydragers oanbelanget, wurkje wy der op dit stuit oan om it platfoarm brûkersfreonliker te meitsjen foar minsken dy’t beskikke oer in lege bânbreedte en om it foar nije minsken ienfâldiger te meitsjen om fluch mei te dwaan. Foar app-arsjitektuer en -ynfrastruktuer meitsje wy it platfoarm mear skealber en de gegevensset better segmentearber foar gegevenskonsuminten.

Takom jier sille wy wurkje oan guon grutte platfoarmevolúsjes, ynklusyf útwreidzjen nei spontane spraak. As jo in yngenieur of gegevenswittenskipper binne dy’t helpe wol, nim dan kontakt op!