Common Voice

Common Voice is the most diverse open voice dataset in the world. Most voice datasets are owned by companies, which stifles innovation. They also under-represent almost every language in the world, as well as people of colour, disabled people, women and LGBTQIA+ people. We want to change that by mobilising people everywhere to share their voice.

Platform en gegevensset

Common Voice is de grootste gecrowdsourcete meertalige spraakgegevensset ter wereld

over Common Voice

Waarom Common Voice?

Spraakgestuurde technologie wordt steeds alomtegenwoordiger – van smartphone-assistenten tot draagbare gezondheidsapparaten tot software voor het oefenen van talen. Het laat ook veel mensen achter. Spraakassistenten ondersteunen momenteel minder dan 1% van alle talen ter wereld! Sommige gemeenschappen worden niet begrepen, omdat AI-trainingsgegevens regelmatig een ondervertegenwoordiging zijn van genderdiverse gemeenschappen, mensen van kleur en mensen met gemarginaliseerde of niet-inheemse accenten, zelfs als hun taal wordt ondersteund.

We zijn hier om dat te veranderen! Door het voor mensen zoals u gemakkelijk te maken om uw stem te delen.

Hoe werkt Common Voice?

  • Stap 1. Iemand vraagt om een taal toe te voegen.
  • Stap 2. De websitetekst wordt door vrijwilligers in die taal vertaald.
  • Stap 3. Zinnen worden verzameld die mensen hardop kunnen lezen.
  • Stap 4. We lanceren het Common Voice-platform in deze taal.
  • Stap 5. Mensen komen hun spraak bijdragen.
  • Stap 6. Anderen valideren die spraakfragmenten.
  • Stap 7. We geven de gegevensset elke drie maanden vrij.
  • Stap 8. De cyclus gaat verder! Meer zinnen, meer fragmenten, meer validaties! We hebben altijd uw hulp nodig!

Hoe doe ik mee?

Bedankt voor het vragen! Controleer op het platform of uw taal meer fragmenten, meer validaties of meer zinnen nodig heeft.

Als u het niet zeker weet, ga dan uw gang en draag wat fragmenten bij! Het duurt maar een paar minuten om AI voor iedereen beter te laten werken.

Als u meer betrokken wilt raken, waarom wordt u dan geen gemeenschapsmobilisator – van een online docent over AI-inclusiekwesties tot het organiseren van lokale evenementen in uw gemeenschap – er zijn veel manieren om te helpen! Neem gewoon contact op en we brengen u in contact met de juiste mensen om te helpen.

Wat er op stapel staat voor het Common Voice-platform!

Wat de ervaring van bijdragers betreft, werken we er momenteel aan om het platform gebruiksvriendelijker te maken voor mensen die beschikken over een lage bandbreedte en om het voor nieuwe mensen eenvoudiger te maken om snel mee te doen. Voor app-architectuur en -infrastructuur maken we het platform schaalbaarder en de gegevensset beter segmenteerbaar voor gegevensconsumenten.

Volgend jaar werken we aan enkele belangrijke platformevoluties, waaronder uitbreiding naar spontane spraak. Als u een ingenieur of datawetenschapper bent die wil helpen, neem dan contact met ons op!

Platform en gegevensset

Common Voice is de grootste gecrowdsourcete meertalige spraakgegevensset ter wereld

over Common Voice

Waarom Common Voice?

Spraakgestuurde technologie wordt steeds alomtegenwoordiger – van smartphone-assistenten tot draagbare gezondheidsapparaten tot software voor het oefenen van talen. Het laat ook veel mensen achter. Spraakassistenten ondersteunen momenteel minder dan 1% van alle talen ter wereld! Sommige gemeenschappen worden niet begrepen, omdat AI-trainingsgegevens regelmatig een ondervertegenwoordiging zijn van genderdiverse gemeenschappen, mensen van kleur en mensen met gemarginaliseerde of niet-inheemse accenten, zelfs als hun taal wordt ondersteund.

We zijn hier om dat te veranderen! Door het voor mensen zoals u gemakkelijk te maken om uw stem te delen.

Hoe werkt Common Voice?

  • Stap 1. Iemand vraagt om een taal toe te voegen.
  • Stap 2. De websitetekst wordt door vrijwilligers in die taal vertaald.
  • Stap 3. Zinnen worden verzameld die mensen hardop kunnen lezen.
  • Stap 4. We lanceren het Common Voice-platform in deze taal.
  • Stap 5. Mensen komen hun spraak bijdragen.
  • Stap 6. Anderen valideren die spraakfragmenten.
  • Stap 7. We geven de gegevensset elke drie maanden vrij.
  • Stap 8. De cyclus gaat verder! Meer zinnen, meer fragmenten, meer validaties! We hebben altijd uw hulp nodig!

Hoe doe ik mee?

Bedankt voor het vragen! Controleer op het platform of uw taal meer fragmenten, meer validaties of meer zinnen nodig heeft.

Als u het niet zeker weet, ga dan uw gang en draag wat fragmenten bij! Het duurt maar een paar minuten om AI voor iedereen beter te laten werken.

Als u meer betrokken wilt raken, waarom wordt u dan geen gemeenschapsmobilisator – van een online docent over AI-inclusiekwesties tot het organiseren van lokale evenementen in uw gemeenschap – er zijn veel manieren om te helpen! Neem gewoon contact op en we brengen u in contact met de juiste mensen om te helpen.

Wat er op stapel staat voor het Common Voice-platform!

Wat de ervaring van bijdragers betreft, werken we er momenteel aan om het platform gebruiksvriendelijker te maken voor mensen die beschikken over een lage bandbreedte en om het voor nieuwe mensen eenvoudiger te maken om snel mee te doen. Voor app-architectuur en -infrastructuur maken we het platform schaalbaarder en de gegevensset beter segmenteerbaar voor gegevensconsumenten.

Volgend jaar werken we aan enkele belangrijke platformevoluties, waaronder uitbreiding naar spontane spraak. Als u een ingenieur of datawetenschapper bent die wil helpen, neem dan contact met ons op!