Common Voice

Common Voice est le jeu de données vocales ouvertes le plus diversifié au monde. La plupart des jeux de données appartiennent à des entreprises, ce qui empêche l’innovation. Ils sous-représentent également presque toutes les langues, les femmes, ainsi que les personnes de couleur, handicapées, ou LGBTQIA+. Nous voulons changer cela.

Plateforme et jeu de données

Common Voice est le plus grand jeu de données vocales multilingues en crowdsourcing au monde

à propos de Common Voice

Pourquoi Common Voice ?

La technologie vocale est de plus en plus omniprésente — des assistants de smartphones aux appareils de santé portables en passant par les logiciels de pratique linguistique. Beaucoup de personnes sont aussi exclues. Les assistants vocaux prennent actuellement en charge moins de 1 % des langues du monde ! Pour certaines communautés, même si leur langue est prise en charge, elles peuvent ne pas être comprises, car les données d’entrainement de l’IA sous-représentent régulièrement les communautés de genres divers, les personnes de couleur et celles qui ont des accents marginalisés ou non natifs.

C’est ce que nous voulons changer, en permettant à des personnes comme vous de partager facilement votre voix.

Comment fonctionne Common Voice ?

  • Étape 1. Quelqu’un demande l’ajout d’une langue.
  • Étape 2. Le texte du site web est traduit dans cette langue par des bénévoles.
  • Étape 3. Des phrases sont collectées pour être lues à haute voix.
  • Étape 4. Nous lançons la plateforme Common Voice dans cette langue.
  • Étape 5. Des personnes contribuent avec leur voix.
  • Étape 6. D’autres personnes valident ces extraits vocaux.
  • Étape 7. Nous publions les données tous les 3 mois.
  • Étape 8. Le cycle continue ! Plus de phrases, plus de clips, plus de validations ! Nous avons toujours besoin de votre aide !

Alors, comment puis-je participer ?

Merci d’avoir posé la question ! Vérifiez sur la plateforme si votre langue a besoin de plus d’échantillons, de plus de validations ou de plus de phrases.

En cas de doute, n’hésitez pas à enregistrer quelques échantillons ! Il suffit de quelques instants pour que l’IA fonctionne mieux pour tout le monde.

Si vous souhaitez vous impliquer davantage, pourquoi ne pas devenir mobilisateur·trice communautaire ? Que ce soit pour éduquer sur les questions d’inclusion de l’IA en ligne à l’organisation d’évènements locaux dans votre communauté, il existe de nombreuses façons d’aider ! Contactez-nous et nous vous mettrons en contact avec les bonnes personnes pour vous aider.

Quelles sont les prochaines étapes pour la plateforme Common Voice ?

En termes d’expérience de contribution, nous travaillons actuellement à rendre la plateforme plus facile à utiliser pour les personnes qui disposent d’une faible bande passante et à faciliter la participation rapide de nouvelles personnes. Pour l’architecture et l’infrastructure des applications, nous rendons la plateforme plus évolutive et augmentons la segmentation du jeu de données pour les personnes qui utilisent les données.

L’année prochaine, nous travaillerons sur certaines évolutions majeures de la plateforme, y compris l’ajout d’échantillons spontanés. Si vous êtes un·e ingénieur·e ou un·e scientifique des données qui souhaite nous aider, contactez-nous !

Plateforme et jeu de données

Common Voice est le plus grand jeu de données vocales multilingues en crowdsourcing au monde

à propos de Common Voice

Pourquoi Common Voice ?

La technologie vocale est de plus en plus omniprésente — des assistants de smartphones aux appareils de santé portables en passant par les logiciels de pratique linguistique. Beaucoup de personnes sont aussi exclues. Les assistants vocaux prennent actuellement en charge moins de 1 % des langues du monde ! Pour certaines communautés, même si leur langue est prise en charge, elles peuvent ne pas être comprises, car les données d’entrainement de l’IA sous-représentent régulièrement les communautés de genres divers, les personnes de couleur et celles qui ont des accents marginalisés ou non natifs.

C’est ce que nous voulons changer, en permettant à des personnes comme vous de partager facilement votre voix.

Comment fonctionne Common Voice ?

  • Étape 1. Quelqu’un demande l’ajout d’une langue.
  • Étape 2. Le texte du site web est traduit dans cette langue par des bénévoles.
  • Étape 3. Des phrases sont collectées pour être lues à haute voix.
  • Étape 4. Nous lançons la plateforme Common Voice dans cette langue.
  • Étape 5. Des personnes contribuent avec leur voix.
  • Étape 6. D’autres personnes valident ces extraits vocaux.
  • Étape 7. Nous publions les données tous les 3 mois.
  • Étape 8. Le cycle continue ! Plus de phrases, plus de clips, plus de validations ! Nous avons toujours besoin de votre aide !

Alors, comment puis-je participer ?

Merci d’avoir posé la question ! Vérifiez sur la plateforme si votre langue a besoin de plus d’échantillons, de plus de validations ou de plus de phrases.

En cas de doute, n’hésitez pas à enregistrer quelques échantillons ! Il suffit de quelques instants pour que l’IA fonctionne mieux pour tout le monde.

Si vous souhaitez vous impliquer davantage, pourquoi ne pas devenir mobilisateur·trice communautaire ? Que ce soit pour éduquer sur les questions d’inclusion de l’IA en ligne à l’organisation d’évènements locaux dans votre communauté, il existe de nombreuses façons d’aider ! Contactez-nous et nous vous mettrons en contact avec les bonnes personnes pour vous aider.

Quelles sont les prochaines étapes pour la plateforme Common Voice ?

En termes d’expérience de contribution, nous travaillons actuellement à rendre la plateforme plus facile à utiliser pour les personnes qui disposent d’une faible bande passante et à faciliter la participation rapide de nouvelles personnes. Pour l’architecture et l’infrastructure des applications, nous rendons la plateforme plus évolutive et augmentons la segmentation du jeu de données pour les personnes qui utilisent les données.

L’année prochaine, nous travaillerons sur certaines évolutions majeures de la plateforme, y compris l’ajout d’échantillons spontanés. Si vous êtes un·e ingénieur·e ou un·e scientifique des données qui souhaite nous aider, contactez-nous !