Image promotionnelle de Our Voices


Lancement de « Our Voices », un nouveau concours de Mozilla pour lutter contre les préjugés dans les technologies vocales

Le concours, organisé par Common Voice, a pour objectif de favoriser l’émergence d’outils de reconnaissance vocale plus diversifiés et inclusifs.

Les expert·e·s du monde entier peuvent participer et remporter un prix sur un total de 20 000 $


(INTERNATIONAL | JEUDI 30 JUIN 2022) — Mozilla lance une série de concours ambitieuse et internationale intitulée « Our Voices » (Nos voix), ayant pour but de rendre la technologie vocale moins partiale et plus inclusive.

Lancé par Mozilla Common Voice, « Our Voices » met les expert·e·s du monde entier au défi de créer des systèmes de reconnaissance vocale qui comprennent et fonctionnent pour tout le monde, indépendamment du genre, de l’accent ou de la langue. Les concours coïncident avec la publication du 10e jeu de données de Common Voice.

Comme le souligne Em Lewis-Jong, responsable produit chez Mozilla pour Common Voice : « Actuellement, l’écosystème de la technologie vocale est truffé de préjugés et de graves insuffisances. De ce fait, des millions de personnes (et d’innombrables langues et accents) ne peuvent pas bénéficier d’une technologie essentielle. “Our Voices” récompense les experts et expertes en technologie qui prennent ce problème à bras le corps. »

Actuellement, l’écosystème de la technologie vocale est truffé de préjugés et de graves insuffisances. De ce fait, des millions de personnes (et d’innombrables langues et accents) ne peuvent pas bénéficier d’une technologie essentielle.

Em Lewis-Jong, responsable produit chez Mozilla pour Common Voice

Le concours propose un total de 20 000 dollars US de récompense dans quatre catégories :

  • Le genre | Par exemple, un modèle de reconnaissance vocale (speech to text, STT) pour une langue qui manque de ressources et qui fonctionne aussi bien pour les locuteurs que les locutrices.
  • Les variantes linguistiques et les accents | Par exemple, des classificateurs d’accents par et pour une communauté, afin de répondre à ses besoins
  • Les méthodologies | Par exemple, un corpus de référence ou une méthodologie d’audit de jeux de données pour identifier les biais
  • Appel ouvert | Tout autre prototype ou outil vocal créatif et pertinent dans le cadre de la diversité, de l’équité et de l’inclusion

Les participants doivent principalement utiliser les données de Mozilla Common Voice, mais peuvent également utiliser d’autres outils open source comme NVIDIA NeMo.

Em Lewis-Jong explique : « Pour rendre le concours aussi accessible que possible, nous accueillons les projets de personnes qui ne disposent pas de grandes quantités de données ou d’un GPU. Nous souhaitons toujours recevoir des projets de type « proof of concept » avec de petits corpus de données, et des ébauches de méthodologie au stade initial. Nous décernons également des prix dans chaque catégorie de ressources linguistiques, afin d’éviter que les langues à faibles ressources disposant de jeux de données beaucoup plus réduits ne soient en concurrence avec des langues disposant de très nombreuses ressources.

Mozilla Common Voice est une initiative open source visant à rendre la technologie vocale plus inclusive. Les personnes peuvent faire don de leur voix à un jeu de données open source, et les expert·e·s peuvent ensuite utiliser ces données pour créer de nouveaux produits. À ce jour, Common Voice a recueilli plus de 20 000 heures de données vocales dans plus de 90 langues, de l’abkhaze au vietnamien.

Les participant·e·s ont de juillet à septembre pour rassembler toutes les données supplémentaires dont ils et elles ont besoin pour leurs idées. Le 11e jeu de données de Common Voice sera publié le 14 septembre et les participant·e·s auront jusqu’au 12 octobre pour créer et soumettre leur projet. Les gagnant·e·s recevront 2 000 $ chacun·e et feront une démonstration de leur travail lors d’un sommet Speech Summit en octobre.

Les projets seront jugés de manière globale sur des critères tels que le taux d’erreur de mots, le besoin social, la possibilité de déploiement et l’impact environnemental. Les juges sont neuf expert·e·s en technologie vocale de NVIDIA, Mozilla, d’universités et d'autres institutions et organisations. Le jury est composé de 50 % de femmes, de 60 % de personnes multilingues et de 30 % de personnes de couleur.

Pour consulter les règles, les détails de participation et les biographies des juges, cliquez ici.


Contact presse : Kevin Zawacki | [email protected]

Image promotionnelle de Common Voice