La langue est un facteur important de l’inclusion numérique. Une grande partie de la technologie est créée depuis des pays où l’anglais est la langue principale. Au-delà de l’accès aux appareils et de leur prix abordable, la langue devient un énorme obstacle à l’accès aux services numériques.

La capacité d’utiliser la langue que vous parlez au quotidien pour accéder aux services numériques est importante pour l’inclusion numérique. Lorsque cela est possible sur des appareils bas de gamme, c’est encore mieux. La capacité de traiter le langage naturel sur une plateforme distante ou via l’edge computing devient essentielle pour accéder à un grand groupe de personnes qui ne sont pas desservies. La voix devient un élément essentiel de l’inclusion numérique et il est très important de permettre aux startups, aux entreprises et aux organisations dans les communautés où la langue est un obstacle de pouvoir s’emparer de cette problématique. C’est pourquoi je pense que la plateforme Common Voice est vraiment importante.

La mise en libre accès des jeux de données vocales permet l’innovation et la recherche autour des langues qui ne sont pas représentées. Cela réduit la barrière à l’entrée pour les personnes qui créent des langues et font des recherches en linguistique. L’investissement nécessaire à la collecte de données vocales diverses pour former des modèles d’apprentissage automatique peut être élevé. Une approche communautaire de la création de jeux de données vocales ouverts permet d’obtenir des données diverses qui réduisent les biais dans les outils créés.

La voix est essentielle, mais une approche axée sur la confidentialité est très importante. La création d’outils qui collectent et traitent les données vocales doit accorder la priorité à la vie privée des personnes.

Je suis très heureux de voir ce qui a été créé à l’aide des jeux de données vocales en swahili qui sont désormais disponibles sur la plateforme Common Voice.