Common Voice est ravi d’annoncer que sa 18e version de jeu de données est disponible au téléchargement. Dans le cadre de notre engagement pour rendre les technologies vocales plus accessibles, nous publions un jeu de données, sans frais ni droit d’auteur, d’échantillons vocaux multilingues et de données textuelles associées, sous licence CC0. Le jeu de données est le fruit d’un effort communautaire, mené par des contributeurs·trices pour les données vocales et textuelles, des militant·es pour les langues, des expert·es en technologie, des universitaires et d’autres membres de la communauté qui constituent Common Voice.
Statistiques de Common Voice 18.0
Le jeu de données Common Voice compte désormais 31 841 heures, dont 20 789 heures de données vocales validées par la communauté. Il s’agit d’une augmentation de près de 700 heures de données vocales depuis la dernière version du jeu de données et d’une augmentation de 382 heures nouvellement validées. Le 18e jeu de données est composé d’échantillons de 129 langues, dont 5 nouvelles avec cette version.
De nouvelles langues rejoignent Common Voice
Nous sommes ravis d’accueillir cinq nouvelles langues dans les jeux de données et la communauté Common Voice. Le xhosa, le kalendjin, le taita, le luo et le tswana sont disponibles dans Common Voice 18. Ces langues sont utilisées par des centaines de millions de personnes à travers le monde qui peuvent désormais être mieux assistées par les technologies vocales.
Participez à Common Voice 19 et aux versions suivantes
Si Common Voice vous passionne, il existe de nombreuses manières de rejoindre la communauté. Partager votre voix ou écrire et soumettre des phrases originales dans votre langue aide à créer le prochain jeu de données. Si votre langue n’est pas encore disponible sur Common Voice, vous pouvez demander son ajout avec ce formulaire. Nous sommes également ravis d’accueillir des contributions techniques sur notre projet open source sur GitHub.
Votre avis
Nous avons hâte de savoir ce que vous pensez des nouvelles versions. Vous pouvez nous contacter sur les forums Common Voice, discuter avec nous sur Matrix ou directement envoyer un e-mail à l’équipe à l’adresse [email protected]. Nous souhaitons particulièrement en savoir plus sur ce que les utilisateurs et utilisatrices des jeux de données créent ou explorent à l’aide de ce jeu de données. Mieux comprendre les besoins des utilisateurs·trices de nos jeux de données peut nous aider à définir une orientation qui réponde mieux à vos besoins.