Common Voice-gegevensset versie 18

Common Voice is verheugd aan te kondigen dat de 18e versie van onze gegevensset nu beschikbaar is om te downloaden. Als onderdeel van onze toewijding om spraaktechnologieën toegankelijker te maken, geven we een kosten- en auteursrechtvrije gegevensset van meertalige spraakfragmenten en bijbehorende tekstgegevens uit onder een CC0-licentie. De gegevensset is een inspanning van de gemeenschap, aangedreven door de leveranciers van spraak en tekst, taalactivisten, technologen, academici en andere leden van de gemeenschap die samen Common Voice vormen.

Common Voice 18.0-cijfers

De Common Voice-gegevensset is uitgegroeid tot een duizelingwekkende 31.841 uur, met 20.789 door de gemeenschap gevalideerde uren aan spraakgegevens. Dit is een toename van bijna 700 uur aan spraakgegevens sinds de laatste uitgave van de gegevensset en een toename van 381 nieuw gevalideerde uren. De 18e gegevensset is samengesteld uit fragmenten uit 129 talen, met 5 nieuwe talen die in deze versie zijn toegevoegd.

Nieuwe talen bij Common Voice

We’re so excited to have five new languages join the Common Voice datasets and community. Xhosa, Kalenjin, Kidaw'ida, Dholuo and Setswana are available in Common Voice 18. These languages are used by hundreds of millions of people around the world who can now be better supported in voice technologies.

Maak deel uit van Common Voice 19 en hoger

Als u enthousiast bent over Common Voice: er zijn zoveel manieren om u aan te sluiten bij de gemeenschap van medewerkers. Delen van uw stem of schrijven en bijdragen van originele zinnen in uw taal helpt bij het bouwen van de volgende gegevensset. Als uw taal nog niet op Common Voice bestaat, kunt u met dit formulier toevoeging aanvragen. We verwelkomen ook graag technische bijdragen aan ons opensourceproject op Github.

Feedback

We zijn altijd blij om te horen wat u van de nieuwe releases vindt. U kunt ons bereiken op de Common Voice-forums, met ons chatten in Matrix of rechtstreeks een e-mailbericht naar het team sturen op [email protected]. We zijn vooral geïnteresseerd in meer informatie over wat gebruikers met de gegevensset bouwen of verkennen. Een beter begrip van de behoeften van de gebruikers van onze gegevensset kan ons helpen de richting te bepalen die uw behoeften beter ondersteunt.

Benadering

Juridisch

Mensen verbinden

Gemeenschappen verzamelen

Beleid beïnvloeden

Onderzoek & analyse

Kom in actie

Leren

Doneren

Kansen

Impact op gemeenschap

Aanbevolen berichten

Populaire onderwerpen