Common Voice

Common Voice is the most diverse open voice dataset in the world. Most voice datasets are owned by companies, which stifles innovation. They also under-represent almost every language in the world, as well as people of colour, disabled people, women and LGBTQIA+ people. We want to change that by mobilising people everywhere to share their voice.

Plattform und Datensatz

Common Voice ist der weltweit größte, mehrsprachige Sprachdatensatz aus Crowdsourcing

Über Common Voice

Warum Common Voice?

Sprachgesteuerte Technologie wird immer allgegenwärtiger – von Smartphone-Assistenten über tragbare Gesundheitsgeräte bis hin zu Sprachübungssoftware. Sie lässt auch viele Menschen zurück. Sprachassistenten unterstützen derzeit weniger als 1 % der Sprachen der Welt! Einige Gemeinschaften werden möglicherweise nicht verstanden, selbst wenn ihre Sprache unterstützt wird, da KI-Trainingsdaten regelmäßig geschlechtsspezifische Gemeinschaften, People of Color und solche mit marginalisierten oder nicht-muttersprachlichen Akzenten unterrepräsentieren.

Wir sind hier, um das zu ändern! Indem wir es Menschen wie Ihnen leicht machen, Ihre Stimme zu teilen.

Wie funktioniert Common Voice?

  • Schritt 1. Jemand bittet darum, eine Sprache hinzuzufügen.
  • Schritt 2. Der Website-Text wird von Freiwilligen in diese Sprache übersetzt.
  • Schritt 3. Sätze werden gesammelt, damit Menschen diese laut vorlesen können.
  • Schritt 4. Wir veröffentlichen die Common-Voice-Plattform in dieser Sprache.
  • Schritt 5. Menschen kommen und spenden ihre Stimme.
  • Schritt 6. Andere Menschen validieren diese Sprachclips.
  • Schritt 7. Wir veröffentlichen den Datensatz alle drei Monate.
  • Schritt 8. Der Zyklus geht weiter! Mehr Sätze, mehr Clips, mehr Bestätigungen! Wir brauchen immer Ihre Hilfe!

Wie kann ich mitmachen?

Danke für die Frage! Überprüfen Sie auf der Plattform, ob Ihre Sprache mehr Clips, mehr Validierungen oder mehr Sätze benötigt.

Wenn Sie sich nicht sicher sind – machen Sie weiter und steuern Sie einige Clips bei! Es dauert nur ein paar Augenblicke und hilft, KI für alle zu verbessern.

Wenn Sie sich tiefer einbringen möchten, warum werden Sie nicht ein Gemeinschafts-Mobilisierer – von der Online-Pädagogik über KI-Integrationsfragen bis hin zur Durchführung lokaler Veranstaltungen in Ihrer Gemeinschaft – es gibt viele Möglichkeiten zu helfen! Wenden Sie sich einfach an uns und wir bringen Sie mit den richtigen Ansprechpartnern in Kontakt.

Was kommt als nächstes für die Common Voice-Plattform!

In Bezug auf die Erfahrung der Mitwirkenden arbeiten wir derzeit daran, die Plattform für Personen in Kontexten mit geringer Bandbreite benutzerfreundlicher zu machen und es für neue Mitwirkende einfacher zu machen, sich schnell einzubringen. Bei der App-Architektur und -Infrastruktur machen wir die Plattform skalierbarer und den Datensatz für Datenkonsumenten segmentierbarer.

Nächstes Jahr werden wir an einigen wichtigen Plattformentwicklungen arbeiten – einschließlich der Erweiterung auf spontane Sprache. Wenn Sie ein Ingenieur oder Datenwissenschaftler sind, der helfen möchte – kontaktieren Sie uns!

Plattform und Datensatz

Common Voice ist der weltweit größte, mehrsprachige Sprachdatensatz aus Crowdsourcing

Über Common Voice

Warum Common Voice?

Sprachgesteuerte Technologie wird immer allgegenwärtiger – von Smartphone-Assistenten über tragbare Gesundheitsgeräte bis hin zu Sprachübungssoftware. Sie lässt auch viele Menschen zurück. Sprachassistenten unterstützen derzeit weniger als 1 % der Sprachen der Welt! Einige Gemeinschaften werden möglicherweise nicht verstanden, selbst wenn ihre Sprache unterstützt wird, da KI-Trainingsdaten regelmäßig geschlechtsspezifische Gemeinschaften, People of Color und solche mit marginalisierten oder nicht-muttersprachlichen Akzenten unterrepräsentieren.

Wir sind hier, um das zu ändern! Indem wir es Menschen wie Ihnen leicht machen, Ihre Stimme zu teilen.

Wie funktioniert Common Voice?

  • Schritt 1. Jemand bittet darum, eine Sprache hinzuzufügen.
  • Schritt 2. Der Website-Text wird von Freiwilligen in diese Sprache übersetzt.
  • Schritt 3. Sätze werden gesammelt, damit Menschen diese laut vorlesen können.
  • Schritt 4. Wir veröffentlichen die Common-Voice-Plattform in dieser Sprache.
  • Schritt 5. Menschen kommen und spenden ihre Stimme.
  • Schritt 6. Andere Menschen validieren diese Sprachclips.
  • Schritt 7. Wir veröffentlichen den Datensatz alle drei Monate.
  • Schritt 8. Der Zyklus geht weiter! Mehr Sätze, mehr Clips, mehr Bestätigungen! Wir brauchen immer Ihre Hilfe!

Wie kann ich mitmachen?

Danke für die Frage! Überprüfen Sie auf der Plattform, ob Ihre Sprache mehr Clips, mehr Validierungen oder mehr Sätze benötigt.

Wenn Sie sich nicht sicher sind – machen Sie weiter und steuern Sie einige Clips bei! Es dauert nur ein paar Augenblicke und hilft, KI für alle zu verbessern.

Wenn Sie sich tiefer einbringen möchten, warum werden Sie nicht ein Gemeinschafts-Mobilisierer – von der Online-Pädagogik über KI-Integrationsfragen bis hin zur Durchführung lokaler Veranstaltungen in Ihrer Gemeinschaft – es gibt viele Möglichkeiten zu helfen! Wenden Sie sich einfach an uns und wir bringen Sie mit den richtigen Ansprechpartnern in Kontakt.

Was kommt als nächstes für die Common Voice-Plattform!

In Bezug auf die Erfahrung der Mitwirkenden arbeiten wir derzeit daran, die Plattform für Personen in Kontexten mit geringer Bandbreite benutzerfreundlicher zu machen und es für neue Mitwirkende einfacher zu machen, sich schnell einzubringen. Bei der App-Architektur und -Infrastruktur machen wir die Plattform skalierbarer und den Datensatz für Datenkonsumenten segmentierbarer.

Nächstes Jahr werden wir an einigen wichtigen Plattformentwicklungen arbeiten – einschließlich der Erweiterung auf spontane Sprache. Wenn Sie ein Ingenieur oder Datenwissenschaftler sind, der helfen möchte – kontaktieren Sie uns!