Common Voice

Common Voice is the most diverse open voice dataset in the world. Most voice datasets are owned by companies, which stifles innovation. They also under-represent almost every language in the world, as well as people of colour, disabled people, women and LGBTQIA+ people. We want to change that by mobilising people everywhere to share their voice.

Plataforma e conjunto de dados

Common Voice é o maior conjunto de dados de fala multilíngue de colaboração coletiva do mundo

sobre o Common Voice

Por que Common Voice?

A tecnologia habilitada por voz está se tornando cada vez mais universal, desde assistentes de celulares e dispositivos corporais de saúde até como linguagem de programação. Também está deixando muita gente para trás. Os assistentes de voz atualmente suportam menos de 1% dos idiomas do mundo! Em algumas comunidades, mesmo que seu idioma seja compatível, as pessoas podem não ser compreendidas, pois os dados de treinamento de inteligência artificial normalmente sub-representam comunidades com diversidade de gênero, de etnia e com sotaques marginalizados ou não nativos.

Estamos aqui para mudar isso! Facilitando a pessoas como você compartilhar sua voz.

Como funciona o Common Voice?

  • Etapa 1. Alguém solicita a adição de um idioma.
  • Etapa 2. O texto do site é traduzido para esse idioma por voluntários.
  • Etapa 3. As frases são coletadas para as pessoas ler em voz alta.
  • Passo 4. Lançamos a plataforma Common Voice nesse idioma.
  • Passo 5. As pessoas vêm e contribuem com suas vozes.
  • Etapa 6. Outras pessoas validam esses clipes de voz.
  • Etapa 7. Lançamos o conjunto de dados a cada 3 meses.
  • Etapa 8. O ciclo continua! Mais frases, mais clipes, mais validações! Precisamos sempre da sua ajuda!

Então, como posso participar?

Obrigado por perguntar! Verifique na plataforma se seu idioma precisa de mais clipes, mais validações ou mais frases.

Se você não tem certeza, vá em frente e contribua com alguns clipes! Leva pouco tempo para fazer a inteligência artificial funcionar melhor para todos.

Se você quer se envolver mais profundamente, que tal se tornar um mobilizador da comunidade? Desde ser educador online sobre questões de inclusão em inteligência artificial até realizar eventos locais em sua comunidade, há muitas formas de ajudar! Basta entrar em contato e te apresentaremos as pessoas certas para ajudar.

O que vem pela frente na plataforma Common Voice!

Em termos de experiência do colaborador, atualmente estamos trabalhando para tornar a plataforma mais fácil de usar para pessoas com internet limitada ou lenta e simplificar a participação de novas pessoas. Na arquitetura e infraestrutura de aplicativos, estamos tornando a plataforma mais escalável e o conjunto de dados mais segmentável para consumidores de dados.

No próximo ano, estaremos trabalhando em algumas evoluções principais da plataforma, incluindo a expansão para fala espontânea. Se você é engenheiro ou cientista de dados e quer ajudar, entre em contato!

Plataforma e conjunto de dados

Common Voice é o maior conjunto de dados de fala multilíngue de colaboração coletiva do mundo

sobre o Common Voice

Por que Common Voice?

A tecnologia habilitada por voz está se tornando cada vez mais universal, desde assistentes de celulares e dispositivos corporais de saúde até como linguagem de programação. Também está deixando muita gente para trás. Os assistentes de voz atualmente suportam menos de 1% dos idiomas do mundo! Em algumas comunidades, mesmo que seu idioma seja compatível, as pessoas podem não ser compreendidas, pois os dados de treinamento de inteligência artificial normalmente sub-representam comunidades com diversidade de gênero, de etnia e com sotaques marginalizados ou não nativos.

Estamos aqui para mudar isso! Facilitando a pessoas como você compartilhar sua voz.

Como funciona o Common Voice?

  • Etapa 1. Alguém solicita a adição de um idioma.
  • Etapa 2. O texto do site é traduzido para esse idioma por voluntários.
  • Etapa 3. As frases são coletadas para as pessoas ler em voz alta.
  • Passo 4. Lançamos a plataforma Common Voice nesse idioma.
  • Passo 5. As pessoas vêm e contribuem com suas vozes.
  • Etapa 6. Outras pessoas validam esses clipes de voz.
  • Etapa 7. Lançamos o conjunto de dados a cada 3 meses.
  • Etapa 8. O ciclo continua! Mais frases, mais clipes, mais validações! Precisamos sempre da sua ajuda!

Então, como posso participar?

Obrigado por perguntar! Verifique na plataforma se seu idioma precisa de mais clipes, mais validações ou mais frases.

Se você não tem certeza, vá em frente e contribua com alguns clipes! Leva pouco tempo para fazer a inteligência artificial funcionar melhor para todos.

Se você quer se envolver mais profundamente, que tal se tornar um mobilizador da comunidade? Desde ser educador online sobre questões de inclusão em inteligência artificial até realizar eventos locais em sua comunidade, há muitas formas de ajudar! Basta entrar em contato e te apresentaremos as pessoas certas para ajudar.

O que vem pela frente na plataforma Common Voice!

Em termos de experiência do colaborador, atualmente estamos trabalhando para tornar a plataforma mais fácil de usar para pessoas com internet limitada ou lenta e simplificar a participação de novas pessoas. Na arquitetura e infraestrutura de aplicativos, estamos tornando a plataforma mais escalável e o conjunto de dados mais segmentável para consumidores de dados.

No próximo ano, estaremos trabalhando em algumas evoluções principais da plataforma, incluindo a expansão para fala espontânea. Se você é engenheiro ou cientista de dados e quer ajudar, entre em contato!