Hoja de ruta de Common Voice 2024

Common Voice es una comunidad global de colaboradores, usuarios de sets de datos, investigadores y interesados aficionados que se unen para crear sets de datos de texto y voz que impulsen un ecosistema de datos más inclusivo, abierto y saludable.

Quisimos ampliar el espacio para la participación de la comunidad para construir contigo el futuro de Common Voice. Como parte de esta iniciativa, queremos compartir nuestros objetivos y nuestra hoja de ruta del año 2024 para recibir comentarios y debatirlos con la comunidad en general.

Esta publicación de blog no incluye al detalle todo el trabajo que hace nuestro pequeño equipo; por ejemplo, seguiremos solucionando errores, agregando nuevos idiomas, respondiendo preguntas de soporte y haciendo todas las tareas diarias que se necesitan para mantener Common Voice en funcionamiento. ¡Y también tenemos en marcha algunas emocionantes expansiones! A grandes rasgos, se agrupan en tres «temas del producto».

Para una visión más interactiva de esta hoja de ruta, también organizaremos una sesión de preguntas y respuestas en vivo con el equipo de Common Voice, el 24 de abril de 2024. El registro gratuito está disponible a través de este formulario.

Una hoja de ruta que muestra los proyectos en los que se centrará el equipo de Common Voice este año. El siguiente texto detalla estos proyectos con más profundidad.

El lenguaje tal como se vive: variantes, alternancia de códigos y habla espontánea

Queremos capturar la diversidad y los matices del habla de las personas. Este año implementaremos soporte para la alternancia de códigos (2 idiomas en 1 mismo set de datos) y sociolectos (variantes de un idioma según el grupo social). Ambos estarán disponibles inicialmente a través de nuestra segunda plataforma: «Common Voice: Spontaneous Speech». CVSS se encuentra actualmente en la fase de pruebas alpha, pero se lanzará en versión beta al comienzo del tercer trimestre, con solo 3 idiomas para empezar.

Volver a centrar el texto como un activo de datos: oraciones impulsadas por el consentimiento y la calidad

Nos hemos centrado en mejorar la salud de nuestros corpus de texto. El año pasado migramos la recopilación de oraciones a la plataforma «Common Voice», lo que ha dado como resultado un aumento del 100 % en la tasa de idiomas que reciben nuevas oraciones, y un aumento del 300 % en la cantidad de personas que se convierten en contribuyentes de oraciones. Este año ya hemos realizado el trabajo para incluir nuestro corpus de texto en nuestros sets de datos, y pronto comenzaremos a trabajar para trasladar los procesos de calidad y verificación de oraciones a la plataforma «Common Voice». Esto hará que sea más rápido y fácil hacer crecer el corpus de texto con contribuciones de alta calidad en todos los idiomas. También crearemos prototipos de algunas herramientas de «comentarios» humanos que pueden ser útiles para otros profesionales dedicados al aprendizaje automático.

Diversificar las vías de gobernanza para una innovación y una sostenibilidad más equitativas

«Data Futures Lab» es un espacio experimental que también forma parte de la Fundación Mozilla y que está dedicado a impulsar nuevos enfoques para enfrentar los desafíos de la administración de datos.

Trabajaremos en colaboración con DFL para explorar cómo la plataforma «Common Voice» puede respaldar proyectos de recopilación de datos dirigidos por la comunidad con diferentes estructuras de gobernanza y licencias. Estamos comprometidos con el efecto positivo del código abierto en el mundo, por lo que no haremos ningún cambio en las licencias de los sets de datos existentes; sin embargo, queremos escuchar a las comunidades que presenten diferentes perspectivas e iniciar un viaje de aprendizaje junto a ellas. Durante 2025, compartiremos nuestras reflexiones y crearemos un espacio de debate.

Dinamizar nuestras comunidades técnicas y dedicadas al código abierto

Uno de nuestros objetivos este año es involucrarnos más con nuestras comunidades más allá de la fase de recopilación de datos. Planeamos diseñar conjuntamente experiencias de aprendizaje con miembros de la comunidad, acerca de la utilización de sus datos para desarrollar aplicaciones responsables de tecnología del habla. Para lograrlo, nos asociamos con Responsible Computing Challenge.

También queremos brindar un mejor apoyo y permitir que nuestra propia comunidad de código abierto participe en la creación de la plataforma CV de modo que satisfaga sus necesidades. Estamos ampliando el espacio para la discusión sobre la dirección técnica y creando más transparencia en la hoja de ruta para recibir comentarios y colaboración. También estamos en el proceso de auditar toda nuestra documentación técnica pública para que sea más fácil participar. Combinamos estas iniciativas con una revisión de nuestros procesos internos, aumentando la atención del equipo a las solicitudes de extracción para asegurarnos de que los colaboradores interesados reciban comentarios rápidos. ¡Chatea con nosotros en Discourse, Matrix o GitHub para guiarnos en la dirección que nos permita apoyarte!

Explorar diferentes asociaciones para la sostenibilidad

«Common Voice» es una iniciativa sin fines de lucro y se financia a través de subvenciones y asociaciones. Parte de cada hoja de ruta anual incluye el trabajo para asegurar la financiación que permita que «Common Voice» crezca de manera sostenible. Este año, continuaremos explorando rutas de financiamiento que se alineen con nuestra misión. Si deseas apoyarnos directamente, aceptamos donaciones. Y si quieres hablar con nosotros sobre subvenciones o asociaciones institucionales, puedes enviar un correo electrónico a [email protected].