Logotipo de Common Voice


Los participantes analizarán cómo agregar el mixe, el chatino y otros idiomas al set de datos de Mozilla Common Voice

En este evento se entregarán cuatro premios en efectivo de 20.000 MXN


(CIUDAD DE MÉXICO, MÉXICO | MIÉRCOLES 20 DE ABRIL DE 2022) — Mozilla Common Voice será el anfitrión de una competencia y una hackatón de cinco días que tendrán lugar en la Ciudad de México este mes de mayo, con el objetivo de garantizar que los sets de datos y los productos con tecnologías de voz representen mejor los idiomas y acentos de México. En el evento pueden participar tecnólogos, científicos de datos o simplemente personas que hablan español mexicano u otros idiomas de México.

Este evento se realiza en colaboración con el Instituto de Matemáticas y el Instituto de Investigaciones Antropológicas de la Universidad Nacional Autónoma de México. Se realizarán charlas, un taller, un panel de discusión y una hackatón con varios premios de 20.000 MXN. El evento se llevará a cabo entre el viernes 29 de abril y el martes 3 de mayo, y será tanto virtual como presencial en la Universidad Nacional Autónoma de México en la Ciudad de México. El jueves 5 de mayo se anunciarán los ganadores y demostrarán sus proyectos.

Inscríbete aquí.

Mozilla Common Voice es una iniciativa de código abierto para hacer que las tecnologías de voz sean más inclusivas. Las personas pueden donar sus voces a un set de datos de código abierto, y los tecnólogos pueden usar esos datos para entrenar nuevos productos. Hasta hoy, Common Voice ha recopilado 406 horas de datos de voz en español proporcionados por más de 20.000 hablantes.

EM Jong, líder de producto de Mozilla para Common Voice, ha dicho: «La tecnología de voz actual no reconoce una amplia variedad de idiomas y acentos. ¿Y cuál es el resultado de esto? Que millones de personas quedan excluidas del uso de tecnologías fundamentales. Este evento es una oportunidad para mitigar ese sesgo, específicamente en relación con los idiomas y acentos de México».

Los aspectos más destacados del evento incluyen:

Hackatón con varios premios en efectivo de 20.000 MXN. Los participantes creadores de software de voz y sets de datos tendrán la oportunidad de ganar un premio en efectivo. Las categorías son: (1) usar un modelo de habla entrenado previamente para español; (2) usar un modelo de habla entrenado previamente para un idioma indígena de México; (3) recolección de datos para español; (4) recolección de datos para idiomas indígenas de México.

Charlas y mesas redondas a cargo de expertos en idiomas indígenas. Los expertos hablarán sobre los sesgos y las oportunidades de las tecnologías de voz para los idiomas indígenas en una serie de charlas tituladas: «Las tecnologías del habla para los idiomas indígenas de América». Además, el evento contará con una mesa redonda entre:

  • Tajëëw Diaz Robles: Es mixe de Tlahuitoltepec, forma parte del colectivo Colmix y actualmente se desempeña como coordinadora del proyecto «Endless Oaxaca Multilingüe» de la Fundación Alfredo Harp Helú en Oaxaca. Además, forma parte de la Red de Activistas Digitales en Lenguas Indígenas.

  • Dra. Hilaria Cruz: Es hablante de chatino de San Juan Quiahije y actualmente es una de las lingüistas del Departamento de Humanidades Comparadas de la Universidad de Louisville de los Estados Unidos. Se especializa en documentación lingüística y revitalización, y trabaja con métodos computacionales de documentación lingüística y en la creación de libros para niños.

  • Huber Benítez Meili: Licenciado en Guaraní y Alemán. Es uno de los fundadores de «Avañe’ẽ Kuaareka Aty» (organización que fomenta las actividades de terminología, traducción e interpretación del guaraní) y de la asociación de profesores de alemán de Paraguay.