I'm really looking forward to chatting about @mozilla.org's #CommonVoice and @mozdatacollective.bsky.social projects with the #SLVlabs folks this Wednesday in #Melbourne #Melbs - the talk is public if you're free 💻 📚
lab.slv.vic.gov.au/participate/...
🎙️ Comment fonctionne Common Voice ? On t’explique comment est constitué le jeu de données open source de voix !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
Mes slides de ma conférence/atelier (talk/workshop) "Contribuer à la traduction De ________ vers le français" présenté au @capitoledulibre.org #cdl2025 sur @firefox.com #commonvoice #sumo @developer.mozilla.org speakerdeck.com/hellosct1/co...
Notre mozillien @hellosct1.bsky.social vous aide à vous lancer dans la traduction au @capitoledulibre.org pour #pontoon #sumo #mdn #commonvoice @mozilla.org @firefox.com
Aujourd'hui, notre mozillien @hellosct1.bsky.social intervient dans un atelier de traduction au @capitoledulibre.org sur #sumo #pontoon #mdn #commonvoice Une occasion pour vous lancer dans cette thématique #cdl2025 capitoledulibre.org/programme/
Aujourd'hui au @capitoledulibre.org , je donne une conférence / Atelier sur la contribution multilangue avec @developer.mozilla.org #pontoon #sumo #commonvoice @mozilla.org @firefox.com @mozilla-fr.bsky.social capitoledulibre.org/programme/
Either I'm completely misunderstanding something or https://commonvoice.mozilla.org/en/datasets don't do persistent linking to neither specific versions nor specific languages. That is, I can't reference it in a scientific paper the way it is usually done in my field for language resources.
🤡 […]
« Donner sa voix pour sauver sa langue. » #CommonVoice
Langues régionales : l'intelligence artificielle au secours de l'alsacien – ici www.francebleu.fr/infos/insoli...
L’alsacien à l’heure de l’IA : intégrer les langues régionales dans les modèles numériques #CommonVoice – Sciences et Avenir www.sciencesetavenir.fr/high-tech/in...
🎙️ Qu’est-ce que Common Voice ? On t’explique les bases du projet dans cet article !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
🎙️ Comment fonctionne Common Voice ? On t’explique comment est constitué le jeu de données open source de voix !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
Join Kathy Reid at PyCon AU 2025 for her talk "Your datasets, under your control: Introducing the Mozilla Data Collective". Ballroom 1, Sunday 14th September, 2.10 PM
With my @mozilla.org Foundation #CommonVoice hat on, I'm delighted to be speaking in just under a fortnight about the #MozillaDataCollective, a new platform initiative that puts you in control of your #datasets. Better #AI requires better #data - authentic, human.
2025.pycon.org.au/program/ZFWM...
🎙️ Penaos aprouiñ lennadennoù e Common Voice ? Displegañ a reomp an dra-se dit er video-mañ !
🔍 C'hoant az peus da c'houzout hiroc'h diwar-benn Common Voice e brezhoneg ? Na chom ket etre daou, ne'z peus nemet koumanantiñ d’hor pajenn !
🔗 commonvoice.mozilla.org/br/guidelines
#bzhg #CommonVoice
🎙️ Comment s’enregistrer sur Common Voice ? On t’explique cela dans cette vidéo !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
🎙️ Comment créer un compte sur Common Voice ? On t’explique cela dans cette vidéo !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
📲 Participa en 👉 doagalego.nos.gal
#AgasallaNós e axuda a construír ferramentas tecnolóxicas inclusivas e plurais
🧠 Porque o futuro tamén se fala... en galego!
#GalegoNaRede #TecnoloxíaEnGalego #FalaEspontánea #CommonVoice #ProxectoNós #IA #DiversidadeLingüística
What was it trained on?
My guess is EuroParl given the focus on European languages and its ability to do language detection. It also appears to have used @mozilla.org #CommonVoice as an evaluation corpus, not in the training set - although a test set could have been held back.
2/3
🎙️ Qu’est-ce que Common Voice ? On t’explique les bases du projet dans cet article !
🔍 Envie d’en savoir plus sur Common Voice breton ? N'hésite pas à t’abonner à notre page !
#bzhg #CommonVoice
Hi there, I'm Kathy and I contract with #CommonVoice and have experience in this space - I'm not with Mozilla.AI for clarity.
Mozilla TTS was deprecated yrs ago and was the foundation for Coqui TTS, also depr'd.
Suggest you look at Piper, used by #HomeAssistant
github.com/rhasspy/piper
Writing this with my @mozilla.org #CommonVoice hat on:
If you would like some guidance on writing prompts for your language for Spontaneous Speech, we're holding office hours this week:
discourse.mozilla.org/t/spontaneou...
H/t to @jesslynnrose.bsky.social for all her efforts on this.
A win for open data and the open models they feed 🏆
#Nvidia launches fully open source transcription #AI model on @hf.co trained by Mozilla #CommonVoice technology venturebeat.com/ai/nvidia-la... @venturebeat.com
@mozilla.ai hello,
I lead @wikipedia.org 's audio recording app #Lingualibre and investigate long text #TTS for #Wikipedia. We have 350~700 linguistic wiki communities.
Does @mozilla.org have a solid, modern, open source TTS ML project you use or work on at the moment ?
cc #CommonVoice #Tatoeba
🍀 It's St Patrick's Day! To celebrate, we looked up similar words in Irish Gaelic and Breton!
#CommonVoice #stpatricksday #irish #bzhg #LáFhéilePádraig #StPatricksDay #Ireland
As we face the extinction of thousands of languages, linguistic and heritage preservation has never been more critical.
#CommonVoice is working with volunteers around the globe to build inclusive, voice-enabled #AI solutions 👏 learn more about the #Taiwan Language volunteers' work⤵️ mzl.la/4kJE3CP
Ahier de tardes se van rechistrar ~500 frases y mas de meya hora d'audio. Agora lo conchunto de datos tiene 3.8 horas. Nos aduyas a arribar a las 5 horas este cabo de semana?
commonvoice.mozilla.org/an/speak
#commonvoice #aragonés #latuyavoz
🗣️Per que la IA y las tecnolochías d'a voz nomás funcionan en uns pocos idiomas?
👩💻No podem deixar que la tecnolochía deixe dezaga l'aragonés!
🎙️Dende la comunidat, podem crear los conchuntos de datos que fan falta pa que l'aragonés no pierda este tren.
#commonvoice #aragonés
Data visualisation of Common Voice v20 splits by gender, stacked to 100% to better show low-resource languages.
The Mozilla #CommonVoice #speech #dataset v20 was released yesterday.
Keep on reading for my observations from the #dataviz below.
observablehq.com/@kathyreid/m...
Mozillien Hellosct1 devant un kakémono Mozilla, à côté d’un stand Mozilla avec dessus deux ordinateurs portables, des stickers et des éléphants en peluche ; sur le mur derrière sont affichées diverses affiches dont certaines arborent un code QR.
En cette dernière journée du salon #PSLXXL de Parinux, nous vous présentons #Pontoon #traductions #Nightly #CommonVoice #PDF dans Firefox
📢 Des chercheurs ont compilé 950 000 heures de données de parole open source pour les 24 langues officielles de l’UE avec le projet MOSEL. Une initiative majeure pour l’avancement de modèles de langue IA en Europe, incluant des données de #CommonVoice. the-decoder.com/researchers-...