A Mozilla új kezdeményezése a szabadon elérhető számítógépes szövegértés megalkotását tűzte ki célul.
Kép: Shutterstock
Újabb projekttel jelentkezik a Mozilla, a szabad internet szószólója. A Common Voice célja a hang-alapú ember-gép kommunikáció megkönnyítése a helyi nyelvi közösségeknek.
A manapság népszerű számítógépes tanulást felhasználva, a Mozilla mérnökei szeretnének olyan könnyen felhasználható mintákat előállítani, amelyeket aztán más projektek beépíthetnek az alkalmazásaikba.
Így az alkalmazásokat fel lehetne ruházni a helyi beszélőt megértő honosított hangfelismeréssel, amely fontos a gépi hang alapú kommunikációhoz. Ez a sok beszélővel rendelkező nyelvek esetén megoldott, de az olyan kevés ember által beszélt nyelvek esetén, mint amilyen a magyar is, csak meglehetősen kezdetleges megoldások állnak rendelkezésre. Ráadásul ezek a megoldások minden nyelv esetén jellemzően zárt, kereskedelmi termékek.
A Mozilla célja a beszélt nyelveken – ahol elegendő hozzájárulás lesz – használható nyelvi hangcsomagok előállítása.
Ehhez keresnek magyar ajkú önkénteseket is.
Most adhatjuk a hangunkat, hogy segítsünk nyílt forrású hang-adatbázist építeni, amit bárki szabadon használhat arra, hogy innovatív alkalmazásokat készítsen eszközökre és a webre.
Olvassunk fel egy mondatot, vagy írjunk magyar mondatokat, hogy segítsük a gépeket megtanulni, hogyan beszélnek a magyar emberek. Ellenőrizzük mások hozzájárulásait, javítva a minőséget.
A Mozilla Voice már elérhető magyarul is, de a munka oroszlánrésze még csak most jön.
Először is szövegeket kell gyűjteni, melyeket az önkéntesek majd felolvashatnak. Nagyon fontos, hogy csak közkincsnek minősülő szövegeket és saját szövegeket lehet használni.
A szövegeket itt lehet beküldeni, legfeljebb ötven mondatonként.
A magyar adatbázis fejlődése nyomon követhető, az elkészült adatokat le tudjuk tölteni.