Hallgatózz és dönts jól!

kami911 képe

Hangalapú alkalmazások készítéséhez már rengeteg magyar hanganyagot rögzítettek az önkéntesek, így arra kér a Mozilla minket, hogy ellenőrizzük a már meglévő felolvasásokat. Ehhez nincs másra szükség, csak egy fejhallgatóra vagy hangszóróra, internetre kötött számítógépre vagy telefonra és egy kis elszántságra. Egészen addiktív hallgatni mások felolvasását. Egy ellenőrzési kör 5 mondatból áll, nagyjából egy percet vesz igénybe.

Amire figyelni kell

Változó kiejtések

Minden akcentust szívesen várunk! Legyen nagyon óvatos, mielőtt azért utasít el egy klipet, mert az olvasó hibásan ejtett ki egy szót, rossz helyre tette a hangsúlyt, vagy figyelmen kívül hagyta a központozást. Sokféle kiejtést használnak, és nem biztos, hogy mindet hallotta a helyi közösségében. Erősen vegye figyelembe, hogy mások másképpen beszélnek.

Másrészt, ha úgy gondolja, hogy az olvasó még soha nem találkozott a szóval, és tévesen tippelt a kiejtésére, akkor utasítsa el. Ha bizonytalan, használja a kihagyás gombot.

Félreolvasások

Számít, hogy az oldalon lévő összes szót helyesen olvassa-e fel. Hallgatáskor nagyon gondosan ellenőrizze, hogy pontosan az lett rögzítve, ami le lett írva; elutasítsa el, ha hozzáadott, összevont vagy kihagyott szavakat.

A gyakori hibák közé tartoznak a következők:

  • Hiányzó „A” vagy „Az” a felvétel elején.
  • Hiányzó betűk, kivéve az hangösszeolvadásokat.
  • Olyan összevonások felolvasása, melyek nem szerepelnek a szövegben.
  • Hiányzó utolsó szó a felvétel túl gyors befejezése miatt.
  • Többszöri próbálkozás egy szó felolvasására.

Háttérzajok

A felvétel minden szavát hallania kell. Azt szeretnénk, ha a gépi tanulási algoritmusok képesek lennének kezelni a különböző háttérzajokat, és még a viszonylag hangos zajok vagy a halk háttérzene is elfogadható, feltéve, hogy nem akadályozzák a szöveg teljes hallását. A szöveg hallását akadályozó recsegés vagy szakadozás azt jelenti, hogy a klipet el kell utasítani.

Hangok a háttérben

Egy kis háttérzaj rendben van, de ha hallja, hogy valaki más is beszél, akkor a klipet el kell utasítani. Ez jellemzően akkor történik, ha a TV bekapcsolva maradt, vagy a közelben beszélgetés folyik.

Hangerő

Természetes eltérések lesznek az olvasók hangereje között. Csak azokat utasítsa el, ahol a hangerő olyan magas, hogy szétesik a felvétel, vagy (ami gyakrabban előfordul) olyan halk, hogy az írott szöveg nélkül nem érti, hogy pontosan mit is olvas fel.

Felolvasói hatások

A legtöbb felvételen az emberek a természetes hangjukon beszélnek. Elfogadhatja az alkalmi nem szokásos felvételeket, amelyen kiabálnak, suttognak vagy csak „drámai” hangok olvassák fel. Viszont a felénekelt vagy számítógéppel szintetizált felvételeket utasítsa el.

Amennyiben bizonytalan

Ha olyan dologgal találkozik, amelyre ezek az irányelvek nem vonatkoznak, akkor szavazzon a legjobb megítélése szerint. Ha valóban nem tud dönteni, akkor használja a kihagyás gombot, és folytassa a következő felvétellel.

Mi ez az egész projekt?

A Mozilla kezdeményezése a szabadon elérhető, helyi beszélő számára számítógépes szövegértést megalkotását tűzte ki célul. A Common Voice egy nyilvánosan elérhető hangadatkészlet, amelyet a világ minden tájáról származó önkéntes közreműködők hangja alkot. Azok, akik hangalapú alkalmazásokat készítenek, az adatkészletet a gépi tanulási modellek betanításához használhatják. Jelenleg a legtöbb hangadatkészlet vállalatok tulajdonában van, ami elfojtja az innovációt. A hangadatkészletek szintén felülreprezentálják a fehér, angolul beszélő férfiakat. Ez azt jelenti, hogy a hangalapú technológia egyáltalán nem működik sok nyelven, és ahol működik, előfordulhat, hogy nem mindenkinél teljesít egyformán jól. Ezen szeretnénk változtatni azáltal, hogy mindenhol mozgósítjuk az embereket, hogy megosszák a hangjukat. A már említett ellenőrzés mellett, lehetőség van, hogy az önkéntesek a megadott szöveget felolvashatják mikrofonba.

Az ilyen jellegű hozzájárulás esetében a következőkre kell figyelni:

  • Beszéljen a normál hangján! Szívesen látjuk az Ön beszédmódját – a megszokott akcentust, hangerőt, stílust és intonációt szeretnénk.
  • Kerülje a túl sok háttérzajt – könnyen hallhatónak kell lennie.
  • Figyelmesen olvassa fel a mondatot – ne hagyjon ki, ne változtasson és ne adjon hozzá szavakat.
  • Mielőtt elkezdené beszélni, győződjön meg arról, hogy a platform rögzíti, és csak akkor áll le, ha befejezte.

A feladatok magyar nyelven is végezhetőek, továbbá a magyar adatbázis fejlődését itt lehet nyomon követni és persze felolvasni és ellenőrizni angol nyelven is lehet.

A Common Voice célja a hang-alapú ember-gép kommunikáció megkönnyítése a helyi nyelvi közösségeknek. A manapság népszerű számítógépes tanulást felhasználva, a Mozilla mérnökei szeretnének olyan könnyen felhasználható mintákat előállítani, amelyeket aztán más projektek beépíthetnek az alkalmazásaikba.

Így az alkalmazásokat fel lehetne ruházni a helyi beszélőt megértő honosított hangfelismeréssel, amely fontos a gépi hang alapú kommunikációhoz. Ez a sok beszélővel rendelkező nyelvek esetén megoldott, de az olyan kevés ember által beszélt nyelvek esetén, mint amilyen a magyar is, csak meglehetősen kezdetleges megoldások állnak rendelkezésre. Ráadásul ezek a megoldások minden nyelv esetén jellemzően zárt, kereskedelmi termékek.

A Mozilla célja a beszélt nyelveken – ahol elegendő hozzájárulás lesz – használható nyelvi hangcsomagok előállítása. Ehhez keresünk most a magyar ajkú önkénteseket is. Most adhatod a hangod, hogy segíts nekünk egy nyílt forrású hang-adatbázist építeni, amit bárki szabadon használhat arra, hogy innovatív alkalmazásokat készítsen eszközökre és a webre.

Hozzászólások

Ami furcsa nekem

Értékelés: 

0
Még nincs értékelve

Lehet, hogy csak én hiányolok egy olyan funkciót az oldalról, ahol meg lehet jelölni, hogy mi a probléma a felolvasással?

Volt már amit nem-el jelöltem, mert a  felolvasó kihagyott egy szót a szövegből, vagy nem azt a szót használta, hanem szinonimát, és volt olyan, hogy összetett szóalak egy egyszerűbb változatát.

Azt hogyan döntik el, hogy mi a gond a szöveggel, ha csak egy elutasítás lehet, de nem lehet részletezni a problémát?

kami911 képe

Ami furcsa nekem

Értékelés: 

0
Még nincs értékelve

#1 Szerintem egyszerűbb az ilyeneket újra felvenni, mint pontosan visszajelezni, hogy mi a gond vele. Legalábbis én ezt gondolom.