Hangmotorok Android 4. Az orosz nyelvű beszédszintetizátorok áttekintése Android operációs rendszerhez

Ha az anyanyelve nem angol, és nem csak az iPhone-hoz ír alkalmazásokat, akkor meglehetősen nehéz lesz az Ön számára, ha megfelelő fejlesztői eszköztárat szeretne találni az ún. mobil, „hanggal kompatibilis” alkalmazások.

Ez az áttekintés egy osztályozást nyújt, és leírja a mobil TTS -motorhoz leginkább méltó típusokat.

Kutatásokat végzek a látássérült emberek mobil interfészeinek tervezésével kapcsolatban. Az egyik projektem megvalósításához szükségem volt egy hanggeneráló motorra, amely többnyelvű támogatást kapott (legalább két nyelven- angolul és oroszul). Ez volt az oka a beszédszintetizátor keresésének.

A kényelem érdekében a TTS motorokat három osztályra osztjuk:

  • kereskedelmi;
  • ingyenes (a GPL, az LGPL és más "puha" licencek, például a BSD License vagy a wxWindows License, amelyek lehetővé teszik a termékek kereskedelmi fejlesztését);
  • beépített (az operációs rendszer által biztosított eszközök).

Kereskedelmi motorok

SVOX Mobile TTS

Ár: n / a
Nyelvek: 26, beleértve az oroszt
magas
Mobil operációs rendszer: Android, Symbian, Windows CE / Windows Mobile, BREW

Az SVOX cég rendelkezik műszaki szempontból a legízletesebb termékkel - az SVOX Mobile TTS -vel. Mivel azonban a cég főként a B2B szegmensben működik, soha nem válaszoltak két árajánlatot kérő levelemre.

A fejlécben szereplő ár olyan operációs rendszerekre vonatkozik, mint a Windows Mobile és a Symbian, de az Acapela üzleti modellje a választott operációs rendszertől függően eltérő. Például a legerősebben az iOS irányát hirdetik, amelyhez külön webhelyet készítettek. Ott regisztrálhat, és ingyenesen beszerezheti a motor értékelési verzióját. A csupasz SDK ára az egykori iPhone OS esetében 250 €. Ezenkívül jelentős százalékot vonnak le minden alkalmazásból, amelyet az App Store -ban értékesít.

Vegye figyelembe, hogy az Acapela felhőalapú beszédszintézist, valamint SDK-portolást biztosít bármely platformhoz.

Ingyenes motorok

Flite
Ár: nem
Nyelvek: angol és a FestVox nyelvek összeállításának lehetősége
A hangminőség szubjektív értékelése: alacsony
Mobil operációs rendszer: Android, Windows CE / Windows Mobile, iOS, PalmOS
Képesség kereskedelmi termékek fejlesztésére: igen (CMU licenc)

Az asztali rendszerek világában a Festival beszédszintetizátor jól ismert. Flite nevű portja van a mobileszközökhöz és a beágyazott rendszerekhez, amelyet saját X11-szerű licencük alapján terjesztenek, amely lehetővé teszi a szoftver szabadon történő továbbadását bárkinek, valamint annak alapján kereskedelmi és ingyenes alkalmazások készítését. Vannak portok a CE CE / Windows Mobile, PalmOS, Android és.

Az elosztásban megtalálhatók a motor WM -re történő fordítására vonatkozó utasítások, de ezen a platformon az eSpeak egy jelentős korlátozással rendelkezik - a hanggenerálás csak WAV fájlban lehetséges. A Windows Mobile számára összeállított TTS motor beszerezhető.

Az ESpeak Androidra van áthelyezve. A legegyszerűbb módja annak, hogy telepítse a TTS Service Extended alkalmazást az Android Marketről, amely lehetővé teszi a beépített motor és az eSpeak közötti váltást. Ez a TTS motor a GNU GPL feltételei szerint kerül forgalmazásra.

Beágyazott megoldások

A beágyazott megoldások csak a Symbian és az Android rendszerben vannak jelen. A Microsoft ismeretlen okból megfosztotta mobil operációs rendszerét a megfelelő programozási felülettől (MS SAPI).
Symbian

Ár: nem
Nyelvek: angol
A hangminőség szubjektív értékelése: rendkívül alacsony
Képesség kereskedelmi termékek fejlesztésére: igen

A Symbian Foundation beágyazott TTS -je a CMdaAudioPlayerUtility osztályban rejtőzik. Bár nem mond róla semmit, mégis lehetővé teszi a beszéd szintetizálását. Sajnos az orosz nyelv nem támogatott. Az angol beszédgeneráció minősége nagyon alacsony. Felkészülés nélkül meglehetősen nehéz megérteni, mit mondott pontosan.

További nyelvi csomagok is letölthetők, de a támogatott telefonok listája rendkívül kicsi. Az orosz nyelvű csomagok telepítése a Symbain OS S60 5. rendszert futtató eszközre nem hozta meg a várt eredményt, a beépített TTS nem beszélt oroszul.

Vegye figyelembe, hogy létezik egy meglehetősen kényelmes API -bővítmény, az NSS TTS Utility API, amelynek leírása megtalálható

A beszédszintetizátor a fő eszköz arra, hogy egy vak számítógépes felhasználó számára információt szerezzen a képernyő tartalmáról, és ha nincs alternatíva Braille -kijelző formájában, akkor általában ez az egyetlen. Tekintettel arra, hogy az Android platformon a tapintható kijelzők használatának támogatása még csak gyerekcipőben jár, a szövegfelolvasás fontossága a látássérült felhasználók számára még nagyobb.

Az írás idején számos orosz beszédszintézis -megoldás áll rendelkezésre az Android operációs rendszer felhasználói számára, különböző szintézisminőséggel és hátrányokkal. Meghívjuk Önt, hogy ismerje meg jobban őket, és hallgassa meg hangjukat.

Mivel az Android rendszer nem biztosítja a felhasználó számára a beszédszintetizátorok menet közbeni átváltásának lehetőségét, gyakran felmerül az a helyzet, amikor az egyik hangmotornak többnyelvű szövegeket kell olvasnia, legalábbis orosz és angol nyelven. Még az angol felületre való teljes átállás sem oldja meg ezt a problémát, hiszen az orosz nyelvű weboldalak vagy üzenetek olvasásához még mindig át kell állnia egy orosz beszédszintetizátorra, végigmenve a menüben. Ezenkívül a beszédszintetizátorokkal végzett munka teljesítménye általában rosszabb, mint a képernyőn megjelenő adatok vizuális észlelése, ezért sok tapasztalt vak felhasználó inkább a maximális olvasási sebességre hangolja a TTS -t, hogy kompenzálja ezt a késést.

Erre tekintettel ebben az áttekintésben nemcsak a beszédszintézis minőségére, mint olyanra, hanem olyan szempontokra is nagy figyelmet fordítunk, mint a latin szöveg olvasása és a beszéd sebessége, amelyek fontosak a szöveget használó emberek számára. beszéd a képernyőolvasókban.

A felülvizsgálat végén talál egy összefoglaló táblázatot a meglévő megoldások értékeléséről három kulcsfontosságú paraméter tekintetében: a szintézis minősége, a beszédsebesség és a latin szöveg olvasásának támogatása.

Acapela TTS hangok

Az Acapela Group több tucat beszédszintetizátorát hordozta az Android operációs rendszerbe, köztük Alena jól ismert orosz hangját. Általánosságban elmondható, hogy a beszédszintézis minőségét tekintve ez a kereskedelmi megoldás meglehetősen magas szinten van, de a termék nem hiányzik számos hiányosságtól, bár a tisztesség kedvéért meg kell jegyezni, hogy abban az időben ennek az értékelésnek az írásakor béta állapotú.

Először is, a teljes motor rendkívül instabil és hajlamos a hibákra az összes támogatott Android verzióban, ezt követően újra kell indítani.

Másodszor, Alenának van egy gyakori hibája a szabadon álló orosz hangtalan betűk, például a lágy és kemény jelek kiejtésének hiányával.

A pozitív tulajdonságok közül kiemelhetjük azt a tényt, hogy kiváló minőségű hangról van szó, amely ugyanakkor nemcsak egyszeri szövegszerkesztési feladatokra, hanem a képernyőolvasók folyamatos munkájára is alkalmas, mivel rendelkezik egy gyorsabb válasz, mint az SVOX motorok, és nincsenek problémái a szabadon álló latin betűk olvasásával.

A latin betűkkel írt szöveg olvasása az angol nyelv szabályai szerint történik, bár a kiejtés rendkívül távol áll a helyességtől.

Alena maximális sebessége nem túl nagy, így azok, akik szeretik a gyors munkát, nagy valószínűséggel csalódni fognak.

A kezdéshez először töltse le a Play Marketről az általános Acapela TTS Voices motort, amelynek menüjéből válassza ki az Önt érdeklő hangot. Ezután a megnyíló menüben kattintson a "Vásárlás" gombra, és menjen át a szokásos vásárlási eljárásra, majd nyissa meg újra ennek a hangnak a menüjét, és töltse be a szintetizátort a "Letöltés" gombra kattintva.

Captin TTS motor

Az Android operációs rendszer alatt Anatolij Kamynin a szűk körökben széles körben ismert Captain beszédszintetizátort hordozta.

Az írás idején a termék a nyilvános tesztelés szakaszában van, de már most egyesek a rendszer fő hangjaként használják.

A meglévő hiányosságok és sajátos jellemzők közül a következőket lehet megjegyezni.

Először is, egyes eszközökön a szintetizátor megismétli a szövegrész első karakterét, ami enyhe dadogás hatását kelti a mondatok elején.

A pozitív tulajdonságok közül megemlíthetjük a rekord sebességű válaszlehetőséget, amely meghaladja az összes létező analógot, valamint a rugalmasabb konfiguráció lehetőségét, különösen a nem ábécés karakterek olvasásának részleteinek többlépcsős kijelzését: ritka írásjelekből minden űrkarakterhez.

A latin szöveg szintetizátor általi olvasása szigorúan a latin szabályok szerint történik, amely az olvasás vonatkozó elveinek ismeretében lehetővé teszi, hogy szinte bármilyen nyelvvel dolgozzon a latin írásmód alapján.

Ami a beszéd sebességét illeti, a kapitány díjakat is igényelhet, amelyek a legmagasabb eredményeket adják ki.

Rendszerkövetelmények: Android 2.2–3.0.

Rendszerkövetelmények: Android 4.0 vagy újabb.

eSpeak TTS

Az Androidra kifejlesztett speciális szoftverek egyik fő fejlesztője, az Eyes-Free Project közösség a jól ismert, nem kereskedelmi eSpeak beszédszintetizátort hozta át ebbe az operációs rendszerbe.

Mint a demonstrációból hallható, orosz nyelvű beszédének számos jelentős hiányossága van.

Először is, az orosz szövegben a szintetizátor nem olvas nagybetűket, amint az a fenti bejegyzésben a "Hello, Me, My, Details" szavakkal történt.

Másodszor, az eSpeak a szintetizátorhoz érkező cirill karakterek teljes karakterláncát sok apró töredékre bontja, amelyek több vagy akár egy betűből állnak. Mi magyarázza az ilyen rongyos beszédet. Ez különösen észrevehető a szavak végén lévő lágy jel jelenlétében, amelyet szinte mindig külön olvasnak.

Harmadszor, az audiojel általános minősége meglehetősen alacsony, ami különösen fejhallgató használatakor figyelhető meg.

A pozitív tulajdonságok közül az analógokhoz képest valamivel magasabb válaszsebességet jegyezhetünk meg, valamint főleg ingyen.

A latin szöveg olvasása ezen a szintetizátoron az angol nyelv szabályai szerint történik, és elfogadható minőségű.

Ami a maximális beszédsebességet illeti, az eSpeak sajnos nem büszkélkedhet magas arányokkal, így ezen az oldalon nem kell sokat várnia tőle.

Rendszerkövetelmények: Android 2.2 vagy újabb.

Milena a Mobile Accessibility RU csomagban

Ez a Vocolazer beszédszintetizátor nem egy univerzális hangmotor, amely az Android TTS szolgáltatásba van beépítve, hanem az orosz nyelvű Mobile Accessibility szoftverkomplexum beépített összetevője a képernyő eléréséhez.

A szintetizátor meglehetősen magas hangminőséggel és tisztességes válaszsebességgel rendelkezik, bár e szempont átfogó tesztelését bonyolítja a motor beépítése egy adott alkalmazásba.

Általánosságban elmondható, hogy ez egy nagyon jó minőségű beszédszintézis megoldás, amely sok más platformról is ismert, de vannak hátrányai is.

Először is, mivel a Milena be van ágyazva a Code Factory termékbe, a felhasználó dolgozhat vele akár a mobil kisegítő lehetőségek környezetében, akár az Android rendszerben, de csak az MA képernyőolvasó használatakor.

Másodszor, Milena hangját néhány betű sajátos kiejtése jellemzi, például a „h” betű, a szomszédos betűk bizonyos konfigurációival, ami különösen a „megjelölt” szóban figyelhető meg, ami gyakran használják felületek hangoztatásakor.

Pozitívumként említhetjük azt a tényt is, hogy a Mobile Accessibility csomag beépített szintetizátora miatt a felhasználó finomabb beállításokkal rendelkezik, mint az Android hangrendszer szolgáltatása, például az írásjelek olvasásának beállítása vagy szimbólumok fonetikus olvasása.

Milena az angol nyelv szabályai szerint olvassa a latin szöveget, de a kiejtés helyessége gyakran meglehetősen alacsony szinten van, bár az általános szabályokat nagyjából betartják.

A beszéd sebességét tekintve ez az egyik leggyorsabb szintetizátor.

SVOX SVOX Classic TTS

Egy másik megoldás két kereskedelmi orosz nyelvű hangot kínál az SVOX-tól.

A különbségek közül csak Yuri hangjának gazdagabb alacsony frekvenciáit, valamint véleményünk szerint helyesebb intonációit lehet megjegyezni. Igaz, itt érdemes megemlíteni Jurij beszédének finom hibáit is a sziszegő mássalhangzók kiejtésekor, amelyek például a "pont" szó "h" betűjéhez viszonyítva láthatók.

Ami az általános jellemzőket illeti, amint a demo fájlokból hallható, itt a szintézis minősége meglehetősen magas, és az olvasható információkat nagy nehézségek nélkül észlelik. Ezeknek a hangoknak azonban számos hátránya is van.

Először is, a szintetizátor gyakran kimondja a szövegrészleteket, amelyek betűk és nem ábécés karakterek kombinációi, karakterről karakterre, és nem együtt, ahogy az a "www.site" link részével történt. Ez az e-mail címeken és egyszerűen a szövegen is megjelenik, ahol például a SMS-ekben nem tartják be egyértelműen a szóközök beállításának szabályait.

Másodszor, szövegbevitelkor az I, V, X, L, C, D és M betűket római számként olvassa fel a szintetizátor, ami rendkívül nehéz egy vak felhasználó számára, aki nem csak könyvek olvasására használja a TTS -t, hanem teljesen működik, kényelmes. Sőt, a római számok olvasása is hibákat szenved, például az MI -t 101 -nek, nem pedig 1001 -nek tekintik.

Negyedszer, a szintetizátor egésze alacsonyabb reakciósebességgel rendelkezik, mint sok analóg, bár rendkívül jelentéktelen különbséggel.

Sajnos, amikor a latin szöveg olvasásáról van szó, az SVOX hangjai nem dicsekedhetnek jó érthetőséggel.

Amint az a demófelvételből is hallható, az SVOX általában a latin ábécét olvassa a latin olvasási szabályok szerint, de helyenként megpróbálja angolul kiejteni, például a "voice" szót "voike" -ként olvassák, nem "hang".

A maximális sebesség tekintetében ezekre a hangokra sem jellemző a magas arány.

Rendszerkövetelmények: SVOX Classic Text to Speech Engine és Android 2.1 vagy újabb.

TTS Online

Ez a szintetizátor, amelyet Szergej Nechiporenko fejlesztett ki és ingyenesen forgalmaz, egy felhőszolgáltatás, amely a Google TTS API -t használja munkájában. Lényegében a program nem foglalkozik beszédszintézissel, csak beágyazódik az Android hangszolgáltatásba, szöveges információkat küld a Google szerverére és lejátssza a visszaadott hangjelet.

Ez ahhoz vezet, hogy a szintetizátor működéséhez aktív, megfelelően magas adatátviteli sebességű internetkapcsolatra van szükség.

Amint az a demó hangfelvételből is hallható, a Google TTS Katya SVOX -tól már ismerős hangját használja, így ugyanazokkal a funkciókkal rendelkezik, mint az SVOX Classic TTS felülvizsgálata.

Külön érdemes csak megjegyezni, hogy a TTS Online nem támogatja a beszédsebesség beállítását, így a felhasználónak meg kell békülnie a nyugodt tempóval.

Ezen túlmenően, az írás idején a TTS Online nem támogatja az Android 4.0.x Ice Cream Sandwich környezetben végzett munkát, és a fejlesztő szerint ezen a belátható jövőben nem terveznek változtatni.

Rendszerkövetelmények: Android 2.2–3.x.

Összefoglaló

Az alábbiakban egy összefoglaló táblázat található a meglévő orosz nyelvű beszédszintetizátorokról az Android operációs rendszer számára, amelyek tükrözik az olyan jellemzőket, mint a hangminőség, a latin szöveg olvasására vonatkozó szabályok és a maximális beszédsebesség.

A szövegfelolvasó alkalmazások kényelmes és megbízható asszisztensek az Android felhasználók számára. Segítségükkel "megszólaltathatja" az alkalmazásokat a világ legnépszerűbb nyelvein, beállíthatja a hangszínt és egyéb fontos paramétereket, valamint hallgathatja a különböző szavak hangját. A legtöbb TTS Android -alkalmazás ingyenesen elérhető, azonban az egyes hangok és funkciók telepítéséért külön kell fizetni. Kiválasztottuk az Ön számára legkényelmesebb beszédszintetizátorokat, amelyeket letölthet honlapunkról.

Google beszédszintézis


műfaj Műszerek
Értékelés 4,1
Telepítések 1 000 000 000–5 000 000 000
A fejlesztő Google LLC
orosz nyelv van
Értékelések 1 107 289
Változat 3.14.9
Apk méret 14,7 MB


A legnépszerűbb és megfizethető TTS segédprogram, sok Android -eszközzel kompatibilis. A program segítségével elolvashatja a képernyőn megjelenő szöveget, valamint számos fontos funkciót elvégezhet:

  • Beszéljen könyveket a Google Play Könyvek alkalmazásban.
  • Fordítson és mondjon szavakat innen:.
  • Kapcsolja be a hangutasításokat a TalkBack szolgáltatás segítségével.

Aktiválhatja a Text-to-Speech alkalmazást a Google-tól közvetlenül az eszközén. Ehhez nyissa meg a "Beállítások" menüpontot, ahol lépjen a "Nyelv és beviteli módszerek" alszakaszba, és ott - "Beszédszintézis". Válassza ki a Google szövegfelolvasó motorját, és az alkalmazás automatikusan aktiválódik.

A program több mint 40 nyelvet támogat, beleértve az angol, orosz, francia, német, japán, spanyol, dán, hindi és még sok más nyelvet. A segédprogram legújabb verziója 3 új nyelvet ad hozzá- román, észt és szlovák, valamint általában javítja a hangminőséget.

Acapela TTS hangok


műfaj Kapcsolat
Értékelés 3,5
Telepítések 100 000–500 000
A fejlesztő Az Acapela Group S.A.
orosz nyelv Nem
Értékelések 3 883
Változat 6.0.0.2
Apk méret 9,3 MB


Egy másik kiváló minőségű beszédszintetizátor Androidra, amely elérhető portálunkon. A program shareware, és mielőtt megvásárolná az alkalmazást, online meghallgathatja a férfi és női hangok demó verzióit. A segédprogram lehetővé teszi olyan programok vásárlását és telepítését, amelyek kiváló minőségű hanggal rendelkeznek, például Google TalkBack, fordítók és hírszinkronizálás.

Egy hang kiválasztásához és beállításához az alkalmazásban lépjen be a menübe, majd nyomja meg és tartsa lenyomva néhány másodpercig a hangot. Sárga csillag ikon jelenik meg a kiválasztott hang mellett, és alapértelmezés szerint be van állítva. Most már használhatja ezt a programot kedvenc könyvolvasójával.

Az Acapela TTS Voices alkalmazás a következő lépésekkel aktiválható.

  • Töltse le a szolgáltatást webhelyünkről vagy a Google Play portálról.
  • Az alkalmazás telepítése után kattintson a program ikonra. Győződjön meg arról, hogy rendelkezik internetkapcsolattal.
  • Nézze meg a szerverről letöltött szavazatok listáját.
  • Kattintson az egyes hangokkal szemben lévő menüre, ahol meghallgathatja saját szövegét, vagy közvetlenül a vásárláshoz léphet.
  • Vásárlás és fizetés után a hang letöltődik, és bármikor használhatja.

Az Acapela TTS Voices App kompatibilis az Android OS 2.2 és újabb verzióival.

TTS Voice vokalizátor


műfaj Munka
Értékelés 3,3
Telepítések 500 000–1 000 000
A fejlesztő Kódgyár
orosz nyelv van
Értékelések 3 405
Változat 2.0.8
Apk méret 5,4 MB


Beszédszintetizátor angol nyelvű menüvel. A program integrált TTS motorral rendelkezik, amely több mint 50 nyelvet támogat. A szolgáltatás előnyösen kiemelkedik kellemes és tiszta hangzással, amelynek hangzása tetszés szerint állítható be.

A Vocalizer lehetővé teszi a népszerű Android -alkalmazások, például könyvek és rehabilitációs szoftverek hangját.

Érdemes megjegyezni a Vocalizer TTS Voice egyéb fontos jellemzőit:

  • 50 nyelv és 100 féle hang támogatása.
  • Emoji támogatás (tudtad, mi ez?).
  • Hangos szavak a szótárakban.
  • Olvasási sebesség beállítások.
  • Az írásjelek hangbeállításai.

Miután telepítette a programot az eszközére, a "Nyelv és beviteli módok"-Szövegfelolvasás-"Beállítások" menüben aktiválhatja azt, és beállíthatja a Vocalizer TTS-t alapértelmezett rendszerként.

Az alkalmazás kompatibilis az Android rendszer 4.0 -s verziójától.

Ha tetszett ez az alkalmazás, és hasonló alkalmazásokat keres, nézze meg az áttekintést. Ha pedig egy ismeretlen országban tartózkodik, és nem érzi a szöveg hangját, akkor le kell fordítania ezt a szöveget - lefényképezheti és lefordíthatja.

Értékelés: / 44
Részletek Kategória: Android. Kutatás és fejlesztés. Frissítve 2018.02.12. 10:54 Megtekintve: 37086

2. oldal a 3 -ból

Az orosz hang telepítése és konfigurálása CoolReader fel kell venni Android(hang). Android(jó, nem frissítve a 4-es verzióra) már sok van erre, de sajnos a fejlesztők CoolReader a régi hagyományok és hangok hívei. Ezért egyenrangúnak kellett lennem a már rajtam lévőkkel Galaxy Note: Samsung TTSés Pico tts, tegyen még egyet TTS - SVOX Classic TTS(otthon nyitunk Piaci játékés ott találjuk SVOX Classic TTS, ingyenesen terjesztik, ami nem mondható el a hozzá tartozó hangokról). Telepítetted? Menj beállítások, ott - Hangbemenet és -kimenet, Szöveg konvertálása beszéddé... Jelölje be a négyzetet Mindig használja a lehetőségeimet... És kapcsolja be (jelölőnégyzet újra) SVOX Classic TTS.

AHTUNG, AHTUNG! Rosen, freebie, ne legyél tompa és utasítsa el az automatikus frissítéseket és frissítéseket SVOX Classic TTSúgy általában Orosz női hang különösen .

Indítsa el a CoolReader programot, válassza ki a rendszermenüből Lehetőségek/Hangosan olvas... És ennyi ... Úgy működik, mint a személyi számítógépeken. Hangos és jó. Nem csuklik. Elég gyorsan beállítottam a sebességet, kicsit kellemesebb lett egy női robot hangját hallgatni. De nekem megteszi. Míg munkába vezetek, könyvet hallgatok, és még a munkahelyemen is, amikor meglátogatok egy kegyetlen apróságot: fejhallgatót a fülemben, eszközt a zsebemben, és néha kopogok a billentyűkön, nehogy felhívja a figyelmet a figyelmes főnököket a billentyűzet csicsergésének hiányában.

Nyelvmotorok és szintetizátorok ( TTS szöveg-beszéd) az orosz nyelv számára soha nem volt valami tökéletes. Az angolokkal ellentétben, akiknek fejlődése folyamatosan és folyamatosan ment végbe, a férfihang több mint tíz éve a hazai szintetizátorok legjobb képviselője. Nikolay az Acapela cégtől. Az elmúlt években két egészen tisztességes női variánssal versenyzett - Alena (Acapela) és Katerina, később - Katerina II (ScanSoft RealSpeak).

A mindennapi használathoz némi erőfeszítésre volt szükség, és a mobil platformok, elsősorban az Android számára, csak személyi számítógéppel együtt voltak alkalmasak, és kényszerítették a szöveg hangossá desztillálását, hogy később lejátszhassák egy szabványos MP3 -lejátszóval a végkészüléken.

Némi reményt a fejlődésre, mint gyakran, a jó Google adta, lásd anyagunkat:
... Egészen a közelmúltig a keresőóriás maximális lehetőségei a szintetizátorukkal végzett online munkára korlátozódtak. Az eredmény őszintén szólva nem volt valami forradalmi. Példát talál a Google API TTS működésére a klubról szóló általános információknál.

Számos más megoldás is készült, amelyeket közvetlenül az okostelefonokhoz használtak:

  • A Pico TTS alapértelmezés szerint biztosított - nincs orosz nyelv
  • IVONA Text-to-Speech-sajnos az orosz nyelv támogatása még nem valósult meg, bár Tatyana hivatalos hangja megtalálható a fejlesztő weboldalán
  • SVOX Classic Text to Speech Engine- az egyetlen működő modell. A szoftver telepítése ingyenes, próbaidőszak az ismerkedéshez. Végső ár ~ 3 USD
Mint látható, csak a megoldás működik igazán. SVOX... A "valóság" ellenére a rendszer nagyon rosszul működik. Vagyis fő célja az orosz nyelvű olvasás, formailag meg is teszi, de rosszul olvas.

Így 2014. május végén megjelenik az új, teljesen ingyenes Google szövegfelolvasó szolgáltatásuk a Google Playen. Ez a termék könnyen csatlakoztatja az övbe az orosz TTS rendszereket használó múltbeli megoldásokat, ráadásul szerény véleményem szerint ez a női hang jobb, mint a személyi számítógépekhez rendelkezésre álló megoldások.

Az alábbiakban egy kis demó töredék található, amely okostelefonról lett beszerelve a Google beszédszintetizátorral - orosz női hang (eddig az egyetlen elérhető)

A rekordot az fb2 FBReader szabványos programja fogadta, csatlakoztatott olvasóval Még ha nem is érzékeli a számítógépes beszédet a könyvek szinkronizálása során, ez a megoldás lehetővé teszi a mobilbarát frissítését. A Google navigáció elkezdi olvasni az utcaneveket, a speciális alkalmazások képesek lesznek szöveges SMS -eket és számokat hangolni a bejövő hívásokhoz.

Ezenkívül, és ez nagyon hasznos a látássérültek vagy vakok számára, most már teljes mértékben használhatja a TalkBack -et - a JAWS képernyőolvasó analógját, amelyet sokan ismernek PC -ken. Ez a rendszer felismeri az Androidban rejlő lehetőségeket a telefon összes eseményének hangos értesítésére, lehetővé téve, hogy a képernyő látása nélkül vezérelje.

    A szintetizátorral végzett munka hátrányai
  • A hangoskönyvek szerelmeseinek jelentős hátránya a megnövekedett energiafogyasztás, pár óra szinkronizálás során akár az akkumulátor töltésének felét is elveszítheti
  • Csak a telefon hangszóróján keresztül történő lejátszás közben rögzített kellemetlenség: enyhe halványítás - a hangszint gyengülése a mondat elején. Vezetékes headseten, külső eszközön és bluetoothon keresztül ez a hatás hiányzik
  • Nem támogatja az egyéni ékezeteket és szótárakat

Különleges csodákra nem kell számítani - ez csak egy számítógép, azonban némi hidegség az olvasás során valakinek kellemes pihenésnek tűnhet az egyes előadóművészek túlzott teatralitása után.

A szintetizátor telepítése rendkívül egyszerű.
Bemegyünk az áruház termékoldalára. A Google Play a szokásos módon értesíti Önt az eszközével való kompatibilitásról - Android szükséges 4.0.3 és a fenti, akkor le kell tölteni és telepíteni. Ezután le kell töltenie a "hangot":
Beállítások -> Kisegítő lehetőségek -> Szövegfelolvasó funkciók kimenete -> Google Beszédszintetizátor (ne ijedjen meg a félelmetes figyelmeztetéstől, a gyártó nem fog újdonságokat megtudni Önről ezen a programon keresztül, ő már biztosan tud mindent) -> Letöltés. És a nyugalom érdekében - indítsa újra.

    UPD.: 2016. október
Az android 4.2 (jobb 4.4) és újabb verzióihoz 6 új került be az alap női hangba - három férfi és három nő: