Mesin suara untuk Android 4. Ulasan synthesizer ucapan berbahasa Rusia untuk OS Android

Jika bahasa ibu Anda bukan bahasa Inggris dan Anda tidak menulis aplikasi hanya untuk iPhone, maka akan cukup sulit bagi Anda jika Anda ingin menemukan perangkat pengembangan yang cocok untuk apa yang disebut. aplikasi seluler "berkemampuan suara".

Ulasan ini memberikan klasifikasi dan menjelaskan jenis mesin TTS seluler yang paling layak.

Saya melakukan penelitian tentang desain antarmuka seluler untuk orang-orang dengan gangguan penglihatan. Untuk mengimplementasikan salah satu proyek saya, saya membutuhkan mesin penghasil suara dengan dukungan multibahasa (setidaknya dua bahasa - Inggris dan Rusia). Ini adalah alasan untuk mencari synthesizer pidato.

Untuk kenyamanan, kami akan membagi mesin TTS menjadi tiga kelas:

  • komersial;
  • gratis (solusi berlisensi di bawah GPL, LGPL dan lebih banyak lisensi "lunak" seperti Lisensi BSD atau Lisensi wxWindows, yang memungkinkan pengembangan produk secara komersial);
  • built-in (alat yang disediakan oleh sistem operasi itu sendiri).

Mesin komersial

SVOX Mobile TTS

Harga: n / a
Bahasa: 26, termasuk Rusia
tinggi
OS Seluler: Android, Symbian, Windows CE / Windows Mobile, BREW

Perusahaan SVOX memiliki produk paling "lezat" dari sudut pandang teknis - SVOX Mobile TTS. Namun, karena perusahaan beroperasi terutama di segmen B2B, mereka tidak pernah menanggapi dua surat saya yang menanyakan harga.

Harga yang ditampilkan di header mengacu pada sistem operasi seperti Windows Mobile dan Symbian, tetapi model bisnis Acapela berbeda tergantung pada OS yang Anda pilih. Misalnya, mereka paling kuat mempromosikan arah iOS, di mana situs terpisah telah dibuat. Di sana Anda dapat mendaftar dan mendapatkan versi evaluasi mesin mereka secara gratis. Harga SDK telanjang untuk OS iPhone sebelumnya adalah 250 €. Selain itu, persentase yang cukup besar dipotong dari setiap aplikasi yang Anda jual di App Store.

Perhatikan bahwa Acapela menyediakan sintesis ucapan berbasis cloud, serta porting SDK untuk platform apa pun.

Mesin gratis

terbang
Harga: tidak
Bahasa: Bahasa Inggris ditambah kemampuan untuk mengkompilasi bahasa FestVox
Penilaian subjektif kualitas suara: rendah
OS Seluler: Android, Windows CE / Windows Mobile, iOS, PalmOS
Kemampuan untuk mengembangkan produk komersial: ya (lisensi CMU)

Di dunia sistem desktop, synthesizer ucapan Festival sangat terkenal. Ini memiliki port yang disebut Flite untuk perangkat seluler dan sistem tertanam, yang didistribusikan di bawah lisensi seperti X11 mereka sendiri, yang memungkinkan perangkat lunak untuk didistribusikan kembali secara bebas kepada siapa pun, serta untuk membangun aplikasi komersial dan gratis atas dasarnya. Ada port untuk Windows CE / Windows Mobile, PalmOS, Android dan.

Instruksi untuk mengkompilasi mesin untuk WM disertakan dalam distribusi, tetapi pada platform ini eSpeak memiliki satu batasan signifikan - pembuatan suara hanya dimungkinkan dalam file WAV. Mesin TTS rakitan untuk Windows Mobile dapat diperoleh.

ESpeak di-porting ke Android. Cara termudah untuk mencobanya adalah dengan menginstal aplikasi TTS Service Extended dari Android Market, yang memungkinkan Anda untuk beralih antara mesin bawaan dan eSpeak. Mesin TTS ini didistribusikan di bawah ketentuan GNU GPL.

Solusi tertanam

Solusi tersemat hanya ada di Symbian dan Android. Untuk beberapa alasan yang tidak diketahui, Microsoft telah mencabut OS selulernya dari antarmuka pemrograman yang sesuai (MS SAPI).
Symbian

Harga: tidak
Bahasa: Inggris
Penilaian subjektif kualitas suara: sangat rendah
Kemampuan untuk mengembangkan produk komersial: ya

TTS tertanam dari Symbian Foundation bersembunyi di kelas CMdaAudioPlayerUtility. Meskipun tidak mengatakan apa-apa tentang itu, itu masih memungkinkan Anda untuk mensintesis ucapan. Sayangnya, bahasa Rusia tidak didukung. Kualitas generasi pidato bahasa Inggris sangat rendah. Tanpa persiapan, agak sulit untuk memahami apa yang sebenarnya dikatakannya.

Paket bahasa tambahan tersedia untuk diunduh, tetapi daftar telepon yang didukung sangat sedikit. Menginstal paket untuk bahasa Rusia pada perangkat yang menjalankan Symbain OS S60 5th tidak memberikan hasil yang diharapkan, TTS bawaan tidak berbicara bahasa Rusia.

Saya perhatikan bahwa ada ekstensi API yang cukup nyaman yang disebut NSS TTS Utility API, deskripsinya dapat ditemukan

Alat penyintesis suara adalah sarana utama untuk memperoleh informasi tentang isi layar bagi pengguna komputer tunanetra, dan bila tidak ada alternatif dalam bentuk tampilan braille, biasanya itu adalah satu-satunya. Karena fakta bahwa dukungan untuk bekerja dengan tampilan taktil di platform Android masih dalam tahap awal, pentingnya text-to-speech untuk pengguna dengan gangguan penglihatan menjadi semakin besar.

Pada saat penulisan ini, ada beberapa solusi sintesis ucapan bahasa Rusia yang tersedia untuk pengguna OS Android dengan kualitas sintesis yang berbeda dan serangkaian kekurangan. Kami mengundang Anda untuk mengenal mereka lebih baik dan mendengarkan suara mereka.

Karena sistem Android tidak memberi pengguna kemampuan untuk beralih synthesizer ucapan dengan cepat, situasi sering muncul ketika satu mesin suara harus membaca teks multibahasa, setidaknya dengan kehadiran bahasa Rusia dan Inggris. Bahkan transisi lengkap ke antarmuka bahasa Inggris tidak menyelesaikan masalah ini, karena untuk membaca halaman web atau pesan berbahasa Rusia, Anda masih harus beralih ke synthesizer ucapan Rusia, menelusuri menu sepenuhnya. Selain itu, bekerja dengan synthesizer ucapan pada umumnya lebih rendah dalam kinerja dibandingkan persepsi visual data dari layar, sehingga banyak pengguna tunanetra yang berpengalaman lebih memilih untuk menyesuaikan TTS ke kecepatan membaca maksimum untuk mengimbangi kelambatan ini.

Mengingat hal ini, dalam tinjauan ini kami juga akan memberikan perhatian yang cukup besar tidak hanya pada kualitas sintesis ucapan itu sendiri, tetapi juga pada aspek-aspek seperti pembacaan teks Latin dan kecepatan bicara, yang penting bagi orang yang menggunakan teks- to-speech di pembaca layar.

Di akhir ulasan, Anda dapat menemukan tabel ringkasan penilaian solusi yang ada untuk tiga parameter utama: kualitas sintesis, kecepatan bicara, dan dukungan untuk membaca teks Latin.

Suara Acapela TTS

Grup Acapela telah mem-porting beberapa lusin synthesizer ucapannya ke sistem operasi Android, di antaranya adalah suara Alena Rusia yang terkenal. Secara umum, dalam hal kualitas sintesis ucapan, solusi komersial ini berada pada tingkat yang cukup tinggi, tetapi produk ini bukannya tanpa sejumlah kekurangan, meskipun, demi keadilan, perlu dicatat bahwa pada saat itu menulis review itu memiliki status beta.

Pertama, seluruh mesin sangat tidak stabil dan rentan terhadap kesalahan pada semua versi Android yang didukung, setelah itu harus dimulai ulang.

Kedua, Alena memiliki kesalahan umum dengan kurangnya pengucapan huruf-huruf tanpa suara Rusia yang berdiri bebas, seperti tanda-tanda lunak dan keras.

Dari fitur-fitur positifnya, kami dapat menyoroti fakta bahwa itu adalah suara berkualitas tinggi, yang pada saat yang sama cocok tidak hanya untuk tugas mencetak teks satu kali, tetapi juga untuk pekerjaan konstan di pembaca layar, karena memiliki respon lebih cepat daripada mesin SVOX dan tidak memiliki masalah dengan membaca huruf Latin yang berdiri sendiri.

Membaca teks yang ditulis dengan huruf latin dilakukan sesuai dengan kaidah bahasa Inggris, meskipun dengan pengucapan yang sangat jauh dari kata benar.

Kecepatan maksimum Alena tidak terlalu tinggi, sehingga mereka yang menyukai pekerjaan cepat kemungkinan besar akan kecewa.

Untuk memulai, pertama-tama unduh mesin Acapela TTS Voices umum dari Play Market, di menu di mana Anda harus memilih suara yang Anda minati. Kemudian, di menu yang terbuka, klik tombol "Beli" dan ikuti prosedur pembelian standar, lalu buka kembali menu suara ini dan muat synthesizer dengan mengklik tombol "Unduh".

Mesin Captin TTS

Di bawah sistem operasi Android, Anatoly Kamynin mem-porting synthesizer ucapan Kapten, yang dikenal luas di kalangan sempit.

Pada saat penulisan ini, produk tersebut sedang dalam tahap uji publik, namun kini sudah ada yang menggunakannya sebagai suara utama sistem.

Dari kekurangan-kekurangan dan ciri-ciri khusus yang ada, berikut ini dapat diperhatikan.

Pertama, pada beberapa perangkat, synthesizer menduplikasi karakter pertama dari segmen teks, yang menciptakan sedikit efek gagap di awal frasa.

Dari fitur-fitur positif, kami dapat mencatat kecepatan respons yang direkam, melampaui semua analog yang ada, serta kemungkinan konfigurasi yang lebih fleksibel, khususnya, indikasi multi-tahap dari detail membaca karakter non-abjad: dari karakter tanda baca yang langka untuk setiap karakter ruang.

Pembacaan teks Latin oleh synthesizer dilakukan secara ketat sesuai dengan aturan Latin, yang, dengan pengetahuan tentang prinsip-prinsip membaca yang relevan, memungkinkan Anda untuk bekerja dengan hampir semua bahasa berdasarkan skrip Latin.

Dalam hal kecepatan bicara, Kapten juga dapat mengklaim hadiah, memberikan beberapa hasil tertinggi.

Persyaratan sistem: Android 2.2 hingga 3.0.

Persyaratan sistem: Android 4.0 atau lebih tinggi.

eSpeak TTS

Salah satu pengembang utama perangkat lunak khusus untuk Android, komunitas Proyek Bebas Mata, mem-porting synthesizer ucapan eSpeak non-komersial yang terkenal ke sistem operasi ini.

Seperti yang dapat Anda dengar dari demonstrasi, pidatonya dalam bahasa Rusia memiliki sejumlah kekurangan yang signifikan.

Pertama, dalam teks Rusia, synthesizer tidak membaca karakter huruf besar, seperti yang terjadi pada entri di atas dengan kata-kata "Halo, Saya, Saya, Detail".

Kedua, eSpeak membagi seluruh string karakter Cyrillic yang tiba di synthesizer menjadi banyak fragmen kecil, yang terdiri dari beberapa atau bahkan satu huruf. Apa yang menjelaskan pidato yang begitu kasar. Ini terutama terlihat dengan adanya tanda lunak di akhir kata, yang hampir selalu dibaca secara terpisah.

Ketiga, kualitas keseluruhan sinyal audio agak rendah, yang terutama terlihat saat menggunakan headphone.

Dari kualitas positif, kami dapat mencatat kecepatan respons yang sedikit lebih tinggi dibandingkan dengan analog, serta, terutama, gratis.

Synthesizer ini membaca teks Latin sesuai dengan aturan bahasa Inggris dan dengan kualitas yang dapat diterima.

Mengenai kecepatan bicara maksimum, sayangnya, eSpeak tidak dapat membanggakan kecepatan tinggi, jadi dari sisi ini Anda tidak boleh berharap banyak darinya.

Persyaratan sistem: Android 2.2 atau lebih tinggi.

Milena dalam paket Mobile Accessibility RU

Synthesizer ucapan dari Vocolazer ini bukan mesin suara universal yang dibangun ke dalam layanan TTS sistem Android, tetapi komponen built-in dari kompleks perangkat lunak Aksesibilitas Seluler berbahasa Rusia untuk akses layar.

Synthesizer memiliki kualitas suara yang cukup tinggi, serta kecepatan respon yang baik, meskipun pengujian komprehensif dari aspek ini diperumit oleh built-in mesin ke dalam aplikasi tertentu.

Secara umum, ini adalah solusi sintesis ucapan berkualitas tinggi, yang dikenal dari banyak platform lain, tetapi juga memiliki beberapa kelemahan.

Pertama, karena Milena tertanam dalam produk Code Factory, pengguna dapat bekerja dengannya baik di dalam lingkungan Aksesibilitas Seluler, atau di sistem Android, tetapi hanya saat menggunakan pembaca layar MA.

Kedua, suara Milena sendiri dicirikan oleh pengucapan yang aneh dari beberapa huruf, misalnya, huruf "h", dengan beberapa konfigurasi huruf tetangga, yang, khususnya, diamati dalam kata "ditandai", yang begitu sering digunakan saat menyuarakan antarmuka.

Sisi positifnya, kami juga dapat mencatat fakta bahwa karena synthesizer bawaan dalam paket Aksesibilitas Seluler, pengguna memiliki pengaturan yang lebih halus daripada yang disediakan oleh layanan sistem suara Android, misalnya, menyesuaikan pembacaan tanda baca atau pembacaan fonetik simbol.

Milena membaca teks Latin sesuai dengan aturan bahasa Inggris, tetapi ketepatan pengucapan seringkali pada tingkat yang agak rendah, meskipun aturan umum secara kasar diikuti.

Dalam hal kecepatan bicara, ini adalah salah satu synthesizer tercepat.

SVOX SVOX Klasik TTS

Solusi lain menawarkan dua suara komersial berbahasa Rusia dari SVOX.

Dari perbedaannya, orang hanya dapat memperhatikan frekuensi rendah yang lebih kaya dari suara Yuri, serta, menurut pendapat kami, intonasinya yang lebih tepat. Benar, di sini juga perlu disebutkan cacat halus ucapan Yuri saat mengucapkan konsonan mendesis, yang, misalnya, dapat dilihat dalam kaitannya dengan huruf "h" dalam kata "titik".

Adapun karakteristik umum, maka, seperti yang dapat Anda dengar dari file demo, di sini kualitas sintesis cukup tinggi dan informasi yang dapat dibaca dirasakan tanpa banyak kesulitan. Namun, suara-suara ini juga memiliki sejumlah kelemahan.

Pertama, synthesizer sering mengucapkan fragmen teks, yang merupakan kombinasi huruf dan karakter non-abjad, karakter demi karakter, dan tidak bersamaan, seperti yang terjadi pada bagian tautan "www.site". Itu juga memanifestasikan dirinya pada alamat email dan hanya pada teks, di mana aturan untuk mengatur spasi tidak diamati dengan jelas, misalnya, dalam SMS.

Kedua, ketika memasukkan teks, huruf I, V, X, L, C, D dan M dibaca sebagai angka Romawi oleh synthesizer, yang sangat sulit bagi pengguna tunanetra yang menggunakan TTS tidak hanya untuk membaca buku, tetapi juga untuk benar-benar semua bekerja. nyaman. Selain itu, pembacaan angka Romawi juga mengalami kesalahan, misalnya, MI dianggap sebagai angka 101, bukan 1001.

Keempat, synthesizer secara keseluruhan memiliki kecepatan reaksi yang lebih rendah daripada banyak analog, meskipun dengan perbedaan yang sangat kecil.

Sayangnya, ketika membaca teks Latin, suara SVOX tidak dapat dibanggakan dengan kejelasan yang baik.

Seperti yang Anda dengar dari rekaman demo, SVOX umumnya membaca abjad Latin sesuai dengan aturan untuk membaca Latin, tetapi di beberapa tempat mencoba mengucapkannya dengan cara bahasa Inggris, misalnya, kata "suara" dibaca sebagai "voike", bukan "suara".

Dalam hal kecepatan maksimum, suara-suara ini juga tidak ditandai dengan kecepatan tinggi.

Persyaratan sistem: SVOX Classic Text To Speech Engine dan Android 2.1 dan lebih tinggi.

TTS Online

Synthesizer ini, dikembangkan oleh Sergei Nechiporenko dan didistribusikan secara gratis, adalah layanan cloud yang menggunakan Google TTS API dalam pekerjaannya. Intinya, program ini tidak terlibat dalam sintesis ucapan, itu hanya menyematkan dirinya dalam layanan suara Android, mengirim informasi teks ke server Google dan memutar sinyal audio yang dikembalikan.

Ini mengarah pada fakta bahwa koneksi Internet aktif dengan kecepatan transfer data yang cukup tinggi diperlukan agar synthesizer berfungsi.

Seperti yang dapat Anda dengar dari rekaman audio demo, Google TTS menggunakan suara Katya yang sudah dikenal dari SVOX, sehingga memiliki semua fitur yang sama yang disorot dalam ulasan SVOX Classic TTS.

Secara terpisah, hanya perlu dicatat bahwa TTS Online tidak mendukung pengaturan kecepatan bicara, sehingga pengguna harus menerima kecepatannya yang santai.

Selain itu, pada saat penulisan ini, TTS Online tidak mendukung pekerjaan di lingkungan Android 4.0.x Ice Cream Sandwich, dan, menurut pengembang, tidak direncanakan untuk mengubahnya di masa mendatang.

Persyaratan sistem: Android 2.2 hingga 3.x.

Ringkasan

Di bawah ini adalah tabel ringkasan synthesizer ucapan berbahasa Rusia yang ada untuk OS Android, yang mencerminkan karakteristik seperti kualitas suara, aturan yang berlaku untuk membaca teks Latin, dan kecepatan bicara maksimum.

Aplikasi text-to-speech adalah asisten yang nyaman dan andal bagi pengguna Android. Dengan bantuan mereka, Anda dapat "membunyikan" aplikasi dalam bahasa paling populer di dunia, menyesuaikan nada suara dan parameter penting lainnya, serta mendengarkan suara kata-kata yang berbeda. Sebagian besar aplikasi TTS Android tersedia secara gratis, namun Anda harus membayar ekstra untuk memasang suara dan fitur individual. Kami telah memilih synthesizer ucapan yang paling nyaman untuk Anda, yang dapat Anda unduh di situs web kami.

Sintesis ucapan Google


aliran Instrumen
Peringkat 4,1
Instalasi 1 000 000 000–5 000 000 000
Pengembang Google LLC
bahasa Rusia ada
Evaluasi 1 107 289
Versi: kapan 3.14.9
Ukuran apk 14,7 MB


Utilitas TTS paling populer dan terjangkau, kompatibel dengan banyak perangkat Android. Dengan bantuan program, Anda dapat membaca teks di layar, serta melakukan sejumlah fungsi penting:

  • Ucapkan buku di aplikasi Google Play Buku.
  • Terjemahkan dan ucapkan kata-kata dari.
  • Aktifkan perintah suara menggunakan layanan TalkBack.

Anda dapat mengaktifkan aplikasi Text-to-Speech dari Google langsung di perangkat Anda. Untuk melakukan ini, buka item menu "Pengaturan", di mana pergi ke subbagian "Bahasa dan metode input", dan di sana - "Sintesis ucapan". Pilih mesin text-to-speech Google dan aplikasi akan aktif secara otomatis.

Program ini mendukung lebih dari 40 bahasa, termasuk Inggris, Rusia, Prancis, Jerman, Jepang, Spanyol, Denmark, Hindi, dan banyak lainnya. Versi terbaru dari utilitas menambahkan 3 bahasa baru - Rumania, Estonia, dan Slovakia, serta peningkatan kualitas suara secara umum.

Suara Acapela TTS


aliran Koneksi
Peringkat 3,5
Instalasi 100 000–500 000
Pengembang Grup Acapela S.A.
bahasa Rusia Tidak
Evaluasi 3 883
Versi: kapan 6.0.0.2
Ukuran apk 9.3 MB


Synthesizer ucapan berkualitas tinggi lainnya untuk Android, yang tersedia di portal kami. Program ini adalah shareware, dan sebelum Anda membeli aplikasinya, Anda dapat mendengarkan versi demo suara pria dan wanita secara online. Utilitas ini memungkinkan Anda untuk membeli dan menginstal program dengan suara berkualitas tinggi, seperti Google TalkBack, penerjemah, dan sulih suara berita.

Untuk memilih dan mengatur suara di aplikasi, masuk ke menu, lalu tekan dan tahan suara selama beberapa detik. Ikon bintang kuning akan muncul di sebelah suara yang dipilih dan akan disetel secara default. Sekarang Anda dapat menggunakan program ini dengan pembaca buku favorit Anda.

Aplikasi Acapela TTS Voices dapat diaktifkan dengan langkah-langkah berikut.

  • Unduh layanan di situs web kami atau di portal Google Play.
  • Setelah menginstal aplikasi, klik ikon program. Pastikan Anda memiliki koneksi internet.
  • Lihat daftar suara yang diunduh dari server.
  • Klik menu di seberang setiap suara, di mana Anda dapat mendengarkan teks Anda sendiri atau langsung ke pembelian.
  • Setelah pembelian dan pembayaran, suara akan diunduh, dan Anda dapat menggunakannya kapan saja.

Acapela TTS Voices App kompatibel dengan Android OS 2.2 dan di atasnya.

Suara TTS Vokalis


aliran Kerja
Peringkat 3,3
Instalasi 500 000–1 000 000
Pengembang Pabrik kode
bahasa Rusia ada
Evaluasi 3 405
Versi: kapan 2.0.8
Ukuran apk 5,4 MB


Sebuah synthesizer pidato dengan menu dalam bahasa Inggris. Program ini memiliki mesin TTS terintegrasi yang mendukung lebih dari 50 bahasa. Layanan ini menonjol dengan suara yang menyenangkan dan bersih, yang timbrenya dapat disesuaikan dengan keinginan Anda.

Vocalizer memungkinkan Anda menyuarakan aplikasi Android populer seperti buku dan perangkat lunak rehabilitasi.

Fitur penting lainnya dari Vocalizer TTS Voice patut diperhatikan:

  • Dukungan untuk 50 bahasa dan 100 jenis suara.
  • Dukungan emoji (tahukah Anda apa itu?).
  • Kata-kata yang terdengar dalam kamus.
  • Pengaturan kecepatan membaca.
  • Pengaturan suara tanda baca.

Setelah program diinstal pada perangkat Anda, Anda dapat mengaktifkannya melalui menu pengaturan di bawah "Bahasa dan metode input" - Text-To-Speech dan mengatur Vocalizer TTS sebagai sistem default.

Aplikasi ini kompatibel dengan sistem Android versi 4.0 dan yang lebih baru.

Jika Anda menyukai aplikasi ini dan mencari aplikasi serupa, lihat ulasannya. Dan jika Anda berada di negara asing, dan Anda tidak menyukai akting suara teks, Anda perlu menerjemahkan teks ini - Anda dapat mengambil fotonya dan menerjemahkannya.

Peringkat: / 44
Detail Kategori: Android. Penelitian dan Pengembangan. Diperbarui pada 12.02.2018 10:54 Dilihat: 37086

halaman 2 dari 3

Untuk menginstal dan mengkonfigurasi suara Rusia di Pembaca Keren itu perlu dipakai Android(suara). Android(baik, tidak ditingkatkan ke versi 4) sudah memiliki banyak untuk ini, tetapi, sayangnya, para pengembang Pembaca Keren penganut tradisi dan suara lama. Oleh karena itu, saya harus setara dengan yang sudah ada di catatan galaksi: Samsung TTS dan pico tts, taruh satu lagi TTS - SVOX Klasik TTS(kami buka di rumah Permainan Pasar dan kami temukan di sana SVOX Klasik TTS, itu didistribusikan secara gratis, yang tidak dapat dikatakan tentang suara-suara itu). Sudahkah Anda menginstalnya? Pergi ke pengaturan, di sana - Masukan dan keluaran suara, Ubah teks menjadi ucapan... Centang kotak Selalu gunakan opsi saya... Dan nyalakan (kotak centang lagi) SVOX Klasik TTS.

AHTUNG, AHTUNG! Rosen, freebie, jangan blak-blakan dan tolak pembaruan dan peningkatan otomatis apa pun sebagai SVOX Klasik TTS secara umum, jadi Suara Wanita Rusia secara khusus .

Luncurkan CoolReader, pilih di menu sistem Pilihan/Bacalah dengan keras... Dan hanya itu ... Bekerja seperti pada komputer pribadi. Keras dan bagus. Tidak cegukan. Saya mengatur kecepatan cukup cepat, menjadi sedikit lebih menyenangkan untuk mendengarkan suara robot wanita. Tapi itu akan berhasil untukku. Saat saya mengemudi untuk bekerja, saya mendengarkan buku, dan bahkan di tempat kerja, ketika saya mengunjungi hal sepele yang kejam: headphone di telinga saya, perangkat di saku saya dan kadang-kadang mengetuk tombol, agar tidak menarik perhatian para bos yang jeli dengan tidak adanya kicau keyboard di pihaknya.

Mesin bahasa dan synthesizer ( TTS text-to-speech) untuk bahasa Rusia tidak pernah menjadi sesuatu yang sempurna. Tidak seperti yang berbahasa Inggris, yang perkembangannya berlangsung terus-menerus dan mantap, suara pria telah menjadi perwakilan terbaik dari synthesizer domestik selama lebih dari sepuluh tahun. Nikolay dari perusahaan Acapela. Dalam beberapa tahun terakhir, ia telah bersaing dengan dua varian wanita yang cukup baik - Alena (Acapela) dan Katerina, kemudian - Katerina II (ScanSoft RealSpeak).

Untuk penggunaan sehari-hari, beberapa upaya diperlukan, dan untuk platform seluler, terutama Android, mereka hanya cocok dengan komputer pribadi, memaksa untuk menyaring teks menjadi suara untuk kemudian memutarnya dengan pemutar Mp3 standar di perangkat akhir.

Beberapa harapan untuk kemajuan, seperti yang sering terjadi, diberikan oleh perusahaan yang baik Google, lihat materi kami:
... Sampai saat ini, peluang maksimum yang disediakan oleh raksasa pencarian terbatas pada pekerjaan online dengan synthesizer mereka. Hasilnya, sejujurnya, bukanlah sesuatu yang revolusioner. Anda dapat menemukan contoh cara kerja Google API TTS di informasi umum tentang Klub.

Ada juga beberapa solusi lain yang dirancang langsung untuk digunakan dengan ponsel cerdas:

  • Pico TTS disediakan secara default - tidak ada bahasa Rusia
  • IVONA Text-to-Speech - sayangnya, dukungan untuk bahasa Rusia belum diterapkan, meskipun suara resmi Tatyana disajikan di situs web pengembang
  • SVOX Classic Text To Speech Engine- satu-satunya model yang berfungsi. Menginstal perangkat lunak gratis, masa percobaan untuk kenalan. Harga akhir ~ 3USD
Seperti yang Anda lihat, hanya solusi yang benar-benar berfungsi SVOX... Untuk semua "kenyataan", sistem bekerja sangat buruk. Artinya, tujuan utamanya adalah membaca dalam bahasa Rusia, secara formal ia melakukannya, tetapi tidak membaca dengan baik.

Jadi, pada akhir Mei 2014, Google Text-to-Speech baru mereka yang benar-benar gratis muncul di Google Play. Produk ini dengan mudah memasukkan solusi masa lalu menggunakan sistem TTS Rusia ke dalam sabuk, apalagi, menurut pendapat saya, suara wanita ini lebih baik daripada solusi yang tersedia untuk komputer pribadi.

Di bawah ini adalah fragmen demo kecil yang diperoleh dari smartphone dengan Google speech synthesizer terpasang - suara wanita Rusia (sejauh ini satu-satunya yang tersedia)

Catatan diterima melalui program standar untuk fb2 FBReader dengan pembaca yang terhubung Bahkan jika Anda tidak melihat ucapan komputer dalam konteks membaca buku, solusi ini akan memungkinkan Anda untuk meningkatkan teman seluler Anda. Navigasi Google akan mulai membacakan nama jalan untuk Anda, aplikasi khusus akan dapat menyuarakan teks SMS dan nomor untuk panggilan masuk.

Selain itu, dan ini sangat berguna bagi pengguna tunanetra atau tunanetra, kini Anda dapat sepenuhnya menggunakan TalkBack - analog dari pembaca layar JAWS yang akrab bagi banyak orang di PC. Sistem ini menyadari potensi Android untuk pemberitahuan suara dari semua acara di telepon, memungkinkan Anda untuk mengontrolnya tanpa melihat layar.

    Kekurangan bekerja dengan synthesizer
  • Kerugian signifikan bagi pecinta buku audio adalah peningkatan konsumsi daya, dalam beberapa jam dubbing Anda akan kehilangan hingga setengah dari daya baterai
  • Gangguan yang direkam hanya selama pemutaran melalui speaker telepon: sedikit memudar - redaman tingkat suara di awal kalimat. Melalui headset berkabel, perangkat eksternal, dan bluetooth, efek ini tidak ada
  • Tidak ada dukungan untuk aksen dan kamus khusus

Keajaiban khusus tidak diharapkan - ini hanya komputer, namun, beberapa kedinginan selama membaca mungkin tampak bagi seseorang sebagai istirahat yang menyenangkan setelah kelebihan sandiwara dalam karya pemain individu.

Memasang synthesizer sangat sederhana.
Kami pergi ke halaman produk di toko. Google Play akan, seperti biasa, memberi tahu Anda tentang kompatibilitas dengan perangkat Anda - Diperlukan Android 4.0.3 dan di atasnya, maka unduh dan instalasi akan berlangsung. Maka Anda perlu mengunduh "suara":
Pengaturan -> Aksesibilitas -> Output fungsi Text-to-speech -> Google Speech Synthesizer (jangan khawatir dengan peringatan yang hebat, pabrikan tidak akan mempelajari sesuatu yang baru tentang Anda melalui program ini, dia sudah tahu segalanya dengan pasti) -> unduh. Dan untuk ketenangan pikiran - reboot.

    UPD.: Oktober 2016
Untuk android 4.2 (lebih baik 4.4) dan lebih tinggi, 6 suara baru telah ditambahkan ke suara dasar wanita - tiga pria dan tiga wanita: