ხმის ძრავები Android 4. 4. რუსულენოვანი მეტყველების სინთეზატორების მიმოხილვა Android OS– ისთვის

თუ თქვენი მშობლიური ენა არ არის ინგლისური და თქვენ არ წერთ პროგრამებს მხოლოდ iPhone– ისთვის, მაშინ თქვენთვის საკმაოდ რთული იქნება, თუ გსურთ იპოვოთ შესაბამისი განვითარების ინსტრუმენტარიუმი ე.წ. მობილური "ხმის ჩართვის" პროგრამები.

ეს მიმოხილვა იძლევა კლასიფიკაციას და აღწერს ყველაზე ღირსეულ მობილურ TTS ძრავს.

მე ვაკეთებ კვლევას ვიზუალური დარღვევების მქონე ადამიანებისთვის მობილური ინტერფეისების დიზაინზე. ჩემი ერთ-ერთი პროექტის განსახორციელებლად მჭირდებოდა ხმის წარმოქმნის ძრავა მრავალენოვანი მხარდაჭერით (მინიმუმ ორი ენა- ინგლისური და რუსული). ეს იყო მეტყველების სინთეზატორის ძებნის მიზეზი.

მოხერხებულობისთვის, ჩვენ TTS ძრავებს დავყოფთ სამ კლასად:

  • კომერციული;
  • უფასო (გადაწყვეტილებები ლიცენზირებულია GPL, LGPL და სხვა "რბილი" ლიცენზიებით, როგორიცაა BSD ლიცენზია ან wxWindows ლიცენზია, რაც იძლევა პროდუქციის კომერციული განვითარების საშუალებას);
  • ჩაშენებული (თავად ოპერაციული სისტემის მიერ მოწოდებული ინსტრუმენტები).

კომერციული ძრავები

SVOX მობილური TTS

ფასი: n / a
ენები: 26, მათ შორის რუსული
მაღალი
მობილური ოპერაციული სისტემა: Android, Symbian, Windows CE / Windows Mobile, BREW

SVOX კომპანიას აქვს ტექნიკური თვალსაზრისით ყველაზე "გემრიელი" პროდუქტი - SVOX Mobile TTS. თუმცა, ვინაიდან კომპანია ძირითადად მუშაობს B2B სეგმენტში, მათ არასოდეს უპასუხიათ ჩემს ორ წერილზე, რომელიც ითხოვდა ფასს.

სათაურში ნაჩვენები ფასი ეხება ისეთ ოპერაციულ სისტემებს, როგორიცაა Windows Mobile და Symbian, მაგრამ Acapela– ს ბიზნეს მოდელი განსხვავდება თქვენს მიერ არჩეული ოპერაციული სისტემის მიხედვით. მაგალითად, ისინი ყველაზე მტკიცედ უწყობენ ხელს iOS მიმართულებას, რისთვისაც შეიქმნა ცალკე საიტი. იქ შეგიძლიათ დარეგისტრირდეთ და მიიღოთ მათი ძრავის შეფასების ვერსია უფასოდ. შიშველი SDK- ის ფასი ყოფილი iPhone OS– ისთვის 250 ევროა. ასევე, მნიშვნელოვანი პროცენტი გამოიქვითება თითოეული აპლიკაციიდან, რომელსაც ყიდით App Store– ში.

გაითვალისწინეთ, რომ Acapela უზრუნველყოფს ღრუბელზე დაფუძნებული მეტყველების სინთეზს, ასევე SDK პორტირებას ნებისმიერი პლატფორმისთვის.

უფასო ძრავები

ფლიტი
ფასი: არა
ენები: ინგლისური პლუს FestVox ენების შედგენის შესაძლებლობა
ხმის ხარისხის სუბიექტური შეფასება: დაბალი
მობილური ოპერაციული სისტემა: Android, Windows CE / Windows Mobile, iOS, PalmOS
კომერციული პროდუქტების განვითარების უნარი: დიახ (CMU ლიცენზია)

დესკტოპის სისტემების სამყაროში ფესტივალის მეტყველების სინთეზატორი კარგად არის ცნობილი. მას აქვს პორტი სახელწოდებით Flite მობილური მოწყობილობებისთვის და ჩადგმული სისტემებისთვის, რომელიც ნაწილდება მათივე X11 მსგავსი ლიცენზიით, რაც საშუალებას აძლევს პროგრამულ უზრუნველყოფას თავისუფლად გადანაწილდეს ვინმესთვის, ასევე შექმნას როგორც კომერციული, ასევე უფასო პროგრამები მის საფუძველზე. არის პორტები Windows CE / Windows Mobile, PalmOS, Android და.

WM ძრავის შედგენის ინსტრუქცია შედის განაწილებაში, მაგრამ ამ პლატფორმაზე eSpeak– ს აქვს ერთი მნიშვნელოვანი შეზღუდვა - ხმის გენერირება შესაძლებელია მხოლოდ WAV ფაილში. Windows Mobile– ისთვის აწყობილი TTS ძრავის მიღება შესაძლებელია.

ESpeak პორტირებულია Android- ზე. ამის გასინჯვის უმარტივესი გზაა Android Market– დან TTS Service Extended პროგრამის დაყენება, რომელიც საშუალებას გაძლევთ გადართოთ ჩაშენებულ ძრავასა და eSpeak– ს შორის. ეს TTS ძრავა განაწილებულია GNU GPL პირობებით.

ჩაშენებული გადაწყვეტილებები

ჩაშენებული გადაწყვეტილებები წარმოდგენილია მხოლოდ Symbian და Android– ში. გაურკვეველი მიზეზის გამო, Microsoft– მა ჩამოართვა მობილური ოპერაციული სისტემის შესაბამისი პროგრამირების ინტერფეისი (MS SAPI).
სიმბიანი

ფასი: არა
ენები: ინგლისური
ხმის ხარისხის სუბიექტური შეფასება: უკიდურესად დაბალი
კომერციული პროდუქტების განვითარების უნარი: დიახ

Symbian Foundation– ის ჩამონტაჟებული TTS იმალება CMdaAudioPlayerUtility კლასში. მიუხედავად იმისა, რომ ის არაფერს ამბობს ამაზე, ის მაინც გაძლევთ მეტყველების სინთეზის საშუალებას. სამწუხაროდ, რუსული ენა არ არის მხარდაჭერილი. ინგლისური მეტყველების თაობის ხარისხი ძალიან დაბალია. მომზადების გარეშე, საკმაოდ რთულია იმის გაგება, თუ რა თქვა მან ზუსტად.

დამატებითი ენის პაკეტები ხელმისაწვდომია ჩამოსატვირთად, მაგრამ მხარდაჭერილი ტელეფონების სია ძალიან მცირეა. პაკეტების დაყენებამ რუსულ ენაზე Symbain OS S60 5th მოწყობილობაზე, არ მისცა მოსალოდნელი შედეგები, ჩაშენებული TTS არ ლაპარაკობდა რუსულად.

გაითვალისწინეთ, რომ არსებობს საკმაოდ მოსახერხებელი API გაფართოება სახელწოდებით NSS TTS Utility API, რომლის აღწერილობაც მოიძიება

მეტყველების სინთეზატორი არის ბრმა კომპიუტერის მომხმარებლისთვის ეკრანის შინაარსის შესახებ ინფორმაციის მოპოვების მთავარი საშუალება და როდესაც ალტერნატივა არ არსებობს ბრაილის ეკრანის სახით, ის ზოგადად ერთადერთია. გამომდინარე იქიდან, რომ Android პლატფორმაზე ტაქტილური ეკრანებით მუშაობის მხარდაჭერა ჯერ კიდევ ადრეულ სტადიაზეა, მხედველობის დარღვევის მქონე მომხმარებლებისათვის ტექსტის მეტყველების მნიშვნელობა კიდევ უფრო დიდი ხდება.

ამ წერის დროს, არსებობს რამოდენიმე რუსული მეტყველების სინთეზის გადაწყვეტა, რომელიც ხელმისაწვდომია Android OS მომხმარებლებისთვის სინთეზის განსხვავებული ხარისხით და ნაკლოვანებებით. გეპატიჟებით უკეთ გაეცნოთ მათ და მოუსმინოთ მათ ხმას.

ვინაიდან Android სისტემა მომხმარებელს არ აძლევს მეტყველების სინთეზატორების "ფრენისას" გადართვის შესაძლებლობას, ხშირად წარმოიქმნება სიტუაცია, როდესაც ერთ ხმოვან ძრავას უწევს მრავალენოვანი ტექსტების წაკითხვა, ყოველ შემთხვევაში რუსულისა და ინგლისურის თანდასწრებით. ინგლისურ ინტერფეისზე სრული გადასვლაც კი არ წყვეტს ამ პრობლემას, ვინაიდან რუსულენოვანი ვებ გვერდების ან შეტყობინებების წასაკითხად, თქვენ მაინც უნდა გადახვიდეთ რუსული მეტყველების სინთეზატორიზე, მენიუს ბოლომდე. გარდა ამისა, მეტყველების სინთეზატორებთან მუშაობა საერთოდ ჩამორჩება ეკრანიდან მონაცემების ვიზუალურ აღქმას, ასე რომ ბევრი გამოცდილი ბრმა მომხმარებელი ამჯობინებს TTS– ს წაკითხვის მაქსიმალურ სიჩქარეზე ამ ჩამორჩენის კომპენსირებას.

ამის გათვალისწინებით, ამ მიმოხილვაში ჩვენ ასევე დიდ ყურადღებას მივაქცევთ არა მხოლოდ მეტყველების სინთეზის ხარისხს, როგორც ასეთს, არამედ ისეთ ასპექტებს, როგორიცაა ლათინური ტექსტის კითხვა და მეტყველების სიჩქარე, რაც მნიშვნელოვანია ადამიანებისთვის, რომლებიც იყენებენ ტექსტს- ეკრანის მკითხველში გამოსვლა.

მიმოხილვის ბოლოს შეგიძლიათ ნახოთ არსებული გადაწყვეტილებების შეფასების შემაჯამებელი ცხრილი სამი ძირითადი პარამეტრისთვის: სინთეზის ხარისხი, მეტყველების სიჩქარე და ლათინური ტექსტის წაკითხვის მხარდაჭერა.

Acapela TTS ხმები

Acapela Group– მა თავისი ათეული თავისი მეტყველების სინთეზატორი გადაიტანა Android ოპერაციული სისტემაში, რომელთა შორისაა ალენას ცნობილი რუსული ხმა. ზოგადად, მეტყველების სინთეზის ხარისხის თვალსაზრისით, ეს კომერციული გადაწყვეტა საკმაოდ მაღალ დონეზეა, მაგრამ პროდუქტი არ არის მოკლებული უამრავ ნაკლოვანებას, თუმცა, სამართლიანობისთვის, უნდა აღინიშნოს, რომ იმ დროს მიმოხილვის დაწერისას მას აქვს ბეტა სტატუსი.

პირველი, მთელი ძრავა უკიდურესად არასტაბილურია და მიდრეკილია შეცდომებისკენ ყველა მხარდაჭერილ Android ვერსიაზე, რის შემდეგაც უნდა გადატვირთოთ.

მეორეც, ალენას აქვს საერთო შეცდომა თავისუფალი რუსული უხმო ასოების გამოთქმის არარსებობაში, როგორიცაა რბილი და მყარი ნიშნები.

პოზიტიური მახასიათებლებისგან ჩვენ შეგვიძლია გამოვყოთ ის ფაქტი, რომ ეს არის მაღალი ხარისხის ხმა, რომელიც ამავე დროს შესაფერისია არა მხოლოდ ტექსტის შეფასების ერთჯერადი ამოცანებისთვის, არამედ ეკრანის მკითხველებში მუდმივი მუშაობისთვის, რადგან მას აქვს უფრო სწრაფი რეაგირება ვიდრე SVOX ძრავებს და არ აქვს მათი პრობლემები დამოუკიდებელი ლათინური ასოების კითხვისას.

ლათინური ასოებით დაწერილი ტექსტის წაკითხვა ხორციელდება ინგლისური ენის წესების მიხედვით, თუმცა გამოთქმით, რომელიც უკიდურესად შორს არის სწორიდან.

ალენას მაქსიმალური სიჩქარე არ არის ძალიან მაღალი, ასე რომ, ვისაც უყვარს სწრაფი მუშაობა, სავარაუდოდ იმედგაცრუებული დარჩება.

დასაწყებად, ჯერ ჩამოტვირთეთ Acapela TTS Voices ძრავა Play Market– დან, რომლის მენიუდან უნდა შეარჩიოთ თქვენთვის საინტერესო ხმა. შემდეგ, მენიუში, რომელიც იხსნება, დააჭირეთ ღილაკს "ყიდვა" და გაიარეთ სტანდარტული შესყიდვის პროცედურა, შემდეგ გახსენით ამ ხმის მენიუ და ჩატვირთეთ სინთეზატორი ღილაკზე "გადმოწერა".

Captin TTS ძრავა

Android ოპერაციული სისტემის ქვეშ, ანატოლი კამინინმა გადაიტანა კაპიტანი მეტყველების სინთეზატორი, რომელიც ფართოდ ცნობილია ვიწრო წრეებში.

ამ წერის დროს, პროდუქტი საჯარო ტესტირების ეტაპზეა, მაგრამ უკვე ზოგი იყენებს მას, როგორც სისტემის მთავარ ხმას.

არსებული ნაკლოვანებებიდან და სპეციფიკური მახასიათებლებიდან შეიძლება აღინიშნოს შემდეგი.

პირველ რიგში, ზოგიერთ მოწყობილობაზე, სინთეზატორი დუბლიკატირებს ტექსტის სეგმენტის პირველ პერსონაჟს, რაც ფრაზების დასაწყისში ქმნის მცირედ დაბნეულ ეფექტს.

დადებითი მახასიათებლებისგან, ჩვენ შეგვიძლია აღვნიშნოთ რეაგირების სიჩქარე, რომელიც აღემატება ყველა არსებულ ანალოგს, ასევე უფრო მოქნილი კონფიგურაციის შესაძლებლობას, კერძოდ, არაბანური სიმბოლოების წაკითხვის დეტალების მრავალსაფეხურიან მითითებას: იშვიათი სასვენი ნიშნებიდან თითოეული სივრცის პერსონაჟისთვის.

სინთეზატორის მიერ ლათინური ტექსტის წაკითხვა ხორციელდება მკაცრად ლათინური წესების შესაბამისად, რაც კითხვის შესაბამისი პრინციპების ცოდნით საშუალებას გაძლევთ იმუშაოთ თითქმის ნებისმიერ ენაზე ლათინური დამწერლობის საფუძველზე.

მეტყველების სიჩქარის თვალსაზრისით, კაპიტანს ასევე შეუძლია მიიღოს პრიზები, რაც იძლევა ყველაზე მაღალ შედეგებს.

სისტემის მოთხოვნები: Android 2.2 -დან 3.0 -მდე.

სისტემის მოთხოვნები: Android 4.0 ან უფრო მაღალი.

eSpeak TTS

Android– ის სპეციალიზირებული პროგრამული უზრუნველყოფის ერთ – ერთმა მთავარმა შემქმნელმა, Eyes-Free Project საზოგადოებამ, ამ ოპერაციულ სისტემაში გადაიტანა ცნობილი არაკომერციული eSpeak მეტყველების სინთეზატორი.

როგორც თქვენ შეგიძლიათ გაიგოთ დემონსტრაციიდან, მის გამოსვლას რუსულ ენაზე აქვს არაერთი მნიშვნელოვანი ნაკლი.

პირველ რიგში, რუსულ ტექსტში სინთეზატორი არ კითხულობს დიდ სიმბოლოებს, როგორც ეს მოხდა ზემოთ ჩანაწერში სიტყვებით "გამარჯობა, მე, ჩემო, დეტალები".

მეორეც, eSpeak დაყოფს კირიული სიმბოლოების მთელ სტრიქონს, რომელიც სინთეზაიერთან მიდის მრავალ პატარა ფრაგმენტად, რომელიც შედგება რამდენიმე ან თუნდაც ერთი ასოსგან. რა განმარტავს ამხელა გამოსვლას. ეს განსაკუთრებით შესამჩნევია სიტყვების ბოლოს რბილი ნიშნის არსებობისას, რომელიც თითქმის ყოველთვის ცალკე იკითხება.

მესამე, აუდიო სიგნალის საერთო ხარისხი საკმაოდ დაბალია, რაც განსაკუთრებით შესამჩნევია ყურსასმენების გამოყენებისას.

დადებითი თვისებებისგან, ჩვენ შეგვიძლია აღვნიშნოთ პასუხის უფრო მაღალი სიჩქარე ანალოგებთან შედარებით, ისევე როგორც, ძირითადად, უფასოდ.

ამ სინთეზატორის მიერ ლათინური ტექსტის კითხვა ხორციელდება ინგლისური ენის წესების შესაბამისად და მისაღები ხარისხისაა.

რაც შეეხება მეტყველების მაქსიმალურ სიჩქარეს, eSpeak, სამწუხაროდ, ვერ დაიკვეხნის მაღალი მაჩვენებლებით, ამიტომ ამ მხრიდანაც არ უნდა ელოდოთ მისგან ბევრს.

სისტემის მოთხოვნები: Android 2.2 ან უფრო მაღალი.

მილენა მობილური წვდომის RU პაკეტში

Vocolazer– ის ეს მეტყველების სინთეზატორი არ არის Android სისტემის TTS სერვისში ჩაშენებული უნივერსალური ხმის ძრავა, არამედ რუსულენოვანი მობილური წვდომის პროგრამული უზრუნველყოფის კომპლექსის ჩამონტაჟებული კომპონენტი ეკრანზე წვდომისათვის.

სინთეზატორს აქვს საკმაოდ მაღალი ხმის ხარისხი, ასევე რეაგირების ღირსეული სიჩქარე, თუმცა ამ ასპექტის ყოვლისმომცველი ტესტირება გართულებულია ძრავის ჩამონტაჟებული სპეციფიკურ პროგრამაში.

ზოგადად, ეს არის ძალიან მაღალი ხარისხის მეტყველების სინთეზის გადაწყვეტა, რომელიც ცნობილია მრავალი სხვა პლატფორმიდან, მაგრამ მას ასევე აქვს გარკვეული ნაკლოვანებები.

ჯერ ერთი, რადგან მილენა ჩართულია Code Factory პროდუქტში, მომხმარებელს შეუძლია მასთან მუშაობა მობილური წვდომის გარემოში ან Android სისტემაში, მაგრამ მხოლოდ MA ეკრანის წამკითხვის გამოყენებისას.

მეორეც, თავად მილენას ხმა ახასიათებს ზოგიერთი ასოების თავისებურ გამოთქმას, მაგალითად, ასო "თ", მეზობელი ასოების ზოგიერთი კონფიგურაციით, რაც, კერძოდ, შეინიშნება სიტყვაში "აღინიშნება", რაც ასეა ხშირად გამოიყენება ინტერფეისების ხმის მიცემისას.

დადებით მხარეზე, ჩვენ ასევე შეგვიძლია აღვნიშნოთ ის ფაქტი, რომ მობილური წვდომის პაკეტში ჩაშენებული სინთეზატორის გამო, მომხმარებელს აქვს უფრო დახვეწილი პარამეტრები ვიდრე Android ხმოვანი სისტემის სერვისით გათვალისწინებული, მაგალითად, პუნქტუაციის ნიშნების წაკითხვის მორგება ან სიმბოლოების ფონეტიკური კითხვა.

მილენა კითხულობს ლათინურ ტექსტს ინგლისური ენის წესების მიხედვით, მაგრამ გამოთქმის სისწორე ხშირად საკმაოდ დაბალ დონეზეა, თუმცა ზოგადი წესები უხეშად არის დაცული.

მეტყველების სიჩქარის თვალსაზრისით, ეს არის ერთ -ერთი ყველაზე სწრაფი სინთეზატორი.

SVOX SVOX კლასიკური TTS

სხვა გამოსავალი გთავაზობთ SVOX– ის ორ კომერციულ რუსულენოვან ხმას.

განსხვავებებიდან შეიძლება აღინიშნოს მხოლოდ იურის ხმის უფრო მდიდარი დაბალი სიხშირე, ასევე, ჩვენი აზრით, მისი უფრო სწორი ინტონაციები. მართალია, აქ ასევე უნდა აღინიშნოს იურის მეტყველების დახვეწილი დეფექტები ხმამაღალი თანხმოვნების წარმოთქმისას, რაც, მაგალითად, შეიძლება ნახოთ ასო "ჰ" -სთან მიმართებაში სიტყვაში "წერტილი".

რაც შეეხება ზოგად მახასიათებლებს, როგორც თქვენ გესმით დემო ფაილებიდან, აქ სინთეზის ხარისხი საკმაოდ მაღალია და წასაკითხი ინფორმაცია აღიქმება დიდი სირთულის გარეშე. ამასთან, ამ ხმებს ასევე აქვთ მრავალი უარყოფითი მხარე.

პირველი, სინთეზატორი ხშირად გამოთქვამს ტექსტის ფრაგმენტებს, რომლებიც წარმოადგენს ასოებისა და ანბანური სიმბოლოების კრებულს, პერსონაჟების მიხედვით და არა ერთად, როგორც ეს მოხდა ბმულის "www.site" ნაწილის შემთხვევაში. ის ასევე ვლინდება ელექტრონული ფოსტის მისამართებზე და უბრალოდ ტექსტზე, სადაც ფართების დადგენის წესები მკაფიოდ არ არის დაცული, მაგალითად, SMS– ში.

მეორეც, ტექსტის შეყვანისას ასოები I, V, X, L, C, D და M იკითხება როგორც რომაული რიცხვები სინთეზატორით, რაც უკიდურესად რთულია ბრმა მომხმარებლისთვის, რომელიც იყენებს TTS არა მხოლოდ წიგნების წასაკითხად, არამედ აბსოლუტურად ყველა სამუშაო. კომფორტული უფრო მეტიც, რომაული რიცხვების კითხვა ასევე განიცდის შეცდომებს, მაგალითად, MI ითვლება ნომრად 101 და არა 1001.

მეოთხე, სინთეზატორს მთლიანობაში აქვს უფრო დაბალი რეაქციის სიჩქარე, ვიდრე ბევრ ანალოგს, თუმცა უკიდურესად უმნიშვნელო განსხვავებით.

სამწუხაროდ, რაც შეეხება ლათინური ტექსტის კითხვას, SVOX ხმებს არ შეუძლიათ დაიკვეხნონ კარგი გაგებით.

როგორც დემო ჩანაწერიდან გესმით, SVOX ზოგადად კითხულობს ლათინურ ანბანს ლათინური კითხვის წესების მიხედვით, მაგრამ ადგილები ცდილობს გამოთქვას იგი ინგლისურად, მაგალითად, სიტყვა "ხმა" იკითხება როგორც "voike", არა "ხმა".

მაქსიმალური სიჩქარის თვალსაზრისით, ამ ხმებს ასევე არ ახასიათებთ მაღალი მაჩვენებლები.

სისტემის მოთხოვნები: SVOX Classic Text To Speech Engine და Android 2.1 და უფრო მაღალი.

TTS ონლაინ რეჟიმში

ეს სინთეზატორი, შემუშავებული სერგეი ნეჩიპორენკოს მიერ და უფასოდ განაწილებული, არის ღრუბლოვანი სერვისი, რომელიც იყენებს Google TTS API- ს თავის მუშაობაში. არსებითად, პროგრამა არ არის ჩართული მეტყველების სინთეზში, ის მხოლოდ Android ხმოვან სერვისშია ჩართული, აგზავნის ტექსტურ ინფორმაციას Google სერვერზე და უკრავს დაბრუნებულ აუდიო სიგნალს.

ეს იწვევს იმ ფაქტს, რომ სინთეზატორის მუშაობისთვის საჭიროა აქტიური ინტერნეტ კავშირი მონაცემთა გადაცემის საკმარისად მაღალი მაჩვენებლით.

როგორც თქვენ შეგიძლიათ მოისმინოთ დემო აუდიოჩანაწერიდან, Google TTS იყენებს კატიას უკვე ნაცნობ ხმას SVOX– დან, ამიტომ მას აქვს ყველა ერთი და იგივე თვისება, რაც ხაზგასმულია SVOX Classic TTS მიმოხილვაში.

ცალკე, მხოლოდ უნდა აღინიშნოს, რომ TTS Online არ უჭერს მხარს მეტყველების სიჩქარის დადგენას, ამიტომ მომხმარებელს მოუწევს შეეგუოს მის თავისუფალ ტემპს.

გარდა ამისა, ამ წერის დროს, TTS Online არ უჭერს მხარს Android 4.0.x Ice Cream Sandwich- ს და, დეველოპერის თქმით, უახლოეს მომავალში ამის შეცვლა არ იგეგმება.

სისტემის მოთხოვნები: Android 2.2 -დან 3.x.

Შემაჯამებელი

ქვემოთ მოცემულია Android OS– ის არსებული რუსულენოვანი მეტყველების სინთეზატორების შემაჯამებელი ცხრილი, რომელიც ასახავს ისეთ მახასიათებლებს, როგორიცაა ხმის ხარისხი, ლათინური ტექსტის წაკითხვის მოქმედი წესები და მეტყველების მაქსიმალური სიჩქარე.

ტექსტის მეტყველების პროგრამები მოსახერხებელი და საიმედო ასისტენტებია Android მომხმარებლებისთვის. მათი დახმარებით თქვენ შეგიძლიათ "გაჟღეროთ" პროგრამები მსოფლიოს ყველაზე პოპულარულ ენებზე, შეცვალოთ ხმის ტონი და სხვა მნიშვნელოვანი პარამეტრები, ასევე მოუსმინოთ სხვადასხვა სიტყვების ხმას. TTS Android პროგრამების უმეტესობა ხელმისაწვდომია უფასოდ, თუმცა ცალკეული ხმისა და მახასიათებლების ინსტალაციისთვის დამატებითი თანხის გადახდა მოგიწევთ. ჩვენ შევარჩიეთ თქვენთვის ყველაზე მოსახერხებელი მეტყველების სინთეზატორი, რომელიც შეგიძლიათ გადმოწეროთ ჩვენს ვებგვერდზე.

Google მეტყველების სინთეზი


ჟანრი ინსტრუმენტები
რეიტინგი 4,1
ინსტალაციები 1 000 000 000–5 000 000 000
დეველოპერი Google LLC
რუსული ენა იქ არის
შეფასებები 1 107 289
ვერსია 3.14.9
Apk ზომა 14.7 MB


ყველაზე პოპულარული და ხელმისაწვდომი TTS პროგრამა, რომელიც თავსებადია ბევრ Android მოწყობილობასთან. პროგრამის დახმარებით თქვენ შეგიძლიათ წაიკითხოთ ტექსტი ეკრანზე, ასევე შეასრულოთ რიგი მნიშვნელოვანი ფუნქციები:

  • ისაუბრეთ წიგნებზე Google Play Books აპში.
  • თარგმნეთ და ისაუბრეთ სიტყვებიდან.
  • ჩართეთ ხმოვანი მოთხოვნები TalkBack სერვისის გამოყენებით.

თქვენ შეგიძლიათ გაააქტიუროთ ტექსტი მეტყველების აპი Google– დან პირდაპირ თქვენს მოწყობილობაზე. ამისათვის გახსენით მენიუს პუნქტი "პარამეტრები", სადაც გადადით ქვეთავში "ენა და შეყვანის მეთოდები" და იქ - "მეტყველების სინთეზი". შეარჩიეთ Google- ის ტექსტის მეტყველების ძრავა და აპლიკაცია ავტომატურად გააქტიურდება.

პროგრამას აქვს 40 -ზე მეტი ენა, მათ შორის ინგლისური, რუსული, ფრანგული, გერმანული, იაპონური, ესპანური, დანიური, ჰინდი და მრავალი სხვა. პროგრამის უახლესი ვერსია ამატებს 3 ახალ ენას- რუმინულს, ესტონურს და სლოვაკურს, ასევე ზოგადად გააუმჯობესებს ხმის ხარისხს.

Acapela TTS ხმები


ჟანრი კავშირი
რეიტინგი 3,5
ინსტალაციები 100 000–500 000
დეველოპერი Acapela Group S.A.
რუსული ენა არა
შეფასებები 3 883
ვერსია 6.0.0.2
Apk ზომა 9.3 MB


Android– ის კიდევ ერთი მაღალი ხარისხის მეტყველების სინთეზატორი, რომელიც ხელმისაწვდომია ჩვენს პორტალზე. პროგრამა გაზიარებულია და პროგრამის შეძენამდე შეგიძლიათ მოუსმინოთ მამაკაცისა და ქალის ხმების დემო ვერსიებს ინტერნეტით. პროგრამა საშუალებას გაძლევთ შეიძინოთ და დააინსტალიროთ პროგრამები მაღალი ხარისხის ხმით, როგორიცაა Google TalkBack, მთარგმნელები და ახალი ამბების დუბლირება.

აპლიკაციაში ხმის შესარჩევად და დასაყენებლად, შედით მენიუში, შემდეგ დააჭირეთ და გააჩერეთ ხმა რამდენიმე წამით. ყვითელი ვარსკვლავის ხატი გამოჩნდება არჩეული ხმის გვერდით და დაყენდება ნაგულისხმევად. ახლა თქვენ შეგიძლიათ გამოიყენოთ ეს პროგრამა თქვენი საყვარელი წიგნის მკითხველთან ერთად.

Acapela TTS Voices პროგრამა შეიძლება გააქტიურდეს შემდეგი ნაბიჯებით.

  • ჩამოტვირთეთ სერვისი ჩვენს ვებგვერდზე ან Google Play პორტალზე.
  • პროგრამის დაყენების შემდეგ დააჭირეთ პროგრამის ხატულას. დარწმუნდით, რომ გაქვთ ინტერნეტ კავშირი.
  • გადახედეთ ხმების ჩამონათვალს, რომლებიც გადმოწერილია სერვერიდან.
  • დააწკაპუნეთ თითოეული ხმის საპირისპირო მენიუზე, სადაც შეგიძლიათ მოუსმინოთ საკუთარ ტექსტს ან პირდაპირ შესყიდვაზე.
  • შეძენისა და გადახდის შემდეგ, ხმა გადმოწერილი იქნება და მისი გამოყენება ნებისმიერ დროს შეგიძლიათ.

Acapela TTS Voices აპლიკაცია თავსებადია Android OS 2.2 და ზემოთ.

ვოკალიზატორი TTS Voice


ჟანრი მუშაობა
რეიტინგი 3,3
ინსტალაციები 500 000–1 000 000
დეველოპერი კოდის ქარხანა
რუსული ენა იქ არის
შეფასებები 3 405
ვერსია 2.0.8
Apk ზომა 5.4 MB


მეტყველების სინთეზატორი მენიუსთან ერთად ინგლისურ ენაზე. პროგრამას აქვს ინტეგრირებული TTS ძრავა, რომელიც მხარს უჭერს 50 -ზე მეტ ენას. მომსახურება დადებითად გამოირჩევა სასიამოვნო და სუფთა ხმით, რომლის ტემბრი შეიძლება მორგებული იყოს თქვენი სურვილისამებრ.

ვოკალიზატორი გაძლევთ საშუალებას გამოხატოთ პოპულარული Android პროგრამები, როგორიცაა წიგნები და სარეაბილიტაციო პროგრამები.

Vocalizer TTS Voice– ის სხვა მნიშვნელოვანი მახასიათებლები აღსანიშნავია:

  • მხარდაჭერა 50 ენაზე და 100 სახის ხმაზე.
  • ემოციის მხარდაჭერა (იცით რა არის?).
  • ლექსიკონებში ჟღერს სიტყვა.
  • კითხვის სიჩქარის პარამეტრები.
  • პუნქტუაციის ხმის პარამეტრები.

მას შემდეგ რაც პროგრამა დაინსტალირდება თქვენს მოწყობილობაზე, შეგიძლიათ გააქტიუროთ ის პარამეტრების მენიუდან "ენა და შეყვანის მეთოდები"-Text-To-Speech და დააყენეთ Vocalizer TTS როგორც ნაგულისხმევი სისტემა.

პროგრამა თავსებადია Android სისტემის ვერსიასთან 4.0 და შემდგომ.

თუ მოგეწონათ ეს აპლიკაცია და ეძებთ მსგავს პროგრამებს, გადახედეთ მიმოხილვას. და თუ თქვენ იმყოფებით უცნობ ქვეყანაში და არ ხართ ტექსტის ხმოვანი მოქმედების უნარი, თქვენ უნდა თარგმნოთ ეს ტექსტი - შეგიძლიათ გადაიღოთ ფოტო და თარგმნოთ იგი.

რეიტინგი: / 44
დეტალები კატეგორია: Android. Კვლევა და განვითარება. განახლებულია 12.02.2018 10:54 ნახვა: 37086

გვერდი 2 – დან 3 – დან

რუსული ხმის დაყენება და კონფიგურაცია CoolReaderმისი ჩაცმაა საჭირო Android(ხმა). Android(კარგი, არ არის განახლებული 4 ვერსიამდე) უკვე ბევრია ამისათვის, მაგრამ, სამწუხაროდ, დეველოპერები CoolReaderძველი ტრადიციებისა და ხმების მიმდევრები. ამიტომ, მე უნდა ვიყო თანაბარი მათთან, ვინც უკვე ჩემზეა გალაქტიკური რვეული: Samsung TTSდა პიკო ტც, დააყენე კიდევ ერთი TTS - SVOX კლასიკური TTS(ჩვენ ვხსნით სახლში ბაზრის თამაშიდა იქ ვიპოვით SVOX კლასიკური TTS, იგი უფასოდ ვრცელდება, რაც არ შეიძლება ითქვას მის ხმებზე). დაინსტალირებული გაქვს? Წადი პარამეტრები, იქ - ხმის შეყვანა და გამოსვლა, გადააქციე ტექსტი მეტყველებაში... შეამოწმეთ ყუთი ყოველთვის გამოიყენეთ ჩემი პარამეტრები... და ჩართე (მონიშვნა ისევ) SVOX კლასიკური TTS.

აჰტუნგი, აჰტუნგი! როზენ, ფრიბი, ნუ იქნები ბლაგვი და უარი თქვით ავტომატურ განახლებებზე და განახლებებზე, როგორც SVOX კლასიკური TTSზოგადად, ასეა რუსული ქალის ხმაკერძოდ .

გაუშვით CoolReader, აირჩიეთ სისტემის მენიუში Პარამეტრები/წაიკითხეთ ხმამაღლა... და ეს არის ის ... მუშაობს პერსონალურ კომპიუტერებზე. ხმამაღლა და კარგად. არ იჩხუბებს. სიჩქარე საკმაოდ სწრაფად დავაყენე, ცოტა უფრო სასიამოვნო გახდა ქალი რობოტის ხმის მოსმენა. მაგრამ ეს ჩემთვის გამოდგება. სანამ მანქანით მივდივარ სამსახურში, ვუსმენ წიგნს და სამსახურშიც კი, როდესაც ვსტუმრობ სასტიკ წვრილმანებს: ყურსასმენი ყურში, მოწყობილობა ჯიბეში და ხანდახან ვაკაკუნებ გასაღებებს, ისე რომ არ მივაქციო ყურადღება დაკვირვებული ავტორიტეტები მათი მხრიდან კლავიატურის ჭიკჭიკის არარსებობით.

ენის ძრავები და სინთეზატორი ( TTSტექსტი-მეტყველება) რუსული ენისთვის არასოდეს ყოფილა რაიმე სრულყოფილი. ინგლისელებისგან განსხვავებით, რომელთა განვითარებაც გამუდმებით და სტაბილურად მიმდინარეობდა, მამრობითი ხმა ათ წელზე მეტი ხნის განმავლობაში იყო შინაური სინთეზატორების საუკეთესო წარმომადგენელი. ნიკოლაიკომპანია Acapela– სგან. ბოლო წლებში მან კონკურენცია გაუწია ორ საკმაოდ ღირსეულ ქალ ვარიანტს - ალენა (Acapela) და კატერინა, მოგვიანებით - კატერინა II (ScanSoft RealSpeak).

ყოველდღიური გამოყენებისთვის, გარკვეული ძალისხმევა იყო საჭირო, ხოლო მობილური პლატფორმებისთვის, უპირველეს ყოვლისა, Android, ისინი შესაფერისი იყო მხოლოდ პერსონალურ კომპიუტერთან ერთად, რაც აიძულებდა ტექსტის გადაცემას ბგერაში, რათა შემდგომში ეთამაშა ის სტანდარტულ Mp3 პლეერს ბოლო მოწყობილობაზე.

პროგრესის გარკვეული იმედი, როგორც ხშირად ხდება, კარგმა კორპორაციამ Google მისცა, იხილეთ ჩვენი მასალა:
... ბოლო დრომდე, საძიებო გიგანტის მიერ მოწოდებული მაქსიმალური შესაძლებლობები შემოიფარგლებოდა მათი სინთეზატორით ონლაინ მუშაობით. შედეგი, გულწრფელად რომ ვთქვათ, არ იყო რაღაც რევოლუციური. მაგალითი იმისა, თუ როგორ მუშაობს Google API TTS, შეგიძლიათ იხილოთ კლუბის შესახებ ზოგად ინფორმაციაში.

ასევე იყო რამდენიმე სხვა გადაწყვეტა, რომლებიც პირდაპირ მორგებული იყო სმარტფონებთან გამოსაყენებლად:

  • Pico TTS მოწოდებულია სტანდარტულად - რუსული ენა არ არის
  • IVONA Text-to-Speech-სამწუხაროდ, რუსული ენის მხარდაჭერა ჯერ არ განხორციელებულა, თუმცა ტატიანას ოფიციალური ხმა წარმოდგენილია დეველოპერის ვებგვერდზე
  • SVOX კლასიკური ტექსტი მეტყველების ძრავა- ერთადერთი სამუშაო მოდელი. პროგრამული უზრუნველყოფის დაყენება უფასოა, საცდელი პერიოდი გაცნობისთვის. საბოლოო ფასი 3 აშშ დოლარი
როგორც ხედავთ, მხოლოდ გამოსავალი ნამდვილად მუშაობს. SVOX... ყველა "რეალობისთვის", სისტემა ძალიან ცუდად მუშაობს. ანუ, მისი მთავარი მიზანია რუსულ ენაზე კითხვა, ოფიციალურად ამას აკეთებს, მაგრამ კარგად არ კითხულობს.

ასე რომ, 2014 წლის მაისის ბოლოს, მათი ახალი აბსოლუტურად უფასო Google Text-to-Speech გამოჩნდება Google Play- ში. ეს პროდუქტი ადვილად აერთებს წარსულ გადაწყვეტილებებს რუსული TTS სისტემების გამოყენებით, უფრო მეტიც, ჩემი მოკრძალებული აზრით, ეს ქალი ხმა უკეთესია, ვიდრე პერსონალური კომპიუტერებისთვის ხელმისაწვდომი გადაწყვეტილებები.

ქვემოთ მოცემულია სმარტფონიდან მიღებული მცირე დემო ფრაგმენტი Google მეტყველების სინთეზატორით დაინსტალირებული - რუსული ქალის ხმა (ჯერჯერობით ერთადერთი ხელმისაწვდომი)

ჩანაწერი მიღებულია სტანდარტული პროგრამის საშუალებით fb2 FBReader- თან დაკავშირებული მკითხველით მაშინაც კი, თუ თქვენ არ აღიქვამთ კომპიუტერულ მეტყველებას წიგნების დუბლირების კონტექსტში, ეს გადაწყვეტა საშუალებას მოგცემთ განაახლოთ თქვენი მობილური მეგობარი. Google ნავიგაცია დაიწყებს თქვენთვის ქუჩების სახელების კითხვას, სპეციალური აპლიკაციები შეძლებენ SMS ტექსტისა და ნომრების გამოძახებას შემომავალი ზარებისთვის.

გარდა ამისა, და ეს ძალიან გამოსადეგია მხედველობით დაქვეითებული ან ბრმა მომხმარებლებისთვის, ახლა უკვე შეგიძლიათ სრულად გამოიყენოთ TalkBack - JAWS ეკრანის წამკითხველის ანალოგი, რომელიც ბევრისთვის ნაცნობია კომპიუტერებზე. ეს სისტემა აცნობიერებს Android- ის პოტენციალს ტელეფონზე ყველა მოვლენის ხმოვანი შეტყობინებისათვის, რაც საშუალებას გაძლევთ გააკონტროლოთ იგი ეკრანის ნახვის გარეშე.

    სინთეზატორით მუშაობის უარყოფითი მხარეები
  • აუდიოწიგნების მოყვარულისთვის მნიშვნელოვანი მინუსი არის ენერგიის მოხმარების გაზრდა, რამოდენიმე საათის დუბლირებისას თქვენ დაკარგავთ ბატარეის დატენვის ნახევარს
  • უსიამოვნება ჩაწერილია მხოლოდ ტელეფონის დინამიკის დაკვრის დროს: უმნიშვნელო ჩაქრობა - ხმის დონის შესუსტება წინადადების დასაწყისში. სადენიანი ყურსასმენის, გარე მოწყობილობისა და bluetooth– ის საშუალებით, ეს ეფექტი არ არსებობს
  • არ არის მხარდაჭერილი აქცენტები და ლექსიკონები

განსაკუთრებული სასწაულების მოლოდინი არ არის - ეს მხოლოდ კომპიუტერია, თუმცა კითხვის დროს სიცივე შეიძლება ვინმეს სასიამოვნო დასვენებად მოეჩვენოს ინდივიდუალური შემსრულებლების თეატრალურობის გადაჭარბების შემდეგ.

სინთეზატორის დაყენება ძალიან მარტივია.
ჩვენ მივდივართ მაღაზიის პროდუქტის გვერდზე. როგორც წესი, Google Play შეგატყობინებთ თქვენს მოწყობილობასთან თავსებადობის შესახებ - საჭიროა Android 4.0.3 და ზემოთ, შემდეგ მოხდება გადმოწერა და ინსტალაცია. შემდეგ თქვენ უნდა ჩამოტვირთოთ "ხმა":
პარამეტრები -> ხელმისაწვდომობა -> ტექსტის მეტყველების ფუნქციის გამომუშავება -> Google მეტყველების სინთეზატორი (ნუ შეგაშფოთებთ საშინელი გაფრთხილება, მწარმოებელი ვერაფერს გაიგებს თქვენს შესახებ ამ პროგრამის საშუალებით, მან უკვე ყველაფერი ზუსტად იცის) -> ჩამოტვირთვა და სიმშვიდისთვის - გადატვირთეთ.

    UPD.: 2016 წლის ოქტომბერი
Android 4.2 (უკეთესი 4.4) და უფრო მაღალი ვერსიისთვის 6 ახალი დაემატა ქალის ძირითად ხმას - სამი მამაკაცი და სამი ქალი: