Czym jest synteza mowy TTS?
Synteza mowy TTS z angielskiego Text-To-Speech to technologia, która zamienia tekst zapisany w formie cyfrowej na mowę generowaną komputerowo. Dzięki niej komputer może odczytywać użytkownikowi dokumenty, komunikaty, menu programu lub treść strony internetowej.
Zastosowanie
Synteza mowy jest szczególnie ważna dla osób z niepełnosprawnością wzrokową, ponieważ umożliwia korzystanie z komputera bez konieczności czytania tekstu z ekranu. Jest stosowana między innymi w:
- czytnikach ekranu,
- programach lektorskich,
- systemach nawigacji,
- asystentach głosowych,
- aplikacjach edukacyjnych.
Przykłady programów i głosów
Przykładem rozwiązania TTS jest Ivona, znana z naturalnie brzmiących głosów. Czytnik ekranu może korzystać z syntezatora mowy, aby odczytywać elementy interfejsu użytkownika.
TTS a OCR
TTS nie rozpoznaje tekstu z obrazu. Jeśli tekst znajduje się na skanie lub zdjęciu, najpierw potrzebny jest program OCR, który zamieni obraz na tekst. Dopiero potem syntezator mowy może ten tekst odczytać.
Najważniejsza informacja
TTS odpowiada za kierunek: tekst → mowa. To odróżnia je od rozpoznawania mowy, gdzie komputer przekształca wypowiedź użytkownika na tekst.