Synteza mowy TTS

Słownik kwalifikacji INF.10 - Obsługa oprogramowania i sprzętu informatycznego wspomagających użytkownika z niepełnosprawnością wzrokową

Czym jest synteza mowy TTS?

Synteza mowy TTS z angielskiego Text-To-Speech to technologia, która zamienia tekst zapisany w formie cyfrowej na mowę generowaną komputerowo. Dzięki niej komputer może odczytywać użytkownikowi dokumenty, komunikaty, menu programu lub treść strony internetowej.

Zastosowanie

Synteza mowy jest szczególnie ważna dla osób z niepełnosprawnością wzrokową, ponieważ umożliwia korzystanie z komputera bez konieczności czytania tekstu z ekranu. Jest stosowana między innymi w:
- czytnikach ekranu,
- programach lektorskich,
- systemach nawigacji,
- asystentach głosowych,
- aplikacjach edukacyjnych.

Przykłady programów i głosów

Przykładem rozwiązania TTS jest Ivona, znana z naturalnie brzmiących głosów. Czytnik ekranu może korzystać z syntezatora mowy, aby odczytywać elementy interfejsu użytkownika.

TTS a OCR

TTS nie rozpoznaje tekstu z obrazu. Jeśli tekst znajduje się na skanie lub zdjęciu, najpierw potrzebny jest program OCR, który zamieni obraz na tekst. Dopiero potem syntezator mowy może ten tekst odczytać.

Najważniejsza informacja

TTS odpowiada za kierunek: tekst → mowa. To odróżnia je od rozpoznawania mowy, gdzie komputer przekształca wypowiedź użytkownika na tekst.

Czym jest synteza mowy TTS?

Zastosowanie

Przykłady programów i głosów

TTS a OCR

Najważniejsza informacja

Pytania egzaminacyjne związane z tym terminem (5)