Audacity to świetne narzędzie do edycji i obróbki dźwięku, ale nie służy do przetwarzania tekstu na mowę (TTS). Z mojego doświadczenia, Audacity najczęściej wykorzystywany jest przez muzyków, podcasterów czy montażystów dźwięku właśnie do nagrywania, cięcia, miksowania czy stosowania różnych efektów na plikach dźwiękowych. Choć pozwala na import i eksport wielu formatów audio, to nie posiada wbudowanej funkcji konwersji tekstu na mowę, czyli zamiany tekstu pisanego na plik dźwiękowy z syntezą głosu. W przeciwieństwie do aplikacji typu Balabolka, TextAloud czy Speech2Go, które specjalizują się w technologii TTS (Text-To-Speech) oraz obsługują syntezatory głosu Microsoft SAPI i oferują eksport wygenerowanej mowy do plików audio, Audacity w tej dziedzinie pozostaje zupełnie neutralny. Często pojawia się pokusa, aby za pomocą Audacity nagrywać przez mikrofon czy nawet próbować wykorzystać inne programy do TTS i potem obrabiać dźwięk w Audacity, ale to zupełnie inny proces niż bezpośrednie przetwarzanie tekstu na dźwięk. W praktyce rozdział tych funkcji jest bardzo istotny w pracy z multimediami – jedno narzędzie do syntezy mowy, drugie do edycji gotowego dźwięku. Warto o tym pamiętać, bo to typowy standard pracy profesjonalistów branży audio i e-learningu.
Często podczas nauki narzędzi multimedialnych pojawia się pomylenie, które programy obsługują syntezę mowy (Text-To-Speech), a które służą raczej do edycji dźwięku. Balabolka, TextAloud i Speech2Go to właśnie przykłady aplikacji, które powstały z myślą o przetwarzaniu tekstu na mowę. W praktyce oznacza to, że potrafią pobrać tekst zapisany w pliku (np. TXT, DOCX, PDF) i zamienić go na mowę przy użyciu syntezatorów głosowych – zarówno tych systemowych, jak i dodatkowych. Pozwalają też często na eksport tej mowy do pliku audio w różnych popularnych formatach, co jest bardzo przydatne w pracy nad audiobookami czy materiałami e-learningowymi. Takie programy wspierają różne standardy syntezy mowy, np. Microsoft SAPI lub systemowe API wbudowane w Windows czy macOS. Typowy błąd to zakładanie, że każdy program audio ma taką funkcję – to nieprawda. Audacity pełni zupełnie inną rolę: edytor dźwięku, w którym można montować, przycinać i manipulować już istniejącymi plikami dźwiękowymi. Nie posiada mechanizmów zamiany tekstu na mowę i nie integruje się bezpośrednio z syntezatorami, co jest standardem w programach TTS. W branży raczej trzyma się zasadę specjalizacji narzędzi: do konwersji tekstu na dźwięk wykorzystuje się właśnie Balabolkę, Speech2Go czy TextAloud, a do obróbki tego, co już powstało – Audacity albo inne edytory audio. Praktyczne rozumienie tej różnicy pozwala lepiej dobierać narzędzia do potrzeb projektu i nie tracić czasu na próby uzyskania funkcji, których dany program po prostu nie ma. Mylenie tych zastosowań to naprawdę częsty i całkiem naturalny błąd, szczególnie na początku przygody z narzędziami multimedialnymi.