SSML

Słownik kwalifikacji INF.10 - Obsługa oprogramowania i sprzętu informatycznego wspomagających użytkownika z niepełnosprawnością wzrokową

Co to jest SSML?

SSML (Speech Synthesis Markup Language) to język znaczników używany w systemach syntezy mowy TTS do sterowania sposobem odczytywania tekstu przez syntezator. Nie służy do ustawiania wyglądu tekstu ani wyboru formatu pliku audio. Jego zadaniem jest opisanie, jak tekst ma zostać wypowiedziany.

Do czego służy SSML?

Za pomocą znaczników SSML można wpływać m.in. na:

  • tempo mówienia,
  • wysokość i głośność głosu,
  • pauzy w wypowiedzi,
  • akcentowanie wyrazów,
  • sposób odczytywania liczb, dat, skrótów,
  • wymowę trudnych słów lub nazw własnych.

Przykłady znaczników

<speak>
  To jest przykład <emphasis>ważnego</emphasis> słowa.
  <break time="500ms"/>
  Czytam dalej po krótkiej pauzie.
</speak>

Znacznik <break> wstawia pauzę, a <emphasis> pozwala wyróżnić fragment wypowiedzi.

Inny przykład:

<speak>
  <prosody rate="slow" pitch="high">
    Ten fragment zostanie wypowiedziany wolniej i wyższym głosem.
  </prosody>
</speak>

Znaczenie egzaminacyjne

W pytaniach egzaminacyjnych należy pamiętać, że SSML dotyczy konfiguracji sposobu wypowiadania wybranej części tekstu. Nie odpowiada za format pliku wyjściowego, wygląd tekstu w programie ani typowe słowniki wymowy czytnika ekranu.