1. Scroll
  2. /
  3. Technologia
  4. /
  5. Syntezator mowy — co to dokładnie jest? Wszystko o syntezatorach mowy

Technologia

1 miesiąc temu

Syntezator mowy — co to dokładnie jest? Wszystko o syntezatorach mowy

Nauka Online Programy i aplikacje
4
1
0
4
1

Syntezator mowy to bardzo użyteczne narzędzie konwertujące tekst pisany na mowę. Jest nieocenionym wsparciem podczas nauki języków obcych, ale przede wszystkim, umożliwiającym komunikację osobom niepełnosprawnym ze światem zewnętrznym. 

Syntezator mowy — co to jest?

To nic innego jak narzędzie umożliwiające przetworzenie tekstu pisanego na wypowiedź głosową (synteza mowy). Rozróżniamy dwa typy syntezatorów mowy: maszynowe (urządzenia przenośne, w tym skanery czy notatniki), a także programowe (specjalne oprogramowanie komputerowe lub system operacyjny Windows, Linux, a także MacOS i systemy mobilne na smartfonach i tabletach). 

syntezator mowy

Bez względu na wykorzystany rodzaj syntezatora, w obu przypadkach można uzyskać bardzo wyraźny głos zbliżony do ludzkiego. Istnieje też możliwość wygenerowania głosu zniekształconego, który dość często jest wykorzystywany w celu ukrycia prawdziwego głosu mówcy. 

Gdzie wykorzystywane są syntezatory mowy?

Syntezatory mowy mają wiele zastosowań. Można je wykorzystać w niemal każdej dziedzinie naszego życia. Przykłady? Proszę bardzo.

Syntezator sprawdzi się rewelacyjnie jako wsparcie podczas nauki języków obcych, a nawet pomoże przetłumaczyć tekst. Najlepszym przykładem wykorzystania syntezatora mowy jest możliwość przeczytania tekstu zapisanego alfabetem Braille’a. 

Alfabet Braille'a

Proces generowania mowy na podstawie tekstu określany jest mianem TTS, czyli text-to-speech – konwertowanie tekstu na mowę jest powszechnie wykorzystywane przez osoby niewidzące (także niedowidzące) podczas korzystania z komputera. 

Dzięki temu są one w stanie zapoznać się ze swoją pocztą elektroniczną, dokumentami, a nawet sterować myszką komputerową. Właśnie dlatego jest to nieocenione narzędzie, bez którego osobom niedowidzącym byłoby o wiele trudniej korzystać z komputera.

Sprawdź: Najlepsze programy do czytania tekstu – zobacz zestawienie darmowych syntezatorów mowy online

Syntezatory mowy sprawdzą się też bardzo dobrze jako lektor czytający podpisy pod filmami czy jako system informacyjny lub alarmujący o jakimś zagrożeniu. Na pewno nie są to wszystkie możliwe zastosowania tych narzędzi.

Przyszłość syntezatorów mowy

Nikt nie wie, jaka będzie przyszłość syntezatorów mowy, ale patrząc na historię ich rozwoju, można wysnuć pewne wnioski. 

Weźmy na przykład najpopularniejszy polski syntezator mowy IVONA, który powstał na Politechnice Gdańskiej i zdobył uznanie na arenie międzynarodowej. Był tak dobry, że w 2013 roku został zakupiony przez Amazon. Ten, niewiele myśląc, przechrzcił IVONę na Alexę i tak powstał inteligentny system głosowy amerykańskiego giganta. Zapewne każdy, choć raz słyszał o możliwościach Alexy, która udziela odpowiedzi na zadane jej pytania. 

IVONA
Źródło: slideserve.com

Można założyć, że w niedalekiej przyszłości syntezatory mowy w połączeniu ze sztuczną inteligencją doprowadzą do zredukowania stanowisk pracy w wielu sektorach rynku. Sprawdzą się bowiem równie dobrze co człowiek pracujący na stanowisku recepcjonisty czy konsultanta telefonicznego. 

Wyobraź sobie, że w hotelu już od przekroczenia drzwi wita Cię sztuczna inteligencja o łagodnym głosie, która nigdy nie ma gorszych dni, a do tego nie potrzebuje przerwy — jest zatem do Twojej dyspozycji zawsze, bez względu na porę dnia czy nocy.

Jak wygląda proces syntezy mowy?

Proces syntezy mowy, a zatem przełożenie tekstu na mowę jest dość złożony, choć w głównej mierze można wyróżnić dwa etapy: przetwarzanie języka naturalnego – NLP (ang. Natural Language Processing) i cyfrowe przetwarzanie sygnału DSP (ang. Digital Signal Processing). 

W pierwszym etapie oprogramowanie do syntezy mowy musi przeanalizować cały tekst i postarać się go zrozumieć, aby następnie zapisać go za pomocą symboli graficznych (pisownia fonetyczna). Jeśli już tego dokona, w kolejnym etapie musi dobrać odpowiedni akcent i intonację, aby wypowiedziany tekst miał sens. 

Zobacz: Polski syntezator mowy Ivona — droga do międzynarodowego sukcesu

Na tym kończy się przetwarzanie języka naturalnego, a zaczyna cyfrowe przetwarzanie sygnału. Program musi przeanalizować zgromadzone dane i przetworzyć je na mowę, dopasowując do tego brzmieniowe właściwości mowy.

Aplikacja ACAT — syntezator mowy Stephena Hawkinga

Stephen Hawking był brytyjskim fizykiem teoretycznym specjalizującym się w astrofizyce. Zmagał się ze stwardnieniem zanikowym bocznym (ALS). Choroba doprowadziła do paraliżu, przez co Hawking stracił między innymi możliwość mówienia. Głos odzyskał jednak dzięki firmie Intel, która przygotowała specjalny syntezator mowy bazujący na technologii Assistive Context-Aware Toolkit (ACAT).

ACAT dla wybitnego naukowca był nie tylko głosem, ale przede wszystkim technologia ta dawała możliwość pisania książek, wygłaszania przemówień i komunikacji ze światem. To wszystko możliwe było dzięki technologii rozpoznawania twarzy użytkownika użytej, aby zrozumieć polecenia. Profesor Hawking wykorzystywał w tym celu czujnik umieszczony w policzku oraz przełącznik podczerwieni w okularach, który pozwalał na przewidywanie tego, co chciał powiedzieć.

Syntezator mowy ACAT
Źródło: osworld.pl

Oprogramowanie ACAT od ponad 5 lat jest dostępne na licencji open source, a zatem każdy może z niego korzystać i dostosowywać je do własnych potrzeb. Intel zdecydował się na udostępnienie kodu źródłowego, aby deweloperzy mogli otrzymać solidną podstawę pod narzędzia mogące poprawić jakość życia osób chorych, które mają mocno ograniczony kontakt ze światem zewnętrznym.

Najlepsze syntezatory mowy na PC

Zazwyczaj jest to narzędzie, nad którym pracuje cały sztab specjalistów. Dobrej jakości translator mowy czy aplikacja przekładająca mowę na tekst wymaga ogromnych nakładów pracy, jak również środków finansowych. Skutkuje to tym, że takich aplikacji nie jest zbyt wiele. Poniżej przedstawiamy te najciekawsze.

IVONA

Bezapelacyjnie najlepszym syntezatorem mowy jest nasz rodzimy — IVONA. Jest on oferowany wraz z niezbędnym pakietem narzędzi umożliwiających w pełni wykorzystanie jego możliwości. Oferuje cztery głosy (dwa męskie i dwa żeńskie), które charakteryzują się bardzo naturalnym brzmieniem, co w przypadku naszego języka wcale nie jest takie proste.

IVONA
Źródło: slideshare.net

Warto wspomnieć, że producent dodaje oprogramowanie IVONA Player, które pozwala na odczyt tekstów z dowolnych aplikacji. Jeśli zdecydujesz się na płatną wersję, to otrzymasz IVONA Readera, odczytującego pliki tekstowe, e-booki, e-maile, komunikaty ze Skype’a czy kanałów RSS, które można w łatwy sposób zapisać do formatu .mp3.

Dant Free

Kolejnym dobrym syntezatorem mowy jest Dant Free. Program jest bezpłatny, aczkolwiek niesie to ze sobą pewien problem — prace nad jego rozwojem zostały wstrzymane. Synteza mowy w przypadku tego programu bazuje na matematycznych obliczeniach. 

Dant Free
Źródło: instalki.pl

W efekcie głos lektora jest mało przyjemny dla ucha i po prostu nienaturalny, co może utrudniać jego zrozumienie. Na jego niekorzyść przemawiać może dość archaiczny wygląd. Mocną stroną Dant Free jest poprawne rozpoznawanie znaków interpunkcyjnych, ciągów liczb, popularnych skrótów i zapożyczeń z języka angielskiego. Treści muszą jednak znaleźć się w systemowym schowku. Aplikacja jest też w stanie podać aktualną godzinę.

RealSpeak Agata

RealSpeak Agata jest silnikiem syntezatora mowy, który pod względem jakości generowanego dźwięku ustępuje tylko IVONIE. Teoretycznie czyni to go alternatywnym wyborem, aczkolwiek w rzeczywistości RealSpeak Agata jest uzupełnieniem innych syntezatorów, a ponadto sprawdzi się idealnie jako alternatywa dla wbudowanego syntezatora w system Windows. Niestety nie radzi sobie dobrze ze skrótami, które czyta dość niezrozumiale.

Wybór Reader (Tekst na Mowę)

To świetne rozwiązanie w postaci wtyczki do przeglądarki Chrome. Aplikacja czyta zaznaczony tekst. Trzeba kliknąć lewym klawiszem myszy w czarną ikonę wtyczki i podświetlić ją na czerwono. Narzędzie oferuje wybór jednego z kilkunastu języków, a także możliwość zmiany szybkości odczytu. Jeśli chodzi o naturalność, to żeński głos o nazwie Paulina brzmi mało prawdziwie, aczkolwiek jest przyjemny dla ucha.

Android a syntezatory mowy — lista najlepszych aplikacji

Android sam w sobie ma już wbudowany syntezator mowy, który jest w stanie przeczytać wszystko, co jest wyświetlane na ekranie smartfona lub tabletu. Niewątpliwe to bardzo duże udogodnienie dla osób niedowidzących. Jest jednak kilka ciekawych aplikacji, które warto wykorzystać do syntezy mowy, aby ułatwić sobie korzystanie ze smartfona. Poniżej kilka z nich.

@Voic Aloud Reader

@Voice Aloud Reader to aplikacja stworzona przez Hyperionics Technology, która dostępna jest w sklepie Play zarówno w wersji darmowej, jak i płatnej. Bez względu na to, na którą wersję się zdecydujesz, możesz być pewien, że Cię nie rozczaruje. 

Narzędzie jest w stanie przeczytać treści z niemal dowolnych źródeł. Poradzi sobie nawet z OCR (optyczne rozpoznawanie znaków) – wyodrębnia tekst z plików PDF, gdzie normalne jego rozpoznawanie nie działa. Może też skopiować całą stronę internetową w celu jej odsłuchania lub przeczytania, usuwając przy tym elementy nawigacyjne, jak również reklamy.

Voic Aloud Reader
Źródło: youtube.com

Zaletą jest też sporo głosów do wyboru (nawet w wersji darmowej), a co jeszcze ważniejsze, głos jest bardzo zbliżony do naturalnego. Jakby tego było mało, aplikacja bardzo dobrze rozpoznaje znaki interpunkcyjne, odpowiednio je intonując.

Narrator’s Voice

Narrator’s Voice znany także jako Głos Narratora to podobno jedna z najlepszych aplikacji do konwertowania tekstu na mowę. Przy jej wykorzystaniu możliwe jest odczytanie wpisanego tekstu, a następnie zapisanie go w formacie audio (.mp3 lub .mp4) w celu dalszego udostępnienia.

Oprogramowanie pozwala na modulowanie głosem w celu uzyskania zabawnego efektu lub wręcz odwrotnie — dość przeraźliwego. I choć dla wielu będzie to świetna zabawa, to jednak Głos Narratora z pewnością nie jest narzędziem dla profesjonalistów. 

Narrator's Voice
Źródło: youtube.com

Mamy nadzieję, że ten materiał pomógł Ci zrozumieć, czym jest syntezator mowy i jak bardzo jest istoty w naszym życiu. Chętnie poznamy Twoją opinię na temat zamiany tekstu na mowę. 

4
1

Podziel się:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.