Сінтэзатар маўлення па тэксце


Сэрвіс «Сінтэзатар маўлення па тэксце» прызначаны для агучвання ўведзенага карыстальнікам тэксту. На ўваход карыстальнік падае электронны тэкст на беларускай ці рускай мове, сінтэзатар маўлення аўтаматычна апрацоўвае тэкст і фарміруе гукавы файл з сінтэзаваным уваходным тэкстам, які можна праслухаць, спампаваць і захаваць на камп’ютар.

 

Асноўныя тэрміны і паняцці

Сінтэзатар маўлення па тэксце (СМТ) — гэта сістэма, здольная генераваць маўленне па тэксце. Змяшчае два блокі: блок лінгвістычнай апрацоўкі тэксту да фанемнага выгляду з пазнакамі націску, інтанацый (прасодыі) і рытму, а таксама блок апрацоўкі маўленчага сігналу, які пераўтварае раней атрыманы фанемны выгляд у гукавы сігнал маўлення [1].

 

Асаблівасці сервісу

Сэрвіс рэалізаваны на бясплатнай і найбольш распаўсюджанай у Інтэрнэце скрыптавай мове праграмавання PHP.

На цяперашні час сінтэзатар прапануе карыстальніку наступныя галасы:

  • AlesiaBel (беларуская, жаночы);
  • Boris (беларуская, мужчынскі) — адрозніваецца ад наступнага тым, што робіць больш рэзкія і даўжэйшыя перапынкі паміж словамі;
  • BorisBel (беларуская, мужчынскі);
  • BorisRus (руская, мужчынскі).

Для больш якаснай агучкі ёсць магчымасць уручную пры дапамозе спецыяльных пазнак «падказаць» сінтэзатару, дзе павінны быць націск:

  • плюс /+/ або акут /ы́/ – для пазначэння асноўнага націску (напрыклад, “звыча+йны”);
  • роўна /=/ або гравіс /ё̀/ – для пазначэння пабочнага націску (напрыклад, “тэ=леперада+ча”);
  • цыркумфлекс /^/ – паміж двума словамі, каб аб’яднаць іх у складанае фанетычнае слова (напрыклад, “на^стале+”, “сказа+ў^бы”).

СМТ выкарыстоўваецца ў працы іншых сэрвісаў платформы www.corpus.by, а менавіта сэрвісаў «Сінтэзатар “Гаворачая галава”» (гукавая дарожка), «Прагназаванне працягласці прамовы» (працягласць прамовы — гэта фактычна час, за які дадзены сінтэзатар прамовіць уваходны тэкст).

 

Практычная каштоўнасць

Сэрвіс мае вялікія перспектывы прымянення і ўкаранення. Невялікая частка сфер, у якіх можа прымяняцца сінтэз маўлення:

  • сістэмы абзвону і інфакіёскі;
  • галасавыя і сігналізацыйныя сістэмы апавяшчэння;
  • сістэмы чытання кніг;
  • навучальныя сістэмы;
  • гаворачыя камп’ютары для інвалідаў па зроку і слыху.

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу ўключае наступныя часткі, прадстаўленыя на малюнку 1.

Малюнак 1. Знешні інтэрфейс сэрвісу «Сінтэзатар маўлення па тэксце»

Інтэрфейс мае наступныя вобласці:

  • інфармацыя аб тым, як расстаўляць спецыяльныя сімвалы — націскі і пабочныя націскі ва ўваходных словах, а таксама прыклад пазначэння націскаў;
  • кнопкі расстаноўкі спецыяльных сімвалаў, якія знаходзяцца над полем уводу справа;
  • поле ўводу тэксту, які патрабуе сінтэзавання (па змаўчанні ўведзены тэкст прыкладу);
  • вобласць выбару мовы ўваходнага тэксту (беларуская, руская);
  • вобласць выбару голасу, якім мусіць быць выканана сінтэзаванае маўленне (AlesiaBel, Boris, BorisBel, BorisRus);
  • кнопка «Сінтэзаваць маўленне!», якая дазваляе атрымаць вынікі;
  • гачак «Паказаць прамежкавую інфармацыю», з дапамогай якога можна ўключыць ці адключыць вывад прамежкавай інфармацыі;
  • інфармацыя аб тым, як убудаваць сінтэзатар на знешнія сайты.

 

Карыстальніцкія сцэнары працы з сэрвісам

Сцэнар 1. Атрыманне сінтэзаванага маўлення

Ніжэй апісаны самы хуткі спосаб атрымаць гукавы файл з сінтэзаваным маўленнем.

  1. У поле ўводу ўвесці (уставіць ці надрукаваць) тэкст, які патрабуе сінтэзавання (напрыклад, наступны тэкст: «Мой родны кут, як ты мне мілы!»).
  2. У вобласці выбару мовы абраць мову ўведзенага тэксту для таго, каб сінтэзатар прымяніў правілы менавіта для пазначанай мовы (па змаўчанні выбрана беларуская).
  3. У вобласці выбару голасу абраць голас, якім мусіць быць выканана сінтэзаванае маўленне (па змаўчанні выбрана AlesiaBel).
  4. Націснуць кнопку «Сінтэзаваць маўленне!» для атрымання вынікаў у полі «Праслухаць сінтэзаванае маўленне» (малюнак 2).
  5. Выніковы гукавы файл можна праслухаць, націснуўшы кнопку прайгравання.
  6. Таксама выніковы файл можна захаваць на камп’ютар, націснуўшы спасылку «спампаваць файл з сінтэзаваным маўленнем».

Малюнак 2. Вынікі сінтэзавання маўлення

 

Сцэнар 2. Атрыманне больш якаснага сінтэзаванага маўлення

Ніжэй апісаны спосаб атрымаць больш якаснае сінтэзаванае маўленне пры дапамозе расстаноўкі дадатковых сімвалаў, якія дадуць сінтэзатару «падказкі» для большай плаўнасці маўлення і больш дакладнай інтанацыі.

  1. У поле ўводу ўвесці (уставіць ці надрукаваць) тэкст, які патрабуе сінтэзавання (напрыклад, наступны тэкст: «Паўночна-заходні вятрыска садзьмуў бы ўсё лісце на выспе, але потым калісьці»).
  2. Для больш якаснай агучкі расставіць пазнакі — націскі і знакі аб’яднання ў адно фанетычнае слова, што можна зрабіць двума спосабамі (малюнак 3):
    • Уручную, ставячы сімвал /+/ на пасля літары асноўнага націску, сімвал /=/ на пасля літары пабочнага націску і сімвал /^/ на месцы аб’яднання ў адно фанетычнае слова: Паўно=чна-захо+дні вятры+ска садзьму+ў^бы ўсё= лі+сце на^вы+спе, але^по+тым калі+сьці.
    • З дапамогай кнопак сэрвісу, якія размешчаны над полем уводу справа. Для пастаноўкі сімвала курсор павінны стаяць пасля неабходнай літары: Паўно̀чна-захо́дні вятры́ска садзьму́ў‿бы ўсё̀ лі́сце на‿вы́спе, але‿по́тым калі́сьці.
  3. У вобласці выбару мовы абраць мову ўведзенага тэксту для таго, каб сінтэзатар прымяніў правілы менавіта для пазначанай мовы (па змаўчанні выбрана беларуская).
  4. У вобласці выбару голасу абраць голас, якім мусіць быць выканана сінтэзаванае маўленне (па змаўчанні выбрана AlesiaBel).
  5. Націснуць кнопку «Сінтэзаваць маўленне!» для атрымання вынікаў у полі «Праслухаць сінтэзаванае маўленне» (малюнак 3).
  6. Выніковы гукавы файл можна праслухаць, націснуўшы кнопку прайгравання.
  7. Таксама выніковы файл можна захаваць на камп’ютар, націснуўшы спасылку «спампаваць файл з сінтэзаваным маўленнем».

Малюнак 3. Вынікі больш якаснага сінтэзавання маўлення

 

Сцэнар 3. Атрыманне сінтэзаванага маўлення з прамежкавымі вынікамі

У ходзе пераўтварэння электроннага тэксту ў маўленне сінтэзатар генеруе мноства прамежкавых вынікаў. Сярод іх ёсць нармалізаваны тэкст, фанемны запіс тэксту, запіс тэксту ў алафонным выглядзе і іншае. Сцэнар застаецца тым жа, што і сцэнары 1 і 2, толькі дадаецца неабходнасць націснуць гачак «Паказаць прамежкавую інфармацыю».

  1. У поле ўводу ўвесці (уставіць ці надрукаваць) тэкст, які патрабуе сінтэзавання (тэкст стандартнага прыкладу).
  2. У вобласці выбару мовы абраць мову ўведзенага тэксту для таго, каб сінтэзатар прымяніў правілы менавіта для пазначанай мовы (па змаўчанні выбрана беларуская).
  3. У вобласці выбару голасу абраць голас, якім мусіць быць выканана сінтэзаванае маўленне (па змаўчанні выбрана AlesiaBel).
  4. Націснуць гачак «Паказаць прамежкавую інфармацыю» для таго, каб пабачыць прамежкавыя вынікі сінтэзатара маўлення.
  5. Націснуць кнопку «Сінтэзаваць маўленне!» для атрымання вынікаў у полі «Праслухаць сінтэзаванае маўленне» (малюнак 2).
  6. Выніковы гукавы файл можна праслухаць, націснуўшы кнопку прайгравання.
  7. Выніковы гукавы файл можна захаваць на камп’ютар, націснуўшы спасылку «спампаваць файл з сінтэзаваным маўленнем».
  8. Разгледзець атрыманыя прамежкавыя вынікі працы сінтэзатара.
  9. Прамежкавыя дадзеныя працы СМТ можна спампаваць, прайшоўшы па адпаведных спасылках «спампаваць».

У вокнах прамежкавых вынікаў працы СМТ выводзіцца разнастайная інфармацыя пра ўведзены тэкст, падрабязна пра якую распаведзена ніжэй.

1. Акно «Токены» адлюстроўвае групіраванне сімвалаў па прыкмеце прыналежнасці да аднаго з 5 відаў сімвалаў:

  • alphabet — сімвалы мэтавага алфавіту (мовы, абранай для сінтэзавання);
  • letters — любыя іншыя літары (не мэтавага алфавіту);
  • digits — лічбы;
  • whitespaces — прабельныя сімвалы (прабел, перавод радка, табуляцыя і інш.);
  • character — іншыя сімвалы (малюнак 4).

2. У акне «Тэкст» выводзяцца дадзеныя аб усіх словах, знойдзеных сістэмай у тэксце: вызначаныя часціны мовы, тэгі, якія з’яўляюцца скарочаным абазначэннем марфалагічных прыкмет слова (малюнак 4).

3. Акно «Токены з націскамі» дае спіс слоў з прастаўленымі карыстальнікам націскамі (малюнак 4).

4. Акно «Невядомыя токены» дае спіс слоў, якія адсутнічаюць у базе дадзеных сістэмы (малюнак 4).

Малюнак 4. Прамежкавыя вынікі працы СМТ: вокны «Токены», «Тэкст», «Токены з націскамі», «Невядомыя токены»

5. Акно «Амографы» дае інфармацыя аб словах, якія маюць неадназначную пазіцыю націска. Спрабуючы вызначыць пазіцыю націска ў слове, сінтэзатар маўлення па тэксце правярае кожнае слова ўваходнага тэксту на наяўнасць некалькіх спосабаў іх прачытання паводле інфармацыі, прадстаўленай у слоўніках. Адбываецца пошук слоў з аднолькавым напісаннем і рознымі націскамі (малюнак 5).

6. У акне «Інтанацыйныя пазнакі» карыстальнік атрымлівае інфармацыю пра інтанацыйную разметку (малюнак 5).

7. У акне «Фанемны тэкст» карыстальнік атрымлівае спіс слоў у фанемным выглядзе (малюнак 5).

8. У акне «Алафонны тэкст» карыстальнік атрымлівае спіс слоў у алафонным выглядзе (малюнак 5).

9. У акне «Характарыстыкі алафонаў» можна пабачыць працягласці і частоты алафонаў (малюнак 5).

Малюнак 5. Прамежкавыя вынікі працы СМТ: вокны «Амографы», «Інтанацыйныя пазнакі», «Фанемны тэкст», «Алафонны тэкст», «Характарыстыкі алафонаў»

Дадатковай функцыяй сінтэзатара з’яўляецца генерацыя транскрыпцыі ўваходнага тэксту ў 4 фарматах: кірылічная, міжнародная (IPA), спрошчаная міжнародная і X-SAMPA (малюнак 4). Больш падрабязна пра кожны з фарматаў можна даведацца, скарыстаўшыся прыведзенымі на старонцы сэрвісу “Генератар транскрыпцый” спасылкамі на электронныя крыніцы, паводле якіх вялася распрацоўка.

Малюнак 6. Прамежкавыя вынікі працы СМТ: чатыры фарматы транскрыпцый

Спасылкі на крыніцы

Старонка сэрвісу: http://corpus.by/TextToSpeechSynthesizer/

Старонка сэрвісу «Сінтэзатар “Гаворачая галава”»: http://corpus.by/TalkingHeadSynthesizer/?lang=be

Старонка сэрвісу «Прагназаванне працягласці прамовы»: http://corpus.by/SpeechDurationPredictor/?lang=be

Перакрыжаваныя спасылкі

  1. Алгарытмы лінгвістычнай апрацоўкі тэкстаў для сінтэзу маўлення на беларускай і рускай мовах : дысертацыя на атрыманне навуковай ступені кандыдата тэхнічных навук : спецыяльнасць 05.13.01 Сістэмны аналіз, кіраванне і апрацоўка інфармацыі / Гецэвіч Юрый Станіслававіч ; навуковы кіраўнік Лабанаў Б. М. ; Аб’яднаны інстытут праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі. — Мінск, 2012. — 184, [6] л. : іл., табл., схемы. — Ч. тэксту рус. — Бібліягр.: л. 153-164.

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.