(Беларуская) Прагназаванне працягласці прамовы


Извините, этот техт доступен только в “Беларуская”. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

Сэрвіс «Прагназаванне працягласці прамовы» дазваляе карыстальніку даведацца прыкладны час працягласці прамовы анлайн. На ўваход сэрвісу падаецца электронны тэкст на беларускай, англійскай ці рускай мовах, тэкст можа быць уведзены ўручную або скапіраваны. На выхадзе карыстальнік атрымлівае вынік у выглядзе прыкладнай працягласці прамовы ў фармаце ГГ:ХХ:СС, а таксама інфармацыю пра колькасць слоў і знакаў, выкарыстаных у тэксце.

 

Асноўныя тэрміны і паняцці

Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем.

Сінтэзатар маўлення па тэксце (СМТ) [1] — гэта сістэма, здольная генераваць маўленне па тэксце. Змяшчае два блокі: блок лінгвістычнай апрацоўкі тэксту да фанемнага выгляду з пазнакамі націску, інтанацый (прасодыі) і рытму, а таксама блок апрацоўкі маўленчага сігналу, які пераўтварае раней артыманы фанемны выгляд у гукавы сігнал маўлення [2].

 

Асаблівасці сервісу

Працягласць прамовы вылічваецца пры дапамозе сінтэзатара маўлення па тэксце: уведзены тэкст разбіваецца на алафоны (найменшыя гукавыя адзінкі), далей суміруюцца даўжыні гучання ўсіх алафонаў уводнага тэксту.

 

Практычная каштоўнасць

Сэрвіс будзе карысны карыстальнікам, якім неабходна выступіць з дакладам. Практычна заўсёды на такіх мерапрыемствах усталяваны рэгламент, у які дакладчык павінны ўкласціся. Сэрвіс дапаможа карыстальніку загадзя пабачыць, колькі прыкладна часу зойме вымаўленне ўведзенага аб’ёму тэксту, каб ня зрушыць рэгламент выступлення. Таксама сэрвіс дапаможа ў стварэнні акустычных рэсурсаў для распрацоўкі і ўдасканальвання сінтэзатара маўлення па тэксце, а менавіта дапаможа спрагназаваць працягласць аўдыязапісу начытанага тэксту для акустычнай базы.

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу ўключае наступныя часткі, прадстаўленыя на малюнку 1.

Малюнак 1. Графічны інтэрфейс сэрвісу «Прагназаванне працягласці прамовы»

Вобласць А ўключае наступныя кнопкі:

  • «EN», «BE» і «RU» — кнопкі выбару лакалізацый;
  • «?» — кнопка адкрые спраўку па сэрвісе (дадзеная старонка).

Вобласць Б уключае наступныя кнопкі:

  • кнопка са стрэлкай прызначана для вяртання першапачатковага прыкладу ў поле ўводу;
  • кнопка з крыжыкам чысціць поле ўводу.

Вобласць В — поле ўводу тэксту.

Вобласць Г — куток, з дапамогай якога можна змяніць памер поля ўводу.

Вобласць Д — кнопка «Спрагназаваць працягласць прамовы», з дапамогай якой можна атрымаць вынік.

Вобласць Е — інфармацыя, якая з’яўляецца вынікам працы сэрвісу.

 

Карыстальніцкія сцэнары працы з сэрвісам

  1. Увесці тэкст на беларускай, англійскай ці рускай мове ў поле ўводу.
  2. Націснуць на «Спрагназаваць працягласць прамовы!», каб атрымаць вынік (малюнак 1).

Вынікам з’яўляецца працягласць сінтэзаванага ўводнага тэксту ў фармаце ГГ:ХХ:СС, а таксама колькасць візуальнымі знакамі: словамі і знакамі прыпынку.

 

Доступ да сэрвіса праз API

Каб атрымаць інфармацыю пра прыкладны час працягласці прамовы па ўваходным электронным тэксце на беларускай ці рускай мовах, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/SpeechDurationPredictor/api.php. Праз масіў параметраў data перадаецца ўваходны тэкст (параметр inputText), мова тэксту (параметр language), голас сінтэзатара маўлення, на аснове характарыстык якога будзе адбывацца прагназаванне, (параметр voice) і маркер неабходнасці атрымання прамежкавай інфармацыі працы сэрвіса (параметр log).

Элементы ўваходнага масіву data маюць наступныя параметры:

  • inputText — адвольны ўваходны тэкст на беларускай або рускай мове.
  • language — мова тэксту:
    • be — беларуская мова;
    • ru — руская мова.
  • voice — голас сінтэзатара маўлення, на аснове характарыстык якога будзе адбывацца прагназаванне:
    • AlesiaBel — для беларускай мовы;
    • BorisBel — для беларускай мовы;
    • Alesia — для рускай мовы;
    • Boris — для рускай мовы;
    • BorisRus — для рускай мовы.
  • log — маркер неабходнасці атрымання прамежкавай інфармацыі працы сэрвіса.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “http://corpus.by/SpeechDurationPredictor/api.php”,
   data:{
      “inputText”: “Груша цвіла апошні год.”,
      “language”: “be”,
      “voice”: “AlesiaBel”,
      “log”: 1
   }
   success: function(msg){ }
});

Сервер верне JSON-масіў з уваходным тэкстам (параметр inputText), прыкладнай ацэнкай працягласці прамовы (параметр result), колькасцю слоў ва ўваходным тэксце (параметр wordsCnt) і колькасцю знакаў прыпынку (параметр delimitersCnt). У выпадку, калі ў запыце была запатрабавана дадатковая інфармацыя (параметр log), выніковы масіў будзе мець яшчэ два элементы: allophonicText, які змяшчае ўваходны тэкст у алафонным выглядзе, і allophonicDuration, які змяшчае спіс алафонаў з іх працягласцямі ў мілісекундах. Па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “inputText”: “Груша цвіла апошні год.”,
      “result”: “0:00:03”,
      “allophonicText”: “GH004,R022,U022,SH002,A323,/,C’002,V’002,I241,L002,A012,/,A221,P001,O012,SH002,N’004,I242,/,GH001,O032,T000,/,#P4,”,

“allophonicDuration”: “GH004 – 66
R022 – 54
U022 – 110
SH002 – 110
A323 – 43
C’002 – 53
V’002 – 57
I241 – 64
L002 – 74
A012 – 133
A221 – 62
P001 – 126
O012 – 123
SH002 – 110
N’004 – 61
I242 – 62
GH001 – 103
O032 – 123
T000 – 109
#P4 – 1176”,
      “allophonicDuration”: “”,
      “wordsCnt”: 4,
      “delimitersCnt”: 1
   }
]

Прыклад выкарыстання дадзенага API — вэб-сэрвіс «Прагназаванне працягласці прамовы праз API» (http://corpus.by/SpeechDurationPredictorViaApi/).

 

Спасылкі на крыніцы

Старонка сэрвісу — http://corpus.by/SpeechDurationPredictor/?lang=be

Сінтэзатар маўлення па тэксце — http://corpus.by/TextToSpeechSynthesizer/?lang=be

 

Перакрыжаваныя спасылкі

  1. Сінтэзатар маўлення па тэксце // Платформа для апрацоўкі тэкставай і гукавой інфармацыі розных тэматычных даменаў [Электронны рэсурс]. — 2017. Рэжым доступу : http://corpus.by/TextToSpeechSynthesizer/?lang=be. — Дата доступу : 30.03.2017.
  2. Алгарытмы лінгвістычнай апрацоўкі тэкстаў для сінтэзу маўлення на беларускай і рускай мовах : дысертацыя на атрыманне навуковай ступені кандыдата тэхнічных навук : спецыяльнасць 05.13.01 Сістэмны аналіз, кіраванне і апрацоўка інфармацыі / Гецэвіч Юрый Станіслававіч ; навуковы кіраўнік Лабанаў Б. М. ; Аб’яднаны інстытут праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі. — Мінск, 2012. — 184, [6] л. : іл., табл., схемы. — Ч. тэксту рус. — Бібліягр.: л. 153-164.

(Беларуская) Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.