Прагназаванне працягласці прамовы


Сэрвіс «Прагназаванне працягласці прамовы» дазваляе карыстальніку даведацца прыкладны час працягласці прамовы анлайн. На ўваход сэрвісу падаецца электронны тэкст на беларускай, англійскай ці рускай мовах, тэкст можа быць уведзены ўручную або скапіраваны. На выхадзе карыстальнік атрымлівае вынік у выглядзе прыкладнай працягласці прамовы ў фармаце ГГ:ХХ:СС, а таксама інфармацыю пра колькасць слоў і знакаў, выкарыстаных у тэксце.

 

Асноўныя тэрміны і паняцці

Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем.

Сінтэзатар маўлення па тэксце (СМТ) [1] — гэта сістэма, здольная генераваць маўленне па тэксце. Змяшчае два блокі: блок лінгвістычнай апрацоўкі тэксту да фанемнага выгляду з пазнакамі націску, інтанацый (прасодыі) і рытму, а таксама блок апрацоўкі маўленчага сігналу, які пераўтварае раней артыманы фанемны выгляд у гукавы сігнал маўлення [2].

 

Асаблівасці сервісу

Працягласць прамовы вылічваецца пры дапамозе сінтэзатара маўлення па тэксце: уведзены тэкст разбіваецца на алафоны (найменшыя гукавыя адзінкі), далей суміруюцца даўжыні гучання ўсіх алафонаў уводнага тэксту.

 

Практычная каштоўнасць

Сэрвіс будзе карысны карыстальнікам, якім неабходна выступіць з дакладам. Практычна заўсёды на такіх мерапрыемствах усталяваны рэгламент, у які дакладчык павінны ўкласціся. Сэрвіс дапаможа карыстальніку загадзя пабачыць, колькі прыкладна часу зойме вымаўленне ўведзенага аб’ёму тэксту, каб ня зрушыць рэгламент выступлення. Таксама сэрвіс дапаможа ў стварэнні акустычных рэсурсаў для распрацоўкі і ўдасканальвання сінтэзатара маўлення па тэксце, а менавіта дапаможа спрагназаваць працягласць аўдыязапісу начытанага тэксту для акустычнай базы.

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу ўключае наступныя часткі, прадстаўленыя на малюнку 1.

Малюнак 1. Графічны інтэрфейс сэрвісу «Прагназаванне працягласці прамовы»

Вобласць А ўключае наступныя кнопкі:

  • «EN», «BE» і «RU» — кнопкі выбару лакалізацый;
  • «?» — кнопка адкрые спраўку па сэрвісе (дадзеная старонка).

Вобласць Б уключае наступныя кнопкі:

  • кнопка са стрэлкай прызначана для вяртання першапачатковага прыкладу ў поле ўводу;
  • кнопка з крыжыкам чысціць поле ўводу.

Вобласць В — поле ўводу тэксту.

Вобласць Г — куток, з дапамогай якога можна змяніць памер поля ўводу.

Вобласць Д — кнопка «Спрагназаваць працягласць прамовы», з дапамогай якой можна атрымаць вынік.

Вобласць Е — інфармацыя, якая з’яўляецца вынікам працы сэрвісу.

 

Карыстальніцкія сцэнары працы з сэрвісам

  1. Увесці тэкст на беларускай, англійскай ці рускай мове ў поле ўводу.
  2. Націснуць на «Спрагназаваць працягласць прамовы!», каб атрымаць вынік (малюнак 1).

Вынікам з’яўляецца працягласць сінтэзаванага ўводнага тэксту ў фармаце ГГ:ХХ:СС, а таксама колькасць візуальнымі знакамі: словамі і знакамі прыпынку.

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Прагназаванне працягласці прамовы” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/SpeechDurationPredictor/api.php. Праз масіў data перадаюцца наступныя параметры:

  • inputText — адвольны ўваходны тэкст на беларускай, рускай або англійскай мове.
  • language — мова тэксту. Даступны беларуская (параметр be), руская (параметр ru) і англійская (параметр en) мовы.
  • voice — голас сінтэзатара маўлення, на аснове характарыстык якога будзе адбывацца прагназаванне:
    • для беларускай і англійскай моў даступны галасы AlesiaBelAlesiaBel (dictation mode)BorisBelBorisBel (dictation mode)BorisBelHigh;
    • для рускай — AlesiaRusAlesiaRus (dictation mode)BorisRusBorisRus (dictation mode)BorisRusHigh.
  • log — маркер неабходнасці атрымання прамежкавай інфармацыі працы сэрвіса.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/SpeechDurationPredictor/api.php”,
   data:{
      “inputText”: “Груша цвіла апошні год.”,
      “language”: “be”,
      “voice”: “AlesiaBel”,
      “log”: 1
   },
   success: function(msg){ },
   error: function() { }
});

Сервер верне JSON-масіў з уваходным тэкстам (параметр inputText), прыкладнай ацэнкай працягласці прамовы (параметр result), колькасцю слоў ва ўваходным тэксце (параметр wordsCnt), колькасцю знакаў прыпынку (параметр delimitersCnt), спісам алафонаў, адсутных у базе (параметр unknownPhones). У выпадку, калі ў запыце была запатрабавана дадатковая інфармацыя (параметр log), выніковы масіў будзе мець яшчэ два элементы: allophonicText, які змяшчае ўваходны тэкст у алафонным выглядзе, і allophonicDuration, які змяшчае спіс алафонаў з іх працягласцямі ў мілісекундах. Па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “inputText”: “Груша цвіла апошні год.”,
      “result”: “0:00:03”,
      “allophonicText”: “GH004,R022,U022,SH002,A323,/,C’002,V’002,I241,L002,A012,/,A221,P001,O012,SH002,N’004,I242,/,GH001,O032,T000,/,#P4,”,
      “allophonicDuration”: “GH004 – 66
R022 – 54
U022 – 110
SH002 – 110
A323 – 43
C’002 – 53
V’002 – 57
I241 – 64
L002 – 74
A012 – 133
A221 – 62
P001 – 126
O012 – 123
SH002 – 110
N’004 – 61
I242 – 62
GH001 – 103
O032 – 123
T000 – 109
#P4 – 1176”,

      “allophonicDuration”: “”,
      “wordsCnt”: 4,
      “delimitersCnt”: 1
      “unknownPhones”: “”
   }
]

 

Спасылкі на крыніцы

Старонка сэрвісу — https://corpus.by/SpeechDurationPredictor/?lang=be

Сінтэзатар маўлення па тэксце — https://corpus.by/TextToSpeechSynthesizer/?lang=be

 

Перакрыжаваныя спасылкі

  1. Сінтэзатар маўлення па тэксце // Платформа для апрацоўкі тэкставай і гукавой інфармацыі розных тэматычных даменаў [Электронны рэсурс]. — 2017. Рэжым доступу : https://corpus.by/TextToSpeechSynthesizer/?lang=be. — Дата доступу : 30.03.2017.
  2. Алгарытмы лінгвістычнай апрацоўкі тэкстаў для сінтэзу маўлення на беларускай і рускай мовах : дысертацыя на атрыманне навуковай ступені кандыдата тэхнічных навук : спецыяльнасць 05.13.01 Сістэмны аналіз, кіраванне і апрацоўка інфармацыі / Гецэвіч Юрый Станіслававіч ; навуковы кіраўнік Лабанаў Б. М. ; Аб’яднаны інстытут праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі. — Мінск, 2012. — 184, [6] л. : іл., табл., схемы. — Ч. тэксту рус. — Бібліягр.: л. 153-164.

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.