Падлік частотнасці алафонаў


Сэрвіс «Падлік частотнасці алафонаў» дазваляе атрымаць звесткі пра частату наяўнасці алафонаў у тэксце. На ўваход сэрвісу падаецца электронны тэкст з алафонамі, і па выніках яго апрацоўкі на выхадзе карыстальнік атрымлівае спіс знойдзеных ва ўваходным тэксце алафонаў і частату іх наяўнасці.

 

Асноўныя тэрміны і паняцці

Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем.

Дыфон — сегмент маўлення паміж сярэдзінамі суседніх фанем.

Поўны алафонны запіс — запіс поўнай назвы алафона(ў), напрыклад, A000, A001, A002, A003.

Скарочаны алафонны запіс — запіс скарочанай назвы, якая ахоплівае некалькі алафонаў. Напрыклад, запіс А0 з частатой 3 ў выніковым спісе азначае, што ў тэксце сустрэлася тры алафоны, якія падпадаюць пад запіс А0. Гэта могуць быць тры любыя алафоны сярод усіх алафонаў, назва якіх пачынаецца з камбінацыі A0 (A000, A001, A002, A003, A010 і г.д.).

 

Практычная каштоўнасць

Мэтай сэрвісу з’яўляецца складанне упарадкаваных па алфавіце або па колькасці спісаў алафонаў, якія змяшчаюцца ва ўваходным алафонным тэксце. Гэты сэрвіс выкарыстоўваецца для стварэння мінімальнага мноства слоў, якое б пакрывала ўсе існуючыя алафоны беларускай мовы, што ў будучыні дапаможа знізіць страты часу і сродкаў на стварэнне новых галасоў для сінтэзатара. Сэрвіс распрацаваны для вузкапрафесійнага кола карыстальнікаў, якія займаюцца ўдасканаленнем працы сінтэзатара маўлення па тэксце.

Асаблівасці сэрвісу

Увод алафонаў павінны ажыццяўляцца толькі з выкарыстаннем сімвалаў лацінскага алфавіту. Пры выкарыстанні кірылічных сімвалаў частата будзе падлічана няправільна або нулявая.

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу прадстаўлены на малюнку 1.

Малюнак 1. Інтэрфейс сэрвісу «Падлік частотнасці алафонаў»

Інтэрфейс змяшчае наступныя вобласці:

  • поле ўводу тэксту з алафонамі;
  • поле ўводу «стоп-алафонаў», дзе карыстальнік можа ўвесці спіс алафонаў, якія будуць ігнаравацца пры пошуку і сартыроўцы;
  • вобласць выбару поўнага ці скарочанага запісу алафонаў;
  • выпадаючае меню, якое дазваляе аддзяляць алафоны ад дыфонаў (толькі алафоны, толькі дыфоны, усе алафоны і дыфоны);
  • поле ўводу колькасці кантэкстаў (па змаўчанні 10);
  • кнопка “Канвертаваць”, якая запускае апрацоўку і дае магчымасць атрымаць вынікі.

 

Карыстальніцкія сцэнары працы з сэрвісам

Сцэнар 1. Падлік частотнасці поўнага запісу алафонаў

  1. У поле ўводу ўвесці тэкст з алафонамі.
  2. У поле ўводу «стоп-алафонаў» пры патрэбе ўвесці спіс алафонаў, якія будуць ігнаравацца пры пошуку і сартыроўцы.
  3. Паставіць гачак насупраць пункту «Пошук поўнага запісу алафонаў».
  4. У выпадаючым меню выбраць толькі алафоны.
  5. Націснуць кнопку «Атрымаць спіс алафонаў» і праглядзець спіс вынікаў (малюнак 2).

Малюнак 2. Вынікі падліку частотнасці поўнага запісу алафонаў

 

Сцэнар 2. Падлік частотнасці скарочанага запісу алафонаў

  1. У поле ўводу ўвесці тэкст з алафонамі.
  2. У поле ўводу «стоп-алафонаў» пры патрэбе ўвесці спіс алафонаў, якія будуць ігнаравацца пры пошуку і сартыроўцы.
  3. Паставіць гачак насупраць пункту «Пошук скарочанага запісу алафонаў».
  4. У выпадаючым меню выбраць толькі алафоны.
  5. Націснуць кнопку «Атрымаць спіс алафонаў» і праглядзець спіс вынікаў (малюнак 3).

Малюнак 3. Вынікі падліку частотнасці скарочанага запісу алафонаў

Сцэнар 3. Падлік частотнасці дыфонаў

  1. У поле ўводу ўвесці тэкст з дыфонамі.
  2. У поле ўводу «стоп-алафонаў» пры патрэбе ўвесці спіс дыфонаў, якія будуць ігнаравацца пры пошуку і сартыроўцы.
  3. Паставіць гачак насупраць пункту «Пошук поўнага запісу алафонаў».
  4. У выпадаючым меню выбраць толькі дыфоны.
  5. Націснуць кнопку «Атрымаць спіс алафонаў» і праглядзець спіс вынікаў (малюнак 4).

Малюнак 4. Вынікі падліку частотнасці дыфонаў

Сцэнар 3. Падлік частотнасці алафонаў і дыфонаў

  1. У поле ўводу ўвесці тэкст з алафонамі і дыфонамі.
  2. У поле ўводу «стоп-алафонаў» пры патрэбе ўвесці спіс алафонаў і дыфонаў, якія будуць ігнаравацца пры пошуку і сартыроўцы.
  3. Паставіць гачак насупраць пункту «Пошук поўнага запісу алафонаў».
  4. У выпадаючым меню выбраць усе алафоны і дыфоны.
  5. Націснуць кнопку «Атрымаць спіс алафонаў» і праглядзець спіс вынікаў (малюнак 5).

Малюнак 5. Вынікі падліку частотнасці поўнага запісу алафонаў і дыфонаў

Спалучэнне наладак «Пошук поўнага запісу алафонаў» і «толькі дыфоны» з’яўляецца некарэктным.

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Падлік частотнасці алафонаў” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/AllophoneFrequencyCounter/api.php. Праз масіў data перадаюцца наступныя параметры:

  • text — уваходны тэкст, які ўяўляе сабой алафонны тэкст, дыфонны тэкст або змешаны алафонны/дыфонны тэкст.
  • stopWords — спіс алафонаў/дыфонаў, якія пры падліку частотнасці не будуць улічвацца, уводзяцца праз прабел ці перавод радка.
  • phonesType — тып базавых адзінак, па якіх вядзецца падлік. Даступны тры тыпы:
    • allophones — для выканання падліку частотнасці толькі алафонаў;
    • diphones — для выканання падліку частотнасці толькі дыфонаў;
    • all — для выканання падліку частотнасці і алафонаў, і дыфонаў.
  • allophonesType — тып алафонаў, па якіх будзе здзяйсняцца падік:
    • full — поўны запіс алафонаў;
    • short — скарочаны запіс алафонаў.
  • examplesNumber — абмежаванне колькасці кантэкстаў, якія будуць прыведзены ў выніковай табліцы.
  • contextSize — абмежаванне колькасці сімвалаў, якія складаюць кантэкст выніку.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/AllophoneFrequencyCounter/api.php”,
   data:{
      “text”: “M004O113,J’013,/,R032O022,D001,N004Y322,/,K001,U032,T000”,
      “stopWords”: “K001 U032 T000”,
      “phonesType”: “all”,

      “allophonesType”: “full”,
      “examplesNumber”: 1,
      “contextSize”: 30
   },
   success: function(msg){ },
   error: function() { }
});

Сервер верне JSON-масіў з уваходным тэкстам (параметр text), колькасцю ўсіх фанем (параметр AllPhonesCnt), колькасцю ўнікальных фанем (параметр UniquePhonesCnt) і выніковай табліцай частотнасці (параметр ResultTable). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “text”: “M004O113,J’013,/,R032O022,D001,N004Y322,/,K001,U032,T000”,
      “AllPhonesCnt”: 5,
      “UniquePhonesCnt”: 5,
      “ResultTable”: “<table id=”resultTableId” class=”sortable”><thead><tr><td>Sound</td><td>Frequency</td><td>Contexts (max. 1)</td></tr></thead><tbody><tr valign=”top”><td width=”5%”><b>D001</b></td><td width=”5%” align=”center”>1</td><td>M004O113,J’013,/,R032O022,<font color=”red”>D001</font>,N004Y322,/,K001,U032,T000<br>
</td></tr><tr valign=”top”><td width=”5%”><b>J’013</b></td><td width=”5%” align=”center”>1</td><td>M004O113,<font color=”red”>J’013</font>,/,R032O022,D001,N004Y322,/,K0<br>
</td></tr><tr valign=”top”><td width=”5%”><b>M004O113</b></td><td width=”5%” align=”center”>1</td><td><font color=”red”>M004O113</font>,J’013,/,R032O022,D001,N004Y32<br>
</td></tr><tr valign=”top”><td width=”5%”><b>N004Y322</b></td><td width=”5%” align=”center”>1</td><td>004O113,J’013,/,R032O022,D001,<font color=”red”>N004Y322</font>,/,K001,U032,T000<br>
</td></tr><tr valign=”top”><td width=”5%”><b>R032O022</b></td><td width=”5%” align=”center”>1</td><td>M004O113,J’013,/,<font color=”red”>R032O022</font>,D001,N004Y322,/,K001,U032,T00<br>
</td></tr></tbody><tfoot></tfoot></table>”

   }
]

 

Спасылкі на крыніцы

Старонка сэрвісу – https://corpus.by/AllophoneFrequencyCounter/?lang=be

Перакрыжаваныя спасылкі

  1. Гецэвіч, Ю.С. Праектаванне інтэрнэт-сервісаў для працэсараў сінтэзатара маўлення па тэксце з магчымасцю прадстаўлення бясплатных электронных паслуг насельніцтву / Ю.С. Гецэвіч, С.І. Лысы // Развитие информатизации и государственной системы научно-технической информации (РИНТИ-2014) : доклады XIII Международной конференции (Минск, 20 ноября 2014 г.). – Минск : ОИПИ НАН Беларуси, 2014. — C. 265-269.

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.