Графічнае адлюстраванне алафонаў


Сэрвіс «Графічнае адлюстраванне алафонаў» дазваляе адлюстроўваць гук у графічным выглядзе. У дадзеным сэрвісе рэалізавана магчымасць звярнуцца да базы алафонаў інтэрнэт-версіі сінтэзатара маўлення па тэксце, абраць пэўны алафон з базы і атрымаць яго асцылаграму альбо спектраграму.

 

Асноўныя тэрміны і паняцці

Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем.

Асцылаграма — графік залежнасці амплітуды гукавога сігналу ад часу. Па восі абсцыс адкладзена змяненне часу, па восі ардынат — амплітуду гукавога сігналу.

Спектраграма — графік залежнасці амплітуды гукавога сігналу ад часу і частаты. Па восі абсцыс адкладзены час, па восі ардынат — частата, па восі аплікат — узровень энергіі сігнала, які характарызуецца інтэнсіўнасцю колеру на малюнку.

Фанема — мінімальная адзінка мовы, якая мае адрозны ад іншых адзінак сэнс і адпавядае гуку мовы, у якім матэрыяльна рэалізуецца. Гукі маўлення бясконца разнастайныя, адзін чалавек не вымаўляе аднолькава адзін і той жа гук (напрыклад, націскны [а́]). Але пакуль усе магчымыя варыянты дазваляюць правільна вызначаць і адрозніваць словы, гук [а́] ва ўсіх яго варыянтах будзе з’яўляцца рэалізацыяй адной і той жа фанемы <а>.

 

Практычная каштоўнасць

Сэрвіс можа выкарыстоўвацца экспертамі-фанетыстамі, лінгвістамі, студэнтамі філалагічных і педагагічных вузаў ці іншымі зацікаўленымі асобамі для азнаямлення з выглядам і фізічнымі характарыстыкамі алафонаў у працэсе вывучэння і даследавання беларускай мовы.

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу прадстаўлены на малюнку 1.

Малюнак 1. Знешні інтэрфейс сэрвісу «Графічнае адлюстраванне алафонаў»

Інтэрфейс змяшчае наступныя вобласці:

  • выпадаючае меню выбару алафона;
  • поле ўводу коду алафона;
  • кнопка «Атрымаць асцылаграму алафона!», якая паказвае пабудаваную асцылаграму;
  • кнопка «Атрымаць спектраграму алафона!», якая паказвае пабудаваную спектраграму;
  • дадатковыя наладкі спектраграмы, якія адкрываюцца пры кліку «Націсніце тут, каб пабачыць дадатковыя варыянты», сярод якіх:
    • выпадаючае меню выбару колеравай гамы (манахромная, каляровая);
    • выпадаючае меню выбару кантрасту (высокі, звычайны);
    • выпадаючае меню выбару вагавай функцыі (Хэмінга, Ханна, Кайзера).

 

Карыстальніцкі сцэнар працы з сэрвісам

Сцэнар 1. Графічнае адлюстраванне асцылаграмы алафона

  1. Выбраць алафон у выпадаючым меню выбару алафона або ўвесці код патрэбнага алафона ў полі ўводу.
  2. Націснуць кнопку «Атрымаць асцылаграму алафона!», якая адлюструецца ў выглядзе малюнка ў фармаце *.png (малюнак 2).

Малюнак 2. Вынік працы сэрвісу «Графічнае адлюстраванне алафонаў» — асцылаграма алафона A000

Па восі абсцыс адкладзена змяненне часу, па восі ардынат — амплітуду гукавога сігналу.

 

Сцэнар 2. Графічнае адлюстраванне спектраграмы алафона

  1. Выбраць алафон у выпадаючым меню выбару алафона або ўвесці код патрэбнага алафона ў полі ўводу.
  2. Пры неабходнасці клікнуць «Націсніце тут, каб пабачыць дадатковыя варыянты» і ў выпадаючых меню абраць патрэбныя наладкі, а менавіта колеравую гаму, кантраст, вагавую функцыю спектраграмы.
  3. Націснуць кнопку «Атрымаць спектраграму алафона!», якая адлюструецца ў выглядзе малюнка ў фармаце *.png (малюнак 3).

Малюнак 3. Вынік працы сэрвісу «Графічнае адлюстраванне алафонаў» — спектраграма алафона A000

На малюнку 3 прадстаўлена спектраграма алафона A000 з наступнымі наладкамі: колеравая гама — каляровая, кантраст — высокі, вагавая функцыя — Ханна. Па восі абсцыс адкладзены час, па восі ардынат — частата, па восі аплікат — узровень энергіі сігнала, які характарызуецца інтэнсіўнасцю колеру на малюнку. Пры выбары іншых наладак будзе атрымана адпаведна іншае адлюстраванне спектраграмы.

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Графічнае адлюстраванне алафонаў” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/AllophonePlotter/api.php. Праз масіў data перадаюцца наступныя параметры:

  • text — алафон. Напрыклад, “A001”.
  • voice — голас агучкі. Даступны наступныя галасы:
    • Для беларускага маўлення: AlesiaBel, AlesiaBel (dictation mode), BorisBel, BorisBel (dictation mode), BorisBelHigh.
    • Для рускага маўлення: AlesiaRus (dictation mode), BorisRus, BorisRus (dictation mode), BorisRusHigh.
  • img_type — тып графічнага адлюстравання. Даступны наступныя тыпы:
    • oscl — асцылаграма.
    • spec — спектраграма.
  • img_color_map — колеравая гама. Даступны наступныя тыпы:
    • color — каляровая колеравая гама.
    • grey — шэрая колеравая гама.
  • img_contrast — кантраст. Даступны наступныя тыпы:
    • high — высокі кантраст.
    • normal — звычайны кантраст.
  • fft_win_type — вагавая функцыя. Даступны наступныя тыпы:
    • hamming — вагавая функцыя Хэмінга.
    • hann — вагавая функцыя Ханна.
    • kaiser — вагавая функцыя Кайзера.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/AllophonePlotter/api.php”,
   data:{
      “text”: “A001”,

      “voice”: “BorisBel”,
      “img_type”: “SpecButton”,
      “img_color_map”: “color”,
      “img_contrast”: “high”,
      “fft_win_type “: “hamming”
   },
   success: function(msg){ },
   error: function() { }
});

Сервер верне JSON-масіў са статусам выканання запыту (параметр status) і адрасам, па якім размешчаны згенераваны малюнак (параметр img_path). Напрыклад, па вышэй прыведзеным AJAX-запыце быў сфарміраваны наступны адказ:

[
   {
      “status”: “success”,
      “img_path”: “cache/img/2018-11-08_13-11-29_80-94-171-2_517_spec_color.png”
   }
]

 

Спасылкі на крыніцы

Старонка сэрвісу: https://corpus.by/AllophonePlotter/?lang=be

Перакрыжаваныя спасылкі

  1. Zahariev, Vadim Grapheme-to-Phoneme and Phoneme-to-Grapheme Conversion in Belarusian with NooJ for TTS and STT Systems / Vadim Zahariev, Stanislau Lysy, Alena Hiuntar, Yury Hetsevich // Automatic Processing of Natural-Language Electronic Texts with NooJ: 9th International Conference, NooJ 2015, Minsk, Belarus, June 11-13, 2015, Revised Selected Papers / ed. T. Okrut, Y. Hetsevich, M. Silberztein, H. Stanislavenka. — Springer International Publishing, 2016. — P. 137-150.

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.