Агучаны электронны граматычны слоўнік


Сэрвіс «Агучаны электронны граматычны слоўнік» прызначаны для атрымання інфармацыі па правільнаму напісанню, вымаўленню слоў, дазваляе пабачыць транскрыпцыю (класічнага выгляду і ў фармаце IPA), а таксама даведацца падрабязную характарыстыку слова пра яго прыналежнасць да той ці іншай часціны мовы (малюнак 1). Сэрвіс аўтаматычна фарміруе гукавы файл, з дапамогай якога можна праслухаць уведзенае карыстальнікам слова і адначасова захаваць яго.

 

image001

Малюнак 1 – Знешні інтэрфейс сэрвіса “Агучаны электронны граматычны слоўнік”

 

У радок “Слова для пошуку” можна падаць любое слова, якое жадае карыстальнік. Для атрымання інфармацыі пра слова трэба ўвесці слова, пазначыць, да якой канкрэтнай часціны мовы адносіцца слова, выбраць, па якіх слоўніках шукаць формы слова, і націснуць на кнопку “Search!/Шукаць!”. Сэрвіс падтрымлівае працу з такімі мовамі, як беларуская, руская і англійская. Для кожнай з моў прадстаўлены свае пэўныя слоўнікі, якія карыстальнік можа выбраць самастойна. Слоўнікі прадстаўлены на малюнку 2.

 

image002

Малюнак 2 – Слоўнікі, з якімі працуе сэрвіс “Агучаны электронны граматычны слоўнік”

 

Выніковыя дадзеныя выводзяцца карстальніку ў форме табліцы. Прыклад выніковых дадзеных пададзены на малюнку 3.

 

image003

Малюнак 3 – Прадстаўленне выніковых дадзеных

 

Сэрвіс дае магчымасць сартаваць выніковыя дадзеныя па кожным са слупкоў. Для гэтага неабходна націснуць на загаловак слупка, па якім трэба адсартаваць спіс. Пры паўторным націску на адзін і той жа загаловак спіс адсартаруецца ў адваротным парадку. На малюнку 4 прадстаўлены прыклад выніковых даных, адсартаваны па часцінамоўнай прыналежнасці ў алфавітным парадку (назоўнік, прыслоўе і г.д.).

 

image004

Малюнак 4 – Вынік апрацоўкі слова сэрвісам “Агучаны электронны граматычны слоўнік”, адсартаваныя па часцінамоўнай прыналежнасці ў алфавітным парадку

 

Акрамя асноўных функцый, сэрвіс мае і дадатковыя:

  • Магчымасці выбраць пэўную часціну мовы, да якой адносіцца слова. Для гэтага трэба у спісе “Часціна мовы” выбраць тое, што патрэбна карыстальніку (малюнак 5).  Або выбраць “Усе часціны мовы” для таго, каб пабачыць усе магчымыя варыянты слова.

 

image005

Малюнак 5 – Дадатковы выбар часціны мовы для слова

 

  • Выбар максімальнай колькасці вынікаў.

Для выбару максімальнай колькасці вынікаў карыстальніку трэба пазначыць колькасць у радку “Максімум вынікаў”. Колькасць можа быць адвольная, аднак сэрвіс абмяжоўвае выдачу вынікаў да 30 радкоў.

  • Адлюстраванне толькі пачатковых форм слова.

Карыстальнік мае магчымасць пабачыць не ўсе формы слова, а толькі пачатковыя. Для гэтага трэба паставіць гачык насупраць “Толькі пачатковыя формы” (малюнак 6). Або наадрварот – прыбраць яго, калі карыстальніка цікавяць усе формы зыходнага слова.

 

image006

Малюнак 6 – Адлюстраванне усіх або пачатковых форм слова

 

  • Спецыяльныя сімвалы для запытаў.

Яшчэ адна дадатковая магчымасць сэрвіса – гэта выкарыстанне спецыяльных сімвалаў для больш пашыранага пошуку. Сімвалы адкрываюцца пры націсканні на поле “Падрабязней пра спецыяльныя сімвалы для запытаў”. Канкрэтныя сімвалы і іх магчымасці прадстаўлены на малюнку 7.

 

image007

Малюнак 7 – Дадатковыя сімвалы для пашыранага пошуку

 

Апісанне спецыяльных сімвалаў для запытаў:

1. “.“(кропка) – выкарыстоўваецца для таго, каб пазначыць, што адвольным можа быць адзін сімвал. Напрыклад, каб атрымаць спіс слоў, якія пачынаюцца з “к” і заканчваюцца на “т”, трэба замест прапушчанай літары паставіць кропку – к.т – і далей націснуць на кнопку “Search!/Шукаць!”. Вынік працы праілюстраваны на малюнку 8.

image008Малюнак 8 – Вынік апрацоўкі слова па пашыраным пошуку з выкарыстаннем спецыяльнага сімвала “.” (кропка)

 

2. * (зорачка) – ставіцца замест адвольнай колькасці любых літар, каб знайсці словы, якія пачынаюцца спалучэннем літар “сло” і заканчваюцца спалучэннем “ік”. Вынік працы прадстаўлены на малюнку 9.

image009Малюнак 9 – Вынік апрацоўкі слова па пашыраным пошуку з выкарыстаннем спецыяльнага сімвала “*” (зорачка)

 

3. + (плюс) – ставіцца пры фарміраванні запыту пасля націскной галоснай, каб знайсці словы з пэўным націскам. Вынік працы прадстаўлены на малюнку 10.

 

image010

Малюнак 10 – Вынік апрацоўкі слова па пашыраным пошуку з выкарыстаннем спецыяльнага сімвала “+” (плюс)

 

4. = (роўна) – ставіцца пры фарміраванні запыту пасля галоснай з пабочным націскам. Вынік працы прадстаўлены на малюнку 11.

 

image011

Малюнак 11 – Вынік апрацоўкі слова па пашыраным пошуку з выкарыстаннем спецыяльнага сімвала “=” (роўна).

 

Доступ да сэрвіса праз API

Каб атрымаць даведачную слоўнікавую інфармацыю пра пэўнае слова, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/VoicedElectronicGrammaticalDictionary/api.php. Праз масіў параметраў data перадаецца запыт (параметр searchRequest), катэгорыя, да якой адносіцца слова ў запыце, (параметр category), маркер пошуку толькі сярод пачатковых форм (параметр onlyInitialForms), тэг фармату sbm1987 (параметр tagSbm1987), абмежаванне па колькасці збіраемых вынікаў (параметр maximumResults) і шэраг маркераў выкарыстання таго ці іншага слоўніка.

Элементы ўваходнага масіву data маюць наступныя параметры:

  • searchRequest — запыт.
  • category — катэгорыя, да якой адносіцца слова ў запыце.
  • onlyInitialForms — маркер пошуку толькі сярод пачатковых форм.
  • tagSbm1987 — тэг фармату sbm1987.
  • maximumResults — абмежаванне па колькасці збіраемых вынікаў.
  • Маркеры выкарыстання слоўнікаў:
    • sbm1987 — «Слоўнік беларускай мовы. Арфаграфія. Арфаэпія. Акцэнтуацыя. Словазмяненне / пад рэд. М.В. Бірылы. – Мінск, 1987»;
    • sbm2012initial —  «Слоўнік беларускай мовы. / навук. рэд. А.А. Лукашанец, В.П. Русак. – Мінск : Беларус. навука, 2012»;
    • noun2013 — «Граматычны слоўнік назоўніка / навук. рэд. В.П. Русак. – Мінск : Беларус. навука, 2013»;
    • asbm2017 — «Арфаэпічны слоўнік беларускай мовы / рэд. В.П. Русак, Ю.С. Гецэвіч, С.І. Лысы. – Мінск : Беларус. навука, 2017»;
    • zalizniak — «Грамматический словарь русского языка: Словоизменение / А.А. Зализняк. — Москва : Русский язык, 1980. — 880 c.»;
    • cmu — «Carnegie Mellon University Pronouncing Dictionary».

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/VoicedElectronicGrammaticalDictionary/api.php”,
   data:{
      “searchRequest”: “дз.сяты”,
      “category”: “усе”,
      “onlyInitialForms”: 0,
      “tagSbm1987”: “”,
      “maxContexts”: 10,
      “sbm1987”: 1,
      “sbm2008”: 1,
      “sbm2012initial”: 1,
      “noun2013”: 1
}
success: function(msg){ }
});

Сервер верне JSON-масіў з запытам (параметр searchRequest), выніковым масівам (параметр resultArr) і масівам з колькасцямі вынікаў па кожным слоўніку (параметр resultCntArr). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “searchRequest”: “дз.сяты”,
      “resultArr”: {
         “sbm1987”: {
            “-1”: {
               “id”: “ID”,
               “word”: “Word”,
               “accent”: “Accented word”,
               “lexeme”: “Lexeme”,
               “transcriptionCyr”: “Transcription”,
               “transcriptionIPA”: “IPA”,
               “tag”: “Tag”,
               “category”: “Category”
            }
            “0”: {
               “0”: {
                  “id”: “1436479”,
                  “word”: “дзесяты”,
                  “accent”: “дзеся+ты”,
                  “lexeme”: “дзесяты”,
                  “transcriptionCyr”: “[z’эс’а́ты]”,
                  “transcriptionIPA”: “[d͡zʲɛˈsʲatɨ]”,
                  “tag”: “DOMO”,
                  “category”: “лічэбнік”
               }
               “1”: { <…> }
               “2”: { <…> }
               “3”: { <…> }
            }
         }
         “sbm2012initial”: { <…> }
         “asbm2017”: { <…> }
      }
      “resultCntArr”: {
         “sbm1987”: 4,
         “sbm2012initial”: 1,
         “noun2013”: 0,
         “asbm2017”: 1
      }
   }
]

 

Спасылкі на крыніцы

Старонка сэрвіса: http://corpus.by/VoicedElectronicGrammaticalDictionary/?lang=be

Перакрыжаваныя спасылкі

  1. Гецэвіч, Ю.С. Камп’ютарна-лінгвістычныя сэрвісы www.corpus.by для аўтаматычнай апрацоўкі тэкстаў / Я.С. Качан, С.І. Лысы, Ю.С. Гецэвіч, Г.Р. Станіславенка, А.В. Гюнтар // Нацыянальна-культурны кампанент у літаратурнай і дыялектнай мове : зб. навук. арт. / Брэсц. дзярж. ун-т імя А. С. Пушкіна ; рэдкал.: С. Ф. Бут-Гусаім [і інш.]. – Брэст : БрДУ, 2016. — C. 93-104.
  2. Русак, В.П. Роля сучасных камп’ютарна-лінгвістычных рэсурсаў у фарміраванні культуры вуснай і пісьмовай мовы / В.П. Русак, Ю.С. Гецэвіч, В.А. Мандзік, С.І. Лысы // Першы міжнародны навуковы кангрэс беларускай культуры : зборнiк матэрыялаў (Мiнск, Беларусь, 5 – 6 мая 2016 г.) / Цэнтр даследаванняў беларускай культуры, мовы і літаратуры НАН Беларусі ; гал. рэд. А. І. Лакотка. — Мінск : Права і эканоміка, 2016. — C. 364-366.

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.