Праверка правапісу «ў»


Адным з важных момантаў у сінтэзаванні маўлення з’яўляецца тое, што ўваходны тэкст мусіць не мець арфаграфічных памылак. Іначай, відавочна, вынікам працы СМТ будзе некарэктны гукавы тэкст, які рэжа слых.

Сэрвіс Праверка правапісу «ў» распрацаваны для хуткай праверкі вялікіх электронных тэкстаў на беларускай мове з мэтай пошуку і выпраўлення адной з найбольш распаўсюджаных памылак – памылкі ў напісанні літар “у” і “ў”.

На ўваход сэрвіса падаецца тэкст на беларускай мове ў звычайным выглядзе. Калі карыстальнік націсне кнопку “Праверыць!”, сэрвіс абазначыць магчымыя памылкі двух тыпаў: па-першае, калі літара “у” напісана ў пазіцыі, дзе верагодна павінна быць літара “ў”; па-другое, у адваротным выпадку, калі напісана літара “ў”, дзе верагодна павінна быць літара “у”.

У працэсе пошуку магчымых памылак сэрвіс ня толькі вызначае, галосная ці зычная літара знаходзіцца перад “у”, але таксама аналізуе сімвалы, якія не з’яўляюцца літарамі, у выпадку, калі літара “у” знаходзіцца ў пачатку слова. Гэтыя сімвалы могуць мець непасрэдны ўплыў на напісанне слова. На сённяшні дзень сэрвіс правярае напісанне без уліку выключэнняў. Дадаць разгляд выключэнняў у сэрвісе плануецца.

 

Доступ да сэрвіса праз API

Для атрымання спісу памылак ва ўваходным тэксце на правілы правапісу літар “у” і “ў”, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/ShortUSpellChecker/api.php. Праз масіў параметраў data перадаецца адвольны ўваходны тэкст на беларускай мове (параметр inputText), спіс выключэнняў (параметры exceptions) і спіс абрэвіятур (параметр abbreviations).

Элементы ўваходнага масіву data маюць наступныя параметры:

  • inputText — адвольны ўваходны тэкст на беларускай мове.
  • exceptions — спіс выключэнняў.
  • abbreviations — спіс абрэвіятур.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “http://corpus.by/ShortUSpellChecker/api.php”,
   data:{
      “inputText“: “Кот ў ботах.
На Ўкраіне паўднёва-усходні вецер.
Тата любіць бульбў.”,

      “exceptions“: “авіяшоу акварыум”,
      “abbreviations“: “УНР УДК
   }
   success: function(msg){ }
});

Сервер верне JSON-масіў з уваходным тэкстам (параметр text), табліцу памылак на “ў” (параметр res_unc) і табліцу памылак на “у” (параметр res_uc). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “text”: “Кот ў ботах.
На Ўкраіне паўднёва-усходні вецер.
Тата любіць бульбў.”,

      “res_unc“: “<table class=”pale” width=”100%”><tbody><tr><td width=”50%” valign=”top”><b>Сустрэлася</b></td><td width=”50%” valign=”top”><b>Каментар</b></td></tr><tr><td width=”50%” valign=”top”>«<font color=”red”>а-у</font>»: …ботах.
На Ўкраіне паўднёв<font color=”red”>а-у</font>сходні вецер.
Тата любіць …”</td><td width=”50%” valign=”top”> <i>(«у» пасля галоснай «а» і злучка)</i></td></tr></tbody></table>”,

      “res_uc“: “<table class=”pale” width=”100%”><tbody><tr><td width=”50%” valign=”top”><b>Сустрэлася</b></td><td width=”50%” valign=”top”><b>Каментар</b></td></tr><tr><td width=”50%” valign=”top”>«<font color=”red”>т ў</font>»: …Ко<font color=”red”>т ў</font> ботах.
На Ўкраіне …”</td><td width=”50%” valign=”top”> <i>(«ў» пасля зычнай «т» без знакаў прыпынку)</i></td></tr><tr><td width=”50%” valign=”top”>«<font color=”red”>Ў</font>»: …ў ботах.
На <font color=”red”>Ў</font>краіне паўднёва-усходні вецер.
Тата …”</td><td width=”50%” valign=”top”> <i>(ВЯЛІКАЯ «Ў» ДАЗВАЛЯЕЦЦА ТОЛЬКІ Ў ТЭКСТАХ, ДЗЕ ЎСЕ СЛОВЫ ПІШУЦЦА ВЯЛІКІМІ ЛІТАРАМІ)</i></td></tr><tr><td width=”50%” valign=”top”>«<font color=”red”>бў</font>»: …вецер.
Тата любіць буль<font color=”red”>бў</font>.…”</td><td width=”50%” valign=”top”> <i>(«ў» пасля зычнай «б»)</i></td></tr></tbody></table>”

   }
]

Прыклад выкарыстання дадзенага API — вэб-сэрвіс «Праверка правапісу “ў” праз API» (http://corpus.by/ShortUSpellCheckerViaApi/).

 

Старонка сэрвісу – http://corpus.by/ShortUSpellChecker/?lang=be

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.