Падлік частотнасці n-грам


Сэрвіс «Падлік частотнасці n-грам» прызначаны для падліку частотнасці паслядоўнасцяў з n элементаў. У якасці элементаў могуць выступаць як сімвалы, так і токены, словы і нават рэгулярныя выразы. На ўваход сэрвісу падаецца адвольны набор сімвалаў. Вынікам працы сэрвісу з’яўляецца спіс n-грам з іх частотамі ва ўваходным тэксце.

 

Доступ да сэрвіса праз API

Для доступу да сэрвіса “Падлік частотнасці n-грам” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/NgramFrequencyCounter/api.php. Праз масіў параметраў data перадаецца адвольны набор сімвалаў (параметр text), тып «грам» – элементаў, па паслядоўнасцях якіх адбываецца падлік, (параметр gramSelector) і колькасць «грам» (параметр n).

Элементы ўваходнага масіву data маюць наступныя параметры:

  • text — адвольны набор сімвалаў.
  • gramSelector — тып «грам» – элементаў, па паслядоўнасцях якіх адбываецца падлік. Даступныя тыпы: сімвал (параметр character). Запланаваныя тыпы: токен (параметр token), слова (параметр word), рэгулярны выраз (параметр regexp).
  • n — колькасць «грам» у адной n-граме.

Прыклад AJAX-запыту:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/NgramFrequencyCounter/api.php”,
   data:{
      “text”: “Груша цвіла апошні год.
Усе галіны яе, усе вялікія расохі, да апошняга пруціка, былі ўсыпаны буйным бела-ружовым цветам. Яна кіпела, млела і раскашавалася ў пчаліным звоне, цягнула да сонца сталыя лапы і распускала ў яго ззянні маленькія, кволыя пальцы новых парасткаў. І была яна такая магутная і свежая, так утрапёна спрачаліся ў яе ружовым раі пчолы, што, здавалася, не будзе ёй зводу і не будзе ёй канца.”,

      “gramSelector“: “character“,
      “n“: “3”
}
success: function(msg){ }
});

Сервер верне JSON-масіў з уваходным наборам сімвалаў (параметр text) і выніковым спісам n-грам з іх частотамі (параметр result). Напрыклад, па вышэй прыведзеным AJAX-запыце будзе сфарміраваны наступны адказ:

[
   {
      “text”: “Груша цвіла апошні год.
Усе галіны яе, усе вялікія расохі, да апошняга пруціка, былі ўсыпаны буйным бела-ружовым цветам. Яна кіпела, млела і раскашавалася ў пчаліным звоне, цягнула да сонца сталыя лапы і распускала ў яго ззянні маленькія, кволыя пальцы новых парасткаў. І была яна такая магутная і свежая, так утрапёна спрачаліся ў яе ружовым раі пчолы, што, здавалася, не будзе ёй зводу і не будзе ёй канца.”,

      “result”: “5: «ла »
4: «ым »
4: «рас»
4: « ра»
4: « і »
3: «ела»
3: « бу»
3: « ў »
3: «а с»
3: «алі»
3: «я, »
3: «ала»
3: «овы»
3: «на »
2: «зво»
2: «да »
2: « зв»

…”
   }
]

Прыклад выкарыстання дадзенага API — вэб-сэрвіс «Падлік частотнасці n-грам праз API» (http://corpus.by/NgramFrequencyCounterViaApi/).

 

Спасылкі на крыніцы

Старонка сэрвіса: http://corpus.by/NgramFrequencyCounter/?lang=be

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.

Пакінуць каментарый

Your email address will not be published. Required fields are marked *