N-gram Frequency Counter


Tools “N-gram Frequency Counter” for counting the frequency of n number of elements frequency. Symbols and tokens can act as elements, as well as words and even regular expressions. Arbitrary characters is an input for the service. The result of the service is a list of n-grams with their frequencies in the input text.

 

Access to the service via the API

To access the service “N-gram Frequency Counter” via the API, you send a POST request to the AJAX-address http://corpus.by/NgramFrequencyCounter/api.php. With the array data the parameters transmitted arbitrary symbol set (parameter text), the type of “gram” – the type of elements in a sequence to be processsed, (gramSelector parameter) and the number of “gram” (parameter n).

Input elements of data array have the following options:

  • text — arbitrary symbol set.
  • gramSelector — the type of elements in a sequence to be processed. Available types: character (parameter character). Planned types: token (token parameter), word (parameter word), the regular expression (the regexp parameter).
  • n — the number of “gram” in one n-gram.

Example of AJAX-request:

$.ajax({
   type: “POST”,
   url: “https://corpus.by/NgramFrequencyCounter/api.php”,
   data:{
      “text”: “Груша цвіла апошні год.
Усе галіны яе, усе вялікія расохі, да апошняга пруціка, былі ўсыпаны буйным бела-ружовым цветам. Яна кіпела, млела і раскашавалася ў пчаліным звоне, цягнула да сонца сталыя лапы і распускала ў яго ззянні маленькія, кволыя пальцы новых парасткаў. І была яна такая магутная і свежая, так утрапёна спрачаліся ў яе ружовым раі пчолы, што, здавалася, не будзе ёй зводу і не будзе ёй канца.”,

      “gramSelector“: “character“,
      “n“: “3”
}
success: function(msg){ }
});

The server returns JSON-array with an input set of characters (text parameter) as well as n-gram list of their frequencies (result parameter). For example, the following reply will be formed on the above-listed AJAX-request:

[
   {
      “text”: “Груша цвіла апошні год.
Усе галіны яе, усе вялікія расохі, да апошняга пруціка, былі ўсыпаны буйным бела-ружовым цветам. Яна кіпела, млела і раскашавалася ў пчаліным звоне, цягнула да сонца сталыя лапы і распускала ў яго ззянні маленькія, кволыя пальцы новых парасткаў. І была яна такая магутная і свежая, так утрапёна спрачаліся ў яе ружовым раі пчолы, што, здавалася, не будзе ёй зводу і не будзе ёй канца.”,

      “result”: “5: «ла »
4: «ым »
4: «рас»
4: « ра»
4: « і »
3: «ела»
3: « бу»
3: « ў »
3: «а с»
3: «алі»
3: «я, »
3: «ала»
3: «овы»
3: «на »
2: «зво»
2: «да »
2: « зв»

…”
   }
]

An example of using this API — Web Service “N-gram Frequency Counter via API» (http://corpus.by/NgramFrequencyCounterViaApi/).

 

Links to sources

Service page: http://corpus.by/NgramFrequencyCounter/?lang=be

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.