(Беларуская) Падлік частотнасці сімвалаў


Извините, этот техт доступен только в “Беларуская” и “Американский Английский”. For the sake of viewer convenience, the content is shown below in this site default language. You may click one of the links to switch the site language to another available language.

Сэрвіс «Падлік частотнасці сімвалаў» дае статыстычную і даведачную інфармацыю пра сімвалы ў тэксце, што дазваляе выявіць і выправіць іх памылковае выкарыстанне. На ўваход сэрвісу падаецца адвольны электронны тэкст ці паслядоўнасць сімвалаў. Сэрвіс падлічвае агульную колькасць сімвалаў уваходнага тэксту і колькасць унікальных сімвалаў у тэксце. На выхадзе для кожнага ўнікальнага сімвала адлюстроўваецца інфармацыя:

  • код па стандарце Unicode;
  • назва (для тых сімвалаў, якія ёсць у базе);
  • частату ўжывання сімвала:
    • фактычную колькасць;
    • долю сярод астатніх сімвалаў;
  • кантэкст ужывання, сустрэты сэрвісам упершыню.

Выніковыя даныя выводзяцца карыстальніку ў форме табліцы.

 

Практычная каштоўнасць

Сэрвіс прымяняецца пры вырашэнні шматлікіх задач.

Напрыклад, апрацоўка тэксту дадзеным сэрвісам — адзін з этапаў методыкі вычыткі тэксту вялікага памеру, дзе сэрвіс дапамагае выявіць няправільнае ўжыванне сімвалаў у тэксце. Так, карыстальнік мусіць прагледзець выніковы спіс сімвалаў і праверыць у ім наступныя моманты:

  • ці аднолькавая колькасць дужак, напрыклад, /(/, /)/, /[/, /]/;
  • ці аднолькавая колькасць падвоеных двукоссяў /“/, /”/, /«/, /»/, /„/, /“/;
  • ці прысутнічае ў тэксце сімвал /”/, які насамрэч з’яўляецца сімвалам секунды, а не двукоссем, і пры няправільным ужыванні мусіць быць замененым на адно з двукоссяў;
  • ці прысутнічае ў тэксце сімвал /’/, які па стандарце Unicode завецца апострафам, але ў беларускім друку ў ролі апострафа не ўжываецца і мусіць быць заменены сімвалам /’/ (Alt+0146);
  • ці правільна выкарыстоўваецца злучок /-/, кароткі /–/, доўгі /—/ працяжнікі;
  • ці прысутнічаюць лацінскія літары ў кірылічным тэксце.

Так, напрыклад, калі колькасць левых і правых дужак не супадае, то, хутчэй за ўсё, у тэксце ёсць пунктуацыйныя памылкі. Па знойдзеных памылковых ужываннях сімвалаў неабходна ўнесці праўкі ў тэкст, пажадана пераправерыць сэрвісам яшчэ раз скарэктаваны тэкст, і перайсці да наступнага этапу вычыткі (гл. методыку).

 

Апісанне інтэрфейсу карыстальніка

Графічны інтэрфейс сэрвісу ўключае наступныя часткі, прадстаўленыя на малюнку 1.

Малюнак 1. Інтэрфейс сэрвісу «Падлік частотнасці сімвалаў»

Інтэрфейс змяшчае наступныя вобласці:

  • поле ўводу электроннага тэксту;
  • кнопка «Атрымаць інфармацыю пра частотнасць сімвалаў!», якая запускае апрацоўку тэксту і дае магчымасць атрымаць вынікі;
  • поле вываду выніковых дадзеных.

 

Карыстальніцкі сцэнар працы з сэрвісам

  1. Увесці ў поле ўводу электронны тэкст ці паслядоўнасць сімвалаў.
  2. Націснуць кнопку «Атрымаць інфармацыю пра частотнасць сімвалаў!», каб атрымаць выніковыя дадзеныя (малюнак 2).
  3. Пры неабходнасці адсартаваць дадзеныя: націснуць на загаловак слупка, па якім патрэбна адсартаваць спіс. Пры паўторным націску на адзін і той жа загаловак спіс адсартуецца ў адваротным парадку (малюнак 3).
  4. Праглядзець спіс знойдзеных сімвалаў, шукаючы магчымыя выпадкі няправільнага іх ужывання, няроўнай колькасці дужак і да г.п.
  5. Унесці праўкі ў зыходны тэкст.
  6. Пажадана пераправерыць сэрвісам тэкст з ужо ўнесенымі праўкамі і захаваць яго.

Прыклад выніковых дадзеных прадстаўлены на малюнку 2.

Малюнак 2. Вынікі апрацоўкі тэксту сэрвісам «Падлік частотнасці сімвалаў»

Прыклад выніковых дадзеных, адсартаваных па колькасці ўжыванняў сімвалаў, прадстаўлены на малюнку 3.

Малюнак 3. Вынікі апрацоўкі тэксту сэрвісам «Падлік частотнасці сімвалаў», адсартаваныя па колькасці ўжыванняў сімвалаў (ад большай да меншай)

 

Спасылкі на крыніцы

Старонка сэрвісу: http://corpus.by/CharacterFrequencyCounter/?lang=be

Методыка вычыткі электроннага тэксту вялікага памеру: http://ssrlab.by/5406

Табліца сімвалаў Unicode: https://unicode-table.com

(Беларуская) Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.