Ідэнтыфікатар амографаў


Сэрвіс «Ідэнтыфікатар амографаў» прызначаны для распазнавання і вылучэння ў тэксце амографаў.

 

Асноўныя тэрміны і паняцці

Амографы — словы, якія маюць аднолькавае напісанне і рознае вымаўленне, напрыклад, му́зыка і музы́ка.

 

Асаблівасці сэрвіса

Ідэнтыфікацыя амографаў ідзе па некалькіх слоўніках, да якіх звяртаецца сэрвіс:

  • SBM1987 (паводле публікацыі «Слоўнік беларускай мовы. Арфаграфія. Арфаэпія. Акцэнтуацыя. Словазмяненне / пад рэд. М.В. Бірылы. – Мінск, 1987»)
  • SBM2012initial (пачатковыя формы паводле публікацыі «Слоўнік беларускай мовы. / навук. рэд. А.А. Лукашанец, В.П. Русак. – Мінск : Беларус. навука, 2012»)
  • ZALIZNIAK (паводле публікацыі «Грамматический словарь русского языка: Словоизменение / А.А. Зализняк. — Москва : Русский язык, 1980. — 880 c.»)
  • CMU (паводле «Carnegie Mellon University Pronouncing Dictionary»)
  • NEW

За адзін раз сэрвіс можа апрацаваць тэкст аб’ёмам каля 20-30 старонак А4 тэксту, набранага шрыфтам 14 пт.

 

Практычная каштоўнасць

Сэрвіс прымяняецца пры вырашэнні шматлікіх задач.

Напрыклад, апрацоўка тэксту дадзеным сэрвісам — адзін з этапаў методыкі вычыткі тэксту вялікага памеру, дзе сэрвіс дапамагае выявіць амографы для далейшай расстаноўкі націскаў у тых выпадках амаграфіі, ад якіх залежыць сэнс тэксту.

 

Апісанне карыстальніцкага інтэрфейсу

Знешні інтэрфейс сэрвісу прадстаўлены на малюнку 1.

Малюнак 1. Знешні інтэрфейс сэрвіса «Ідэнтыфікатар амографаў»

Малюнак 1. Знешні інтэрфейс сэрвіса «Ідэнтыфікатар амографаў»

Інтэрфейс змяшчае наступныя вобласці:

  • поле ўводу электроннага тэксту;
  • поле выбару слоўнікаў;
  • кнопка «Шукаць амографы», якая запускае апрацоўку і дае магчымасць атрымаць вынікі ў полі іх вываду.

 

Карыстальніцкі сцэнар працы з сэрвісам

  1. На старонцы сэрвісу ўвесці ў поле ўводу тэкст, які патрабуе праверкі.
  2. Праглядзець спіс знойдзеных амографаў знайсці словы з памылкамі і ўнесці ў зыходны тэкст праўкі.
  3. Захаваць зыходны тэкст.

Вынік пошуку амографаў падаецца карыстальніку ў выглядзе табліцы (малюнак 2), што з’яўляецца вельмі зручным для карыстальніка.

Карыстальнік сэрвісу можа сам абраць з дадзенага спісу толькі тыя слоўнікі, якія яму патрэбны для аналізу тэксту.

image003

Малюнак 2 – Вынік пошуку амографаў у тэксце

У табліцы выводзяцца наступныя даныя

1) слова-амограф;

2) варыянты націску ў словах-амографах;

3) тып амографа (часцінамоўнае вызначэнне);

4) колькасць сустраканняў у тэксце;

5) кантэксты ўжыванняў;

6) слоўнік, па якім быў праведзены пошук амографаў.

Таксама сэрвіс прапануе карыстальніку атрымаць амографы ў форме звычайнага спісу. Каб атрымаць такі спіс, патрэбна націснуць на адпаведную спасылку (малюнак 3 і малюнак 4).

image005

Малюнак 3 – Спасылка на спіс амографаў

image007

Малюнак 4 – Амографы на асобнай старонцы

 

Старонка сэрвісу: http://corpus.by/HomographIdentifier/?lang=be

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.