Homograph Identifier


Sorry, this entry is only available in Беларуская. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

Сэрвіс «Ідэнтыфікатар амографаў» прызначаны для распазнавання і вылучэння ў тэксце амографаў. На ўваход сэрвісу падаецца электронны тэкст, і па выніках апрацоўкі карыстальнік атрымлівае спіс знойдзеных у тэксце амографаў з іх падрабязнымі дадзенымі.

 

Асноўныя тэрміны і паняцці

Амаграфія — уласцівасць двух ці некалькіх знакаў, што маюць адну графічную форму, але розныя значэнні. Амаграфія — гэта графічная аманімія.

Аманімія — супадзенне слоў ці іх форм у гукавым дачыненні пры поўнай адрознасці ў значэнні.

Амографы — словы, якія маюць аднолькавае напісанне і рознае вымаўленне, напрыклад, му́зыка і музы́ка.

Амонімы — розныя па значэнні, але аднолькавыя па напісанні і гучанні адзінкі мовы (словы, марфемы і інш.).

 

Асаблівасці сэрвісу

Ідэнтыфікацыя амографаў ідзе па некалькіх слоўніках, да якіх звяртаецца сэрвіс:

  • SBM1987 (паводле публікацыі «Слоўнік беларускай мовы. Арфаграфія. Арфаэпія. Акцэнтуацыя. Словазмяненне / пад рэд. М.В. Бірылы. – Мінск, 1987»)
  • SBM2012initial (пачатковыя формы паводле публікацыі «Слоўнік беларускай мовы. / навук. рэд. А.А. Лукашанец, В.П. Русак. – Мінск : Беларус. навука, 2012»)
  • ZALIZNIAK (паводле публікацыі «Грамматический словарь русского языка: Словоизменение / А.А. Зализняк. — Москва : Русский язык, 1980. — 880 c.»)
  • CMU (паводле «Carnegie Mellon University Pronouncing Dictionary»)
  • NEW

Карыстальнік можа абраць з дадзенага спісу толькі тыя слоўнікі, якія яму патрэбныя для аналізу тэксту. Напрыклад, для пошуку амаграфіі ў тэксце на беларускай мове мэтазгодна абраць слоўнікі SBM1987 і SBM2012initial, на рускай мове — толькі слоўнік ZALIZNIAK, на англійскай мове — толькі слоўнік CMU.

За адзін раз сэрвіс можа апрацаваць тэкст аб’ёмам каля 20-30 старонак А4, набранага шрыфтам 14 пт.

 

Практычная каштоўнасць

Сэрвіс прымяняецца пры вырашэнні шматлікіх задач.

Напрыклад, апрацоўка тэксту дадзеным сэрвісам — адзін з этапаў методыкі вычыткі тэксту вялікага памеру, дзе сэрвіс дапамагае выявіць амографы для далейшай расстаноўкі націскаў у тых выпадках амаграфіі, ад якіх залежыць сэнс тэксту.

 

Апісанне карыстальніцкага інтэрфейсу

Знешні інтэрфейс сэрвісу прадстаўлены на малюнку 1.

Малюнак 1. Знешні інтэрфейс сэрвіса «Ідэнтыфікатар амографаў»

Малюнак 1. Знешні інтэрфейс сэрвісу «Ідэнтыфікатар амографаў»

Інтэрфейс змяшчае наступныя вобласці:

  • поле ўводу электроннага тэксту;
  • поле выбару слоўнікаў;
  • кнопка «Шукаць амографы!», якая запускае апрацоўку;
  • поле вываду вынікаў, якое з’яўляецца пасля апрацоўкі і мае выгляд табліцы.

 

Карыстальніцкі сцэнар працы з сэрвісам

  1. Ўвесці ў поле ўводу тэкст, які патрабуе вызначэння амографаў.
  2. Выбраць неабходныя слоўнікі.
  3. Націснуць кнопку «Шукаць амографы!» для запуску пошуку і атрымання вынікаў.
  4. Праглядзець спіс знойдзеных амографаў у полі вываду (малюнак 2), вызначаючы выпадкі амаграфіі, якія цікавяць карыстальніка, і пры патрэбе ўнесці праўкі (напрыклад, паставіць націскі) у зыходны тэкст.
Малюнак 2. Вынікі працы сэрвіса «Ідэнтыфікатар амографаў»: знойдзеныя амографы

Малюнак 2. Вынікі працы сэрвісу «Ідэнтыфікатар амографаў»: знойдзеныя амографы

У табліцы выводзяцца наступныя даныя:

  • слова-амограф;
  • варыянты націску ў словах-амографах;
  • тып амографа (часцінамоўнае вызначэнне);
  • колькасць ужыванняў у тэксце;
  • кантэксты ўжыванняў;
  • слоўнік(і), па якім(якіх) быў праведзены пошук амографаў.

Таксама сэрвіс прапануе карыстальніку атрымаць амографы ў форме звычайнага спісу. Каб атрымаць такі спіс, патрэбна націснуць на адпаведную спасылку (малюнак 3), і будзе даступны спіс (малюнак 4).

Малюнак 3. Спасылка на спіс амографаў

Малюнак 3. Спасылка на спіс амографаў

Малюнак 4. Амографы на асобнай старонцы

Малюнак 4. Амографы на асобнай старонцы

Спасылкі на крыніцы

Старонка сэрвісу: http://corpus.by/HomographIdentifier/?lang=be

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.