Рэалізавана

Агучаны электронны граматычны слоўнік

Сэрвіс «Агучаны электронны граматычны слоўнік» прызначаны для атрымання інфармацыі па правільнаму напісанню, вымаўленню слоў, дазваляе пабачыць транскрыпцыю (класічнага выгляду і ў фармаце IPA), а таксама даведацца падрабязную характарыстыку слова пра яго прыналежнасць да той ці іншай часціны мовы (малюнак 1). Сэрвіс аўтаматычна фарміруе гукавы файл, з дапамогай якога можна праслухаць уведзенае карыстальнікам слова і адначасова […]

Чытаць больш...

Упарадкаванне па алфавіце

Сэрвіс «Упарадкаванне па алфавіце» прызначаны для атрымання тэкставых радкоў у алфавітным парадку. На ўваход сэрвісу падаецца адвольны тэкст альбо паслядоўнасць сімвалаў, у якім 1 радок = 1 адзінка для ўпарадкавання па алфавіце, і сэрвіс прывядзе ўваходны тэкст у алфавітны парадак па радках. Таксама ён дазволіць расставіць сімвалы паводле прыярытэту пры сартыроўцы альбо абраць алфавіт.   Асаблівасці […]

Чытаць больш...

Распазнаванне музыкі

Сэрвіс “Music Recognizer” дазваляе распазнаваць ноты па мелодыі. “Music Recognizer” з’яўляецца ўнікальным рэсурсам канвертавання мелодыі ў ноты. Сэрвіс можа быць выкарыстаны як аматарамі, так і прафесіяналамі ў музыцы. “Music Recognizer” знаходзіцца ў адкрытым доступе і мае просты і зразумелы інтэрфейс, што спрашчае яго выкарыстоўванне.

Чытаць больш...

Канвертар азбукі Морзэ

Сэрвіс “Канвертар азбукі Морзэ” дазваляе ператвараць друкаваны тэкст у код Морзэ і наадварот. Таксама сэрвіс дае магчымасць карыстальніку праслухоўваць атрыманыя вынікі (код Морзэ ці друкаваны тэкст у залежнасці ад мэтанакіраванасці) анлайн.

Чытаць больш...

Графічнае адлюстраванне контуру асноўнага тону

Сэрвіс “Графічнае адлюстраванне контуру асноўнага тону” дазваляе карыстальніку атрымаць графічнае адлюстраванне контуру асноўнага тону маўленчай фразы анлайн. На ўваход сэрвісу даецца фанаграма фразы працягласцю не больш за хвіліну. Фанаграма можа быць загружана на сэрвіс з цвёрдага дыску камп’ютара або па спасылцы з сеткі Інтэрнэт, павінна быць у фармаце .wav ці запісана праз магчымасці аўдыязапісу сэрвісу. На выхадзе атрымліваюцца […]

Чытаць больш...

Графічнае адлюстраванне алафонных фраз

Галоўнай задачай сэрвісу “Графічнае адлюстраванне алафонных фраз” з’яўляецца графічнае адлюстраванне фізічнага сігналу ў часавым альбо частотным выглядзе для алафоннага радка, зададзенага карыстальнікам сэрвісу. Алафонны радок мае форму тэкставага радка, складзенага з паслядоўна запісаных алафонаў. Для адлюстравання сігналу выкарыстоўваюцца два графікі: асцылаграма сігналу і спектраграма сігналу. Асцылаграма сігналу – двухмернае часавае адлюстраванне сігналу. Больш дакладна, залежнасць […]

Чытаць больш...

Вычытка тэкстаў праз сэрвісы www.Corpus.by

Алгарытм працы пры вычытцы электронных беларускіх тэкстаў рознага памеру з выкарыстанне сэрвісаў, распрацаваных лабараторыя распазнавання і сінтэзу маўлення Аб’яднага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі.

Чытаць больш...

Інструкцыя па апісанні сэрвісаў партала www.Corpus.by (да 2016.10.03)

Інструкцыя па апісанні сэрвісаў партала www.Corpus.by: Пачынаць апісанне сэрвісу трэба з невялікага сказа, які раскрывае яго сутнасць і прызначэнне. У першым сказе павінна прысутнічаць назва сэрвісу і ўбудаваная спасылка на старонку сэрвісу. У апісанні павінен быць размешчаны скрыншот асноўнага акна сэрвісу. У апісанні сэрвісу павінны быць прыведзены ўсе яго функцыянальныя магчымасці. Функцыі сэрвісу павінны быць […]

Чытаць больш...

Праверка правапісу

Сэрвіс «Праверка правапісу» прызначаны для праверкі правільнасці напісання слоў. На ўваход сэрвісу падаецца электронны тэкст, які патрабуе праверкі. Па націсканні кнопкі «Праверыць!» сэрвіс параўноўвае словы тэксту са словамі ў падключаных слоўніках. Знойдзеныя хаця б у адным са слоўнікаў словы ўваходнага тэксту сэрвіс кваліфікуе як напісаныя правільна і адкідае. Словы, не знойдзеныя ў слоўніках, сэрвіс кваліфікуе […]

Чытаць больш...

Падлік частотнасці сімвалаў

Сэрвіс «Падлік частотнасці сімвалаў» дае статыстычную і даведачную інфармацыю пра сімвалы ў тэксце, што дазваляе выявіць і выправіць іх памылковае выкарыстанне. На ўваход сэрвісу падаецца адвольны электронны тэкст ці паслядоўнасць сімвалаў. Сэрвіс падлічвае агульную колькасць сімвалаў уваходнага тэксту і колькасць унікальных сімвалаў у тэксце. На выхадзе для кожнага ўнікальнага сімвала адлюстроўваецца інфармацыя: код па стандарце […]

Чытаць больш...

Графічнае адлюстраванне алафонаў

Сэрвіс «Графічнае адлюстраванне алафонаў» дазваляе адлюстроўваць гук у графічным выглядзе. У дадзеным сэрвісе рэалізавана магчымасць звярнуцца да базы алафонаў інтэрнэт-версіі сінтэзатара маўлення па тэксце, абраць пэўны алафон з базы і атрымаць яго асцылаграму альбо спектраграму.   Асноўныя тэрміны і паняцці Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем. Асцылаграма — графік залежнасці амплітуды гукавога сігналу […]

Чытаць больш...

Генератар транскрыпцый

Сэрвіс “Генератар транскрыпцый” распрацаваны для графічнага запісу гучання слоў (малюнак 1). Функцыянальнасць сэрвісу не абмяжоўваецца магчымасцю апрацоўкі паасобных слоў, але таксама дазваляе апрацоўваць вялікія аб’ёмы тэкстаў.

Чытаць больш...

Чытанне RSS

Сэрвіс «Чытанне RSS» патрэбны для таго, каб карыстальніку было зручна адсочваць на сайтах інфармацыю, якая рэгулярна абнаўляецца. Дадзены сэрвіс дае магчымасць увесці адвольны інтэрнэт-адрас альбо выбраць са спісу па змаўчанні і атрымаць спіс апісанняў апошніх навін ці новых артыкулаў сайта. Для карэктнай працы сэрвіса ўведзены адрас павінен быць спасылкай на RSS сайта. Гэтыя спасылкі можна […]

Чытаць больш...

Захаванне зместу інтэрнэт-старонкі

“Захаванне зместу інтэрнэт-старонкі” дазваляе карыстальніку без асаблівых складанасцяў захаваць HTML код любой інтэрнэт-старонкі. Дастаткова ў полі “Please input an URL” увесці спасылку і націснуць кнопку “Атрымать старонку”. Пасля апрацоўкі фарміруюцца два тэкставыя дакументы (*.txt): з тэгамі HTML (малюнак 2) і без іх (малюнак 3). Для таго, каб захаваць дакумент з HTML тэгамі, трэба націснуць на спасылку […]

Чытаць больш...

Генератар спасылак на публікацыі

Стварэнне бібліяграфічных спасылак — неад’емная частка навуковай працы. Каб спрасціць гэтую задачу для карыстальнікаў, быў створаны сэрвіс «Генератар спасылак на публікацыі». Дадзены сэрвіс распрацаваны для аўтаматычнай генерацыі спасылак. Зайшоўшы на старонку сэрвісу, карыстальніку неабходна пазначыць фармат спасылкі, тып крыніцы (кніга, артыкул часопісу, канферэнцыя, вэб-сайт) і мову афармлення публікацыі (беларуская, руская ці англійская) (малюнкі 1, 2). […]

Чытаць больш...

Збор тэматычных спісаў

Сэрвіс “Збор тэматычных спісаў” ставіць сваёй задачай прывесці мінімум па адным прыкладзе для адлюстравання кожнага канкрэтнага алафона ці дыфона (у нашым выпадку складаецца з санорнага зычнага і галоснага гукаў). У аснове дадзенага сэрвісу ляжаць спісы слоў, якія былі спецыяльна састаўлены экспертам. Для зручнасці карыстання і ўспрымання, падабраныя словы згрупіраваны па тэматыках, паколькі адвольны набор слоў, вельмі […]

Чытаць больш...

Сістэма апрацоўкі тэкстаў на беларускай і рускай мовах праз лінгвістычны працэсар NooJ

З дапамогай алгарытмаў канвертацыі электронных слоўнікаў былі распрацаваныя слоўнікі і граматыкі беларускай і рускай моў для лінгвістычнага настройвальнага працэсара NooJ. Для беларускай мовы модуль даступны для спампавання і выкарыстання (малюнак 1). Абодва модулі выкарыстоўваюцца ў прылажэнні да двухмоўнага СМТ (малюнак 2, малюнак 3). Малюнак 1 – Беларускія лінгвістычныя рэсурсы ў фармаце NooJ апублікаваныя на афіцыйным сайце […]

Чытаць больш...

Двухмоўны сінтэзатар у складзе інфармацыйна-аналітычнай сістэмы пошуку і апрацоўкі навукова-тэхнічнай інфармацыі

Інфармацыйна-аналітычная сістэма пошуку і апрацоўкі навукова-тэхнічнай інфармацыі была абсталявана двухмоўным сінтэзатарам. У выніку карыстальнік атрымаў магчымасць праслухоўваць атрыманы рэферат вялікага тэксту на БМ (малюнак 1) ці на РМ (малюнак 2). Блок нармалізацыі тэксту дазваляе якасна прыводзіць да арфаграфічнага тэксту складанаўтвораныя тэхнічныя выразы. Малюнак 1. Інтэрфейс стварэння рэферату на БМ з магчымасцю агучыць яго праз двухмоўны […]

Чытаць больш...

Гібрыдны сінтэзатар выразнага маўлення «ЭТАП-МУЛЬТЫФОН»

На малюнку 1 прыведзены прыклад перакладу тэксту з англійскай мовы на РМ. На малюнку 2 прыведзены прыклад сінтагматычнай апрацоўкі тэксту на РМ. Выніковыя тэксты ў абодвух выпадках размячаюцца адпаведнымі тыпамі сінтаксічных структур сказа, якія апрацоўваюцца СМТ на БМ і РМ у выразнае сінтэзаванае маўленне. Малюнак 1. Прыклад перакладу тэксту з англійскай мовы на РМ з магчымасцю […]

Чытаць больш...

Двухмоўная пытальна-адказная дыялогавая сістэма

Структура эксперыментальнай сістэмы натуральна-моўных інтэрфейсаў прыведзена на малюнку. Яна ўспрымае галасавыя пытанні на БМ ці РМ, апрацоўвае іх ў адпаведны тэкст, па ім з дапамогай машыны апрацоўкі пытанняў генеруецца тэкставае паведамленне, па якім сінтэзуецца маўленне. Малюнак 1. Функцыянальная схема пытальна-адказнай дыялогавай сістэмы для БМ і РМ Эксперыментальная мадэль сістэмы была распрацаваная для тэмы геаметрыя. Прыклады […]

Чытаць больш...

Падлік частотнасці алафонаў

Сэрвіс пошуку і сартыроўкі алафонаў” распрацаваны для вузка-прафесійнага кола карыстальнікаў, якія займаюцца ўдасканаленнем працы сінтэзатара маўлення па тэксце.

Чытаць больш...

Падлік частотнасці слоў

Сэрвіс “Частотнасць слоў” вырашае задачу па атрыманні статыстыкі ўжывання адвольных сімвальных паслядоўнасцяў у электронным тэксце. Прыватным выпадкам гэтай задачы з’яўляецца задача падліку частоты ўжывання слоў у электронным тэксце. Старонка сэрвісу – http://www.corpus.by/wordFrequency/

Чытаць больш...

Праверка правапісу «ў»

Сэрвіс «Праверка правапісу «ў» распрацаваны для хуткай праверкі вялікіх электронных тэкстаў на беларускай мове з мэтай пошуку і выпраўлення адной з найбольш распаўсюджаных памылак – памылкі ў напісанні літар «у» і «ў». На ўваход сэрвісу падаецца тэкст на беларускай мове ў звычайным выглядзе. Калі карыстальнік націсне кнопку «Праверыць!», сэрвіс абазначыць магчымыя памылкі двух тыпаў: па-першае, […]

Чытаць больш...

Сінтэзатар беларускага і рускага маўлення па тэксце для стацыянарных, мабільных і інтэрнэт платформ

Звычайная камунікацыя паміж людзьмі адбываецца праз голас і слых. Гэты спосаб узаемадзеяння пажаданы для чалавека-машынных адносінаў. Сінтэзатар маўлення распрацоўваецца, каб мабільны ці стацыянарны камп’ютар меў магчымасць прачытаць асобныя словы, сказы і інш. тэкставыя фрагменты на дзвюх дзяржаўных мовах Рэспублікі Беларусь: беларускай і рускай.

Чытаць больш...

Генератар арфаэпічнага слоўніка

Сэрвіс «Генератар арфаэпічнага слоўніка» выконвае задачу канвертавання электроннага арфаграфічнага запісу беларускіх слоў у фанетычную транскрыпцыю ў адпаведнасці з нормамі сучаснага беларускага маўлення. На ўваход сэрвісу падаецца тэкст на беларускай мове, далей сэрвіс прадстаўляе зыходныя дадзеныя ў транскрыбіраваным выглядзе: на выхадзе апрацоўкі падаецца кірылічная транскрыпцыя слова, якая адлюстроўвае яго правільнае вымаўленне.   Асноўныя тэрміны і паняцці Арфаэпія […]

Чытаць больш...

Генератар інфармацыі аб сімвалах

Сэрвіс «Генератар інфармацыі аб сімвалах» дае магчымасць атрымаць назвы сімвалаў кадыроўкі Windows-1251 (стандартнай 8-бітнай кадыроўкі для ўсіх рускіх версій Microsoft Windows). На ўваход сэрвісу падаецца электронны тэкст ці любая адвольная паслядоўнасць электронных сімвалаў кадыроўкі Windows-1251. Пасля апрацоўкі ўведзеных дадзеных карыстальнік атрымлівае спіс назваў сімвалаў па парадку іх знаходжання ва ўваходным тэксце.   Практычная каштоўнасць Мэтай дадзенага […]

Чытаць больш...

Электронная гаворачая бібліятэка “TalkingLibrary”

Агучванне электронных кніг, для невідушчых людзей, сінтэз маўлення па адвольным тэксце, электронная гаворачая бібліятэка, выраб агучанай літаратуры, кіраванне праграмай без ужывання візуальнага канала атрымання інфармацыі.

Чытаць больш...