PHP

Генератар алфавітна-прадметнага паказальніка

Сэрвіс «Генератар алфавітна-прадметнага паказальніка» дае магчымасць канвертаваць тэкст табліц універсальнай дзесятковай класіфікацыі (УДК) у алфавітна-прадметны паказальнік (АПП). На ўваход сэрвісу падаюцца табліцы УДК у фармаце «код класа — апісанне класа» праз табуляцыю, па адным класе на радок. Вынікам працы сэрвіса з’яўляецца фрагмент АПП. Асноўныя тэрміны і паняцці Алфавітна-прадметны паказальнік (АПП) — паказальнік, які складаецца з упарадкаванага па алфавіце мноства […]

Чытаць больш...

Падлік частотнасці n-грам

Сэрвіс «Падлік частотнасці n-грам» прызначаны для падліку частотнасці паслядоўнасцяў з n элементаў. У якасці элементаў могуць выступаць як сімвалы, так і токены, словы і нават рэгулярныя выразы. На ўваход сэрвісу падаецца адвольны набор сімвалаў. Вынікам працы сэрвісу з’яўляецца спіс n-грам з іх частотамі ва ўваходным тэксце.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Падлік […]

Чытаць больш...

Лематызатар

Сэрвіс «Лематызатар» прызначаны для вызначэння пачатковых форм слоў. На ўваход сэрвісу падаецца адвольны тэкст на беларускай мове. Вынікам працы сэрвісу з’яўляецца спіс слоў уваходнага тэксту з іх пачатковымі формамі, а таксама спіс слоў, пачатковую форму якіх не ўдалося вызначыць.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Лематызатар” праз API, неабходна адправіць AJAX-запыт тыпу POST на […]

Чытаць больш...

Вызначэнне мовы тэксту

Сэрвіс «Вызначэнне мовы тэксту» прызначаны для вызначэння мовы пададзенага на ўваход адвольнага тэксту.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Вызначэнне мовы” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/LanguageIdentifier/api.php. Праз масіў параметраў data перадаецца адвольны ўваходны тэкст (параметр text). Элементы ўваходнага масіву data маюць наступныя параметры: text — адвольны ўваходны тэкст памерам […]

Чытаць больш...

Расшыфроўка УДК

Сэрвіс «Расшыфроўка УДК» прызначаны для расшыфроўкі кодаў Універсальнай дзесятковай класіфікацыі. На ўваход сэрвісу падаецца код УДК, які патрэбна расшыфраваць. На выхадзе карыстальнік атрымлівае расшыфроўку кода УДК.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Расшыфроўка УДК” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/UdcDecoder/api.php. Праз масіў параметраў data перадаецца код УДК (параметр text). Элементы ўваходнага […]

Чытаць больш...

Ідэнтыфікатар тэгаў

Сэрвіс «Ідэнтыфікатар тэгаў» прызначаны для атрымання дапаможнай інфармацыі пра тэгі ў тэксце. На ўваход сэрвісу можна падаць адвольны тэкст альбо паслядоўнасць сімвалаў з тэгамі. На выхадзе карыстальнік атрымлівае наступную дапаможную інфармацыю пра тэгі ў тэксце: спіс тэгаў (адзіночных або толькі адкрываючых) паводле парадку, у якім яны сустракаюцца ў тэксце; частату выкарыстання кожнага тэга (у дужках […]

Чытаць больш...

Апрацоўка невядомых слоў

Сэрвіс «Апрацоўка невядомых слоў» пакліканы дапаўняць наяўныя слоўнікі сінтэзатара маўлення словамі, якія найбольш часта вызначаліся як невядомыя ці некарэктныя ў сэрвісах «Сінтэзатар маўлення па тэксце», «Праверка правапісу», «Агучаны электронны граматычны слоўнік».   Карыстальніцкі сцэнар працы з сэрвісам На старонцы сэрвіса абраць слова для апрацоўкі са спісу найбольш частотных невядомых слоў. Калі ніводнае слова са спісу не […]

Чытаць больш...

Прагназаванне працягласці прамовы

Сэрвіс «Прагназаванне працягласці прамовы» дазваляе карыстальніку даведацца прыкладны час працягласці прамовы анлайн. На ўваход сэрвісу падаецца электронны тэкст на беларускай, англійскай ці рускай мовах, тэкст можа быць уведзены ўручную або скапіраваны. На выхадзе карыстальнік атрымлівае вынік у выглядзе прыкладнай працягласці прамовы ў фармаце ГГ:ХХ:СС, а таксама інфармацыю пра колькасць слоў і знакаў, выкарыстаных у тэксце.   […]

Чытаць больш...

Вызначэнне часцін мовы

Сэрвіс “Вызначэнне часцін мовы” дазваляе карыстальніку ў рэжыме анлайн даведацца, да якой часціны мовы належыць пэўнае слова. На ўваход сэрвісу даецца тэкст на беларускай ці рускай мове, на выхадзе карыстальнік атрымлівае спіс слоў, у якім пазначана, да якой часціны мовы адносіцца кожнае слова тэксту.   Асноўныя тэрміны і паняцці Часціны мовы — разрады слоў, якія характарызуюцца […]

Чытаць больш...

Абрэзка выяў

Сэрвіс “Абрэзка выяў” прызначаны для хуткага і простага кадравання выявы ў прамавугольны або круглы фармат. На ўваход сэрвісу падаецца выява ці некалькі выяў у фармаце .jpg ці .png, пасля апрацоўкі на выхадзе карыстальнік атрымлівае магчымасць спампаваць уваходную выяву ў выглядзе прамавугольніка памерам 800х533 і круга дыяметрам 100 пікселяў у фармаце .png.   Асноўныя тэрміны і паняцці Кадраванне – выбар […]

Чытаць больш...

Дэманстрацыйны сэрвіс

“Дэманстрацыйны сэрвіс” з’яўляецца гатовым задзелам з адкрытым зыходным кодам для стварэння будучых сэрвісаў інтэрнэт-платформы для апрацоўкі тэксту і маўлення www.corpus.by. Таксама сэрвіс дэманструе магчымы прынцып працы будучых сэрвісаў, створаных на яго аснове. На ўваход дэманстрацыйнаму сэрвісу падаецца электронны тэкст, карыстальнік абірае любыя чэкбоксы, кнопку і опцыю, і пасля націскання кнопкі “Паказаць уведзены тэкст і абраныя наладкі” […]

Чытаць больш...

Генератар парадыгмы слова

Сэрвіс «Генератар парадыгмы слова» дазваляе атрымаць парадыгму слова. На ўваход сэрвісу даецца слова ці яго словаформы, сэрвіс ажыццяўляе пошук парадыгмы па слоўніку, і пры адсутнасці гатовай парадыгмы на выхадзе карыстальнік атрымлівае згенераваную парадыгму ўведзенага слова ці парадыгмы, створаныя на падставе падобных па напісанні слоў. Выніковыя згенераваныя парадыгмы маюць націск, пазначаны сімвалам «+», і спецыяльныя тэгі, аддзеленыя ад […]

Чытаць больш...

Тэматычнае распазнаванне маўлення

Сэрвіс «Тэматычнае распазнаванне маўлення» дазваляе карыстальніку пераўтварыць маўленне ў электронны тэкст анлайн. На ўваход сэрвісу даецца фанаграма маўленчых слоў тэматычных даменаў памерам не больш за 20 MB, на выхадзе сэрвіс дае распазнаны электронны тэкст фанаграмы. Фанаграма можа быць выбрана з пададзеных прыкладаў, загружана на сэрвіс з цвёрдага дыску камп’ютара ў фармаце .wav, а таксама можа быць […]

Чытаць больш...

Апрацоўка табліц

Сэрвіс “Апрацоўка табліц” прызначаны для прадстаўлення неспарадкаваных зыходных дадзеных у выглядзе табліцы. Знешні інтэрфейс сэрвісу прадстаўлены на малюнку 1. На ўваход сэрвісу можна падаць дадзеныя ў пэўным фармаце, якія цікавяць карыстальніка. Для атрымання табліцы з інфармацыяй карыстальніка трэба націснуць на кнопку “Show table!/Паказаць табліцу!” Малюнак 1 – Знешні выгляд сэрвісу “Апрацоўка табліц” Сэрвіс апрацоўвае пададзеную […]

Чытаць больш...

Сінтэзатар маўлення па тэксце

Сэрвіс «Сінтэзатар маўлення па тэксце» прызначаны для агучвання ўведзенага карыстальнікам тэксту. На ўваход карыстальнік падае электронны тэкст на беларускай ці рускай мове, сінтэзатар маўлення аўтаматычна апрацоўвае тэкст і фарміруе гукавы файл з сінтэзаваным уваходным тэкстам, які можна праслухаць, спампаваць і захаваць на камп’ютар.   Асноўныя тэрміны і паняцці Сінтэзатар маўлення па тэксце (СМТ) — гэта сістэма, здольная […]

Чытаць больш...

Гуказапіс

Сэрвіс “Гуказапіс” дае магчымасць запісваць гук прама ў браўзеры, не выкарыстоўваючы нейкія дадатковыя праграмы. Інтэрфэйс вельмі просты, але дае мінімальны набор неабходных інструментаў для працы. Сэрвіс можа запісаць адвольны гук ці зрабіць запіс праз ваш мікрафон, агучыць яго,  дазволіць спампаваць на камп’ютар ці выкарыстаць прамую спасылку. Малюнак 1 – Знешні інтэрфейс сэрвісу “Гуказапіс” Як працаваць […]

Чытаць больш...

Ідэнтыфікатар амографаў

Сэрвіс «Ідэнтыфікатар амографаў» прызначаны для распазнавання і вылучэння ў тэксце амографаў. На ўваход сэрвісу падаецца электронны тэкст, і па выніках апрацоўкі карыстальнік атрымлівае спіс знойдзеных у тэксце амографаў з іх падрабязнымі дадзенымі.   Асноўныя тэрміны і паняцці Амаграфія — уласцівасць двух ці некалькіх знакаў, што маюць адну графічную форму, але розныя значэнні. Амаграфія — гэта […]

Чытаць больш...

Агучаны электронны граматычны слоўнік

Сэрвіс «Агучаны электронны граматычны слоўнік» прызначаны для атрымання інфармацыі па правільнаму напісанню, вымаўленню слоў, дазваляе пабачыць транскрыпцыю (класічнага выгляду і ў фармаце IPA), а таксама даведацца падрабязную характарыстыку слова пра яго прыналежнасць да той ці іншай часціны мовы (малюнак 1). Сэрвіс аўтаматычна фарміруе гукавы файл, з дапамогай якога можна праслухаць уведзенае карыстальнікам слова і адначасова […]

Чытаць больш...

Упарадкаванне па алфавіце

Сэрвіс «Упарадкаванне па алфавіце» прызначаны для атрымання тэкставых радкоў у алфавітным парадку. На ўваход сэрвісу падаецца адвольны тэкст альбо паслядоўнасць сімвалаў, у якім 1 радок = 1 адзінка для ўпарадкавання па алфавіце, і сэрвіс прывядзе ўваходны тэкст у алфавітны парадак па радках. Таксама ён дазволіць расставіць сімвалы паводле прыярытэту пры сартыроўцы альбо абраць алфавіт.   Асаблівасці […]

Чытаць больш...

Распазнаванне музыкі

Сэрвіс “Music Recognizer” дазваляе распазнаваць ноты па мелодыі. “Music Recognizer” з’яўляецца ўнікальным рэсурсам канвертавання мелодыі ў ноты. Сэрвіс можа быць выкарыстаны як аматарамі, так і прафесіяналамі ў музыцы. “Music Recognizer” знаходзіцца ў адкрытым доступе і мае просты і зразумелы інтэрфейс, што спрашчае яго выкарыстоўванне.

Чытаць больш...

Канвертар азбукі Морзэ

Сэрвіс “Канвертар азбукі Морзэ” дазваляе ператвараць друкаваны тэкст у код Морзэ і наадварот. Таксама сэрвіс дае магчымасць карыстальніку праслухоўваць атрыманыя вынікі (код Морзэ ці друкаваны тэкст у залежнасці ад мэтанакіраванасці) анлайн.

Чытаць больш...

Графічнае адлюстраванне алафонных фраз

Галоўнай задачай сэрвісу “Графічнае адлюстраванне алафонных фраз” з’яўляецца графічнае адлюстраванне фізічнага сігналу ў часавым альбо частотным выглядзе для алафоннага радка, зададзенага карыстальнікам сэрвісу. Алафонны радок мае форму тэкставага радка, складзенага з паслядоўна запісаных алафонаў. Для адлюстравання сігналу выкарыстоўваюцца два графікі: асцылаграма сігналу і спектраграма сігналу. Асцылаграма сігналу – двухмернае часавае адлюстраванне сігналу. Больш дакладна, залежнасць […]

Чытаць больш...

Вычытка тэкстаў праз сэрвісы www.Corpus.by

Алгарытм працы пры вычытцы электронных беларускіх тэкстаў рознага памеру з выкарыстанне сэрвісаў, распрацаваных лабараторыя распазнавання і сінтэзу маўлення Аб’яднага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі.

Чытаць больш...

Інструкцыя па апісанні сэрвісаў партала www.Corpus.by (да 2016.10.03)

Інструкцыя па апісанні сэрвісаў партала www.Corpus.by: Пачынаць апісанне сэрвісу трэба з невялікага сказа, які раскрывае яго сутнасць і прызначэнне. У першым сказе павінна прысутнічаць назва сэрвісу і ўбудаваная спасылка на старонку сэрвісу. У апісанні павінен быць размешчаны скрыншот асноўнага акна сэрвісу. У апісанні сэрвісу павінны быць прыведзены ўсе яго функцыянальныя магчымасці. Функцыі сэрвісу павінны быць […]

Чытаць больш...

Праверка правапісу

Сэрвіс “Праверка правапісу” прызначаны для праверкі правільнасці напісання слоў. На ўваход сэрвісу падаецца электронны тэкст, які патрабуе праверкі. Па націсканні кнопкі “Праверыць” сэрвіс параўноўвае словы тэксту са словамі ў падключаных слоўніках. Знойдзеныя ў слоўніку ўваходныя словы сэрвіс кваліфікуе як напісаныя правільна і адкідае. Не знойдзеныя ў слоўніку ўваходныя словы (г. зн. невядомыя сэрвісу) сэрвіс кваліфікуе як напісаныя няправільна, […]

Чытаць больш...

Падлік частотнасці сімвалаў

Сэрвіс «Падлік частотнасці сімвалаў» дае статыстычную і даведачную інфармацыю пра сімвалы ў тэксце, што дазваляе выявіць і выправіць іх памылковае выкарыстанне. На ўваход сэрвісу падаецца адвольны электронны тэкст ці паслядоўнасць сімвалаў. Сэрвіс падлічвае агульную колькасць сімвалаў уваходнага тэксту і колькасць унікальных сімвалаў у тэксце. На выхадзе для кожнага ўнікальнага сімвала адлюстроўваецца інфармацыя: код па стандарце Unicode; […]

Чытаць больш...

Графічнае адлюстраванне алафонаў

Сэрвіс «Графічнае адлюстраванне алафонаў» дазваляе адлюстроўваць гук у графічным выглядзе. У дадзеным сэрвісе рэалізавана магчымасць звярнуцца да базы алафонаў інтэрнэт-версіі сінтэзатара маўлення па тэксце, абраць пэўны алафон з базы і атрымаць яго асцылаграму альбо спектраграму.   Асноўныя тэрміны і паняцці Алафон — рэалізацыя фанемы, яе варыянт, абумоўлены канкрэтным фанетычным акружэннем. Асцылаграма — графік залежнасці амплітуды гукавога сігналу […]

Чытаць больш...

Генератар транскрыпцый

Сэрвіс “Генератар транскрыпцый” распрацаваны для графічнага запісу гучання слоў (малюнак 1). Функцыянальнасць сэрвісу не абмяжоўваецца магчымасцю апрацоўкі паасобных слоў, але таксама дазваляе апрацоўваць вялікія аб’ёмы тэкстаў.

Чытаць больш...