PHP

Дэманстрацыйны сэрвіс з аўтарызацыяй

«Дэманстрацыйны сэрвіс з аўтарызацыяй» з’яўляецца рэалізацыяй механізму аўтарызацыі на аснове «Дэманстрацыйнага сэрвіса». Гэта гатовы задзел з адкрытым зыходным кодам для стварэння будучых сэрвісаў інтэрнэт-платформы для апрацоўкі тэксту і маўлення www.corpus.by. Сэрвіс дэманструе магчымы прынцып працы будучых сэрвісаў, створаных на яго аснове.   Доступ да сэрвіса праз API Для доступу да “Дэманстрацыйнага сэрвіса з аўтарызацыяй” праз API, неабходна […]

Чытаць больш...

Раманізатар

Сэрвіс “Раманізатар” прызначаны для пераўтварэння беларускамоўнага тэксту, запісанага кірылічнымі сімваламі, у тэкст, запісаны лацінскімі сімваламі. На ўваход сэрвісу даецца беларускамоўны тэкст, запісаны сімваламі беларускага кірылічнага алфавіту. Дадзены тэкст можа ўяўляць сабой імёны, геаграфічныя назвы або іншую інфармацыю. Пасля апрацоўкі тэксту на выхадзе карыстальнік атрымлівае лацінізаваны запіс уваходнага кірылічнага тэксту.   Асноўныя тэрміны і паняцці Транслітарацыя – дакладная […]

Чытаць больш...

Пошук фанетычных з’яў

Сэрвіс «Пошук фанетычных з’яў» прызначаны для ідэнтыфікацыі той ці іншай фанетычнай з’явы ва ўведзеным тэксце. Доступ да сэрвіса праз API Для доступу да сэрвіса “Пошук фанетычных з’яў” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/PhoneticPhenomenaSearcher/api.php. Праз масіў data перадаюцца наступныя параметры: text — адвольны ўваходны тэкст. consonantsBel — спіс літар, якія абазначаюць зычныя гукі беларускай […]

Чытаць больш...

Генератар алфавітна-прадметнага паказальніка

Сэрвіс «Генератар алфавітна-прадметнага паказальніка» дае магчымасць канвертаваць тэкст табліц універсальнай дзесятковай класіфікацыі (УДК) у алфавітна-прадметны паказальнік (АПП). На ўваход сэрвісу падаюцца табліцы УДК у фармаце «код класа — апісанне класа» праз табуляцыю, па адным класе на радок. Вынікам працы сэрвіса з’яўляецца фрагмент АПП. Асноўныя тэрміны і паняцці Алфавітна-прадметны паказальнік (АПП) — паказальнік, які складаецца з упарадкаванага па алфавіце мноства […]

Чытаць больш...

Падлік частотнасці n-грам

Сэрвіс «Падлік частотнасці n-грам» прызначаны для падліку частотнасці паслядоўнасцяў розных па велічыні камбінацый элементаў. У якасці элементаў могуць выступаць як сімвалы, так і токены, словы і нават рэгулярныя выразы. На ўваход сэрвісу падаецца адвольны набор сімвалаў. Вынікам працы сэрвісу з’яўляецца спіс n-грам з іх частотамі ва ўваходным тэксце. Напрыклад, пры ўмовах па змаўчанні, сэрвіс пакажа частоты ўсіх […]

Чытаць больш...

Лематызатар

Сэрвіс «Лематызатар» прызначаны для вызначэння пачатковых форм слоў. На ўваход сэрвісу падаецца адвольны тэкст на беларускай мове. Вынікам працы сэрвісу з’яўляецца спіс слоў уваходнага тэксту з іх пачатковымі формамі, а таксама спіс слоў, пачатковую форму якіх не ўдалося вызначыць.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Лематызатар” праз API, неабходна адправіць AJAX-запыт тыпу POST на […]

Чытаць больш...

Вызначэнне мовы тэксту

Сэрвіс «Вызначэнне мовы тэксту» прызначаны для вызначэння мовы пададзенага на ўваход адвольнага тэксту.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Вызначэнне мовы” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас http://corpus.by/LanguageIdentifier/api.php. Праз масіў параметраў data перадаецца адвольны ўваходны тэкст (параметр text). Элементы ўваходнага масіву data маюць наступныя параметры: text — адвольны ўваходны тэкст памерам […]

Чытаць больш...

Расшыфроўка УДК

Сэрвіс «Расшыфроўка УДК» дазваляе карыстальніку атрымаць расшыфроўку кодаў Універсальнай дзесятковай класіфікацыі. На ўваход сэрвісу падаецца код УДК, які патрэбна расшыфраваць. На выхадзе карыстальнік атрымлівае інфармацыю па ўведзеным кодзе: код класа; апісанне класа па-англійску; апісанне класа па-беларуску.   Асноўныя тэрміны і паняцці УДК (Універса́льная дзесятко́вая класіфіка́цыя) – гэта мова індэксавання дакументаў, якая ўяўляе сабой сістэму класіфікацыі, ахопліваючую ўсе […]

Чытаць больш...

Ідэнтыфікатар тэгаў

Сэрвіс «Ідэнтыфікатар тэгаў» прызначаны для атрымання дапаможнай інфармацыі пра тэгі ў тэксце. На ўваход сэрвісу можна падаць адвольны тэкст альбо паслядоўнасць сімвалаў з тэгамі. На выхадзе карыстальнік атрымлівае наступную дапаможную інфармацыю пра тэгі ў тэксце: спіс тэгаў (адзіночных або толькі адкрываючых) паводле парадку, у якім яны сустракаюцца ў тэксце; частату выкарыстання кожнага тэга (у дужках […]

Чытаць больш...

Спецыялізаваны фанетычны слоўнік

Сэрвіс «Спецыялізаваны фанетычны слоўнік» прызначаны для адлюстравання транскрыпцыі спісаў слоў спецыялізаванай тэматыкі. На дадзены момант слоўнік змяшчае словы для рускай мовы, гэтыя словы ўжываліся ў бытавым і гутарковым тэматычным дамене. На старонцы сэрвіса знаходзіцца спіс літар па алфавіце, з якіх пачынаюцца словы з прапісаным фанетычным разборам. Карыстальнік можа выбраць любую літару і слова, што пачынаецца […]

Чытаць больш...

Апрацоўка невядомых слоў

Сэрвіс «Апрацоўка невядомых слоў» пакліканы дапаўняць наяўныя слоўнікі сінтэзатара маўлення словамі, якія найбольш часта вызначаліся як невядомыя ці некарэктныя ў сэрвісах «Сінтэзатар маўлення па тэксце», «Праверка правапісу», «Агучаны электронны граматычны слоўнік».   Карыстальніцкі сцэнар працы з сэрвісам На старонцы сэрвіса абраць слова для апрацоўкі са спісу найбольш частотных невядомых слоў. Калі ніводнае слова са спісу не […]

Чытаць больш...

Прагназаванне працягласці прамовы

Сэрвіс «Прагназаванне працягласці прамовы» дазваляе карыстальніку даведацца прыкладны час працягласці прамовы анлайн. На ўваход сэрвісу падаецца электронны тэкст на беларускай, англійскай ці рускай мовах, тэкст можа быць уведзены ўручную або скапіраваны. На выхадзе карыстальнік атрымлівае вынік у выглядзе прыкладнай працягласці прамовы ў фармаце ГГ:ХХ:СС, а таксама інфармацыю пра колькасць слоў і знакаў, выкарыстаных у тэксце.   […]

Чытаць больш...

Сінтэзатар «Гаворачая галава»

Сэрвіс «Сінтэзатар “Гаворачая галава”» дазваляе атрымаць візуалізацыю ўведзенага карыстальнікам тэксту. На ўваход сэрвісу падаецца электронны тэкст, сэрвіс апрацоўвае ўваходны тэкст і фарміруе відэафайл з аніміраванай галавой, якая вымаўляе ўведзеную фразу. «Гаворачая галава» перадае міміку чалавечай галавы і сінтэзаваны гук пры вымаўленні ўваходнага тэксту. Карыстальнік можа праглядзець выніковы відэафайл і захаваць яго.   Асноўныя тэрміны і паняцці Сінтэз […]

Чытаць больш...

Вызначэнне часцін мовы

Сэрвіс “Вызначэнне часцін мовы” дазваляе карыстальніку ў рэжыме анлайн даведацца, да якой часціны мовы належыць пэўнае слова. На ўваход сэрвісу даецца тэкст на беларускай ці рускай мове, на выхадзе карыстальнік атрымлівае спіс слоў, у якім пазначана, да якой часціны мовы адносіцца кожнае слова тэксту.   Асноўныя тэрміны і паняцці Часціны мовы — разрады слоў, якія характарызуюцца […]

Чытаць больш...

Абрэзка выяў

Сэрвіс “Абрэзка выяў” прызначаны для хуткага і простага кадравання выявы ў прамавугольны або круглы фармат. На ўваход сэрвісу падаецца выява ці некалькі выяў у фармаце .jpg ці .png, пасля апрацоўкі на выхадзе карыстальнік атрымлівае магчымасць спампаваць уваходную выяву ў выглядзе прамавугольніка памерам 800х533 і круга дыяметрам 100 пікселяў у фармаце .png.   Асноўныя тэрміны і паняцці Кадраванне – выбар […]

Чытаць больш...

Дэманстрацыйны сэрвіс

“Дэманстрацыйны сэрвіс” з’яўляецца гатовым задзелам з адкрытым зыходным кодам для стварэння будучых сэрвісаў інтэрнэт-платформы для апрацоўкі тэксту і маўлення www.corpus.by. Таксама сэрвіс дэманструе магчымы прынцып працы будучых сэрвісаў, створаных на яго аснове. На ўваход дэманстрацыйнаму сэрвісу падаецца электронны тэкст, карыстальнік абірае любыя чэкбоксы, кнопку і опцыю, і пасля націскання кнопкі “Паказаць уведзены тэкст і абраныя наладкі” […]

Чытаць больш...

Генератар парадыгмы слова

Сэрвіс «Генератар парадыгмы слова» дазваляе атрымаць парадыгму слова. На ўваход сэрвісу даецца слова ці яго словаформы, сэрвіс ажыццяўляе пошук парадыгмы па слоўніку, і пры адсутнасці гатовай парадыгмы на выхадзе карыстальнік атрымлівае згенераваную парадыгму ўведзенага слова ці парадыгмы, створаныя на падставе падобных па напісанні слоў. Выніковыя згенераваныя парадыгмы маюць націск, пазначаны сімвалам «+», і спецыяльныя тэгі, аддзеленыя ад […]

Чытаць больш...

Тэматычнае распазнаванне маўлення

Сэрвіс «Тэматычнае распазнаванне маўлення» дазваляе карыстальніку пераўтварыць маўленне ў электронны тэкст анлайн. На ўваход сэрвісу даецца фанаграма маўленчых слоў тэматычных даменаў памерам не больш за 20 MB, на выхадзе сэрвіс дае распазнаны электронны тэкст фанаграмы. Фанаграма можа быць выбрана з пададзеных прыкладаў, загружана на сэрвіс з цвёрдага дыску камп’ютара ў фармаце .wav, а таксама можа быць […]

Чытаць больш...

Апрацоўка табліц

Сэрвіс “Апрацоўка табліц” прызначаны для прадстаўлення неспарадкаваных зыходных дадзеных у выглядзе табліцы. Знешні інтэрфейс сэрвісу прадстаўлены на малюнку 1. На ўваход сэрвісу можна падаць дадзеныя ў пэўным фармаце, якія цікавяць карыстальніка. Для атрымання табліцы з інфармацыяй карыстальніка трэба націснуць на кнопку “Show table!/Паказаць табліцу!” Малюнак 1 – Знешні выгляд сэрвісу “Апрацоўка табліц” Сэрвіс апрацоўвае пададзеную […]

Чытаць больш...

Сінтэзатар маўлення па тэксце

Сэрвіс «Сінтэзатар маўлення па тэксце» прызначаны для агучвання ўведзенага карыстальнікам тэксту. На ўваход карыстальнік падае электронны тэкст на беларускай ці рускай мове, сінтэзатар маўлення аўтаматычна апрацоўвае тэкст і фарміруе гукавы файл з сінтэзаваным уваходным тэкстам, які можна праслухаць, спампаваць і захаваць на камп’ютар.   Асноўныя тэрміны і паняцці Сінтэзатар маўлення па тэксце (СМТ) — гэта сістэма, здольная […]

Чытаць больш...

Гуказапіс

Сэрвіс “Гуказапіс” дае магчымасць запісваць гук прама ў браўзеры, не выкарыстоўваючы нейкія дадатковыя праграмы. Інтэрфэйс вельмі просты, але дае мінімальны набор неабходных інструментаў для працы. Сэрвіс можа запісаць адвольны гук ці зрабіць запіс праз ваш мікрафон, агучыць яго,  дазволіць спампаваць на камп’ютар ці выкарыстаць прамую спасылку. Малюнак 1 – Знешні інтэрфейс сэрвісу “Гуказапіс” Як працаваць […]

Чытаць больш...

Ідэнтыфікатар амографаў

Сэрвіс «Ідэнтыфікатар амографаў» прызначаны для распазнавання і вылучэння ў тэксце амографаў. На ўваход сэрвісу падаецца электронны тэкст, і па выніках апрацоўкі карыстальнік атрымлівае спіс знойдзеных у тэксце амографаў з іх падрабязнымі дадзенымі.   Асноўныя тэрміны і паняцці Амаграфія — уласцівасць двух ці некалькіх знакаў, што маюць адну графічную форму, але розныя значэнні. Амаграфія — гэта […]

Чытаць больш...

Агучаны электронны граматычны слоўнік

Сэрвіс «Агучаны электронны граматычны слоўнік» прызначаны для атрымання інфармацыі па правільнаму напісанню, вымаўленню слоў, дазваляе пабачыць транскрыпцыю (класічнага выгляду і ў фармаце IPA), а таксама даведацца падрабязную характарыстыку слова пра яго прыналежнасць да той ці іншай часціны мовы (малюнак 1). Сэрвіс аўтаматычна фарміруе гукавы файл, з дапамогай якога можна праслухаць уведзенае карыстальнікам слова і адначасова […]

Чытаць больш...

Упарадкаванне па алфавіце

Сэрвіс «Упарадкаванне па алфавіце» прызначаны для атрымання тэкставых радкоў у алфавітным парадку. На ўваход сэрвісу падаецца адвольны тэкст альбо паслядоўнасць сімвалаў, у якім 1 радок = 1 адзінка для ўпарадкавання па алфавіце, і сэрвіс прывядзе ўваходны тэкст у алфавітны парадак па радках. Таксама ён дазволіць расставіць сімвалы паводле прыярытэту пры сартыроўцы альбо абраць алфавіт.   Асаблівасці […]

Чытаць больш...

Распазнаванне музыкі

Сэрвіс “Music Recognizer” дазваляе распазнаваць ноты па мелодыі. “Music Recognizer” з’яўляецца ўнікальным рэсурсам канвертавання мелодыі ў ноты. Сэрвіс можа быць выкарыстаны як аматарамі, так і прафесіяналамі ў музыцы. “Music Recognizer” знаходзіцца ў адкрытым доступе і мае просты і зразумелы інтэрфейс, што спрашчае яго выкарыстоўванне.

Чытаць больш...

Канвертар азбукі Морзэ

Сэрвіс “Канвертар азбукі Морзэ” дазваляе ператвараць друкаваны тэкст у код Морзэ і наадварот. Таксама сэрвіс дае магчымасць карыстальніку праслухоўваць атрыманыя вынікі (код Морзэ ці друкаваны тэкст у залежнасці ад мэтанакіраванасці) анлайн.

Чытаць больш...

Графічнае адлюстраванне алафонных фраз

Галоўнай задачай сэрвісу “Графічнае адлюстраванне алафонных фраз” з’яўляецца графічнае адлюстраванне фізічнага сігналу ў часавым альбо частотным выглядзе для алафоннага радка, зададзенага карыстальнікам сэрвісу. Алафонны радок мае форму тэкставага радка, складзенага з паслядоўна запісаных алафонаў. Для адлюстравання сігналу выкарыстоўваюцца два графікі: асцылаграма сігналу і спектраграма сігналу. Асцылаграма сігналу – двухмернае часавае адлюстраванне сігналу. Больш дакладна, залежнасць […]

Чытаць больш...

Вычытка тэкстаў праз сэрвісы www.Corpus.by

Алгарытм працы пры вычытцы электронных беларускіх тэкстаў рознага памеру з выкарыстанне сэрвісаў, распрацаваных лабараторыя распазнавання і сінтэзу маўлення Аб’яднага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі.

Чытаць больш...