PHP

Пошук найбліжэйшых слоў

Сэрвіс «Пошук найбліжэйшых слоў» апрацоўвае паслядоўнасці сімвалаў, раздзеленыя сімваламі водступаў, і параўноўвае іх з карыстальніцкімі слоўнікавымі паслядоўнасцямі. Вынікам працы сэрвіса з’яўляецца HTML-табліца з парамі «слова – адпаведнік», дзе слова – зыходная паслядоўнасць сімвалаў, адпаведнік – слоўнікавая паслядоўнасць сімвалаў, найбліжэйшая да слова згодна з адлегласцю Левенштэйна.   Асноўныя тэрміны і паняцці Адлегласць Левенштэйна (рэдакцыйная адлегласць, дыстанцыя […]

Чытаць больш...

Апрацоўка граматычнага слоўніка

Сэрвіс «Апрацоўка граматычнага слоўніка» дае магчымасць карыстальніку атрымаць у выглядзе HTML-табліцы папярэдне загружаныя і прыведзеныя да патрэбнага фармату лексікаграфічныя дадзеныя граматычнага слоўніка, а таксама атрымаць SQL-інструкцыі для стварэння базы дадзеных, якая змяшчае ўведзеную інфармацыю ў структурыраваным выглядзе.   Асноўныя тэрміны і паняцці Парсінг (або сінтаксічны аналіз) – у лінгвістыцы і інфарматыцы – працэс супастаўлення лінейнай […]

Чытаць больш...

Пошук кода УДК

Сэрвіс «Пошук кода УДК» дазваляе карыстальніку атрымаць спіс кодаў Універсальнай дзесятковай класіфікацыі, у апісаннях якіх сустракаецца тое ці іншае слова. На ўваход сэрвісу падаецца слова, якое неабходна знайсці. На выхадзе карыстальнік атрымлівае наступную інфармацыю пра класы УДК, дзе сустракаецца ўведзенае слова: код класа; апісанне класа па-англійску; апісанне класа па-беларуску.   Асноўныя тэрміны і паняцці УДК […]

Чытаць больш...

Фанетычны мінімізатар

Сэрвіс «Фанетычны мінімізатар» дазваляе карыстальніку на аснове корпуса тэкстаў на беларускай мове сфарміраваць мінімізаванае мноства сказаў, якія пакрываюць усе фанетычныя адзінкі, наяўныя ў зыходным корпусе. На ўваход сэрвісу падаецца ўведзены карыстальнікам тэкст або абраная карыстальнікам база тэкстаў. Карыстальнік можа вызначыць два параметры мінімізацыі: базавую адзінку, паводле якой адбываецца мінімізацыя, і мяжу пошуку, да якой адбываецца […]

Чытаць больш...

Дэманстрацыйны сэрвіс з аўтарызацыяй

«Дэманстрацыйны сэрвіс з аўтарызацыяй» з’яўляецца рэалізацыяй механізму аўтарызацыі на аснове «Дэманстрацыйнага сэрвіса». Гэта гатовы задзел з адкрытым зыходным кодам для стварэння будучых сэрвісаў інтэрнэт-платформы для апрацоўкі тэксту і маўлення www.corpus.by. Сэрвіс дэманструе магчымы прынцып працы будучых сэрвісаў, створаных на яго аснове.   Доступ да сэрвіса праз API Для доступу да “Дэманстрацыйнага сэрвіса з аўтарызацыяй” праз API, неабходна […]

Чытаць больш...

Раманізатар

Сэрвіс “Раманізатар” прызначаны для пераўтварэння беларускамоўнага тэксту, запісанага кірылічнымі сімваламі, у тэкст, запісаны лацінскімі сімваламі. На ўваход сэрвісу даецца беларускамоўны тэкст, запісаны сімваламі беларускага кірылічнага алфавіту. Дадзены тэкст можа ўяўляць сабой імёны, геаграфічныя назвы або іншую інфармацыю. Пасля апрацоўкі тэксту на выхадзе карыстальнік атрымлівае лацінізаваны запіс уваходнага кірылічнага тэксту.   Асноўныя тэрміны і паняцці Транслітарацыя – дакладная […]

Чытаць больш...

Пошук фанетычных з’яў

Сэрвіс «Пошук фанетычных з’яў» прызначаны для ідэнтыфікацыі той ці іншай фанетычнай з’явы ва ўведзеным тэксце.   Доступ да сэрвіса праз API Для доступу да сэрвіса “Пошук фанетычных з’яў” праз API, неабходна адправіць AJAX-запыт тыпу POST на адрас https://corpus.by/PhoneticPhenomenaSearcher/api.php. Праз масіў data перадаюцца наступныя параметры: text — адвольны ўваходны тэкст. consonantsBel — спіс літар, якія абазначаюць зычныя гукі […]

Чытаць больш...

Генератар алфавітна-прадметнага паказальніка

Сэрвіс «Генератар алфавітна-прадметнага паказальніка» дае магчымасць канвертаваць тэкст табліц універсальнай дзесятковай класіфікацыі (УДК) у алфавітна-прадметны паказальнік (АПП). На ўваход сэрвісу падаюцца табліцы УДК у фармаце «код класа — апісанне класа» праз табуляцыю, па адным класе на радок. Вынікам працы сэрвіса з’яўляецца фрагмент АПП. Асноўныя тэрміны і паняцці Алфавітна-прадметны паказальнік (АПП) — паказальнік, які складаецца з упарадкаванага па алфавіце мноства […]

Чытаць больш...

Падлік частотнасці n-грам

Сэрвіс «Падлік частотнасці n-грам» прызначаны для падліку частотнасці паслядоўнасцяў розных па велічыні камбінацый элементаў. У якасці элементаў могуць выступаць як сімвалы, так і токены, словы і нават рэгулярныя выразы. На ўваход сэрвісу падаецца адвольны набор сімвалаў. Вынікам працы сэрвісу з’яўляецца спіс n-грам з іх частотамі ва ўваходным тэксце. Напрыклад, пры ўмовах па змаўчанні, сэрвіс пакажа частоты ўсіх […]

Чытаць больш...

Лематызатар

Сэрвіс «Лематызатар» прызначаны для вызначэння пачатковых форм слоў. На ўваход сэрвісу падаецца адвольны тэкст на беларускай або рускай мове. Вынікам працы сэрвіса з’яўляецца спіс слоў уваходнага тэксту з іх пачатковымі формамі, а таксама спіс слоў, пачатковую форму якіх не ўдалося вызначыць. Агульны выгляд, у якім будзе прадстаўлены вынік, можа быць наладжаны згодна з патрэбамі карыстальніка. […]

Чытаць больш...

Вызначэнне мовы тэксту

Сэрвіс «Вызначэнне мовы тэксту» прызначаны для вызначэння мовы пададзенага на ўваход адвольнага тэксту. На дадзены момант сэрвіс распазнае 5 моў: беларускую, рускую, украінскую, ангельскую і нямецкую.   Асноўныя тэрміны і паняцці Ідэнтыфікацыя мовы (або ўгадванне мовы) – праблема, якая адносіцца да сферы апрацоўкі тэкстаў на натуральнай мове і заключаецца ў вызначэнні таго, на якой мове […]

Чытаць больш...

Расшыфроўка УДК

Сэрвіс «Расшыфроўка УДК» дазваляе карыстальніку атрымаць расшыфроўку кодаў Універсальнай дзесятковай класіфікацыі. На ўваход сэрвісу падаецца код УДК, які патрэбна расшыфраваць. На выхадзе карыстальнік атрымлівае інфармацыю па ўведзеным кодзе: код класа; апісанне класа па-англійску; апісанне класа па-беларуску.   Асноўныя тэрміны і паняцці УДК (Універса́льная дзесятко́вая класіфіка́цыя) – гэта мова індэксавання дакументаў, якая ўяўляе сабой сістэму класіфікацыі, […]

Чытаць больш...

Ідэнтыфікатар тэгаў

Сэрвіс «Ідэнтыфікатар тэгаў» прызначаны для атрымання дапаможнай інфармацыі пра тэгі ў тэксце. На ўваход сэрвісу можна падаць адвольны тэкст альбо паслядоўнасць сімвалаў з тэгамі. На выхадзе карыстальнік атрымлівае наступную дапаможную інфармацыю пра тэгі ў тэксце: спіс тэгаў (адзіночных або толькі адкрываючых) паводле парадку, у якім яны сустракаюцца ў тэксце; частату выкарыстання кожнага тэга (у дужках […]

Чытаць больш...

Спецыялізаваны фанетычны слоўнік

Сэрвіс «Спецыялізаваны фанетычны слоўнік» прызначаны для адлюстравання транскрыпцыі спісаў слоў спецыялізаванай тэматыкі. На дадзены момант слоўнік змяшчае словы для рускай мовы, гэтыя словы ўжываліся ў бытавым і гутарковым тэматычным дамене. На старонцы сэрвіса знаходзіцца спіс літар па алфавіце, з якіх пачынаюцца словы з прапісаным фанетычным разборам. Карыстальнік можа выбраць любую літару і слова, што пачынаецца […]

Чытаць больш...

Апрацоўка невядомых слоў

Сэрвіс «Апрацоўка невядомых слоў» пакліканы дапаўняць наяўныя слоўнікі сінтэзатара маўлення словамі, якія найбольш часта вызначаліся як невядомыя ці некарэктныя ў сэрвісах «Сінтэзатар маўлення па тэксце», «Праверка правапісу», «Агучаны электронны граматычны слоўнік».   Карыстальніцкі сцэнар працы з сэрвісам На старонцы сэрвіса абраць слова для апрацоўкі са спісу найбольш частотных невядомых слоў. Калі ніводнае слова са спісу не […]

Чытаць больш...

Прагназаванне працягласці прамовы

Сэрвіс «Прагназаванне працягласці прамовы» дазваляе карыстальніку даведацца прыкладны час працягласці прамовы анлайн. На ўваход сэрвісу падаецца электронны тэкст на беларускай, англійскай ці рускай мовах, тэкст можа быць уведзены ўручную або скапіраваны. На выхадзе карыстальнік атрымлівае вынік у выглядзе прыкладнай працягласці прамовы ў фармаце ГГ:ХХ:СС, а таксама інфармацыю пра колькасць слоў і знакаў, выкарыстаных у тэксце.   […]

Чытаць больш...

Сінтэзатар «Гаворачая галава»

Сэрвіс «Сінтэзатар “Гаворачая галава”» дазваляе атрымаць візуалізацыю ўведзенага карыстальнікам тэксту. На ўваход сэрвісу падаецца электронны тэкст, сэрвіс апрацоўвае ўваходны тэкст і фарміруе відэафайл з аніміраванай галавой, якая вымаўляе ўведзеную фразу. «Гаворачая галава» перадае міміку чалавечай галавы і сінтэзаваны гук пры вымаўленні ўваходнага тэксту. Карыстальнік можа праглядзець выніковы відэафайл і захаваць яго.   Асноўныя тэрміны і паняцці Сінтэз […]

Чытаць больш...

Вызначэнне часцін мовы

Сэрвіс “Вызначэнне часцін мовы” дазваляе карыстальніку ў рэжыме анлайн даведацца, да якой часціны мовы належыць пэўнае слова. На ўваход сэрвісу даецца тэкст на беларускай ці рускай мове, на выхадзе карыстальнік атрымлівае спіс слоў, у якім пазначана, да якой часціны мовы адносіцца кожнае слова тэксту.   Асноўныя тэрміны і паняцці Часціны мовы — разрады слоў, якія характарызуюцца […]

Чытаць больш...

Абрэзка выяў

Сэрвіс “Абрэзка выяў” прызначаны для хуткага і простага кадравання выявы ў прамавугольны або круглы фармат. На ўваход сэрвісу падаецца выява ці некалькі выяў у фармаце .jpg ці .png, пасля апрацоўкі на выхадзе карыстальнік атрымлівае магчымасць спампаваць уваходную выяву ў выглядзе прамавугольніка памерам 800х533 і круга дыяметрам 100 пікселяў у фармаце .png.   Асноўныя тэрміны і паняцці Кадраванне – выбар […]

Чытаць больш...

Дэманстрацыйны сэрвіс

“Дэманстрацыйны сэрвіс” з’яўляецца гатовым задзелам з адкрытым зыходным кодам для стварэння будучых сэрвісаў інтэрнэт-платформы для апрацоўкі тэксту і маўлення www.corpus.by. Таксама сэрвіс дэманструе магчымы прынцып працы будучых сэрвісаў, створаных на яго аснове. На ўваход дэманстрацыйнаму сэрвісу падаецца электронны тэкст, карыстальнік абірае любыя чэкбоксы, кнопку і опцыю, і пасля націскання кнопкі “Паказаць уведзены тэкст і абраныя наладкі” […]

Чытаць больш...

Генератар парадыгмы слова

Сэрвіс «Генератар парадыгмы слова» дазваляе атрымаць парадыгму слова. На ўваход сэрвісу даецца слова ці яго словаформы, сэрвіс ажыццяўляе пошук парадыгмы па слоўніку, і пры адсутнасці гатовай парадыгмы на выхадзе карыстальнік атрымлівае згенераваную парадыгму ўведзенага слова ці парадыгмы, створаныя на падставе падобных па напісанні слоў. Выніковыя згенераваныя парадыгмы маюць націск, пазначаны сімвалам «+», і спецыяльныя тэгі, аддзеленыя ад […]

Чытаць больш...

Тэматычнае распазнаванне маўлення

Сэрвіс «Тэматычнае распазнаванне маўлення» дазваляе карыстальніку пераўтварыць маўленне ў электронны тэкст анлайн. На ўваход сэрвісу даецца фанаграма маўленчых слоў тэматычных даменаў памерам не больш за 20 MB, на выхадзе сэрвіс дае распазнаны электронны тэкст фанаграмы. Фанаграма можа быць выбрана з пададзеных прыкладаў, загружана на сэрвіс з цвёрдага дыску камп’ютара ў фармаце .wav, а таксама можа быць […]

Чытаць больш...

Апрацоўка табліц

Сэрвіс “Апрацоўка табліц” прызначаны для перапрацоўкі зыходных дадзеных у выгляд табліцы і для працы з атрыманай табліцай. Знешні інтэрфейс сэрвісу прадстаўлены на малюнку 1. На ўваход сэрвісу можна падаць дадзеныя ў пэўным фармаце, якія цікавяць карыстальніка. Для атрымання табліцы з інфармацыяй карыстальніка трэба націснуць на кнопку “Show table!/Паказаць табліцу!” Малюнак 1 – Знешні выгляд сэрвісу […]

Чытаць больш...

Сінтэзатар маўлення па тэксце

Сэрвіс «Сінтэзатар маўлення па тэксце» прызначаны для агучвання ўведзенага карыстальнікам тэксту. На ўваход карыстальнік падае электронны тэкст на беларускай ці рускай мове, сінтэзатар маўлення аўтаматычна апрацоўвае тэкст і фарміруе гукавы файл з сінтэзаваным уваходным тэкстам, які можна праслухаць, спампаваць і захаваць на камп’ютар.   Асноўныя тэрміны і паняцці Сінтэзатар маўлення па тэксце (СМТ) — гэта сістэма, здольная […]

Чытаць больш...

Гуказапіс

Сэрвіс “Гуказапіс” дае магчымасць запісваць гук прама ў браўзеры, не выкарыстоўваючы нейкія дадатковыя праграмы. Інтэрфэйс вельмі просты, але дае мінімальны набор неабходных інструментаў для працы. Сэрвіс можа запісаць адвольны гук ці зрабіць запіс праз ваш мікрафон, агучыць яго,  дазволіць спампаваць на камп’ютар ці выкарыстаць прамую спасылку. Малюнак 1 – Знешні інтэрфейс сэрвісу “Гуказапіс” Як працаваць […]

Чытаць больш...

Ідэнтыфікатар амографаў

Сэрвіс «Ідэнтыфікатар амографаў» прызначаны для распазнавання і вылучэння ў тэксце амографаў. На ўваход сэрвісу падаецца электронны тэкст, па выніках апрацоўкі карыстальнік атрымлівае спіс знойдзеных у тэксце амографаў з іх падрабязнымі дадзенымі.   Асноўныя тэрміны і паняцці Аманімія – супадзенне слоў ці іх форм пры поўнай адрознасці ў значэнні. Ад аманіміі важна адрозніваць полісемію (наяўнасць некалькіх […]

Чытаць больш...

Агучаны электронны граматычны слоўнік

Сэрвіс «Агучаны электронны граматычны слоўнік» прызначаны для атрымання інфармацыі па правільнаму напісанню, вымаўленню слоў, дазваляе пабачыць транскрыпцыю (класічнага выгляду і ў фармаце IPA), а таксама даведацца падрабязную характарыстыку слова пра яго прыналежнасць да той ці іншай часціны мовы (малюнак 1). Сэрвіс аўтаматычна фарміруе гукавы файл, з дапамогай якога можна праслухаць уведзенае карыстальнікам слова і адначасова […]

Чытаць больш...

Упарадкаванне па алфавіце

Сэрвіс «Упарадкаванне па алфавіце» прызначаны для атрымання тэкставых радкоў у алфавітным парадку. На ўваход сэрвісу падаецца адвольны тэкст альбо паслядоўнасць сімвалаў, у якім 1 радок = 1 адзінка для ўпарадкавання па алфавіце, і сэрвіс прывядзе ўваходны тэкст у алфавітны парадак па радках. Таксама ён дазволіць расставіць сімвалы паводле прыярытэту пры сартыроўцы альбо абраць алфавіт.   Асаблівасці […]

Чытаць больш...