Апрацоўка тэксту, маўлення і іншых дадзеных на Інтэрнэт-платформе www.Corpus.by


 

Платформа www.corpus.by распрацавана і пастаянна дадаткова распрацоўваецца, каб прадставіць карыстальніку набор інструментальных сродкаў (сэрвісаў) па апрацоўцы тэксту, маўлення і іншых дадзеных. Распрацаваныя сэрвісы групуюцца ў тэматычныя дамены для больш зручнага выкарыстання ў канкрэтных практычных сферах.

 

Падыход да распрацоўкі кожнага сэрвіса палягае ў тым, каб карыстальнік мог па ўведзеных тэставых дадзеных запусціць сэрвіс адной кнопкай і азнаёміцца з яго вынікамі працы. Далей карыстальніку прапануецца самастойна выкарыстоўваць сэрвіс на свой страх і рызыку з уведзенымі ўласнымі дадзенымі і выстаўленымі ўласнымі ж настройкамі. Аднак папярэдне рэкамендуецца азнаёміцца з апісаннем сэрвіса (?).

 

Апісанне сэрвіса (?) мае на мэце прадставіць карыстальніку задачу, якую вырашае сэрвіс, а таксама падказаць, як можна выкарыстоўваць сэрвіс для сваіх мэт. Апісанне сэрвіса адбываецца па меры яго дапрацоўкі і ўкаранення ў практыку. Дадатковыя каментары і водгукі збіраюцца праз кантакты платформы, каб больш аб’ектыўна складаць тэхнічныя заданні па дапрацоўцы сэрвіса для яго мадэрнізацыі. Даволі поўнымі апісаннямі сэрвісаў з’яўляюцца: https://ssrlab.by/4039, https://ssrlab.by/5047, https://ssrlab.by/6684, https://ssrlab.by/8071.

 

Распрацоўка новых сэрвісаў адбываецца па жаданні ці па замове праз выкарыстанне сэрвіса шаблона “Дэманстрацыйны сэрвіс”. Яго можна вольна спампаваць на абранай мове праграмавання, даць назву новаму сэрвісу Х, скарэктаваць пад выкананне пастаўленай задачы. Калі вырашэнне пастаўленай задачы адбылося паспяхова, калі сэрвіс Х адпрацоўвае з дакладнасцю больш чым 1%, тады яго можна апублікаваць на платформе праз кантакт з распрацоўшчыкамі.

 

Тэхналагічны стэк, які выкарыстоўваецца для платформы – php, MySql, Python, JavaScript, Html, Css. Больш за 90% сэрвісаў запраграмаваны на мове php, працэс далучэння мовы Python пачаты з распрацоўкі і выстаўлення “Дэманстрацыйнага сэрвіса” на гэтай мове. Далейшы перавод усіх сэрвісаў на Python ідзе, але мы шукаем дадатковага распрацоўшчыка для паскарэння гэтай справы. Іншыя мовы праграмавання могуць быць выкарыстаны для распрацоўкі сэрвісаў праз непасрэдны кантакт з распрацоўшчыкамі.

 

Рэвыкарыстанне сэрвісаў платформы вітаецца ў Вашых праектах. Для большасці сэрвісаў распрацаваны функцыянал API і дадаткова прадэманстравана выкарыстанне сэрвіса праз API. Просім высылаць просты ліст з пазнакай “Мы выкарысталі сэрвіс Y у праекце Z :)”. Гэта нас натхніць на выкананне планаў па развіцці платформы!

 

Планы

 

 • Фарміраванне новых тэматычных даменаў і сэрвісаў для іх;
 • Завядзенне карыстальніцкіх акаўнтаў для магчымасці захавання вынікаў сваіх эксперыментаў і дзялення імі з іншымі;
 • Распрацоўка сістэмы выстаўлення рэйтынгаў сэрвісаў;
 • Распрацоўка сістэмы збору статыстыкі выкарыстання сэрвісаў для паляпшэння працы найбольш папулярных сэрвісаў;
 • Пашырэнне каманды распрацоўшчыкаў платформы;
 • Напісанне (пашырэнне) апісанняў сэрвісаў, якія прайшлі ўкараненне, апрабацыю, мадэрнізацыю. Пераклад устойлівых апісанняў на англійскую і іншыя мовы;
 • Распрацоўка новых сэрвісаў для апрацоўкі новых электронных рэсурсаў для розных моў, тэматычных даменаў і задач;
 • Працяг выкарыстання наступных падыходаў у распрацоўцы сэрвісаў:
  • “усё ўжо інсталявана”,
  • “толькі выкарыстоўвай”,
  • “1 націск на пуск – 1 імгненны вынік”,
  • “усё захавана”;
 • Распрацоўка версіі платформы і сэрвісаў для Android, IPhone, Promobot v4.

 

Будзем удзячны за дадатковыя планы, каментары ад Вас
і за online ці offline сустрэчы з Вамі!

 

E-mail: corpusby.contacts@gmail.com
Буклет на беларускай і англійскай мовах.

Перакрыжаваныя спасылкі

 1. Дзенісюк, Д. А. Платформа для апрацоўкі тэкставай і гукавой інфармацыі для розных тэматычных даменаў беларускай мовы / Д. А. Дзенісюк, Я. С. Зяноўка, А. Е. Драгун [і інш.] // Языковая личность и эффективная коммуникация в современном поликультурном мире : материалы VI Междунар. науч.-практ. конф., посвящ. 100-летию Белорус. гос. ун-та, Минск, 29–30 окт. 2020 г. / Белорус. гос. ун-т ; редкол.: С. В. Воробьева (гл. ред.) [и др.]. – Минск : БГУ, 2011. – С. 69-74.
 2. Казлоўская, Н.Д. Выкарыстанне камп’ютарна-лінгвістычных рэсурсаў платформы corpus.by пры перакладзе Кодэкса аб шлюбу і сям’і / Н.Д. Казлоўская, Г.Р. Станіславенка, А.В. Крывальцэвіч, М.У. Марчык, А.У. Бабкоў, І.В. Рэентовіч, Ю.С. Гецэвіч // Межкультурная коммуникация и проблемы обучения иностранному языку и переводу : сб. науч. ст. / редкол. : М.Г. Богова (отв. ред), Т.В. Бусел, Н.П. Грицкевич [и др.]. — Минск : РИВШ, 2017. — C. 137-142.
 3. Гецэвіч, Ю.С. Камп’ютарна-лінгвістычныя сэрвісы www.corpus.by для аўтаматычнай апрацоўкі тэкстаў / Я.С. Качан, С.І. Лысы, Ю.С. Гецэвіч, Г.Р. Станіславенка, А.В. Гюнтар // Нацыянальна-культурны кампанент у літаратурнай і дыялектнай мове : зб. навук. арт. / Брэсц. дзярж. ун-т імя А. С. Пушкіна ; рэдкал.: С. Ф. Бут-Гусаім [і інш.]. – Брэст : БрДУ, 2016. — C. 93-104.
 4. Казлоўская, Н.Д. Этапы і асаблівасці перакладу юрыдычнай лексікі на прыкладзе Кодэкса аб шлюбе і сям’і з выкарыстаннем камп’ютарна-лінгвістычных рэсурсаў / Н.Д. Казлоўская, А.У. Бабкоў, Ю.С. Гецэвіч, А.В. Крывальцэвіч, Г.Р. Станіславенка, М.У. Марчык, І.В. Рэентовіч // Лингвистика, лингводидактика, лингвокультурология: актуальные вопросы и перспективы развития : материалы I Респ. науч.-практ. конф. с междунар. участием, Минск, 23–24 февр. 2017 г. / БГУ, факультет социокультурных коммуникаций ; редкол. : О.Г. Прохоренко (отв. ред.) [и др.]. — Минск : Изд. центр БГУ, 2017. — C. 189-191.
 5. Drahun, A. Semi-Automatic Proofreading of Belarusian and English texts / A. Drahun, Yu. Hetsevich, A. Bakunovich, Dz. Dzenisiuk, J. Shynkevich // International Conference NooJ 2019: Book of Abstracts. – Hammamet, Tunisia, 2019.
 6. Станіславенка, Г.Р. Рэдагаванне электронных масіваў тэкстаў на беларускай мове з выкарыстаннем камп’ютарна-лінгвістычных сэрвісаў платформы www.corpus.by / Г.Р. Станіславенка, С.І. Лысы, Ю.С. Гецэвіч // Карповские научные чтения / БГУ ; под ред. А.И. Головня [и др.]. — Минск : ИВЦ Минфина, 2016. — C. 262-267.
 7. Гецэвіч, Ю.С. Праектаванне інтэрнэт-сервісаў для працэсараў сінтэзатара маўлення па тэксце з магчымасцю прадстаўлення бясплатных электронных паслуг насельніцтву / Ю.С. Гецэвіч, С.І. Лысы // Развитие информатизации и государственной системы научно-технической информации (РИНТИ-2014) : доклады XIII Международной конференции (Минск, 20 ноября 2014 г.). – Минск : ОИПИ НАН Беларуси, 2014. — C. 265-269.
 8. Станіславенка, Г.Р. Выкарыстанне камп’ютарна-лінгвістычных сродкаў для перакладу ўніверсальнай дзесятковай класіфікацыі дамена “тэатр” з англійскай на беларускую мову і генерацыя алфавітна-прадметнага паказальніка / Г.Р. Станіславенка, Ю.С. Гецэвіч, С.І. Лысы // Актуальные вопросы германской филологии и лингводидактики: материалы XX Междунар. науч.-практ. конф. / Брест. гос. ун-т  имени А.С. Пушкина; редкол.: Е. Г. Сальникова [и др.]. — Брест : Альтернатива, 2016. — C. 264-266.
 9. Русак, В.П. Программная обработка фонетических особенностей белорусских говоров центрального региона / В.П. Русак, Ю.С. Гецевич // Исследования по славянской диалектологии 19–20. Славянские диалекты в современной языковой ситуации. Диалектный словарь как способ исследования славянских диалектов / отв. редактор выпуска: д. ф. н. Л. Э. Калнынь. — Москва : Институт славяноведения РАН, 2018. — C. 87-94.
 10. Русак, В.П. Программная обработка фонетических особенностей белорусских говоров центрального региона / В.П. Русак, Ю.С. Гецевич // Исследования по славянской диалектологии 19–20. Славянские диалекты в современной языковой ситуации. Диалектный словарь как способ исследования славянских диалектов / отв. редактор выпуска: д. ф. н. Л. Э. Калнынь. — Москва : Институт славяноведения РАН, 2018. — C. 87-94.

 

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.