Лідчанін навучыў камп’ютар чытаць па-беларуску


2014-05-02Камп’ютар вучаць чытаць па-беларуску

30-гадовы навуковец нарадзіўся ў вёсцы Крупава Лідскага раёна. Вучыўся ў мясцовай сярэдняй школе, потым у гімназіі №1 горада Ліды. Скончыў факультэт прыкладной матэматыкі і інфарматыкі Белдзярж-універсітэта, магістратуру, аспірантуру, абараніў дысертацыю. Сёмы год працуе ў сферы сінтэзу маўлення і камп’ютарнай лінгвістыкі, выкладае ў БДУ і БДУІР.

Наш зямляк Юрась Гецэвіч – кандыдат тэхнічных навук, загадчык лабараторыі распазнавання сінтэзу маўлення Аб’яднанага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі – разам з камандай вучыць камп’ютар распазнаваць і агучваць беларускія тэксты.

…Юрась уводзіць тэкст у праграму, націскае на «пераўтварэнне» – і… надрукаваны тэкст імгненна перапрацоўваецца ў аўдыяфайл! Камп’ютар чытае ўслых сінтэзаваным, бы робат з фільма, голасам…

– Цуд, ды й толькі, – здзіўляюся я. – А ці складана было навучыць камп’ютар размаўляць па-беларуску? 

– Наша лабараторыя адна з першых на Беларусі распрацавала агульныя прынцыпы і прататыпы сінтэзатараў маўлення, якія падышлі да розных славянскіх моў: беларускай, рускай, украінскай, чэшскай. Працэс сінтэзу маўлення даволі складаны і ў той жа час вельмі захапляючы, працуе над ім вялікая каманда «фізікаў і лірыкаў»: лінгвісты, філолагі, стылісты, праграмісты. Што тычыцца беларускай мовы – машына павінна не толькі дакладна прачытаць тэкст, але і ўлічыць асаблівасці вымаўлення слоў, інтанацыйнага афармлення, націскі, асімілятыўнае змякчэнне і г.д.

– Гэта справа апошніх гадоў?

– Не, лабараторыя існуе больш за сорак год. Калі яшчэ мяне не было на свеце і камп’ютарныя тэхналогіі толькі пачалі развівацца ў нашай краіне, лабараторыя пад кіраўніцтвам доктара навук Барыса Лабанава пачала займацца тэхналогіямі маўлення: сістэмай распазнавання мовы і сістэмай сінтэзу, пераводам інфармацыі з гукавога выгляду ў тэкст і наадварот.

– На каго разлічана ваша праграма? І якое практычнае прымяненне яна знаходзіць? 

– Праграма сінтэзу маўлення па электронным тэксце карысная для слабабачачых і сляпых людзей ці тых, хто не можа чытаць, бо, напрыклад, кіруе аўтамабілем. Напрыклад, яна паспяхова выкарыстоўваецца ў Маладзечанскай спецыяльнай агульнаадукацыйнай школе-інтэрнаце для дзяцей з парушэннямі зроку з 2006 года. Можа прымяняцца ў gps-навігатарах, «гаворачых» танометрах, тэрмометрах, вагах і іншых разнастайных электронных прыладах. З яе дапамогай можна чытаць RSS-рассылкі, перакладаць кнігі ў аўдыёфармат, агучваць сайты – усё гэта будзе садзейнічаць развіццю роднай мовы і яе захаванню.

– Для вас гэта вельмі важна?

– Так. Бо мова – Божы дар, якім трэба карыстацца, які трэба захоўваць і перадаваць з пакалення ў пакаленне.

 – У сям’і Вы таксама размаўляеце па-беларуску?

– Безумоўна! Жонка Святлана – філолаг французскай і англійскай мовы – і сынок Сымон таксама размаўляюць на роднай мове. Я ганаруся тым, што свае першыя словы наш сын сказаў па-беларуску. Калі мова будзе жыць у сям’і, яна будзе жыць і ў народзе.

– Летась на выставе «TIBO-2013» сапраўдны ажыятаж выклікалі мабільныя аўтаномныя беларускія робаты, якія размаўлялі на беларускай мове.

– Мы імкнёмся больш дзейсна ўкараняць сістэму маўлення ў робататэхніку. Каб жалязяка была інтэлектуальнай. І зноў жа, каб наша родная мова больш актыўна ўжывалася ў паўсядзённым жыцці, гучала паўсюдна. Таму шукаем зацікаўленых людзей і адкрыты да супрацаўніцтва.

P.S. Для вас, чытачы «ГП», – інтэрнэт-версія сінтэзатара маўлення па тэксце: www.corpus.by/tts3/ ад Юрася Гецэвіча. Уводзячы тэкст, пасля націскных галосных пішыце «плюсік», – каб машына бачыла, дзе трэба рабіць націск.

Ала БІБІКАВА
02.05.2014

Спампаваць (PDF, 854KB)

If you have found a spelling error, please, notify us by selecting that text and pressing Ctrl+Enter.