14 верасня 2011 года
№ 175 (27038)
Я размаўляў па-беларуску з… камп’ютарам
Вам не здалося, і тут няма памылкі друку: карэспандэнт “Звязды” сапраўды “пагутарыў” з камп’ютарам праз спецыяльную праграму, якая распазнае тэкставую інфармацыю і пераводзіць яе ў маўленне. Шмат для якіх моў такія праграмы ўжо існуюць. У нашай Акадэміі навук займаюцца распрацоўкай менавіта беларускамоўнага “гаваруна”. Пра маўленчыя тэхналогіі расказала Лілія Цырульнік, кандыдат навук, выканаўца абавязкаў загадчыка лабараторыі распазнання і сінтэзу маўлення Аб’яднанага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі, і Юрась Гецэвіч, малодшы навуковы супрацоўнік той жа лабараторыі, які непасрэдна распрацоўвае беларускамоўны сегмент.
— Калі пачалася распрацоўка маўленчых тэхналогій?
Лілія Цырульнік:
— Лабараторыя існуе больш за сорак гадоў. І ў той час, калі і камп’ютары былі не асабліва развітыя, і прайграванне маўлення было складаным нават з фізічнага пункту гледжання, лабараторыя пачала займацца маўленчымі тэхналогіямі. У прыватнасці, сістэмай распазнання маўлення і сістэмай сінтэзу маўлення, гэта значыць, пераводам інфармацыі з маўленчага віду ў тэкст і наадварот: з тэксту — у маўленчую форму. Дарэчы, вялікі ўклад у развіццё маўленчых тэхналогій у Беларусі ўнёс доктар навук Барыс Лабанаў, да нядаўняга часу — загадчык лабараторыі распазнання і сінтэзу маўлення, а зараз — галоўны навуковы супрацоўнік інстытута. За апошнія некалькі гадоў у лабараторыі распрацаваны сістэмы сінтэзу маўлення для рускай, польскай моў. Зараз распрацоўваецца сінтэзатар мовы для якуцкай мовы. Актыўна займаецца лабараторыя і распрацоўкай беларускамоўнага сінтэзатара маўлення.
— Якое прымяненне можа быць у сінтэзатараў маўлення?
Лілія Цырульнік:
— Прымяненне самае шырокае: стварэнне аўдыёкніг, дапамога сляпым людзям, чытанне электроннай пошты…
Юрась Гецэвіч:
— Электронныя чэргі таксама: можна вельмі гнутка і хутка змяняць выразы, якія “гаворыць” гэтая чарга.
Лілія Цырульнік:
— Ці ёсць якія-небудзь цяжкасці з распрацоўкамі?
Юрась Гецэвіч:
— Складанае пытанне — пастаноўка націскаў у словах. Складанасці таксама ёсць з абрэвіятурамі, лічбава-літарнымі абазначэннямі (напрыклад, назвы самалётаў, верталётаў, хімічныя формулы і іншае). І яшчэ: калі чытанне нейкага тэхнічнага тэксту можа быць здавальняючым, то літаратурны тэкст выклікае шмат нараканняў.
— Вельмі часта можна пачуць, што ўсё беларускамоўнае не мае ніякіх перспектыў, што яно нікому не патрэбна. Ці не будзе так і з гэтым сінтэзатарам?
Юрась Гецэвіч:
— Звычайна так кажуць у Беларусі. Калі выязджаеш за мяжу, там усе гэтым цікавяцца і з задавальненнем вывучаюць нашу мову. Ужыванне беларускай мовы памяншаецца, але зараз ёсць новае пакаленне, якое цікавіцца ўсім беларускім. Да таго ж шмат беларускамоўных сайтаў з’яўляецца. А значыць, і гэтыя сінтэзатары беларускай мовы могуць быць запатрабаваны моладдзю для таго, каб чытаць RSS-рассылкі, пераводзіць кнігі ў аўдыёфармат. І гэта, несумненна, будзе спрыяць развіццю беларускай мовы.
Р.S. Пасля размовы Юрась Гецэвіч прапанаваў мне паглядзець і пачуць, як працуе беларускамоўны сінтэзатар. Звычайны мужчынскі голас, толькі з металічным, як бывае ў фантастычных фільмах, прыгукам, перадаў прывітанне нашай газеце імгненна пасля таго, як Юрась надрукаваў некалькі слоў на клавіятуры. Яшчэ адна адметнасць камп’ютарнага голасу — невялікае замаруджванне пры “чытанні” вялікіх слоў. Асабліва гэта заўважаецца пры прайграванні паэтычных твораў. Так, я паслухаў “А хто там ідзе?” Янкі Купалы і ўрывак “Мой родны кут…” з паэмы “Новая зямля” Якуба Коласа. А вось выкананне навуковага тэксту амаль цалкам задавальняе: калі не асабліва прыдзірацца, то і не адрозніш ад чалавека.
Уладзіслаў КУЛЕЦКІ.
Крыніца: http://old.zviazda.by/ru/archive/article.php?id=85869&idate=2011-09-14