(Беларуская) Наша Ніва. Беларуская гаварылка


Извините, этот техт доступен только в “Беларуская” и “Американский Английский”. For the sake of viewer convenience, the content is shown below in this site default language. You may click one of the links to switch the site language to another available language.

Извините, этот техт доступен только в “Беларуская” и “Американский Английский”. For the sake of viewer convenience, the content is shown below in this site default language. You may click one of the links to switch the site language to another available language.

Як камп’ютар навучыўся размаўляць па-беларуску: праграма гаворыць любым голасам, а найбольшую складанасць выклікаюць націскі.

Тэхналогіі распазванання тэкставай інфармацыі і пераводу яе ў маўленне распрацаваныя шмат для якіх моваў свету. Цяпер і беларуская не выключэнне. У нашай краіне распрацоўкай такой праграмы займаюцца ў Аб’яднаным інстытуце праблем інфарматыкі Нацыянальнай акадэміі навук, а таксама ў прыватнай кампаніі «Сакрамент». Пра сваю распрацоўку расказала кандыдат тэхнічных навук Лілія Цырульнік і малодшы навуковы супрацоўнік Юрась Гецэвіч, які непасрэдна займаецца беларускамоўным сегментам.

BelarusianComputerMasters1

«Наша Ніва»: У чым адметнасць вашай лабараторыі?

Лілія Цырульнік: Наша асаблівасць — гэта распрацоўка сістэмы сінтэзу маўлення для беларускай мовы. Акрамя гэтага, мы распрацавалі такія сістэмы для расейскай і польскай моваў, а таксама займаемся стварэннем сінтэзатара якуцкай мовы.

«НН»: Дзе можа выкарыстоўвацца ваша праграма?

ЛЦ:

Сфера прымянення даволі шырокая: стварэнне аўдыёкніг, чытанне электроннай пошты, дапамога сляпым людзям. Што яшчэ важна, сістэма сінтэзу беларускага маўлення будзе спрыяць захаванню мовы.

«НН»: Колькі каштуе такая праграма?

ЛЦ: Пакуль няма камерцыйнай версіі праграмы для беларускай мовы, яна будзе створана цягам некалькіх месяцаў. Для канчатковага карыстальніка гэта будзе адзін кошт, для карпаратыўнага ўжытку ці для выкарыстоўвання ў сістэмах апавяшчэння абанентаў па тэлефоне — іншы. Напрыклад, створаная намі праграма для агучвання аўдыёкніг на расейскай мове «aBookForge» каштуе каля $7. На гэту лічбу можна арыентавацца.

«НН»: Як даўно вы займаецеся распрацоўкамі сінтэзатараў маўлення?

ЛЦ: Лабараторыя існуе ўжо больш за 40 гадоў. Былы загадчык лабараторыі — Барыс Мяфодзевіч Лабанаў — вядомы вучоны, на рахунку якога шмат навуковых распрацовак. Дарэчы, яго голасам «размаўляе» праграма. А беларускамоўным сінтэзатарам пачалі займацца гадоў 10 таму.

«НН»: Ці звяртаецеся вы да паслуг філолагаў?

ЛЦ: Вядома ж. Трэба ўлічваць асаблівасці і гукаў, і інтанацыі. Напрыклад, у польскай мове націск трапляе пераважна на перадапошні склад. Мовы пастаянна развіваюцца, з’яўляюцца новыя словы. А вось колькасць гукаў — абмежаваная. У беларускай мове ёсць 42 гукі. Такім чынам, з існуючай базы гукаў праграма ўтварае словы, сказы, тэксты… Акрамя таго, адзін і той жа гук можа быць вымаўлены з рознай інтанацыяй і тэмпам.

«НН»: Ці можа праграмма «размаўляць» голасам іншага чалавека па жаданні заказчыка?

ЛЦ: Што тычыцца персанальнага голасу, у нас распрацавана тэхналогія, дзякуючы якой любы дыктар можа прачытаць пэўны тэкст, зрабіць яго аўдыёзапіс. Потым гэты запіс апрацоўваецца спецыяльным чынам і ствараецца маўленчая база дадзеных. Таму тэарэтычна праграма можа размаўляць любым голасам.

«НН»: З якімі цяжкасцямі вы сутыкаліся пры распрацоўцы беларускай версіі?

Юрась Гецэвіч: Найбольшую складанасць выклікаюць розныя скарачэнні, абрэвіятуры, даты, а таксама пастаноўка націскаў у словах. Да таго ж, людзі часта робяць памылкі пры напісанні тэкстаў. Таму мая задача — рабіць лінгвістычны блок, які б мог распазнаваць «закадаваныя» выразы ў тэксце, затым пераводзіць іх у арфаграфічныя словы, знаходзіць гэтыя словы ў слоўніку і расстаўляць націскі. Напачатку слоўніка не было. Нам яго перадалі з Лабараторыі камп’ютарнай лінгвістыкі БДУ. Зразумела, што прыйшлося яго адаптаваць, дадаваць новыя словы, імёны.

Каб лепш зразумець, як працуе праграма, Юрась Гецэвіч надрукаваў некалькі словаў на клавіятуры — і камп’ютар прамовіў прыемным мужчынскім голасам з лёгкім металічным акцэнтам: «Прывітанне, газета «Наша Ніва»! Вы першая беларуская газета з малюнкамі. А мы першая лабараторыя, якая сінтэзуе беларускую мову».

27.09.2011

Аксана Рудовіч

Крыніца: http://nn.by/?c=ar&i=60765

Спампаваць (PDF, 527KB)

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.