Навуковы накірунак


Лабараторыя распазнавання і сінтэзу маўлення была заснавана ў 1974 годзе спачатку як аддзел Цэнтральнага навукова-даследчага інстытуту сувязі (ЦНДІС), а з 1986 года як лабараторыя Інстытуту тэхнічнай кібернетыкі НАН Беларусі. Галоўны навуковы напрамак дзейнасці лабараторыі – тэорыя распазнавання і сінтэзу маўлення і прымяненне маўленчай сувязі ў чалавека-машынных сістэмах.

Галоўныя напрамкі навуковых даследаванняў лабараторыі:
  • Высакаякасны сінтэз маўлення па тэксце;
  • Камп’ютарнае кланаванне персанальнага голасу і маўлення;
  • Шматмоўны сінтэз маўлення;
  • Рабастнае распазнаванне дыскрэтнай і злітнай паслядоўнасці слоў;
  • Камп’ютарная тэлефанія;
  • Камп’ютарныя сістэмы рэабілітацыі інвалідаў слыху і зроку;
  • Камп’ютэраная лінгвістыка;
  • Апрацоўка натуральнай мовы;
  • Перадапрацоўка электроннага тэксту.
Навуковыя падыходы і метадалогія

Высакаякасны шматмоўны і шматгалосы сінтэз маўлення па тэксце грунтуецца на выкарыстанні алафонных элементаў (усяго парадку 1000 шт.) натуральнага маўлення з максімальна магчымай імітацыяй зададзеных мужчынскіх і жаночых галасоў. Задача “персаналізацыі” сінтэтычнага маўлення (камп’ютарнае кланаванне) была паспяхова вырашана шляхам задавальнення наступных умоў:

  1. Максімальна дакладнае мадэляванне акустычных, фанетычных і прасадычных індывідуальных асаблівасцей голасу і маўлення дыктара;
  2. Мінімальна магчымыя скажэнні элементаў кампіляцыі ў працэсе іх запісу, прайгравання і прасадычнай мадыфікацыі;
  3. Адсутнасць якіх-небудзь дадатковых пераўтварэнняў элементаў маўлення тыпу PSOLA (ад скароч. англ. Pitch Synchronous Overlap and Add) ці FFT (ад скароч. англ. Fast Fourier Transform – хуткае пераўтварэнне Фур’е).

Задача перадапрацоўкі электронных тэкстаў на натуральнай мове вырашаецца з дапамогай праграмнага сродку NooJ (www.nooj4nlp.net), які дазваляе распра­цоўваць сінтаксічныя і марфалагічныя граматыкі, або так званыя канчатковыя аўтаматы, і тэставаць іх на вялікай колькасці тэкстаў. Для гэтых мэт быў непасрэдна распрацаваны беларускі модуль, які ўключае набор падабраных тэкстаў, некалькі дэманстрацыйных граматык і набор слоўнікаў (http://www.nooj4nlp.net/pages/belarusian.html).

Базавыя алгарытмы распазнавання і прыняцця слоўных рашэнняў рэалізуюцца на аснове прапанаванага ў лабараторыі новага метаду дынамічнага супастаўлення сігналаў, мадыфікаванага для распазнавання слоў злітнага маўлення. Метад дае магчымасць ажыццявіць у працэсе распазнавання дынамічнае выраўноўванне часавых шкал эталоннага апісання слова і яго рэалізацыі ў бягучым маўленні пры невядомых пачатку і канцы слова, якое распазнаецца. Галоўнай вартасцю метаду з’яўляецца магчымасць вызначэння верагоднасці прысутнасці слова ў бягучым маўленчым патоку і ацэнкі яго часовага месцазнаходжання ў рэальных умовах наяўнасці рознага роду акустычных памех.

Вырашэнне праблемы рабастнага распазнавання маўлення грунтуецца на рэалізацыі двух асноўных падыходаў:

  1. Выкарыстанне вядомых метадаў рабастнага ацэньвання статыстычных параметраў у канкрэтных спецыфічных задачах аналізу, выдзялення прыкмет, навучання і распазнавання маўленчых сігналаў;
  2. Выкарыстанне метадаў калектыўнага распазнавання, дзе канчатковае рашэнне прымаецца па выніках распазнавання калектывам рашаючых правілаў з розным наборам прыкмет маўленчага сігналу.

Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.