(Беларуская) Навуковы накірунак


Извините, этот техт доступен только в “Беларуская” и “Американский Английский”. For the sake of viewer convenience, the content is shown below in this site default language. You may click one of the links to switch the site language to another available language.

Лабараторыя распазнавання і сінтэзу маўлення была заснавана ў 1974 годзе спачатку як аддзел Цэнтральнага навукова-даследчага інстытуту сувязі (ЦНДІС), а з 1986 года як лабараторыя Інстытуту тэхнічнай кібернетыкі НАН Беларусі. Галоўны навуковы напрамак дзейнасці лабараторыі – тэорыя распазнавання і сінтэзу маўлення і прымяненне маўленчай сувязі ў чалавека-машынных сістэмах.

Галоўныя напрамкі навуковых даследаванняў лабараторыі:
  • Высакаякасны сінтэз маўлення па тэксце;
  • Камп’ютарнае кланаванне персанальнага голасу і маўлення;
  • Шматмоўны сінтэз маўлення;
  • Рабастнае распазнаванне дыскрэтнай і злітнай паслядоўнасці слоў;
  • Камп’ютарная тэлефанія;
  • Камп’ютарныя сістэмы рэабілітацыі інвалідаў слыху і зроку;
  • Камп’ютэраная лінгвістыка;
  • Апрацоўка натуральнай мовы;
  • Перадапрацоўка электроннага тэксту.
Навуковыя падыходы і метадалогія

Высакаякасны шматмоўны і шматгалосы сінтэз маўлення па тэксце грунтуецца на выкарыстанні алафонных элементаў (усяго парадку 1000 шт.) натуральнага маўлення з максімальна магчымай імітацыяй зададзеных мужчынскіх і жаночых галасоў. Задача “персаналізацыі” сінтэтычнага маўлення (камп’ютарнае кланаванне) была паспяхова вырашана шляхам задавальнення наступных умоў:

  1. Максімальна дакладнае мадэляванне акустычных, фанетычных і прасадычных індывідуальных асаблівасцей голасу і маўлення дыктара;
  2. Мінімальна магчымыя скажэнні элементаў кампіляцыі ў працэсе іх запісу, прайгравання і прасадычнай мадыфікацыі;
  3. Адсутнасць якіх-небудзь дадатковых пераўтварэнняў элементаў маўлення тыпу PSOLA (ад скароч. англ. Pitch Synchronous Overlap and Add) ці FFT (ад скароч. англ. Fast Fourier Transform – хуткае пераўтварэнне Фур’е).

Задача перадапрацоўкі электронных тэкстаў на натуральнай мове вырашаецца з дапамогай праграмнага сродку NooJ (www.nooj4nlp.net), які дазваляе распра­цоўваць сінтаксічныя і марфалагічныя граматыкі, або так званыя канчатковыя аўтаматы, і тэставаць іх на вялікай колькасці тэкстаў. Для гэтых мэт быў непасрэдна распрацаваны беларускі модуль, які ўключае набор падабраных тэкстаў, некалькі дэманстрацыйных граматык і набор слоўнікаў (http://www.nooj4nlp.net/pages/belarusian.html).

Базавыя алгарытмы распазнавання і прыняцця слоўных рашэнняў рэалізуюцца на аснове прапанаванага ў лабараторыі новага метаду дынамічнага супастаўлення сігналаў, мадыфікаванага для распазнавання слоў злітнага маўлення. Метад дае магчымасць ажыццявіць у працэсе распазнавання дынамічнае выраўноўванне часавых шкал эталоннага апісання слова і яго рэалізацыі ў бягучым маўленні пры невядомых пачатку і канцы слова, якое распазнаецца. Галоўнай вартасцю метаду з’яўляецца магчымасць вызначэння верагоднасці прысутнасці слова ў бягучым маўленчым патоку і ацэнкі яго часовага месцазнаходжання ў рэальных умовах наяўнасці рознага роду акустычных памех.

Вырашэнне праблемы рабастнага распазнавання маўлення грунтуецца на рэалізацыі двух асноўных падыходаў:

  1. Выкарыстанне вядомых метадаў рабастнага ацэньвання статыстычных параметраў у канкрэтных спецыфічных задачах аналізу, выдзялення прыкмет, навучання і распазнавання маўленчых сігналаў;
  2. Выкарыстанне метадаў калектыўнага распазнавання, дзе канчатковае рашэнне прымаецца па выніках распазнавання калектывам рашаючых правілаў з розным наборам прыкмет маўленчага сігналу.

(Беларуская) Калі Вы знайшлі ў тэксце памылку правапісу, калі ласка, выдзеліце гэты тэкст і націсніце Ctrl+Enter.