Анатацыя
Універсальная дзесятковая класіфікацыя (УДК) з’яўляецца міжнароднай класіфікацыйнай сістэмай, якая адпавядае найбольш істотным патрабаванням да класіфікацый: міжнароднасць, універсальнасць, пашыральнасць. Табліцы УДК былі перакладзены і апублікаваны цалкам ці часткова на больш чым 40 мовах, а выкарыстоўваецца УДК прыкладна ў 130 краінах свету. На тэрыторыі Беларусі УДК дзейнічае на працягу апошніх 50 гадоў. Аднак толькі ў 2016 г. з’явілася афіцыйнае выданне УДК на беларускай мове. Алфавітна-прадметны паказальнік (АПП), які складае больш за чвэрць выдання, быў падрыхтаваны пры дапамозе алгарытму, які аўтаматызаваў працэс яго стварэння. У артыкуле падрабязна апісваецца падыход да аўтаматызаванага стварэння АПП беларускамоўнага выдання УДК. Разглядаюцца патрабаванні да АПП, параўноўваюцца фарматы АПП, выкарыстаныя ў выданнях УДК розных краін. Таксама апісваюцца электронныя лінгвістычныя рэсурсы, неабходныя для аўтаматызаванай генерацыі АПП, прыводзіцца падрабязны пакрокавы алгарытм. У якасці падцверджання працаздольнасці і карэктнасці працы дадзенага алгарытму прыводзіцца распрацаваны праграмны прататып сістэмы генерацыі АПП УДК. Дадзены прататып быў непасрэдным чынам выкарыстаны пры стварэнні АПП першага выдання Універсальнай дзесятковай класіфікацыі на беларускай мове.
Ключавыя словы: апрацоўка электронных тэкстаў, сістэмы класіфікацыі, беларуская мова, Універсальная дзесятковая класіфікацыя, алфавітна-прадметны паказальнік,
Гэтая публікацыя ў часопісе «Інфарматыка».