Метод побудови направлених зважених мереж термінів на основі текстових корпусів
Ланде Д.В., Дмитренко О.О.

Матеріали XVIII Всеукраїнської науково-практичної конференції студентів, аспірантів та молодих вчених "Теоретичні і прикладні проблеми фізики, математики та інформатики" (12 - 13 травня 2020, м. Київ, Україна)/ НТУУ "КПІ", 2020. - C. 68-71.
В цiй роботi розглядається одна з найбiльш актуальних проблем комп’ютерного аналiзу природньої мови – форму-
вання термiнологiчних онтологiй предметних областей на основi текстових корпусiв заданої тематики. Мережа
термiнiв, вузли якої вiдповiдають окремим словам та словосполученням у текстi, а ребра – зв’язкам мiж ними,
розглядатися в якостi онтологiчної моделi. Для побудови направленої мережi iз термiнiв, що вiдповiдають певним
поняттям обраної предметної областi, в цiй роботi застосовується новий пiдхiд до побудови мереж на основi часового ряду – модифiкований алгоритм графа горизонтальної видимостi (Directed Horizontal Visibility Graph algorithm –DHVG). Також запропоновано новий метод розрахунку вагових значень зв’язкiв у направленiй мережi термiнiв. Апробацiю запропонованого методу було здiйснено на основi текстового корпусу з iнформацiйних повiдомлень за темою «COVID-19». Також було розглянуто корпус тiєї ж теми, сформований з анотацiй наукових статей, що були вивантаженi з вiльної доступної пошукової системи Google Scholar. Результатом роботи стало вiзуальне представлення мереж термiнiв для текстових корпусiв за темою «COVID-19».

Ключові слова: предметна область, термiнологiчна онтологiя, граф горизонтальної видимостi, направлена зважена мережа термiнiв, COVID-19.

© 2021, Oleh Dmytrenko
dmitrenko_o@ukr.net
This site was made on Tilda — a website builder that helps to create a website without any code
Create a website