Побудова мереж термінів на основі тематичних інформаційних публікацій
Дмитренко О.О.
Реєстрація, зберігання і обробка даних. Щорічна підсумкова наукова конференція ІПРІ НАНУ «Реєстрація зберігання і обробка даних» 28-29 вересня 2020 року: збірник / - Київ: ІПРІ НАН України, 2020. - С. 107-108.
Розвиток Інтернет та глобалізація інформаційного простору призвели до стрімкого розвитку інформаційних ресурсів, що в свою чергу спричинили ряд специфічних проблем, пов’язаних, в першу чергу, із не менш стрімким збільшенням об’ємів даних у веб-просторі, в тому числі і неструктурованих та навіть непотрібних. Сьогодні в Інтернет існує доступна для експериментів динамічна інформаційна база такого об’єму, який раніше навіть важко було уявити. Тож питання пов’язані зі збиранням, обробкою, аналізом, пошуком і навігацією у
надвеликих масивах неструктурованих даних є актуальними.
В цій роботі розглядається одна з найбільш важливих проблем комп’ютерного аналізу природньої мови – формування термінологічних онтологій предметних областей, придатних
для автоматизованої обробки, на основі текстових корпусів заданої тематики. Мережа термінів, вузли якої відповідають окремим словам та словосполученням у тексті, а ребра – зв’язкам між ними, розглядається як можливий варіант онтологічної моделі.