Статья: Конвейер обработки данных научных публикаций для выявления приоритетных направлений исследований
В условиях стремительного роста объемов научной информации возникает необходимость в автоматизированных методах анализа, способных выявлять наиболее перспективные направления исследований. Актуальность этой задачи обусловлена невозможностью вручную обработать огромные массивы данных и необходимостью оперативного стратегического планирования научной деятельности. Целью исследования является разработка и апробация конвейера обработки данных научных публикаций, который позволит систематизировать большие объемы информации и обеспечивать поддержку принятия решений в научных организациях. Для реализации конвейера используется платформа Lens. org, предоставляющая доступ к обширным базам данных научных публикаций. Сбор информации с последующей предобработкой включает удаление дубликатов, токенизацию, лемматизацию и векторизацию текстов. Для выделения скрытых тем применяется метод тематического моделирования (LDA). Дополнительно проводится анализ цитируемости и графовый анализ взаимосвязей между публикациями. Особое внимание уделено разработке новой метрики – «индекс приоритетности», которая комбинирует показатели цитируемости, тематической релевантности и временного тренда публикаций. Апробация конвейера на выборке, состоящей из более чем 50 тыс. публикаций за 2014–2024 гг., продемонстрировала высокую точность и эффективность предложенного метода. Полученные результаты позволили выделить ключевые направления исследований, такие как искусственный интеллект, обработка больших данных и распределенные энергетические системы, а также проследить динамику их развития.
Информация о документе
- Формат документа
- Кол-во страниц
- 1 страница
- Загрузил(а)
- Лицензия
- —
- Доступ
- Всем
- Просмотров
- 1
Предпросмотр документа
Информация о статье
- ISSN
- 2949-477X
- EISSN
- 2782-4934
- Журнал
- ЦИФРОВЫЕ МОДЕЛИ И РЕШЕНИЯ
- Год публикации
- 2025