Статья: АНАЛИЗ МЕТОДОВ СГЛАЖИВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ИНФОРМАЦИОННОГО ПОИСКА В СИСТЕМАХ БОЛЬШИХ ДАННЫХ

Данная работа посвящена анализу методов сглаживания, направленных на улучшение точности поиска информации в системах, обрабатывающих большие объёмы данных.

Были изучены три основных метода: сглаживание по Елинеку - Мерсеру, байесовский подход с использованием распределения Дирихле и метод абсолютного дисконтирования.

В рамках исследования был создан набор данных из 10 000 документов и 5 поисковых запросов, на основе которого проведён эксперимент для оценки эффективности указанных подходов в задаче ранжирования документов.

Итоги эксперимента продемонстрировали, что байесовское сглаживание с распределением Дирихле показало наивысшую точность (MAP = 0.78) благодаря способности адаптироваться к большим объёмам данных.

Полученные результаты имеют прикладное значение для оптимизации и разработки алгоритмов поиска, используемых в обработке крупных текстовых массивов.

Информация о документе

Формат документа
PDF
Кол-во страниц
1 страница
Загрузил(а)
Лицензия
Доступ
Всем
Просмотров
3

Предпросмотр документа

Информация о статье

ISSN
2076-4359
EISSN
2222-5218
Журнал
УЧЕНЫЕ ЗАПИСКИ КОМСОМОЛЬСКОГО-НА-АМУРЕ ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА
Год публикации
2025
Автор(ы)
ПЕТРОВА А. Н., ФРОЛОВ Д. О., Дмитриева Т. Л.