В статье приводятся результаты применения методов машинного обучения для исследования данных специальной анкеты, учитывающей общие характеристики авиарейсов, характеристики пассажиров и их мнения о различных аспектах авиарейса. Цель исследования - выявление в экспериментальных данных факторов, негативно влияющих на отношение пассажиров к услугам авиакомпании. При проведении исследования были использованы популярные алгоритмы, входящие в состав свободного программного обеспечения для анализа данных и машинного обучения, университета Вайкато (Новая Зеландия) WEKA, распространяемого по лицензии GNU GPL: наивный байесовский классификатор; многослойный перцептрон, использующий алгоритм обратного распространения ошибки; метод ближайших соседей (KNN) с адаптивным подбором параметров; деревья решений - алгоритм J48, который является аналогом на Java известного алгоритма C4.5; случайный лес; логистическая регрессия; алгоритм адаптивного бустинга (AdaBoost); машина опорных векторов - алгоритм SMO (Sequential Minimal Optimization), являющийся одной из возможных реализаций алгоритма машины опорных векторов. Показано, что наилучшие по точности модели, отражающие удовлетворенность пассажиров услугами авиакомпании, получаются с помощью алгоритмов «случайный лес» (погрешность на тестовой выборке - 3,9 %) и нейросетевого подхода (погрешность на тестовой выборке - 3,7 %). Вместе с тем, указанные алгоритмы не позволяют явным образом выделить факторы, характерные для авиапассажиров, не удовлетворенных качеством обслуживания. Этот пробел восполняет алгоритм на основе метода структурного резонанса в многомерных данных SRMD, позволивший выявить в данных точные логические правила, обладающие высокой полнотой. Полученные логические правила являются хорошо интерпретируемыми паттернами пассажиров, которые либо отрицательно, либо нейтрально оценивают услуги авиакомпании в целом. Полный текст статьи в переводе на английский язык публикуется во второй части данного выпуска.
Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.
Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.
Все права на товарные знаки принадлежат их законным владельцам!
Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.
Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.
Спасибо, понятно.