Статья: НЕЙРОСЕТЕВАЯ МОДЕЛЬ В ИНФОРМАЦИОННОЙ ВОПРОСНО-ОТВЕТНОЙ СИСТЕМЕ

Скачать

Введение: многочисленные исследования говорят о том, что современные крупные нейронные сети, как правило, имеют избыточное количество параметров. Целью работы является обучение и оптимизация модели “ruBERT” для применения в информационных вопросно-ответных системах на русском языке. Научная новизна работы состоит в экспериментальном исследовании различных методов прореживания модели “ruBERT” при дообучении на наборе данных “SberQuAD”.
Методы: в настоящей работе используются методы обработки естественного языка, машинного обучения, прореживания искусственных нейронных сетей. Языковая модель была настроена и дообучена при помощи библиотек машинного обучения “Torch” и “Hugging Face”. Для обучения нейронных сетей использовался набор данных “SberQuAD”. Все эксперименты проводились при помощи сервисов “Google Colab” и “Google Cloud”.
Результаты: было обнаружено, что удаление ~54% от числа весов кодировщика модели “ruBERT” (~39 миллионов параметров) приводит к незначительным ухудшениям в результатах работы модели: с 67,31 до 63,28 для показателя EM и с 85,47 до 82,48 для показателя F-мера. Полученные результаты говорят о том, что модель “ruBERT” содержит избыточное количество весов для задачи “извлечение ответа на вопрос”. Для эффективного применения данной модели в информационных вопросно-ответных системах на русском языке необходимо проводить её компрессию и оптимизацию. Оптимизированная модель может работать на менее мощном оборудовании без значимых потерь в производительности, что приводит к уменьшению затрат на поддержание информационных вопросно-ответных систем, в которых применяется данная модель.

Информация о документе

Формат документа: PDF
Кол-во страниц: 1 страница
Загрузил(а): ВОЛКОВ ДЕНИС АНДРЕЕВИЧ
Лицензия: —
Доступ: Всем

Информация о статье

ISSN: 2409-5419
EISSN: 2412-1363
Журнал: НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ
Год публикации: 2024
Автор(ы): ВОЛКОВ Д. А., Галеев Д. Т., ТИТОВ Д. В.
Ключевые фразы: машинное обучение, глубокое обучение, нейронные сети, обработка естественного языка, ТРАНСФОРМЕР
УДК: 004.8. Искусственный интеллект

Статистика просмотров

Статистика просмотров статьи за 2025 год.

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – Сайт) представляет собой платформу, на которой пользователи самостоятельно добавляют и публикуют метаинформацию о материалах разных видов (названия, обложки, аннотации, данные об авторах и т.п.). Администрация Сайта не занимается самостоятельным сбором или первоначальной публикацией этих сведений.

Модерация контента

На Сайте действует постмодерация. Это означает, что материалы, добавляемые пользователями, становятся общедоступными сразу после публикации и проверяются Администрацией Сайта постфактум в разумные сроки.

Использование информации

Администрация Сайта не использует метаданные и обложки документов в коммерческих или рекламных целях для продвижения товаров или услуг и не заявляет о каких-либо правах на представленные объекты интеллектуальной собственности. Все права на документы и сопутствующие материалы принадлежат их законным правообладателям.

Отказ от гарантий

Администрация Сайта не гарантирует точность, полноту и достоверность метаинформации, размещенной пользователями, поскольку не осуществляет ее предварительную проверку.

Ответственность

Сайт носит исключительно информационно-справочный характер. Администрация Сайта не несет ответственности за содержание и достоверность информации, добавленной пользователями, а также за любые убытки, возникшие в связи с использованием или невозможностью использования Сайта и размещенной на нем информации.