Статья: Композиционно-структурные, семантические и пресуппозиционально-прагматические параметры и дефекты сгенерированных коротких текстов в языковой нейросети GigaChat (2024)

Читать онлайн

Введение. Актуальность выполненного исследования состоит прежде всего в том, что все более активное обращение самых широких кругов пользователей к генерации текстов разных жанров, свойств и объёмов с помощью так называемых LLM (Large Language Model, Большая Языковая Модель, БЯМ) порождает необходимость изучения собственно лингвистических возможностей этих генеративных моделей, в том числе необходимость лингвистического исследования порождаемых ими текстов. Немаловажным также представляется тот факт, что большое количество специалистов из разных областей деятельности активно используют генеративные возможности языковых нейросетей в своих сугубо профессиональных целях, из чего следует, что качество генерируемых текстов приобрело статус производственного фактора и непосредственным образом влияет на успех в профессиональной деятельности, что также указывает на актуальность предпринятого нами исследования.

Материалы и методы. В качестве объекта исследования были избраны тексты коротких рассказов, поскольку в определенном отношении такого рода тексты могут рассматриваться как архетипические структуры, лежащие в основе текстов некоторых функциональных типов (сценарии, рекламные тексты, рассказы).

Анализ. Такое положение дел потребовало изучения сгенерированных рассказов в том числе в аспекте репрезентации в нём фреймовых структур, поскольку это позволяет составить представление о том, как устроены тексты этого типа с точки зрения стандартной языковой семантики, включая синтаксическую семантику.

Результаты. Установлено, что при всей грамматической, структурно-семантической и композиционной адекватности, сгенерированные в GigaChatPro тексты коротких рассказов, созданные сетью на определенную тему или по определенному фрейму, могут содержать нарушения в глобально-семантической организации, порожденные как пресуппозициональнопрагматическими нарушениями, так и нарушениями текстовой референции. Отмечены также нарушения в общей функциональной прагматике сгенерированных рассказов: выраженная назидательность, длина предложений в них – 5-7 слов свойственны рассказам для детей младшего школьного возраста, при том, что темы этих рассказов изначально не соответствуют их возрастным интересам.

Ключевые фразы: текст, ГЕНЕРАЦИЯ, llm, языковая модель, нейросеть, семантический, прагматический, ДЕФЕКТ, галлюцинация
Автор (ы): Гусаренко Сергей Викторович, Гусаренко Марина Константиновна
Журнал: ГУМАНИТАРНЫЕ И ЮРИДИЧЕСКИЕ ИССЛЕДОВАНИЯ

Предпросмотр статьи

Идентификаторы и классификаторы

SCI
Языкознание
УДК
81. Лингвистика. Языкознание. Языки
Префикс DOI
10.37493/2409-1030.2024.2.21
Для цитирования:
ГУСАРЕНКО С. В., ГУСАРЕНКО М. К. КОМПОЗИЦИОННО-СТРУКТУРНЫЕ, СЕМАНТИЧЕСКИЕ И ПРЕСУППОЗИЦИОНАЛЬНО-ПРАГМАТИЧЕСКИЕ ПАРАМЕТРЫ И ДЕФЕКТЫ СГЕНЕРИРОВАННЫХ КОРОТКИХ ТЕКСТОВ В ЯЗЫКОВОЙ НЕЙРОСЕТИ GIGACHAT // ГУМАНИТАРНЫЕ И ЮРИДИЧЕСКИЕ ИССЛЕДОВАНИЯ. 2024. ТОМ 11, № 2
Текстовый фрагмент статьи