Статья: ИДЕНТИФИКАЦИЯ СРЕДСТВ КАТЕГОРИИ ОТРИЦАНИЯ В СБАЛАНСИРОВАННОМ ЛИНГВИСТИЧЕСКОМ КОРПУСЕ (2025)

Читать онлайн

Цель исследования - разработать базовую технологию идентификации средств категории отрицания в рамках работы программного комплекса «Генератор сбалансированного лингвистического корпуса и корпусный менеджер». Применяются методы анализа, тестирования, моделирования, профессионально ориентированного программирования и эксперимента. В качестве лингвистического материала выступает корпус актуальных новостных текстов CNN объемом 1 024 583 токена. В результате исследования уточнены возможности текущей версии программного комплекса, а также написано расширение, позволяющее находить лексические единицы, находящиеся в прямом подчинении от заданной леммы.

Ключевые фразы: ПРИКЛАДНАЯ ЛИНГВИСТИКА, корпусная лингвистика, корпусный менеджер, сбалансированный лингвистический корпус, отрицание, тексты сми, обработка естественного языка
Автор (ы): ГОРОЖАНОВ АЛЕКСЕЙ ИВАНОВИЧ
Журнал: ВЕСТНИК МОСКОВСКОГО ГОСУДАРСТВЕННОГО ЛИНГВИСТИЧЕСКОГО УНИВЕРСИТЕТА. ГУМАНИТАРНЫЕ НАУКИ

Предпросмотр статьи

Идентификаторы и классификаторы

SCI
Языкознание
УДК
81. Лингвистика. Языкознание. Языки
Для цитирования:
ГОРОЖАНОВ А. И. ИДЕНТИФИКАЦИЯ СРЕДСТВ КАТЕГОРИИ ОТРИЦАНИЯ В СБАЛАНСИРОВАННОМ ЛИНГВИСТИЧЕСКОМ КОРПУСЕ // ВЕСТНИК МОСКОВСКОГО ГОСУДАРСТВЕННОГО ЛИНГВИСТИЧЕСКОГО УНИВЕРСИТЕТА. ГУМАНИТАРНЫЕ НАУКИ. 2025. № 2 (896)
Текстовый фрагмент статьи