SCI Библиотека
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
В рамках процесса информатизации здравоохранения для профилактики кардиоваскулярных заболеваний целесообразным является создание программных сервисов поддержки врача обладающих свойствами объяснимого искусственного. В работе описан новый модуль знаний о хронической сердечной недостаточности, расширяющий возможности интеллектуального сервиса для диагностики и прогноза. Показаны методы аттестационного тестирования таких сервисов.
Современные роботы способны выполнять все более сложные задачи, которые обычно требуют высокой степени взаимодействия с окружающей средой, в которой им приходится работать. Как следствие, роботизированные системы должны обладать глубокими и конкретными знаниями о своих рабочих пространствах, которые выходят далеко за рамки простого представления показателей, которое роботизированная система может создать с помощью приёмов обработки только зрительных данных, например в задаче одновременной локализация и картографирования (SLAM). Анализ сцены является связующим звеном между распознаванием объектов и знанием об окружающем мире и в том или ином виде присутствует в процессе извлечения из зрительных данных информации, необходимой для решения конкретной задачи. В статье представляется систематизированный подход к обеспечению анализа сцены бортовыми СТЗ. Рассматриваются технологии анализа сцены как составной части повышения степени автономности подвижных РТК. Ряд технологий только предстоит освоить и воплотить в жизнь, но общая структура позволяет постепенно углублять анализ сцены на борту РТК, тем самым повышая степень автономности без коренной переделки бортовой информационно-управляющей системы и СТЗ, как ключевой части информационного обеспечения. Информация, извлечённая из зрительных данных, интегрируется в многослойную карту, обеспечивая высокоуровневое представление окружающей среды, которое воплощает в себе знания, необходимые робототехническому комплексу для реального выполнения сложных задач. Многослойная карта представляет собой форму хранения знаний об окружающей обстановке и объектов в ней. Эта карта объединяет пространственную иерархию объектов и мест с семантической иерархией понятий и отношений. Описываются структуры для представления данных в различных слоях этой карты и механизмы их использования. В частности, для описания маршрутов движения РТК, используются принципы интерпретирующей навигации, для представления информации об условиях функционирования и объектах интереса структуры сигнатур. В основе программной реализации предлагаемых механизмов используется унифицированный подход на основе программного каркаса СТЗ реального времени. Приводятся примеры использования описанных технологий при решении задач информационного обеспечения целенаправленных перемещений наземных РТК.
Рассматривается проблема представления знаний о моделях жизненного цикла программного обеспечения (ПО), необходимость решения которой обусловлена стремительным развитием методологий разработки ПО, отсутствием формальной легко расширяемой модели знаний в этой предметной области и тем, что выбор модели жизненного цикла и соответствующей ей методологии разработки оказывает значительное влияние на успешность программных проектов. Проведен системный анализ основных типов методологий разработки ПО, моделей жизненного цикла и их фаз. Приведены результаты исследования области представления моделей жизненного цикла ПО в виде онтологий. Разработана онтология «Software development life cycle (SDLC)», которая предназначена для представления знаний о различных моделях жизненного цикла ПО, фазах (стадиях) жизненного цикла, присущих различным моделям, и возможности описания повторяемости фаз. Онтология позволяет описывать модели как в рамках прогностических методологий разработки (водопадная, инкрементная), так и в рамках гибких методологий разработки (Scrum, Kanban). Описаны классы, свойства и аксиомы онтологии, на основе которых возможно осуществление формального логического вывода. Онтология SDLC разработана на основе форматов семантического веба (на языке OWL), опубликована в открытом доступе и представляет собой развивающийся, легко расширяемый проект. Это позволит использовать ее любым специалистам в области разработки ПО в практических или исследовательских целях. Также представлена идея программной оболочки, использующей представленную онтологию, которая позволит по заданным параметрам выбрать наиболее подходящую методологию для проекта, что упростит процесс разработки, позволит избежать ряда ошибок и сократит время на разработку.
В работе рассматривается проблема развития семантической библиотеки путем добавления новой прикладной научной области. На примере журнала по прикладным вопросам композиционных материалов строится дополнение к основному контенту библиотеки, расширяется описание исходной предметной области и происходит детализация статей УДК и MSC, соответствующих локальной предметной области. При этом решаются задачи добавления терминов в тезаурус, построения эталонного корпуса прикладной предметной области математики, создания настраиваемого интерфейса. Формулы и уравнения локальной предметной области семантически связываются с основным контентом библиотеки. Главное преимущество использования семантических библиотек для подобного рода задач состоит в обогащении имеющейся базы знаний библиотеки и выявлении связей в данных. Реализация перечисленных задач ведется средствами семантической библиотеки LibMeta, что позволяет обсуждать такие понятия, как тематическая область/подобласть и их иерархические связи, в частности, автоматическое включение понятий охватывающей области в систему знаний подобласти, возможности персонализации построенных конструкций и использования LibMeta как инструмента построения, в частности, собственно онтологии. Исследование этих задач требует взаимодействия с экспертами предметной области и использования современных средств и методов обработки естественного языка, машинного обучения подходов к представлению знаний. Интеграция данных в рамках библиотеки позволяет расширять описание предметных областей, связанных с приложениями математики в междисциплинарных исследованиях и технологиях. Для одного из прикладных разделов задач математической физики показана процедура включения специфических словарей, тезаурусов, а также массива публикаций специализированного журнала в семантическую библиотеку. Предлагаемый подход позволит использовать контент семантической библиотеки «математика» для научных исследований, минимизируя процесс поиска информации в локальной предметной области без потери более общих результатов, содержащихся за пределами этой области.
Развитие цифровой трансформации требует широкого использования новых технологий в документах по стандартизации. Одной из задач является создание стандартов с машинопонимаемым содержанием, которые позволят использовать цифровые документы на различных этапах разработки и производства без необходимости участия человека-оператора. Целью данной работы является описание подхода для создания и перевода в машинопонимаемое представление нормативных документов отрасли для дальнейшего их использования в программных сервисах и системах. Содержимое SMART-стандарта бывает трех видов: машиночитаемое, машиноинтерпретируемое и машинопонимаемое. Для формализации данных и знаний при решении различных задач активно используются графы знаний. Предложен новый двухуровневый подход для создания и перевода в машинопонимаемое представление нормативных документов как графов знаний. Подход определяет два вида интерпретации такого документа (человекочитаемость и машинопонимаемость) через два связанных формата: граф, каждый семантический узел которого представляет текст на естественном языке, и сеть понятий и строгих связей. Каждому узлу «человекочитаемого» графа соответствует (в общем случае) поддерево машинопонимаемого графа знаний. В качестве основы для обеспечения преобразования одной формы представления SMART-стандарта в другую форму служат LLM модели, дополняемые специализированным адаптером, полученным в результате дообучения с помощью подхода Parameter-Efficient Fine-Tuning. Установлены требования к набору проблемно- и предметно-ориентированных инструментальных средств формирования графов знаний. Показана концептуальная архитектура системы поддержки решения комплекса задач на основе SMART-документов в виде графов, установлены принципы реализации программных компонентов, работающих со знаниями, для интеллектуальных программных сервисов.
В настоящее время использование связки – (а) программные средства глубокого обучения и (б) параллельный двуязычный выравненный корпус текстов – позволяет создать переводчик для определенной предметной области. С помощью семейства патентов Patent Family (изобретения, профессионально переведенные на различные языки: русский, английский и т. п. и зарегистрированные в патентных базах различных стран), полученного посредством парсинга Google Patents, возможно создать параллельный корпус текстов для обучения лингвистической модели. В ходе работы получен новый метод, обеспечивающий формирование русско-английского параллельного корпуса для автоматического перевода текста патентов. Разработаны алгоритмы: парсинга патентов с Google Patents; формирования параллельного корпуса; обучения лингвистической модели перевода текстов патентов с использованием модели seq2seq. Разработанные алгоритмы реализованы в виде программного модуля на языке Python с использованием PyTorch, NLTK, spaCy, MySQL, ClickHouse. Программный модуль апробирован на патентах с сайта Google Patents. Для вычисления точности перевода были рассчитаны коэффициент BLEU и коэффициент полноты.