Проект направлен на создание семантико-синтаксического анализатора, объединяющего фазы синтаксического и семантического анализа текстов на естественном языке в одной процедуре.

Исследованы взаимодействие синтаксиса и семантики и возможность интеграции семантического и синтаксического анализа в рамках единого семантико-синтаксического анализатора. Разработан метод автоматического семантико-синтаксического анализа текстов на естественном языке, выполняющий синтаксический и семантический анализ текстов на основе единого подхода, в одной процедуре с использованием единой структуры данных.

Читать далее

В области обработки текстов на ЕЯ выделилось отдельное актуальное быстроразвивающееся научное направление, которое занимается проблемой анализа клинических текстов. В рамках этого направления разрабатываются специализированные системы, решающие задачи извлечения информации из клинических текстов и ее структурирования. Информация, полученная из текстов, может существенно обогатить базы знаний и данных, на основе которых работают медицинские системы поддержки принятия решений, что, в конечном счете, может повысить их эффективность.

Читать далее

Разрешение анафоры является важной задачей искусственного интеллекта в области обработки естественного языка, направленной на реализацию полноценной системы понимания текста. Цель этой задачи заключается в совмещении семантических сетей отдельных предложений в общую семантическую сеть текста, в которой установлены связи между объектами, упоминаемыми на протяжении целого дискурса.

На первом этапе исследования были изучены два вопроса:

  1. Какой метод разрешения местоименной анафоры эффективней: метод машинного обучения или метод, основанный на правилах?
  2. Как влияют на качество разрешения анафоры семантические признаки?

Читать далее

Проект направлен на исследование и разработку методов извлечения целевой информации из первичных научных публикаций – научных статей, монографий, авторефератов диссертаций, трудов конференций и др. Разрабатываемые методы будут ориентированы прежде всего на выявление в научных публикациях результатов научных исследований и введенных авторами новых понятий. Отличительная особенность предлагаемых подходов состоит в использовании реляционно- ситуационного анализа научных текстов и принципов активного и инкрементального машинного обучения с применением композиции индуктивных и статистических методов обучения. Предполагается создание размеченного корпуса научных текстов для обучения и проверки разработанных методов.

Настоящий проект направлен на исследование методов дискурсивного анализа текстов, применение которых в автоматических системах обработки естественного языка повышает качество решения таких задач как машинный перевод, автоматическое реферирование, анализ тональности, генерация текстов и другие. В качестве модели представления дискурсивной структуры текста используется Теория риторических структур.

Также в рамках проекта создается русскоязычный дискурсивный корпус, на основе которого будут исследоваться формальные, функциональные и семантические принципы выражения конкретных дискурсивных отношений в языке.

Читать далее