Исследования

Исследования

Мои научные интересы включают (но не ограничиваются):

  • искусственный интеллект;
  • интеллектуальная робототехника;
  • автоматическое планирование, планирование траектории;
  • эвристический поиск;
  • многоагентные системы;
  • визуальная навигация;
  • когнитивные агенты.

Я сосредоточен на исследовании методов и разработке алгоритмов, применимых для создания систем управления интеллектуальными агентами (мобильными роботами, беспилотными автомобилями, дронами, персонажами компьютерных игр и пр.), которые бы позволяли этим агентам:

  • быть автономными, т.е. способными действовать в сложной, динамической среде без участия оператора (человека);
  • быть адаптивными, т.е. способными эффективно выполнять возложенные на них задачи в условиях возникновения нештатных ситуаций, непредвиденных обстоятельств и пр.;
  • взаимодействовать как между собой, так и с человеком для эффективного решения поставленных задач.

Создание таких интеллектуальных систем управления — комплексная задача, для успешного решения которой необходимо использование методов и моделей искусственного интеллекта, теории автоматического управления, когнитивного моделирования и др.

В настоящий момент мои основные исследования сосредоточены на методах планирования траектории и (в меньшей степени) на методах визуальной навигации.


Видео || Результаты || Простыми словами


Видео

Видео иллюстрируют некоторые результаты исследований, в которых я принимал непосредственное участие.







Результаты

Ниже перечислены некоторые научные результаты (методы и алгоритмы), полученные при моем участии, а также публикации, в которых они описываются. Полная информация о публикациях представлена в соответствующем разделе.

  1. Алгоритмы централизованного планирования совокупности неконфликтных траекторий для группы агентов.
    • CCBS — алгоритм, гарантирующий построение оптимальных решений задачи много-агентного планирования в непрерывном времени. Есть также большая журнальная статья про этот алгоритм. (Это — одна из самых цитируемых моих работ)
    • ICCBS — улучшенная версия алгоритма CCBS, существенно превосходящая его по вычислительной эффективности.
    • AA-SIPP(m) — алгоритм приоритизированного планирования, допускающий возможность перемещения в произвольном направлении.
    • Улучшенный алгоритм AA-SIPP(m), предусматривающий возможность вращения и  агентов различного размера.
  2. Алгоритмы децентрализованного много-агентного планирования и навигации.
    • Follower — алгоритм, основанный на интеграции эвристического поиска (для долгосрочного планирования) и обучения с подкреплением (для локального избегания столкновений и кооперации).
    • Switcher — ещё один вариант интеграции поиска и обучения с подкреплением для решения задачи децентрализованного много-агентного планирования, основанный на различных механизмах переключения между обучаемой и необучаемой стратегией поведения.
    • MATS-LP — алгоритм много-агентного планирования, основанный на поиске Монте-Карло по дереву (Monte-Carlo Tree Search, MCTS). Ещё одна статья на эту тему (с предварительными результатами).
  3. Алгоритмы планирования траектории для одного агента, использующие современные методы машинного обучения.
    • POLAMP — алгоритм планирования траектории в динамической среде, основанный на интеграции обучения с подкреплением и методов эвристического поиска и случайного семплирования.
    • TransPath — метод планирования траектории, использующий современные нейросетевые модели (трансформеры) для сокращения пространства поиска. Более ранняя работа на эту тему — тут.
    • GridPathRL — одна из наших первых работ, посвященных возможности использования современных (на тот момент) методов обучения с подкреплением для решения задачи планирования траектории на графе-сетке. (Это — одна из моих самых цитируемых работ).
  4. Алгоритмы планирования траектории, основанные на эвристическом поиске.
    • SIPP-IP — метод планирования траектории в динамической среде, использующий принцип безопасно-интервального планирования (для повышения эффективности поиска) и учитывающий кинодинамические ограничения агента (например, невозможность мгновенно остановиться).
    • TO-AA-SIPP — метод планирования траектории в динамической среде, допускающий перемещение в произвольном направлении (any-angle) и при этом гарантирующий оптимальность решения.
    • LIAN — семейство алгоритмов планирования траектории, не содержащей резких поворотов. Статья на русскомещё одна). Статья на английскомещё одна).
  5. Алгоримы визуальной навигации.

Простыми словами

Я с коллегами занимаюсь задачами, решение которых позволит сделать мобильных агентов, например — мобильных роботов, немного умнее. При этом мы не занимаемся железками, т.е. не конструируем самих роботов. Нам как исследователям важны, прежде всего, те алгоритмы, благодаря которым они могут решать сложные задачи в автономном режиме. Именно поэтому мы зачастую проводим модельные эксперименты, которые выглядят как «прыгающие точки на экране», или же эксперименты в симуляторах. Когда мы чувствуем, что наши методы работают хорошо, мы запускаем эксперименты на готовых робототехнических платформах, которые обычно покупаем на свободном рынке.

В средствах массовой информации то, чем мы занимаемся, назвали бы «разработкой Искусственного Интеллекта для роботов». Это, на мой взгляд, некорректная фраза, т.к. искусственный интеллект — это (в академическом понимании) область науки, такая же как, например, математика или химия. Вы же не пишите «Математика» с большой буквы. Теперь представьте фразу «разработка математики для роботов» — звучит странно. Поэтому корректно говорить — «мы занимаемся применением методов и моделей искусственного интеллекта для создания систем управления мобильными агентами».

Важно отметить, что человечество ещё весьма далеко, на мой взгляд, от создания полностью автономных, адаптивных, способных к полноценному взаимодействию машин, которые так часто становятся героями фантастических фильмов и сериалов. Слишком много в этой области нерешенных научных и инженерных задач. Это и делает её привлекательной для исследований и разработок.