Нейросимволический ИИ: что будет, если объединить два антагонистических подхода к ИИ

Создание мыслящих машин было навязчивой идеей человечества, и на протяжении всей истории многие исследователи работали над концепцией создания разумных машин. Хотя нейронные сети — наиболее популярная форма ИИ, символический ИИ когда-то сыграл решающую роль в этом. Он использовался в суперкомпьютере IBM Watson, чтобы победить человека в шоу-викторине Jeopardy в 2011 году, пока его место не заняли нейронные сети, обученные методом глубокого обучения.

Хотя нейронные сети подарили нам много интересных разработок, исследователи считают, что для прогресса ИИ должен понимать не только «что», но и «почему», то есть обрабатывать причинно-следственные связи. Это заставило искать новые направления в ИИ.

Нейросимволический ИИ (Neuro-symbolic AI) — это форма ИИ, которая сочетает в себе методы машинного обучения и символические системы. В статье рассмотрим, что получится, если объединить две противоположные концепции. Мы продолжаем рассказывать о «Цикле хайпа», в который Gartner включили самые перспективные технологии ближайших лет и предположения об их развитии.

фигуры геометрические

Что такое нейросимволический ИИ

Нейро-символический ИИ — одно из развивающихся направлений ИИ сейчас. Первой парадигмой ИИ был символический ИИ, в основе которого лежит символическое представление задач и логический вывод. Ему на смену пришел статистический ИИ (машинное обучение, нейронные сети). Он решает задачи, с которыми не справлялся предыдущий: распознает изображения, речь, текст.

Долгое время оба направления противопоставлялись друг другу, причем первую парадигму считали устаревшей. Оказалось, что объединив символический и статистический ИИ, можно значительно повысить эффективность нейронных сетей и для некоторых задач обойти ограничения статистического ИИ.

Нейросимволический искусственный интеллект — это продвинутая версия, которая улучшает процесс принятия решения нейронной сетью, добавляя в него классический ИИ, основанный на правилах (символический). Такой гибридный подход требует меньше обучающих данных и позволяет человеку отслеживать, как ИИ принял решение.

Например, при распознавании изображений нейросимволический ИИ может использовать глубокое обучение для идентификации отдельного объекта, а затем добавить слой информации о свойствах объекта и его отдельных частях, применяя символические рассуждения. Таким образом, система нейросимволического ИИ способна не только идентифицировать объект, например яблоко, но и объяснить, почему она обнаружила именно яблоко, предложив в качестве объяснения список уникальных характеристик и свойств яблока.

Символический ИИ: основан на правилах

Этот подход был первой официальной попыткой создания искусственного интеллекта. Им пользовались в период с 1950-х по 1980-е годы.

Символический ИИ основан на способности человека понимать мир путем формирования символических взаимосвязей и представлений. Это помогает создавать правила для определения понятий и фиксировать повседневные знания.

Это означает, что для того, чтобы объяснить что-то системе символического ИИ, инженеру и исследователю придется явно предоставить все сведения и правила, которые ИИ сможет использовать для правильной идентификации.

Так символический ИИ определит яблоко:

символический ИИ
Источник: MIT-IBM Watson AI Lab

Нейронные сети: основаны на данных

Нейросетевой ИИ отличается от символьного, поскольку он основан на данных, а не на правилах.

Аспект «нейро» относится к нейронным сетям глубокого обучения. Их разработчики вдохновились способностью человеческого мозга к конкуренции. Идея самодвижущихся автомобилей — нейронная сеть. Концепция персональных помощников вроде Алисы — тоже нейросети.

Они учатся с помощью данных. Чтобы обучить нейросетевой ИИ, придется показывать ему многочисленные фотографии изучаемого предмета. Как только он станет достаточно умным, он сможет не только идентифицировать объект, на который его обучали, но и создавать похожие, которые могут даже не существовать в реальном мире. Вспомните лица людей, сгенерированные искусственным интеллектом.

Так нейросетевой ИИ определил бы яблоко:

нейросетевой ИИ
Источник: MIT-IBM Watson AI Lab

Разделенные подходы к ИИ: в чем их проблема

В каждом из подходов к ИИ есть свои проблемы. Минус классического, символического ИИ в том, что он ограничен областями. Он ломается, когда не запрограммирован на что-то явно.

Для нейронных сетей самое большое ограничение — это данные. Нейронные сети, как и люди, учатся на примерах. Однако если человеку, чтобы узнать об объекте, может потребоваться пара обучающих примеров, то нейронному ИИ нужно гораздо больше. Если инженеры ИИ не смогут предоставить огромное количество аннотированных данных, точность алгоритма останется слабой. Из-за этого, хотя нейронный ИИ и может быть правильным в 80% случаев, он не справляется с оставшимися 20%, особенно со случаями из ряда вон выходящими.

К чему приведет слияние символьного и нейросетевого ИИ

Объединение нейросетевого ИИ с символьным ИИ позволяет создавать более интеллектуальные системы ИИ. Глубокое обучение помогает символическому ИИ разложить мир на символы, опираясь не на программистов-людей, а на данные. В свою очередь символический ИИ включает в глубокое обучение здравый смысл, рассуждения.

Вместе символьный и нейросетевой подходы к ИИ могут привести к значительным достижениям. Нейросимволический искусственный интеллект не только сочетает в себе признанные подходы к ИИ и машинному обучению, но и позволяет обойти большинство слабых мест и недостатков, которые возникают при использовании каждой системы в отдельности.

Главные преимущества нейросимволического ИИ:

  • Эффективное использование данных. Система нейросимволического ИИ может быть обучена всего лишь на 1% данных от того объема, который потребовался бы для традиционных методов машинного обучения. Это избавляет специалистов по исследованию данных от необходимости собирать огромные объемы информации, а также экономит время и усилия, необходимые для организации и маркировки отдельных точек данных.
  • Высокая точность. И нейронные сети, и символьный ИИ обладают высокой степенью точности. Однако их процент недостаточно высок, чтобы использовать их в сценариях с высоким уровнем риска, требующих точного и быстрого реагирования (например, в самоуправляемых автомобилях). В нейросимволическом ИИ нейронные сети и символьный ИИ накладываются друг на друга, чтобы устранить любые пробелы в точности и получить более надежные результаты.
  • Прозрачность данных. Самообучающиеся системы ИИ принимают решения, используя базовый алгоритм, который они сами разработали, оставляя тех, кто создал систему, в неведении относительно методологии, которую использовала программа, чтобы прийти к своему заключению. Нейросимволический ИИ, напротив, устраняет эту проблему, предлагая полную прозрачность и показывая пользователям, как он пришел к конечному результату.

Проекты и прорывы

Системы нейросимволического искусственного интеллекта — это далеко не просто идея с нишевой аудиторией. Рассмотрим несколько примеров использования этой концепции ИИ.

CLEVRER

Исследователи из Массачусетского технологического института, IBM и Гарварда занимают лидирующие позиции. Их наиболее заметный проект — CLEVRER, большая база данных видеорассуждений, которую можно использовать, чтобы помочь системам ИИ лучше распознавать объекты на видео, а также отслеживать и анализировать их движение с высокой точностью.

С помощью CLEVRER исследователи оценили производительность нейронных сетей и нейросимволических рассуждений, используя лишь малую часть данных, необходимых для традиционных систем глубокого обучения. Это помогло ИИ не только понять случайные связи, но и применить здравый смысл для решения проблем.

CLEVRER
Образец видео, вопросов и ответов из набора данных CoLlision Events for Video REpresentation and Reasoning (CLEVRER). CLEVRER предназначен для оценки того, могут ли вычислительные модели понять, что происходит на видео (I, описательные вопросы), объяснить причину событий (II, объяснительные), предсказать, что произойдет в будущем (III, предсказательные) и представить контрфактические сценарии (IV)

Они создали и протестировали нейро-символическую динамическую модель рассуждений (NS-DR), чтобы выяснить, сможет ли она преуспеть там, где нейронные сети не справятся. Она использовала нейронные сети для распознавания цветов, форм и материалов объектов и символическую систему для понимания физики их движения, а также причинно-следственных связей между ними. Исследователи обнаружили, что NS-DR значительно превзошла модели глубокого обучения по всем категориям вопросов.

AlphaGeometry

DeepMind представила AlphaGeometry — это сочетание языковой модели и символического двигателя дедукции. Один компонент быстро генерирует интуитивные идеи, а другой — принимает рациональные решения.

AlphaGeometry

AlphaGeometry решает задачи по геометрии на уровне золотых медалистов Международной математической олимпиады. Система решила 25 из 30 задач олимпиады, используя комбинацию статистических предположений, типичных для языковых моделей, и символического рассуждения, то есть рисуя окружности и отрезки. Другими словами, тут использовали нейросимволический подход.

Aдам и Ева

Это новая нейросимволическая архитектура, которая в 700 раз быстрее стандартных трансформеров.

Aдам и Ева

Алгоритмы нейросимволического обучения основаны на принципе минимальной длины описания. Этот принцип гласит, что способность модели к точному прогнозированию возрастает с увеличением эффективности сжатия данных.

В новой архитектуре каждый уровень независимо разрабатывает свой собственный формальный язык, выявляя повторяющиеся шаблоны в потоке входящих символов и эффективно сжимая их в более плотную последовательность часто встречающихся комбинаций. Так реализуется сжатие данных внутри слоев без потерь.

Обучение модели представляет собой иерархический процесс. Она изучает ряд формальных языков, в которых слова низкого уровня абстрагируются в символы более высокого уровня. Понимание входного потока возникает в результате анализа снизу вверх всеми слоями, а формирование ответа — это процесс сверху вниз, когда каждый слой вносит свой вклад в реализацию общей стратегии.

Потенциал технологии и какое у нее будущее

График Gartner в виде кривой показывает цикл развития каждой новой технологии в настоящее время. Он включает пять ключевых этапов, а нейросимволический ИИ находится на этапе триггера инноваций. Это момент, в который происходит потенциальный технологический прорыв, а также появляются первые подтверждающие жизнеспособность концепции. Согласно Gartner, коммерческий потенциал проектов еще не доказан, а технологии понадобится примерно 10 лет, чтобы прояснились перспективы.

График Gartner

Пока весь мир использует архитектуру Transformer, есть умы, которые пытаются снизить издержки на обучение в сотни раз. Сейчас обучение LLM обходится дорого, а стоимость зависит от размера набора данных. Даже OpenAI и другие уже сталкиваются с нехваткой оборудования для этих целей. Чтобы раскрыть потенциал ИИ, необходимо изучить альтернативные архитектуры, которые надо меньше вычислительной мощности. Концепция нейросимволического ИИ поможет ученым обучать алгоритмы с меньшим количеством данных.

Другой важный фактор — желание понимать решения, принимаемые ИИ. Нейронные сети с их распределенным мышлением не интерпретируемые. Непонятно, почему они дают такие, а не иные ответы, и как на их поведение можно влиять, не переобучая всю модель. Ожидается, что нейросимволический ИИ поможет снизить предвзятость машин, сделав процесс принятия решений обучающейся моделью более прозрачным и объяснимым.

Таким образом, чтобы ответить на вопрос, нейросимволическая система использует и логику, и обработку языка, что похоже на то, как ответил бы человек. Она не только более эффективна, но и требует мало обучающих данных, в отличие от нейронных сетей. Нейросимволический ИИ сможет преуспеть там, где старые технологии потерпели неудачу.

Читать еще из рубрики «Цикл хайпа»:

Распаковывая черный ящик: как работает Causal AI

Кто такие «цифровые люди» и чего от них ждать

Супер-удобные супер-приложения: что такое SuperApp и кому они нужны

Что будем искать? Например,ChatGPT

Мы в социальных сетях