Искусственный интеллект (ИИ), машинное обучение и глубокое обучение… Чем они отличаются? Это «на пальцах» поясняется в блоге Oracle. ИИ (AI, Artificial Intelligence) означает, что компьютер тем или иным образом имитирует поведение человека. Машинное обучение (ML, Machine Learning) – это подмножество ИИ, состоящее из методов, которые позволяют компьютерам делать выводы на основе данных и предоставлять ИИ-приложениям. Глубокое обучение (DL, Deep Learning) является подмножеством машинного обучения, и оно дает компьютерам возможность решать более сложные задачи.

Все эти описания корректны, но довольно лаконичны. Поэтому стоит рассказать о каждой из областей подробнее.

Искусственный интеллект как академическая дисциплина появился в 1956 году. Цель, как и сейчас, тогда заключалась в том, чтобы заставить компьютеры решать задачи, которые считались подвластными исключительно людям: те, что требовали интеллекта. Первоначально исследователи работали над такими задачами, как игра в шашки и решение логических головоломок.

Взглянув на результаты одной из таких программ игры в шашки, можно было увидеть за их ходами какую-то форму «искусственного интеллекта», особенно когда компьютер вас побеждал. Первые успехи вызвали у исследователей почти безграничный энтузиазм по поводу потенциала ИИ, который однако не соответствовал тому, насколько сложными могли оказаться решения отдельных задач.

Искусственный интеллект, следовательно, относится к выводам компьютера. Компьютер делает что-то «умное», поэтому он демонстрирует интеллект, интеллект искусственный.

Сам термин «ИИ» ничего не говорит о том, как именно эти задачи решаются. Между тем существует множество различных методов, в том числе основанных на правилах или экспертных системах. И одну категорию методов стали особенно широко использовать в 1980-х годах – машинное обучение.

Причина, по которой первые исследователи столкнулись с тем, что некоторые задачи на самом деле оказались намного сложнее, чем представлялось ранее, состоит в следующем: эти задачи просто не поддаются решению ранними методами, используемыми в ИИ. Жестко закодированные алгоритмы или фиксированные, основанные на правилах системы не очень хорошо работают с такими вещами, как распознавание изображений или понимание текста.

Решением оказалось не просто подражание человеческому поведению, а имитация того, как люди учатся. Именно в этом и состоит идея машинного обучения. Дать алгоритму (в отличие от мозга) огромное множество данных и позволить ему сделать заключения. По мере совершенствования этих алгоритмов они могли бы решить многие задачи. Но некоторые вещи, которые людям казались довольно легкими (например, распознавание речи или рукописного ввода), все еще были трудными для машин. Однако, если машинное обучение – это подражание тому, как люди учатся, почему бы не пройти весь путь и не попытаться имитировать человеческий мозг? Эта идея – в основе нейронных сетей.

Идея использования искусственных нейронов (а нейроны, связанные посредством синапсов, являются основными элементами нашего мозга) была известна довольно давно, и нейронные сети, смоделированные в программном обеспечении, стали использовать для решения определенных задач. Подход оказался многообещающим и позволил решить некоторые сложные задачи, с которыми не справлялись другие алгоритмы.

Но машинное обучение все еще ограничивалось тем, с чем легко справлялись младшие школьники. Оказалось, что проблема – вовсе не в самой концепции машинного обучения. И даже не в идее подражать работе человеческого мозга. Простые нейронные сети с сотнями или даже тысячами нейронов, связанные относительно простым способом, не могли дублировать то, на что способен человеческий мозг. Если подумать, то это вовсе не удивительно: в человеческом мозгу насчитывается около 86 миллиардов нейронов и имеют место очень сложные взаимосвязи.

Попросту говоря, глубокое обучение – это использование нейронных сетей с большим количеством нейронов, слоев и взаимосвязей. Мы все еще далеки от имитации человеческого мозга во всей его сложности, но движемся именно в этом направлении.

Существует множество разных методов ИИ, но одно из подмножеств этого большего списка – машинное обучение – позволяет алгоритмам учиться на наборах данных. Наконец, глубокое обучение – это подмножество машинного обучения, использующее многослойные нейронные сети для решения самых сложных (для компьютеров) задач.