ИИ в поисках смысла | Компьютерра

Год уходящий запомнится целым рядом замечательных ИИ-достижений. Тут и синтез речи беспрецедентного качества, и переизобретение криптографии, и кинематограф, музыка и творчество вообще, и победа в го, считавшаяся невозможной… Но даже на этом фоне новость, пришедшая на днях, выделяется. Потому что касается процесса, который, вообще говоря, до сих пор считался недостижимо сложным для автоматизации: осмысления информации. Правда, и сейчас ещё доказать, что — получилось, проблематично. Но косвенные улики, которые удалось собрать, свидетельствуют: машина научилась выделять смысл.

Чтобы понять, как этого удалось добиться, нужно вернуться на тройку месяцев назад. В сентябрь, когда разработчики Google Translate — знаете ведь этот сервис, один из самых популярных мультиязычных машинных переводчиков? — отрапортовали об успешной замене некоторых стандартных переводных моделей одной универсальной, основанной на ИИ и глубоком обучении.

До тех пор GT был набором моделей-трансляторов, которые, грубо говоря, писались наново для каждой пары языков. А гугловцы сделали следующее: взяли у коллег нейросетевой ИИ, который не раз уже применялся для решения других задач, и заставили его обучаться на миллиардах словарных пар из нескольких языков сразу, чтобы затем заставить переводить. Вообразите, насколько это сэкономит труд программистов! Ведь в одном только GT больше ста поддерживаемых языков, и если для каждой языковой пары писать отдельную модель, получается сто в квадрате.

Конечно, они были не первыми, кто попытался применить ИИ для перевода. Недостатки этого подхода известны, их два. Во-первых, ИИ-переводчики плохо показывают себя на фразах с относительно редкими словами. Во-вторых, они слишком жадны до машинных ресурсов — как в обучении, так и в работе. Однако гугловцам удалось обе проблемы решить, построив нейросеть особой формы (в частностью, с обратной связью: «вниманием»). Подробности изложены в статье, препринт которой остался на Arxiv.org: вот, если интересно.

Так вот результаты, показанные ИИ-переводчиком, оказались на уровне лучших машинных трансляторов. Между языками, для которых удалось набрать один-два миллиарда словарных пар, ИИ переводит не просто лучше, а делая аж на 80% меньше ошибок по сравнению с классическим транслятором. Неудивительно, что разработка сразу же и была внедрена: ИИ взял на себя несколько языков в Google Translate и со временем стал набирать их всё больше. И вот когда счёт пошёл на десятки, вскрылась ещё одна удивительная вещь. Оказывается, ИИ-переводчик умеет переводить даже между языками, переводить между которыми его не учили!

Представьте, например, что на этапе обучения машину тренируют переводить с португальского на английский и с английского на испанский. Значит ли это, что она сможет потом перевести прямо с португальского на испанский? До сих пор ответ был отрицательным (гугловцы осторожно уточняют, что им об успехах в этом направлении ничего не известно). Но построенный ими ИИ-переводчик действительно это делает, причём качество перевода опять-таки на высоте. И это несмотря на то, что он в глаза не видел прямого сопоставления португальских и испанских фраз! Если же при обучении показать машине кое-что из португало-испанского словаря, качество перевода ещё улучшится.

Но как ИИ это делает? К сожалению, искусственная нейросеть — не компьютерная программа, внутрь которой можно залезть и вычленить алгоритм. С нейросетью приходится применять методы, отдалённо напоминающие методы исследования головного мозга живых существ: загружать её работой и визуализировать активность разных участков, пытаясь проникнуть в суть протекающих там процессов. Именно такому анализу был подвергнут и ИИ-переводчик — и получена следующая картинка.

Здесь (а) показана работа нейросети в период перевода между тремя языками: английским, корейским и японским. При этом одним цветом обозначены блоки данных, имеющие общий смысл, то есть, например, хранящие предложение, переводимое с английского на корейский и с японского на английский. А (с) показывает уже внутреннюю структуру одноцветных сочленений: тут для разных языков уже разные цвета. Так вот тот факт, что языковые гроздья сгруппированы, но разделены по языкам, означает, что ИИ научился не просто механически сопоставлять слова и фразы из разных языков, а именно выделять смысл текста и накапливать его.

Это можно понимать и как осмысление (то есть выделение и накопление некоторой фундаментальной информации о содержании текста, не имеющей прямой связи собственно с языком, на котором текст был написан), так и изобретение искусственным интеллектом собственного промежуточного низкоуровневого языка («интерлингва», который машина потом использует, чтобы переводить между языковыми парами, которым её не учили). В обоих случаях это одинаково масштабное достижение — и оно уже применяется практически в Google Translate, хоть пока и не для всех языков, и имеет огромный потенциал.

Чем это может пригодиться человеку и чем угрожать? Что касается пользы, следует понимать вот какую вещь: умение выделять смысл из информации — святой грааль для всех самых важных задач, какие только человек мечтает заставить машину решать. Научите машину выделять смысл — и вы научите её изобретать методы компрессии данных недостижимо высокой эффективности. Научите выделять смысл — и машина обыграет всех спекулянтов на бирже. Научите выделять смысл — и она пройдёт, наконец, тест Тьюринга, но уже не обманув человека красивой имитацией, а действительно осмысленно строя диалог! Так что за качественным ИИ-переводом обязательно последуют другие интересные свершения в областях, вроде бы с лингвистикой совершенно не связанных, тут нет никаких сомнений.

А вот чем это может нам угрожать? Угроза тут проистекает из одного того факта, что машина становится умнее человека. Не быстрее, точнее или логичней, а именно умнее. Раз она способна теперь проникать в суть вещей и событий по крайней мере так же глубоко, как создатель, возникает и реальная опасность, что это может быть против создателя так или иначе обращено.

Правда, тут понадобится разум: одного только блока выделения смысла для бунта машин мало. Но что если где-то там, в переплетениях искусственных нейронов гугловского сильного ИИ, научившегося тому, чему и человека научить не всегда возможно, огонёк разума уже теплится, а мы просто не понимаем?