Игра в распознавание котиков и судьба человека…

Век с лишним назад Артур Конан Дойль в рассказе «Магическая дверь» отметил, что «Старинные мастера рисовали харчевни и святых Севастьянов, когда Колумб на их глазах открыл Новый Свет». Святые нынче не водятся, новостные ленты заполнены деталями очередной резни на Ближнем Востоке, и эвентуальными ужасами, могущими проистечь, скажем, от иранской ядерной бомбы (которая, будто, чем- то будет отличаться от израильских, индийских, корейских, пакистанских устройств…). А вот на действительно важное внимание, практически, не обращают…

Ну, вот робот KUKA продемонстрировал, что скорость и точность движений у него будут повыше, чем у человека. («Страшная месть робота KUKA» – сомневающимся в этом предложим наглядно продемонстрировать сие окружающим, обыграв предварительно в пинг-понг Тима Болля, уделать в очередном марше робота в прямом эфире – без отъема лавр у Болля фирма вряд ли согласится…). Но у человека все же остается преимущество, выработанное миллионами лет эволюции потомков обезьян. Он несколько лучше ориентируется в окружающем мире.

И важнейшая часть этой ориентации – способность к распознаванию образов. Когда-то, когда ранние обезьянки были индивидуалистами, дававшая возможность им выживать, разглядывая в ветвях банан или древесного краба, а потом, по мере того, как мартышки-единоличники вливались в дружный коллектив, обеспечивали им социальную и светскую жизнь, позволяя не только отличать альфа-самца от презренных омег, но и определять тончайшие оттенки настроения вождя, определявшие, когда можно халявно получить перераспределенный банан или кусок падали, а когда и отхватить оплеуху…

И даже когда мы говорим о труде по преимуществу физическом, но человеческом, в труде этом крайне высока всегда бывает доля проходящих по ведомству искусственного интеллекта ориентации в пространстве и распознавания образов. Причем грузчик, задача которого круглое катать, а квадратное носить, хоть и норовит порой проделать все в обратном порядке, но все же распознаёт образы несопоставимо лучше компьютеров; и не только той романтичной счетоподобной архаики, что некогда обсчитывала параметры космических трасс, но и тех пожирателей чисел, что нынче по технологии Big Data деловито выявляют покупательские предпочтения в глобальных дистрибьюторских сетях.

Правда, к осени прошлого года, компьютерные системы достаточно незаметно для окружающих приблизились к человеческой способности распознавать образы. Поведавший об этом в своем блоге Hacker’s guide to Neural Networks (название, отсылающее к культовым книгам Дугласа Адамса) Андрей Карпатий (Andrej Karpathy) рассказал, что он распознает изображения из тестового набора ImageNet, допуская 5.1% ошибок, а нейрокомпьютерная программа GoogLeNet на этом наборе образов дала 6.8% ошибок. (What I learned from competing against a ConvNet on ImageNet)

Человек, в котором все должно быть прекрасно, звучал в этом тесте гордо, на целых 1,7% превосходя бездушную железяку, точнее – кремниевую каменюку. Именно таким было прошлой осенью превосходство выработанной миллиарднолетней историей Земли и жизни на ней белковой нейросети над созданной инженерами программой GoogLeNet. Но прогресс не стоит на месте, и кремний эволюционирует несколько быстрее, чем белок…

И вот появляются такие свидетельства этой эволюции – «In the annual ImageNet competition, the best neural net was able to correctly classify images with a 25.7 percent error rate in 2011. That went to 16.4 percent in 2012, 11.7 percent in 2013, and 6.7 percent in 2014. Baidu showed a paper with a 6.0 percent error rate in January, Microsoft published a 4.9 percent error rate in February, and Google itself published a paper with a 4.8 percent error rate on March 2″.

Вспомним осенние, прошлого года, достижения человека, причем человеа, спечиально обучившегося распознавать тестовые данные – 5.1% ошибок против 6,8% у машины. А тут мы видим, что системы от Microsoft в феврале 2015 года показали уровень ошибок распознавания в 4,9%, а Google опубликовал 2 марта 2015 года – запомним эту дату! – данные о том, что его роботы опознают образы с уровнем ошибок в 4,8% (Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift). Им в спину дышит китаянка Baidu, с уровнем ошибок в 6,0%. Улучшил ли свои результаты отстаивающий честь человеческой расы Андрей Карпатий, неясно…

Но ясно одно – рекордные пока компьютерные системы от компьютерных гигантов обеспечили распознавание образов с результативностью лучшей, чем дает даже специально обученный человек. И более того – системы эти имеют прекрасные шансы на дальнейшее развитие. В статье Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images рассказывается о системах, способных с весьма высокой вероятностью распознавать такие изменения образов, которые человеческий глаз не выделяет. (Вспоминаются эксперименты первого, начала 1960-х годов, пришествия бионики, когда контролером на конвейер норовили посадить голубя…)

И значение этих публикаций переоценить трудно. Да, распознавание образов это довольно слабый искусственный интеллект. Но давайте посмотрим на то, чем заняты в современной цивилизации большинство людей? Да тем, для чего вполне хватит распознавательных способностей показанных не только рекордсменом от Google, но и новой на этом рынке Baidu – Андрей Карпатий ведь обучался распознавать образы тестового набора, да и одно дело соревнование, а другое – работа на конвейере и его аналоге изо дня в день…

А глазастому роботу-то и три смены и семь дней в неделю по плечу, или что там на этом месте у нейрокомпьютеров… И совместить в единой системе нейрокомпьютеры распознавания изображений и быстрые да точные в движениях роботы дело не простое, не дешевое, но не запрещенное никаким фундаментальным законом природы. Вполне, видимо, решаемое – как были решены задачи создания классических персональных компьютеров, всемирной паутины, мобильных гаджетов…

И вот тут-то пойдут интереснейшие социальные последствия. Такие, которые и представить в полной мере трудно. Ну, прежде всего, глазастый робот, оказавшись более универсальным и гибким, чем его предшественники, заменит своих предшественников в заводских цехах, вытолкнув оттуда случайно уцелевших пролетариев. Конечно, это произойдет не сразу, и не везде, а там, где рабочая смена робота станет обходиться дешевле, чем смена местного человека.

Затем произойдет неизбежное – роботы начнут собирать роботов. Крупносерийное, а затем и массовое производства железных работников смогут радикально снижать их стоимость. А будут они куда универсальнее роботов нынешних, благодаря тем самым системам технического зрения. И вот тут-то начнется самое забавное. Прежде всего, страны, экспортирующие человеческий труд, прежде всего из Юго-Восточной Азии, начнут терять свои геополитические конкурентные преимущества.

Но и пролетариату стран, в которые по соображениям логистики и сбалансированности платежного баланса, начнут возвращаться производства, особенно радоваться не приходится. Их на этих производствах – мягко говоря – не ждут. Они слишком уж дороги, благодаря высокой стоимости расширенного воспроизводства рабочей силы в странах Первого мира, да и изрядно избалованны наличием профсоюзов и прочей политкорректностью. Роботы трудиться будут, роботы…

И сборщиками, и грузчиками, и операторами торговых залов (это те тетеньки, которые расставляют по полкам гипермаркетов товар), и продавцами-кассирами (они смогут не только распознать товар в корзинке, введя стоимость в чек, но и глянув на мордочку покупателя шнапса или лагера прикинуть, сколько ему лет, затребовав в сомнительных случаях аусвайс). Кстати, последняя процедура в наших краях становится реальным кошмаром продавщиц – продать пива или табака малолеткам чревато штрафами, лишением премии и увольнениями…

И на стройке глазастый робот будет гож, и в сельском хозяйстве, что в огородничестве, что в животноводстве. И это – неминуемое будущее. В прошедшем марте приблизившееся еще на шаг. И об этом будущем, похоже, никто не думает. О нем никто не предупреждает людей. Интересно – почему…

P.S. Автор выражает благодарность бесподобному Анатолию Левенчуку, мимо блога которого не проскользнет ни одна ИТ-новинка!