Почему распознавание паспорта больше не актуальная задача

Первые системы распознавания паспорта, использующие вычисления на GPU, появились еще в 2005 году — двадцать лет назад. Тогда это было технологическим прорывом. А уже десять лет назад, с появлением первой мобильной системы распознавания российского паспорта, процесс удаленной идентификации стал реальностью и быстро превратился в отраслевой стандарт. 

Сегодня быстрое и точное распознавание паспорта стало стандартом для бизнеса, базовой функцией «по умолчанию». И перед ведущими мировыми разработчиками ИИ стоят более сложные задачи. О том, почему распознавание паспорта давно перестало быть вызовом и какие технологии действительно определяют будущее, — в материале ниже.

Первые системы распознавания паспорта, использующие вычисления на GPU, появились еще в 2005 году — двадцать лет назад. Тогда это было технологическим прорывом. А уже десять лет назад, с появлением первой мобильной системы распознавания российского паспорта, процесс удаленной идентификации стал реальностью и быстро превратился в отраслевой стандарт. 

Сегодня быстрое и точное распознавание паспорта стало стандартом для бизнеса, базовой функцией «по умолчанию». И перед ведущими мировыми разработчиками ИИ стоят более сложные задачи. О том, почему распознавание паспорта давно перестало быть вызовом и какие технологии действительно определяют будущее, — в материале ниже.

Эволюция систем распознавания в России

Первая система распознавания паспорта, которая работала на сервере с GPU, появилась еще в 2005 году — задолго до повсеместной цифровизации и до эпохи нейросетей. Но настоящий прорыв произошел в 2015-м, когда была представлена первая система распознавания паспорта, которая распознавала данные прямо на смартфоне: в видеопотоке и на фотографиях. Впервые процедура удостоверения личности перестала быть привязанной к офисам и отделениям. У бизнеса появилась возможность организовывать выездное обслуживание и предложить онлайн-сервисы для оказания услуг в дистанционном формате.

Одной из первых сфер, где эта технология получила широкое применение, стал финтех. Банки, операторы связи и страховые компании начали обслуживать клиентов удаленно: открывать счета, оформлять кредиты, подключать услуги, регистрировать новых пользователей. Всt, что требовалось от человека, — направить камеру смартфона на документ и подтвердить данные. Это делали и клиенты самостоятельно, и выездные сотрудники банков.

Уже тогда решение отвечало всем важным на тот момент требованиям: ввод данных происходил быстро, при этом распознавание осуществлялось непосредственно на устройстве, без передачи изображений в облако или на сторонние серверы. Это гарантировало безопасность персональных данных и позволило применять технологию даже на средних по железу смартфонах того времени — iPhone 4S и Samsung Galaxy S3.

Такой технологический подход обеспечил мощный импульс развитию финтеха. Отечественные банки и операторы связи стали международными лидерами по удобству и скорости обслуживания. Многие компании смогли существенно нарастить клиентскую базу, например, «первопроходец» «Т-Банк» (ранее «Тинькофф Банк») увеличил число клиентов с 5 до 50 млн за десять лет, «Почта Банк» — с 3 до 21 млн, а операторы связи, такие как «МТС», значительно расширили линейку продуктов и сервисов.

Новые вызовы

Когда технология распознавания паспортов доказала свою надежность и стала стандартом, рынок осознал, что одной автоматизации ввода данных из основного разворота недостаточно. Для полноценных KYC-процессов требуется работа с целым комплексом документов — страницами паспорта со штампами о регистрации, водительскими удостоверениями и другими документами России и других стран. Именно в этот момент перед разработчиками встали три новых крупных вызова.

Первый вызов — распознавание рукописных данных

Во многих национальных документах до сих пор встречаются поля, заполняемые вручную. Штампы в паспортах часто содержат рукописные записи, и их качество может значительно различаться. Чтобы обеспечить автоматизацию, система должна уверенно и точно считывать как печатный текст, так и рукопись — вне зависимости от почерка, толщины линий или угла наклона.

Второй вызов — поддержка широкого спектра документов разных стран

Рост миграции и выход российских компаний на зарубежные рынки привели к тому, что банки и сервисные компании начали работать не только с гражданами России, но и с пользователями из Беларуси, стран СНГ, Индии, Китая и многих других государств.

Документы различных стран отличаются форматами, расположением полей, правилами записи имени и фамилии. Человек может не знать, где в ID-карте ОАЭ указывается имя, а где фамилия, но система должна понимать это автоматически.

Третий вызов — обеспечение технологической независимости и стабильной работы систем за пределами экосистем крупных иностранных платформ

После приостановки работы сервисов Apple Pay и Google Pay в 2022 году перед банками и другими компаниями встал вопрос: как сохранить полноценный функционал мобильных приложений и при этом не зависеть от App Store и Google Play. 

Ответом стало развитие прогрессивных веб-приложений (PWA), работающих прямо в браузере. Для этого требовались ИИ-технологии, в том числе технология распознавания паспорта, способные работать локально и эффективно.

Все три вызова отрасль смогла преодолеть. Современные системы распознавания паспорта на базе ИИ уверенно работает в браузере, на мобильных устройствах и в локальных инфраструктурах на серверах в режиме on-premise. 

Они поддерживают тысячи типов документов на более 100 языках мира, одинаково точно извлекают данные из паспорта Китая, удостоверения личности Армении или ID-карты Казахстана и справляются даже со сложной рукописью — вплоть до «страшного сна» любого CV-специалиста вроде слова «шиншилла». В серверных решениях такая система сегодня способна без использования GPU распознавать более 100 разворотов паспорта РФ в секунду.

Технология распознавания стала действительно зрелой. Она работает стабильно в любых условиях, масштабируется под новые требования и уверенно закрывает задачи, которые еще несколько лет назад казались почти нерешаемыми.

Борьба с мошенниками — новые горизонты для ИИ

К 2025 году ключевым вызовом для отрасли финтеха стало противодействие мошенничеству с подделками. Число таких преступлений с каждым годом растет. Например, по статье 327 УК РФ — «Фальсификация, изготовление и оборот поддельных документов» — количество уголовных дел выросло с 2,9 до 3,9 тыс. всего за год, то есть на 34%. Число осужденных также увеличилось в прошлом году — почти до 11 тыс. человек. Все это указывает на то, что сегодня уже недостаточно просто извлечь данные из документа, необходимо убедиться в его подлинности и проверить достоверность информации. 

Если говорить о проверке паспорта, то фундамент любой качественной антифрод-системы — безупречное распознавание полей. Для ее решения нельзя говорить о точности на уровне 95%, которая уже дает эффект для задачи ввода данных, а о результатах 99,9% и выше. 

Любая ошибка при проверке документа ведет к рискам: с одной стороны, можно пропустить мошенника и понести прямые убытки, с другой — ошибочно отказать добросовестному клиенту, что влечет за собой снижение доверия и прямую потерю прибыли.

Однако распознавание — лишь первый шаг. Современные антифрод-решения должны уметь выявлять несоответствия и следы как физического, так и цифрового вмешательства. На уровне структуры документа система проверяет шаблон и защитные элементы. На уровне заполнения анализирует не только символы, но и шрифт, способ нанесения текста и особенности печати. 

Дополнительная сложность заключается в том, что документы разных стран и разных годов выпуска имеют десятки отличий, а их стандарты постоянно меняются. Человек физически не в состоянии запомнить все эти нюансы и сопоставлять их в реальном времени — и именно здесь начинается поле настоящей прикладной работы для ИИ, который может учитывать миллионы вариантов и мгновенно находить отклонения от нормы.

Последний аспект — современные антифрод-системы должны работать в мультимодальной среде, где объединяются данные из разных источников и форматов. Они обрабатывают изображения в оптическом, ультрафиолетовом и инфракрасном диапазонах, анализируют видеопоследовательности, текстовые поля, данные NFC-чипа, штрихкоды, метаданные и цифровые сигнатуры. При этом проверяться должны не только отдельные элементы, но и связи между ними.

Как выбрать зрелую технологию: руководство для бизнеса

К 2025 году технологии вроде распознавания паспорта перестали быть конкурентным преимуществом сами по себе. Это уже базовый функционал, который решает частную задачу — ввод данных. Для бизнеса же ценность появляется там, где технология становится частью управляемого процесса: помогает снижать риски, выстраивать доверие с клиентом и масштабировать операции без потери контроля.

Зрелые решения отличаются не скоростью OCR, а устойчивой научной базой, широким покрытием типов документов, встроенными механизмами проверки подлинности и защитой от мошенничества, а также способностью работать в разных ИТ-ландшафтах. Такие системы изначально проектируются не как «модуль распознавания», а как инфраструктурный элемент цифрового сервиса.

И тут перед руководителями встает вполне практичный выбор. Первый путь — разрабатывать собственную систему, инвестировать годы, бюджет и экспертизу в решение задач, которые рынок уже научился закрывать. Второй — опереться на зрелую технологию, которая прошла эксплуатацию, сертификации и реальные нагрузки, и сосредоточиться на том, что действительно дает бизнес-эффект.

Что будем искать? Например,ChatGPT

Мы в социальных сетях