В России создали нейросеть, распознающую рукописный текст

Компания «Биорг» (резидент «Сколково») разработала нейросеть, способную распознавать рукописный текст по принципу, схожему с человеческим зрением. В отличие от традиционных систем, которые анализируют символы по отдельности, новая модель обрабатывает изображение целиком как единый массив данных.

В России создали нейросеть, распознающую рукописный текст

Такой сквозной подход, известный как end-to-end, позволяет искусственному интеллекту за три-четыре секунды с точностью около 80% расшифровывать даже зашумленные фрагменты, например, рукописные записи в штампах паспортов, трудовых книжках или военных билетах. При этом для работы алгоритма не требуется мощных видеокарт.

Обучение модели проходило в несколько этапов: сначала на простых строках, затем на более сложных и зашумленных участках. В итоге нейросеть научилась самостоятельно выявлять характерные признаки символов, анализировать их написание и преобразовывать в электронные данные вне зависимости от типа документа. База для обучения включила в себя как открытые массивы данных, так и собственный датасет компании, насчитывающий более тридцати тысяч вариантов рукописных фрагментов, включая синтетические изображения. Разработчики отмечают, что при дополнительном обучении на профильных выборках точность распознавания может превысить девяносто процентов.

«Технология востребована для оцифровки рукописных фрагментов в паспортах, справках, трудовых книжках и военных билетах, что актуально для бизнес-процессов банков, страховых компаний и других корпоративных заказчиков. Далее мы адаптируем ее из SaaS в «коробочную» версию ПО «Биорг.Документы». Это веха в нашей стратегии непрерывных улучшений».

Руслан Алигаджиев, гендиректор «Биорг»

Классические методы распознавания часто дают сбой из-за вариативности почерка, неровных строк или наложения печатного текста. Новая разработка решает эту проблему, воспринимая изображение целостно и минимизируя количество ошибок.

Читайте по теме: «В России разработана универсальная ИИ-система для анализа медицинских снимков».

Что будем искать? Например,ChatGPT

Мы в социальных сетях