В «Яндексе» запустили «Поиск по архивам» — нейросеть, которая расшифровывает архивные документы

Команда «Яндекса» анонсировала новый проект «Поиск по архивам». В базе нового сервиса более 2,5 миллионов архивных рукописных документов за XVIII — XX века.
«Поиск по архивам» / «Яндекс»

Что это такое

Новая модель была обучена на сотнях тысяч рукописных строк реальных архивных документов, датированных с XVIII по XIX век. Кроме того, нейросети также скормили миллионы примеров, которые были искусственно сгенерированы.

«Сервис Яндекса «Поиск по архивам» позволяет быстро находить имена, фамилии, названия населённых пунктов и любые другие слова в рукописных документах XVIII — начала XX века. Сейчас в базе более 2,5 миллионов архивных документов из хранилищ Москвы, Оренбурга и Великого Новгорода. Со временем количество фондов и источников будет увеличиваться» — сообщается в описании «Поиска по архивам»

Попробовать модель можно уже сейчас. Бесплатная технология доступна всем желающим на сайте проекта «Поиск по архивам».

Как работает «Поиск по архивам»

«Поиск по архивам» / «Яндекс»

Модель построена на основе системы оптического распознавания символов. При этом нейросеть учитывает особенности почерка, узнает дореволюционные буквы и понимает специфическую структуру архивных документов.

«Сервис работает на базе технологии оптического распознавания текста Яндекса. Нейросети узнают утратившие актуальность символы, учитывают особенности почерка и за несколько секунд превращают непонятные неподготовленному человеку записи в печатный текст» — объясняют на сайте проекта.

Больше про Яндекс

Недавно «Яндекс» анонсировал интерактивную карту захода солнца, которая позволяет посмотреть часовой пояс и время суток в любой точке Земного шара. Запуск приурочили к Дню зимнего солнцестояния, который был в декабре 2022 года.

Ранее сервис для чтения книг «Букмейт» вошел в подписку «Яндекс.Плюс», после того, как ирландскую компанию «Bookmate» включили в реестр СМИ-иноагентов.

Что будем искать? Например,ChatGPT

Мы в социальных сетях