В России создан ИИ-помощник для работы с научной информацией на восточных языках

«Яндекс» и Институт востоковедения РАН создали ИИ-помощника для ускорения анализа данных на восточных языках. Он обрабатывает до тысячи источников в день вместо традиционных восьми-десяти, что позволяет исследователям быстрее работать с материалами из Азии, Африки и Ближнего Востока. Сейчас помощник тестируется для сотрудников института, а в будущем будет доступен всем исследователям.

В России создан ИИ-помощник для работы с научной информацией на восточных языках

Доступ к оригинальным источникам по восточным странам ограничен, так как многие материалы публикуются на национальных языках и редко переводятся. Это затрудняет исследования и часто приводит к искаженному восприятию событий через англоязычные интерпретации.

ИИ-помощник разработан на платформе Yandex AI Studio и обрабатывает научные тексты, выделяя ключевые факты и формируя краткие аналитические выжимки. Он также анализирует публикации в китайских СМИ и создает русскоязычные дайджесты, что позволяет оперативно получать информацию о событиях в регионе.

Обучение моделей проводилось специалистами Yandex Cloud и студентами Школы анализа данных. Для информационного наполнения использован архив востоковедных знаний Института востоковедения РАН, который уже содержит более полутора миллионов документов на четырех вариантах китайского языка.

Александр Костыркин из Лаборатории цифровых исследований современного Востока РАН отметил, что ИИ ускоряет анализ материалов в 6–8 раз, сокращая время поиска и анализа с нескольких часов до 10–15 минут. Это позволяет исследователям обрабатывать больше источников, проводить глубокий анализ и получать полное представление о тенденциях в регионе.

Анна Лемякина из Yandex Cloud подчеркнула важность работы с первоисточниками для востоковедов и отметила, что ИИ помогает делать это быстрее, точнее и глубже. Цель проекта — предоставить ученым доступ к ранее труднодоступным данным.

В будущем планируется расширить языковую поддержку, добавив японский, арабский, турецкий, персидский и другие восточные языки.

Что будем искать? Например,ChatGPT

Мы в социальных сетях