Как вузы повышают качество проверок на плагиат в ИИ-сервисе «Руконтекст»

Три года назад Александр Жадан стал первым в мире студентом, который защитил дипломную работу, написанную с помощью ChatGPT. Этот случай изменил подход к написанию работ и их проверке. Теперь студенты активно используют ИИ‑модели и переводчики, аспиранты пишут диссертации и научные статьи на нескольких языках, а объем текстов растет быстрее, чем их успевают проверять. Теперь мало просто знать процент уникальности — важно видеть более детальную картину о заимствованиях.

«Руконтекст» — сервис поиска заимствований на базе ИИ, которым пользуются 150+ вузов. Система делает проверку прозрачной и для авторов, и для проверяющих. Подробный отчет покажет, что именно система считает заимствованием, откуда взят фрагмент и насколько корректно оформлено цитирование. У «Руконтекста» понятный интерфейс, гибкое администрирование и инструменты совместной работы над проверками. В статье поговорим о том, как работает проверка и что есть в отчете, каковы возможности для вузов и как сервис помогает разным пользователям решать их задачи.

Как устроена проверка и в чем преимущества системы

Работа происходит в браузере. Система принимает файлы до 25 Мбайт — PDF (текст или сканы), DOC, DOCX, ODT, RTF, TXT, а также OCR — можно загрузить фотографию текста. Проверка до 250 страниц занимает 2–5 минут, более крупных документов — до 15 минут.

Высокое определение рерайта с помощью ИИ

Классические системы основаны на шинглах, которые ищут только точные совпадения фрагментов, не замечая перефразировок. «Руконтекст» использует собственную ИИ-модель, которая анализирует семантику и находит заимствования даже при глубокой переработке оригинала. В отчете найденные фрагменты отображаются рядом с оригиналом — можно быстро перепроверить вручную.

База из 2+ млрд индексов

Система выполняет проверки по нескольким базам из порядка 2 млрд индексов — кратких сведений о документе. Общедоступные базы содержат индексы публикаций в научных журналах и СМИ, госархивах, базах рефератов и справочников. У системы также есть собственные базы: 

  • «Руконтекст» — диссертации и авторефераты (1,2 млн индексов);
  • «НОПИ» — научная и отраслевая периодика (60 млн индексов);
  • «ЭБС Руконт» — учебная и методическая литература (660 тыс индексов).

Поиск по локальным коллекциям вуза

Вузы загружают документы в собственный индекс и создают внутренние базы, чтобы учитывать их при проверке или проверять только по ним. Возможна загрузка документов с проверкой и без.

Заимствования разных типов

В ходе проверки система находит:

  • прямые заимствования;
  • переводные заимствования с любого неиероглифического языка;
  • перефразированные фрагменты (рерайт);
  • цитаты из других источников;
  • цитаты из работ самого автора.

Проверку можно отредактировать — изменить тип заимствования или исключить фрагмент из рассмотрения.

Детекция нейроконтента и попыток обхода

«Руконтекст» выявляет сгенерированные нейросетями тексты с помощью собственной модели, обученной на 2 млн текстов — как написанных людьми, так и созданных различными ИИ-моделями. Отдельные алгоритмы распознают попытки обмануть проверку: замену кириллицы на похожие латинские буквы, невидимые символы и тонкие пробелы, скрытый микротекст. Для каждого типа обхода подобран свой метод детекции: где-то лучше работает ML-модель, где-то — классический алгоритм.

Как выглядят результаты проверки

Отчет устроен так, чтобы пользователь мог за несколько секунд понять, где проблемы. Посмотреть результаты проверки можно в двух режимах: интерактивном и статичном. 

Интерактивный отчет позволяет смотреть текст и одновременно видеть заимствованные фрагменты. Также указаны ссылка на источник, количество фрагментов из этого источника и общий процент заимствования. 

Фрагменты из одного и того же источника выделены одинаковым цветом. При клике на фрагмент появится окно с данными для идентификации источника
Фрагменты из одного и того же источника выделены одинаковым цветом. При клике на фрагмент появится окно с данными для идентификации источника

Если система не определила фрагменты как цитаты, можно пометить их вручную либо исключить.

Статичный отчет есть в краткой и расширенной форме. Обе начинаются одинаково: данные о документе, дата и время загрузки, список модулей (баз данных), проценты совпадений, цитирования и оригинальности, возможные попытки обхода.

В кратком отчете есть только сводка и источники в порядке убывания процента заимствования. 

Расширенный отчет позволяет наглядно сравнить заимствования и дословные фрагменты источника. 

Еще есть справка, она содержит данные с первой страницы отчета и сведения об учебном заведении, ФИО и должность проверяющего. 

Все отчеты можно скачать в PDF и переслать в виде ссылки или QR-кода. 

Какие возможности используют вузы

Оргструктура c филиалами и роли

В систему можно перенести всю структуру вуза: филиал, факультет, кафедра, группы — так проще контролировать проверки и не путаться в них. 

Помимо структурной единицы, каждому пользователю назначается роль: администратор, модератор, супервизор, эксперт, преподаватель, студент. У каждой роли свои права: изменения оргструктуры, лимиты проверок, просмотр отчетов и т. п.

Папки и комментарии для совместной работы

Всем пользователям доступны папки. В «Моих проверках» лежат все проверенные работы, есть еще «Обходы», «Ошибки» и «Корзина». Одна и та же проверка может быть в разных папках и у разных пользователей. 

Проверки можно отфильтровать по автору, заглавию, примечанию и другим критериям, а также по подразделению. Пометка «Подозрительный документ» указывает на попытку обхода

К любому фрагменту текста можно оставлять комментарии. Преподаватели и научруки задают вопросы по ВКР или статье, а авторы работ — уточняют что-то и отвечают. Комментарии видят все пользователи с доступом к проверке.

Билеты для студентов

Преподаватели могут выдавать студентам билеты, позволяющие выполнить проверку за счет вуза. У каждого билета свой лимит проверок и срок жизни. Преподаватель видит историю проверок по своим билетам и может давать рекомендации конкретным студентам.

ЭБС по ВКР и проверка диссертаций

Встроенная электронно-библиотечная система ВКР соответствует требованиям Минобрнауки. Доступен поиск, фильтрация, вывод и печать отчетов из ЭБС, а пополнять ее можно только проверенными документами. 

«Диссовет» — отдельный сервис внутри системы — позволяет анализировать диссертации на соответствие требованиям ВАК и Минобрнауки. Можно оценить полноту изложения содержания научных публикаций и их наличие в рецензируемых изданиях ВАК и МДБ на дату публикации, быстро найти основные научные результаты и многое другое.

Как «Руконтекст» помогает пользователям решать их задачи

В системе есть все необходимое для того, чтобы пользователи могли решать свои задачи быстро и без лишних телодвижений.

Администратор легко разворачивает систему и управляет ей

Он добавляет пользователей через Excel-файл с автоматической верификацией email-адресов (до 100 человек за импорт), настраивает права и блокирует аккаунты. Редактирует оргструктуру, назначает лимиты проверок и выдает преподавателям билеты для студентов. Видит статистику проверок и выгружает ее в Excel для отчетности и госаккредитаций, а после защит — переносит проверенные работы в ЭБС. 

Студенты и аспиранты быстро вносят доработки

Авторам работ легко понять, что нужно доработать. Они наводят порядок в своих проверках, корректируют работу по комментариям проверяющих, а перед сдачей проверяют ее повторно, чтобы убедиться в корректности изменений.

Преподаватели экономят время и упорядочивают работу

Структура совпадений помогает быстро найти требующие внимания фрагменты, а удобная навигация — легко перейти к следующему фрагменту из того же источника. Неверные совпадения можно исключить, а спорные места — прокомментировать. 

Научные сотрудники увереннее работают с публикациями и переводами

Проверки по источникам на других языках, анализ списков литературы и переход к исходному документу упрощают работу научников. Они сравнивают версии рукописи, обсуждают спорные места, добавляют финальные тексты в локальную базу.

Резюме

Проверка уникальности в образовании уходит от простой формальности. «Руконтекст» дает вузам инструменты, которые позволяют видеть реальную картину заимствований, быстро корректировать работу и делать это аргументированно, без лишних хлопот и рутины.

Что будем искать? Например,ChatGPT

Мы в социальных сетях