Российская компания «Антиплагиат» занимается разработкой новой технологии, которая будет находить в научных работах переводные фрагменты-заимствования с любого языка. Российская венчурная компания (РВК) предоставила им грант в размере 180 млн рублей. Разработка будет осуществляться в рамках направления «Искусственный интеллект» (ИИ), которое относится к нацпроекту «Цифровая экономика». Возможно, мера связана с участившимися случаями плагиата в работах чиновников и политиков.


Фото: antiplagiat.ru

Разработчики компании хотят создать универсальный алгоритм поиска повторяющихся текстовых фрагментов для различных пар языков, которые может задать пользователь. Технология будет основана на компьютерной лингвистике с внедрением ИИ и возможности адаптивного обучения.

Тестовый запуск системы уже показал более 20 000 копирований текста с английского языка в научных статьях. На данный момент технология может находить плагиат с русского, английского и казахского языков. С развитием проекта, компания хочет распространить его за рубежом и выйти за пределы российского рынка.


Фото: unsplash.com

Сервисы компании «Антиплагиат» начали работу в 2005 году. Это первый проект подобного плана в России. Большинство российских научных учреждений (вузы, издательства, школы и т.д.) пользуются их программами. На сайте разработчиков указано, что сервис индексирует более 500 млн источников на разных языках. Примерно 250 000 проверок с помощью программы осуществляются ежедневно.

Прямое копирование текстов, без каких-либо изменений может расцениваться как нарушение авторского права. С развитием машинного перевода участились случаи прямых заимствований из иностранных источников. В противовес этому, с помощью возможностей ИИ, компьютеры постепенно учатся лучше анализировать и обрабатывать естественный язык, программы по поиску плагиата постоянно становятся «умнее».

Реклама на Компьютерре