Роботов призывают спасать Википедию от «дедовщины»

Есть интересное определение «интернета вещей» как места, где цифровой мир встречается с миром интеллектуальным. А со времён самой первой Промышленной революции, Industry 1.0, символом интеллектуального мира является энциклопедия: толковый словарь наук, искусств и ремёсел появился аккурат в век самых первых паровых машин и угольных шахт, век Просвещения. Ну а одним из явлений, которым будут характеризовать наше время, явно является Wikipedia, попытка создать сумму знаний на базе цифровых технологий и добровольного труда. И вот сейчас говорят о возможности того, что редактировать Википедию станут роботы!

Энциклопедии бумажные, тяжёлые тома, рассказывавшие обо всём, от лифляндской реки Аа до реки Яя в Кемеровской области, если и не забыты окончательно, то сохраняются лишь в домах немногих любителей старины, а открываются вообще единицами. Свод знаний ныне хранится в Интернете, и чаще всего им оказывается Wikipedia. Это шестой по посещаемости сайт мира. На него с очень высокой вероятностью приведёт поиск в солидном и основательном Google, к нему прибежит говорунья Siri, заставляющая вспомнить персонажа из саги о Гиперионе Дэна Симмонса…

Действительно, Википедия — явление уникальное. Появившись на свет 15 января 2001 года английской версией, она через пару лет имела уже сотню тысяч статей, а на 8 ноября 2013-го в ней на наречии англосаксов насчитывалось 4 370 629 статей, просматриваемых десять миллиардов раз в месяц, причем уже к 2011 году эти статьи претерпели полмиллиарда правок… Encyclopædia Britannica Online, наследница авторитетнейших бумажных изданий, с её 120 000 регулярно обновляемых статей, выглядит бедной Золушкой на этом фоне… Но, как давным-давно сказано, наши достоинства есть продолжение наших недостатков.

Проблемы — причём очень серьёзные — не миновали и Wikipedia. Говорят ни более ни менее как об «упадке Википедии» («The Decline of Wikipedia«). Отмечаются проблемы, подрывающие её фундамент, ставящие под сомнение её способность составить свод всех человеческих знаний. И проблемы эти порождает отток тех самых добровольцев, которые должны защищать ресурс, построенный на общедоступном Wiki-движке, от умышленных манипуляцией информацией в корыстных или политических целях, бескорыстных мистификаций и примитивного вандализма.

В результате многочисленные статью Википедии оказываются крайне неоднородными по содержанию. О таком явлении, как «покемоны», или о барышнях и дамах, снимавшихся в кино «для взрослых», узнать можно почти всё, а вот о географии Африки южнее Сахеля — прискорбно мало… Ну а качественные статьи, которые, по мнению коллектива Википедии, составляют её ядро (если возьмёте том старой энциклопедии, то увидите перечень важнейших статей с указанием их авторов), тонут в груде «информационного шума». Тысяча лучших материалов не заслужила — по критериям самой Wikipedia — даже среднего уровня оценок…

И никаких секретных причин такого состояния дел нет. Те добровольцы, авторы и редакторы, которые приходят в проект, сталкиваются с многоуровневой бюрократией, отпугивающей новичков, сокрушающей энтузиазм и истирающей добрые намерения. Если говорить о Wikipedia в терминах кибернетики, то можно использовать понятие не-марковской системы, поведение которой в значительной степени определено её историей, былыми этапами эволюции.

Началось все с максимальной свободы. Потом появились случаи явной «туфты», прямого вандализма, увлекательные, но малоперспективные политические дискуссии атеистов и новообращённых верующих, ольстерских католиков и протестантов — прямая порча информации. Потребовалось введение защитных фильтров… Ими стали редакторы. Ну а говоря в терминах элементарной, линейной ещё, теории автоматического регулирования, пытаясь повысить устойчивость системы, мы платим за это коэффициентом передачи по контуру, точностью и динамикой… Нечто похожее происходит и здесь, с Википедией.

Проще говоря, здесь сложилась элементарная «дедовщина». Неформальная власть «старых» редакторов над новичками. И если «дедовщина» обычная кончается в тот момент, когда офицеры начинают дневать и ночевать в роте / на батарее, то с Wikipedia такой номер не пройдёт: устав для добровольцев не писан, дисциплинарных прав в отношении них у 187 сотрудников Wikimedia Foundation, некоммерческой организации, оплачивающей ресурсную поддержку Вики, нет и быть не может. Но проблему они осознают со всей серьёзностью. И говорят об ответственности перед обществом (тем самым, что охотно собирает пожертвования для энциклопедии), лежащей на них…

Дело в том, что Wikipedia фактически уникальна. Ссылки на неё топят в поиске Google все прочие варианты ответа. Проект Encarta был закрыт Microsoft ещё в 2009 году: компания добровольцев-энтузиастов фактически поборола гиганта мира традиционных персональных компьютеров. Упомянутая выше Encyclopædia Britannica Online жаждет получить за годовую подписку на свои 120 000 статей 70 долларов — в отличие от предоставляемых читателю бесплатно 4 370 629 статей Вики… Так что деваться некуда: единственный путь — повышать качество самой Wikipedia…

И глава Wikimedia Foundation Сью Гарднер, и основатель Wikipedia Джимми Уэйлс считают, что этому поможет вовлечение в проект новых участников. Они оперируют конкретными цифрами: в 2007 году над «народной энциклопедией» трудились 51 тысяча редакторов. К лету 2013 года их число сократилось до 31 тысячи человек. Однако материалов-то становится всё больше, а потребность в них растёт всё быстрей. Но новичков — как пишут американские журналисты — отпугивает всевластие небольшой группы из 635 человек, имеющих статус «администраторов» английской версии Вики: именно им принадлежит реальная власть над проектом…

Как же эта «бюрократия добровольцев» справляется с «властью» над проектом уникальных размеров и сложности? Подробно исследовавший — по контракту с Wikimedia Foundation — эту проблему аспирант Миннесотского университета Аарон Хэлфакер (Aaron Halfaker) описал результаты в материале «Подъём и упадок сообщества открытого сотрудничества» («The Rise and Decline of an Open Collaboration Community: How Wikipedia’s reaction to sudden popularity is causing its decline«). Оказывается, власть бюрократов-энциклопедистов основывается на различных программных инструментах редактирования, позволяющих «активным редакторам» и «администраторам» буквально одним движением мыша править и отвергать работы новичков.

То есть фактически нынешняя, образца 2013 года, Wikipedia сформирована работой полуавтоматических инструментов. Редакторов-полуавтоматов, так, что ли, сказать… Именно благодаря им она достигла такого объёма, и они же виновны в проблемах с качеством. Автор-доброволец может писать что угодно. Но приняты или отброшены текст или правка будут по предельно формализованной процедуре. И вот теперь появилась идея — решить назревшие в Википедии проблемы с помощью ещё более широкого привлечения роботов-редакторов. Её излагают в «Assessing the Quality of Wikipedia Pages Using Edit Longevity and Contributor Centrality» авторы из Университетского колледжа Дублина Сянцзюй Цинь (Xiangju Qin) и Патрик Каннингэм (Pádraig Cunningham).

Нет, они не предлагают железного человека с кремниевым мозгом, правящего статьи Вики. Речь идёт лишь о применении подробно описанных в статье алгоритмов, которые смогут наглядно оценивать качество статей сетевой энциклопедии. Причём на основе внимания, которое им уделяют читатели. На основе тех правок, которые читатели порываются внести. Одним из критерием достоверности статьи или правки тут оказывается долговечность. Если статья живёт долго и читается — она хороша. Если правки не вызывают желания их немедленно откорректировать, то они адекватны и объективны. (Материалы, порождающие политические флеймы, — отдельный разговор…)

Так что подобный инструмент может дать объективный критерий оценки качества материалов и правок в Википедии. Американские журналисты полагают, что это в некоторой степени сможет решить описанную проблему с качеством статей, с организацией работы коллектива добровольцев. «Робот-редактор» как коллективный агитатор и организатор… В удивительное время живём, уважаемые читатели. Самый массовый свод знаний уже редактируется полуавтоматами, а в ближайшем будущем всё больше и больше станет склоняться к «чистой» автоматике.

Что будем искать? Например,ChatGPT

Мы в социальных сетях