Полцарства за метаданные: почему спецслужбы собирают только метаинформацию — и что это вообще такое?

Когда бывший директор АНБ и ЦРУ Майкл Гайден советовал европейцам поинтересоваться, чем занимаются их собственные спецслужбы (вместо того чтобы хаять американские: см. «Спасение утопающего»), он явно знал, о чём говорит. Не прошло и двух недель, как во Франции вскрылась система электронного шпионажа за гражданами, едва ли уступающая PRISM по функционалу и наглости. Известно о ней стало отчасти опять же благодаря Эдварду Сноудену, вялая реакция на которого французских официальных лиц заставила журналистов внимательней присмотреться к происходящему в родных пенатах. Плюс к тому — нет худа без добра! — продолжающийся поток разоблачений обратил внимание уже всей западной общественности на то, какого типа сведения собирают спецслужбы. Потому что и в Штатах, и в Европе соглядатаям не так, кажется, нужно содержимое самих телефонных переговоров или электронных писем, как какие-то «метаданные».

О том, что Франция эксплуатирует собственную гигантскую систему электронной слежки, стало известно в результате расследования, проведённого сотрудниками газеты Le Monde. В центре скандала — Служба внешней разведки (DGSE), установившая в своей штаб-квартире «один из мощнейших в Европе» суперкомпьютеров и собирающая с его помощью информацию о телефонных звонках, электронной переписке и прочей интернет-активности французских граждан. Под прицелом всё и вся, и журналисты даже сравнивают построенную систему с гигантским пылесосом. Естественно, целью её работы называется борьба с терроризмом; естественно, законных оснований нет, и хотя даже не все члены правительства в курсе происходящего, отечественные спецслужбы и полиция имеют доступ к собранным сведениям (им позволено делать запросы на интересующих лиц).

Что ж, с момента начала сноуденовских разоблачений минул месяц — и картина рисуется замечательная. С одной стороны, Европа продолжает накручивать сама себя и в последние дни дошла до организации полномасштабного расследования вскрывшейся слежки США за европейскими гражданами, а также предложений отказаться от пользования американскими интернет-ресурсами и даже прекращения, если понадобится, воздушного сообщения между США и ЕС. С другой, как выяснилось, следят за простыми людьми не только США, но и Франция, и Англия (совместно с АНБ тихо врезавшаяся в трансатлантический оптоволоконный бэкбон). А Германия и «большинство других западных стран» (по Сноудену) если и не имеют собственных систем слежки, то сотрудничают с АНБ ради получения информации из той самой базы данных, существование которой так разозлило их политиков.

Таким образом, разбор отдельных инцидентов теряет смысл: как и предполагалось, рыльце в пушку у всех. На первый план выходит аспект, месяц назад недооценённый. АНБ, ФБР, DGSE, MI-5 и MI-6, а с ними, вероятно, и другие спецслужбы интересуются прежде всего метаинформацией. Когда Сноуден только начинал публикацию секретных материалов, официальные лица в США, если помните, пытались смягчить социальный резонанс, обращая внимание публики именно на тот факт, что часто речь идёт о сборе «всего лишь метаданных». Однако при ближайшем рассмотрении выясняется, что именно они наиболее ценны. Но что же это за данные такие?

Википедия определяет метаданные как «информацию об информации». Попросту говоря, применительно к нашему случаю это любые косвенные сведения о состоявшемся контакте двух лиц: кем и с кем был установлен контакт, когда, где, сколько длился, какой была тема и тому подобное. Формально метакатегория дробится как минимум на структурную метаинформацию (описывающую строение данных) и описательную (собственно о данных). А при желании выделяются и более мелкие части. Но для нас сейчас важнее не теория, а практика: чем такие сведения могут быть полезны практически?

Лично мне памятны примеры Второй мировой войны, когда, пожалуй, впервые анализу метаинформации стали уделять такое же внимание, как и непосредственно информации о противнике. Знание времени, места отправления, автора шифрованных радиопередач позволяло предположить как минимум смысл и частичное содержание текста. А это, например, компенсировало жёсткую нехватку вычислительных мощностей при расшифровке сообщений, пропущенных через знаменитую Энигму (в замечательной «Книге кодов» Саймона Сингха история описывается в мельчайших деталях). И даже если вскрыть шифровку не удавалось, учёт метаинформации всё равно приносил пользу, раскрывая направление движения частей противника, схему их взаимодействия и т. п.

Сегодня, когда «жить громко» — нормальное и даже ожидаемое для среднестатистического индивида поведение, а сбор и обработка информации легки и дёшевы как никогда, игнорировать метаданные просто грех. Увидеть, какие вкусности извлекаются таким «непрямым» путём, можно, воспользовавшись веб-сервисом Immersion, построенным сотрудниками MIT. Этот сервис работает в паре с Gmail: вы предоставляете доступ к своей переписке, Immersion собирает и анализирует метаинформацию о ваших письмах, не читая собственно текста, после чего генерирует наглядный социальный граф. Не имея понятия, о чём именно вы переписывались с вашими друзьями и знакомыми, Immersion легко рассортирует письма по важности для вас, найдёт пересечения ваших контактов и таким образом сделает видимыми сообщества, в которых вы (возможно, сами того не подозревая) участвуете. И в целом даст пищу для размышлений на тему того, с кем вы общаетесь, почему, каково качество этих связей, стоят ли они того, чтобы их активизировать, и прочее, и прочее.

И это только электронная почта плюс рудиментарный метаанализ! АНБ же и другие спецслужбы можно представить в виде почтальона, подробно описывающего каждую проходящую через его руки посылку (а таковой может быть любая контент-единица, вплоть до отдельных IP-пакетов) и владеющего уникальным арсеналом средств для анализа собранных сведений. Кроме того, спецслужбы имеют доступ к материалам, которые простому человеку никогда доступны не будут, — вроде информации о тех же телефонных звонках. Собрав гигантскую базу данных из разнородных метаединиц, можно искать в ней зависимости (скажем, в виде пересекающихся социальных графов), строить цепочки, выявлять шаблоны. После чего применять против интересующих субъектов более грубые методы вроде слежки, прослушки и пр.

Насколько детальной может быть нарисованная таким образом картина, легко понять опять-таки по примеру из жизни. Год назад германский политик Мальте Шпитц сумел отсудить у оператора T-Mobile собранную на него за полгода метаинформацию (десятки тысяч записей), после чего обратился к сотрудникам еженедельника Die Zeit, которые помогли сопоставить метаданные с информацией о Шпитце из открытых источников (соцсети, блоги, СМИ и т. п.). И получили подробнейшее — поминутное, пошаговое — описание шести месяцев жизни одного человека. Смонтированный журналистами интерактивный ролик размещён на сайте газеты и стоит того, чтобы с ним поиграть: видно, например, как легко идентифицировать информаторов вроде Сноудена, если таковые однажды на Шпитца выходили.

Так почему, если метаинформация столь важна, даже параноидальные во всём, что касается гражданских прав, американцы её так сильно недооценили? Результат ещё одного заговора? Увы, всё проще. Авторы проекта Immersion считают, что виноват тут сам обыватель. Для науки и государства ценность метаданных о гражданах была очевидной ещё десять лет назад. Но среднестатистическому индивиду уже сама идея «информации об информации» кажется слишком сложной, в детали он вникать не желает. И только сейчас и не по своей воле мы учим этот урок.

Immersion хорош наличием кнопки REMOVE. Поскольку правительства демократических стран, уличённые в слежке за гражданами, функцию удаления метаинформации пока не предоставляют, вероятно, именно этот вопрос будет следующим, по крайней мере в Европе и Соединённых Штатах.

Что насчёт России?

Что будем искать? Например,ChatGPT

Мы в социальных сетях