Прогресс всегда идет рука об руку с усложнением не только технологий, но и жизни человека в принципе. Например, столетия назад людям не нужно было хранить гигабайты данных — глиняные таблички в Месопотамии или береста в Древней Руси вполне справлялись с тем, чтобы увековечить информацию о налогах или законах.
Однако чем сложнее становилось общество, тем быстрее росло количество данных. И в XIX–XX веках их объем стал настолько велик, что пришлось искать новые носители. В дальнейшем они привели к созданию перфолент, вычислительных машин, баз данных и много чего еще.
Об этом увлекательном пути развития способов хранения данных рассказывает ORM-маркетолог облачной платформы Beget Оксана Карелина.
Древность: от палеолита до Нового времени
Люди всегда были изобретательными, и чем быстрее развивались общества, тем совершеннее и умнее становились не только орудия труда, но и способы хранения и передачи данных.
Петроглифы
Самый ранний памятник общественной жизни — наскальные рисунки. В период нескольких десятков тысяч лет до н. э. древние люди начали наносить на стены сцены из своих будней.
Сначала это были изображения животных и охоты, потом — ритуалов и общинной жизни. Ученые выдвигают разные гипотезы насчет того, какую роль играли петроглифы в жизни древних людей: от желания запечатлеть красоту до ритуала визуализации успешной охоты.

Глиняные таблички
Около 10 тысяч лет до н. э. люди разделились на земледельцев и скотоводов, и этот шаг принес им стабильность и новое качество жизни. Раньше выбора, что съесть на ужин, не было, теперь же продукты можно было откладывать, хранить, и даже появились излишки. Так родилась торговля, а вместе с ней и необходимость фиксировать информацию.
Это произошло примерно 4 тысячи лет назад — в Египте и Древней Месопотамии, на территории Ближнего Востока. Для записи информации о торговых сделках и ведения долговых книжек люди лепили из глины плоские листы, тонкой палочкой прописывали информацию и высушивали их на солнце.

Папирус
В Древнем Египте одновременно с табличками существовал другой, более продвинутый способ хранения информации, который постепенно стал основным. Это был папирус, который собирали с болотистых почв по берегам Нила.
Стебли растения очищали, нарезали на полоски, накладывали их друг на друга, а затем сушили. Получался лист, на котором писали чернилами с помощью тростниковой палочки.

Такой материал мог долго храниться, различался по качеству, а написанное на нем можно было даже стереть и начать заново. Первый найденный папирус датируется 2500 годом до н. э., однако большинство обнаруженных фрагментов относятся к греко-римскому периоду истории Египта (IV в. до н. э. – IV в. н. э.). На папирусе даже были написаны многие книги Нового Завета.
Пергамент
В начале II тысячелетия н. э. пергамент почти вытеснил папирус. И дело не в преимуществах технологии, а в позиции церкви. Многие античные тексты были написаны на папирусе, и христианство, как новая религия, нуждалось в своем носителе информации. Поскольку папирус был основным материалом для языческого мира, пергамент должен был стать главным хранилищем текстов о новой религии.
С точки зрения технологии, пергамент — это обработанная кожа животных. Процесс его изготовления был сложным: шкуру обдирали, вымачивали в растворе извести, растягивали, удаляли слой жира, а затем шлифовали и обрабатывали пемзой.

Бумага
В отличие от многих других древних носителей информации, бумага появилась в Азии. В 105 году до н. э. китайский чиновник Цай Лунь придумал технологию создания современной бумаги: волокна растений измельчали, разбавляли водой, переплетали на сетке и высушивали. При этом использовали самые разные материалы: хлопок, бамбук, тростник, дерево, кору и т. д., что делало бумагу универсальной.
В III веке н. э. технология стала общедоступной в Китае, в VI–VIII веках распространилась в другие страны, а к началу II тысячелетия попала в Европу. Там быстро поняли преимущества новой технологии, и некоторое время пергамент и бумага использовались в равной степени, а с изобретением книгопечатания в XV веке бумага получила полноправный статус главного носителя информации на долгие века.

На этом история древних носителей данных заканчивается. Человечество на время оставило попытки усовершенствовать технологии в этой области и обратилось к открытиям в промышленности, транспорте и военном искусстве.
Все предки компьютера: XVIII–XX века
Создание книгопечатного станка в XV веке стало революционным событием в истории данных. Оно совпадает с началом Нового времени, Возрождения и географических открытий.
Пока до компьютера было далеко, однако бурное развитие промышленности, глобализация мира и научные открытия создали запрос на новые методы автоматизации быта и работы — родоначальников современных способов хранения данных.
Перфокарты
Перфокарты — бумажные карточки с отверстиями — появились в 1804 году и первоначально использовались в промышленности для создания жаккардовой ткани. Несколько карточек складывались в цепочку пластин, которая проходила через считывающее устройство. Прутья устройства попадали в отверстия и поднимали нужные нити — в зависимости от того, какой необходим узор.
В конце XIX века американец Герман Холлерит придумал использовать перфокарты для хранения данных, в частности — для автоматизации переписи населения в США. Он создал табулятор — устройство, считывающее данные с перфокарт и выводящее их на бумагу.
Что интересно, сами перфокарты всё еще кое-где используются в Соединенных Штатах — преимущественно в промышленности, оборонном и архивном деле. Например, Aperture card со встроенным микрочипом до сих пор применяются в США для инженерных чертежей и хранения данных Министерства обороны США.

Разработка Холлерита пользовалась успехом, сократив время расчетов и обработки данных в несколько раз. Инженер основал компанию, вошедшую в 1911 году в состав Computing Tabulating Recording. Она, в свою очередь, впоследствии была переименована в International Business Machines или IBM, современного пионера цифровых технологий.

В дальнейшем устройства превратились в перфоленты — те же носители данных с отверстиями, но уже в виде длинных бумажных лент. Они просуществовали вплоть до 1980-х годов и вошли в состав первых ЭВМ.
Первую электронную вычислительную машину (как раньше называли компьютер) выпустили американцы в 1945 году под именем ENIAC. Ее главной задачей были электронные вычисления, но уже совсем скоро люди поняли, что возможности компьютера гораздо шире, и начали активно работать над его усовершенствованием. Но это совсем другая история.
Уже на первых экземплярах ЭВМ стало понятно, что памяти перфолент не хватает. Скорость записи данных на перфоленту составляла в среднем сто байтов в секунду, а чтения — 1–2 тысячи байтов.
К тому же бумажная лента была хрупкой и не подлежала редактированию. Всё это заставило ученых искать новые способы хранения информации, и данных способов было несколько — первым стал магнитный накопитель.
Магнитные ленты
Использовать магнит в хранении данных ученые пытались давно. В конце XIX века инженер Вальдемар Поульсен разработал телеграфон — устройство, записывающее звуковые волны на проволоку с помощью электромагнита.
Первая магнитная лента, созданная в 1930-е годы, тоже применялась для записи звука. Она вмещала в себя уже 2 Мб данных, так что в 1950-е ее подхватили предприимчивые инженеры IBM и использовали как запчасть для компьютеров вплоть до 1970-х годов.

Правда, у магнитных носителей тоже был недостаток — информация с лент считывалась и записывалась последовательно, поэтому быстро обращаться к конкретным данным было невозможно.
Файловая структура для каждой ленты разрабатывалась с нуля, а если нужно было ее изменить, приходилось заново переписывать программное обеспечение.
Ученые могли искать новый способ организации хранения данных на носителях еще долго, но совсем скоро проблема была решена, когда в дело включилась политика.
Появление СУБД
В 1960-е американцы решили высадиться на Луне, и автоматизацией контроля данных для шаттла занялась производственная компания Rockwell. Первая же попытка переложить всю информацию о грядущем полете на магнитную катушку обернулась неудачей, поэтому инженеры начали работать над идеей прямого доступа к данным и привлекли к сотрудничеству IBM.
Результатом совместной работы стала иерархическая система управления базами данных IMS. Ее структуру можно представить на примере дерева или папок на компьютере, где есть головная папка, внутри которой подпапки, еще подпапки — и так до бесконечности.
IMS была изначально создана для IMS System/360 и размещалась на мейнфрейме z/OS, а в дальнейшем перенесена на более современные ОС.
Однако новшество было не только в системе хранения, но и в ее носителе. Данные размещались на устройстве DASD (Direct Access Storage Device), дисковом хранилище с прямым доступом. На нем, в отличие от магнитной ленты, каждая физическая запись имеет дискретное местоположение и уникальный адрес. Мэйнфреймы IBM получали прямой доступ к DASD через каналы или специальные мини-процессоры, которые и управляли устройством.
Сегодня СУБД всё еще используется в некоторых областях (финансы, здравоохранение, государственное управление, производство), а основным языком для работы на ней уже считается Java.
Реляционные, сетевые и другие типы СУБД
Пока одни инженеры служили на благо государству, другие думали о выгоде бизнеса. В 1960-е в General Electric начали разработку сетевой системы управления базами данных. У одного элемента в такой СУБД могло быть несколько предков. До 1970-х сетевая и иерархическая СУБД были основными на рынке, однако в 1969–1970-х годах в IBM была создана технология реляционной базы данных. Разработки в этой области проводились и в СССР — например, для ЭВМ «Киев».
Если для иерархической СУБД основной структурой было дерево, для сетевой — сетка, то для реляционной БД — таблица. Строка в ней выполняет роль отдельной записи, а каждый столбец состоит из атрибутов со значениями.
Для работы с реляционными системами был создан язык обработки данных SQL. Одной из первых СУБД на этом рынке стала Oracle: создатели одноименной компании не побоялись новой технологии, которая в итоге принесла им успех. И хотя первое время как реляционные СУБД, так и SQL сталкивались с критикой, время доказало их пользу.
Современность
Быстрое развитие цифровых технологий, а затем и интернета сделали свое дело. На рынок вышли и закрепились СУБД, а потом и реляционные БД. В качестве внешнего хранителя информации появились дискеты, оптические носители информации (CD- и DVD-диски), флеш-накопители, HDD, а затем и SSD.
С распространением интернета, увеличением количества пользователей и сайтов выросли требования к производительности баз данных. Компании искали возможность масштабировать инфраструктуру дешево и быстро.
Облако стало тем самым средством, которое полностью изменило правила игры на рынке технологий: сегодня в него можно вынести базы данных, сетевые диски и серверы, компании массово переносят свои данные и файлы в облачные хранилища.
Ожидается, что в 2025 году половина мировых данных будет храниться в облаке, что неудивительно, ведь в облаке компании развиваются на 26% быстрее, зарабатывают на 21% больше и экономят 30–40% затрат на TCO (совокупной стоимости владения).
Заключение
Технологии хранения данных прошли огромный путь. То, что нашим прадедам могло бы показаться выдумкой или шуткой, сейчас стало обыденностью. И сегодня наука не собирается останавливаться. Например, ученые уже сейчас предлагают хранить данные в колониях микроорганизмов, пластике, молекулах, кварце и даже человеческой ДНК.
Последний способ считается одним из самых перспективных: ДНК в 1000 раз прочнее, чем любой SSD, что позволяет надежно хранить самую чувствительную информацию сотни и тысячи лет, поэтому другие способы хранения персональных данных проигрывают перед ним.