Молодая компания Crocodoc, основанная выпускниками Массачусетского технологического института, решает проблему некорректного отображения документов в браузерах радикальным образом. Для этого она разрабатывает продвинутый онлайн-конвертер, преобразующий документы любого формата в чистый HTML с максимально возможным сохранением форматирования.

Доступные в сети документы в форматах PDF и Microsoft Word часто приходится сохранять перед просмотром, поскольку в окне браузера через плагины они отображаются не совсем корректно. Над общей проблемой искажения структуры документов при их онлайн-просмотре годами работали сотни людей. Разными способами её пытались решить программисты Adobe, Microsoft и авторы всех браузеров, но тщетно. Чтобы увидеть многие документы в оригинальном виде, по-прежнему приходится сохранять их – и только затем открывать локальную копию специализированной программой просмотра.

Генеральный директор Crocodoc Райан Дамико (Ryan Damico) так описывает достижения своей команды в пресс-релизе:

“Мы потратили огромное количество времени на понимание структуры документов разных форматов на очень глубоком уровне. Мы научились быстро и качественно воссоздавать их в любом веб-браузере, включая мобильные”.

Почему на таких файлообменных сервисах, как Flickr и YouTube, вы всегда видите изображения и видео независимо от формата, в котором они были загружены? Просто потому, что они конвертируют медиаконтент любого типа в тот формат, который гарантированно поддерживается всеми браузерами.

Используя инструменты Crocodoc, пользователи могут загрузить документы в формате PDF или Microsoft Office, которые максимально точно будут преобразованы в HTML-версию. Последнюю можно сделать общей и просматривать в любом браузере.

Пример документа, загруженного в формате PDF и доступного для совместного редактирования (изображение: crunchbase.com)
Пример документа, загруженного в формате PDF и доступного для совместного редактирования (изображение: crunchbase.com).

Сrocodoc предлагает разработчикам интегрировать соответствующий интерфейс прикладного программирования (API) в свои веб-сервисы, чтобы пользователям не нужно было загружать файлы большого объёма, устанавливать плагины для браузеров и отдельные программы для просмотра документов.

На фоне растущих потребностей в простом обмене цифровым контентом и развития облачных технологий конвертер документов Crocodoc стал прибыльной инициативой. За прошедшие с момента выпуска первой бета-версии три года его стали применять такие крупные компании, как LinkedIn, Yammer, Blackboard, Edmodo и SAP. На данный момент Crocodoc использован для конвертации 200 млн документов и 14 млн аннотаций к ним.

В качестве теста поддержки кириллицы и последнего формата MS Word я загрузил на демонстрационной странице проекта текст данной заметки. Как видите, он отображается без проблем.

Тест поддержки кириллицы (скриншот сайта crocodoc.com)
Тест поддержки кириллицы (скриншот сайта crocodoc.com).

Ещё когда команда искала первых клиентов через сайт поддержки стартапов Y Combinator, отмечалось, что эта технология просмотра документов функционирует лучше аналогичных и пользуется спросом.

Большинство других конвертеров формировало изображение каждой страницы. Такой подход был медленным и страдал от проблем с низким качеством форматирования. Вместо этого Crocodoc разделяет содержимое документа на логические фрагменты и конвертирует их в соответствии с принятыми стандартами для браузеров. Текст преобразуется в HTML, а изображения – в масштабируемую векторную графику. Форматирование сохраняется с помощью CSS (каскадных таблиц стилей).

Crocodoc восходит к любительскому проекту WebNotes, который был запущен соседями по общежитию в MIT – студентами Беннетом Роджерсом (Bennet Rogers), Мэттом Лонгом (Matt Long), и Питером Лаем (Peter Lai).

WebNotes давал возможность выделять и комментировать текст на веб-страницах. Вскоре после окончания Массачусетского технологического института команда решила значительно расширить функционал и преобразовала его в Crocodoc.

В этом году крупная компания Box, предоставляющая услуги облачного хранения данных, стала партнёром Crocodoc, получив права совместного использования платформой. Райан Дамико высоко оценивает результаты нового сотрудничества:

“С компанией BOX мы остались верны намеченному вектору развития, но теперь обладаем в десять раз большим количеством ресурсов”.

С такой поддержкой авторы Crocodoc быстрее выпустят новую версию API и сделают свой продукт ещё более популярным.