Ни для кого не является секретом, что мы все стараемся хранить большинство документов и важные текстовые данные в электронном виде. Благо оборот электронных документов в стране растет, за что отдельная благодарность руководству нашей страны, которая внедрив электронный документооборот на сайтах государственных структур заставила всех остальных "подтягиваться" в вопросе электронного документооборота. Пожалуй, это тот редкий случай, когда государство задало тренд в нужном направлении и показала действительно хороший пример как для бизнеса, так и Рунета в целом. Так в каком формате лучше же хранить текстовые документы?
Наиболее популярным форматом для объемных документов является PDF файл. О том как создать PDF файл написано немало статей в Интернете, поэтому отдельно на данном вопросы мы останавливаться не будем. Лишь отметим, что PDF файл по размеру достаточно массивный, что усложнит его "облачное использование" через мобильные устройтсва, так как мобильный интернет хоть и быстрее день ото дня - до уровня кабельных соединений ему еще далеко.
Более компактным форматом для текстовых документов является DJVU формат. Зачастую большинство текстовых PDF файлов в десять и более раз ужимаются при их переводе в DJVU. При этом эффективность сжатия данных одинакова как для цветных, так и черно-белых данных. Единственный минус - при необходимости изъятия текста из DJVU файла - простое выделение и копирование недоступно - вам придется извлекать текст путем дополнительных манипуляций, что описано в отдельных статьях в Интернете.
Формат TIFF был популярен на заре появления сканеров. На сегодняшний день его можно считать устаревшим, так как явных преимуществ перед другими форматами у него нет.
Файлы MS Word DOC (DOCX) или RTF интересны своей универсальностью - они читаются практически любым устройством, а их содержимое в виде документа понятно для большинства из нас. Большой размер файлов можно устранить путем их архивации архиваторами RAR или ZIP. Степень сжатия конечно будет ниже, чем у формата DJVU, но зато вы сохраняете все преимущества документа перед обычным фотографическим изображением.