Вопрос

Это скорее забавный вопрос, чем серьезный, но как формат Adobe PDF делает документы такими...портативный?

Я только что создал небольшой документ Word размером 235 КБ, содержащий несколько цветных фотографий и несколько текстовых фраз.PDF-файл, созданный с помощью CutePDF (который, как я понимаю, не самый эффективный метод создания PDF), весит всего 176 КБ.Это степень сжатия 25%.Когда эти файлы помещаются в сжатую папку, PDF-файл способен сжиматься на 3%, тогда как .docx — только на 2%.Я уверен, что большие файлы будут иметь еще большую разницу в размере.

Мой вопрос: как Adobe удается настолько уменьшить размер своих файлов?Я понимаю, что они нарисованы из растровой графики, но мои 3 растровых файла действительно ничем не могут помочь из растра, не так ли?

Это было полезно?

Решение

Если у вас есть Acrobat 9, в него встроен хороший инструмент, позволяющий увидеть, как был составлен PDF-файл (и какое сжатие использовалось).В блоге есть сообщение, объясняющее, как его использовать: http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

Другие советы

Есть несколько способов сжать это:

  1. Файлы PDF используют сжатие lzw и zip.

  2. Если изображение масштабировано в документе или имеет разрешение на диске больше, чем разрешено в cutepdf (например, если для cutepdf установлено значение 300 точек на дюйм, а разрешение изображения — 600 точек на дюйм), его можно масштабировать в PDF-файле.

  3. Microsoft хранит ТОННЫ информации в формате docx, в xml.НАМНОГО больше, чем действительно необходимо для простого экспорта информации (например, попробуйте скопировать и вставить текст в ячейку текстового поля и посмотреть на полученную информацию в формате html - у меня было ограничение на размер текстового поля для cms, и предложение из 7 слов увеличено до 950 символов).Это сделано для того, чтобы его можно было позже отредактировать, а также с большим количеством эзотерической информации, чтобы убедиться, что все отображается правильно во всех возможных перестановках.PDF-файлу эта информация не нужна, поэтому он может просто указать шрифт и размер и удалить всю ненужную информацию, сэкономив массу места.

Когда вы используете такие маленькие файлы, любые накладные расходы в формате документа будут иметь непропорциональный эффект, поэтому вы видите такие большие процентные различия.

Я взял JPEG размером 2683 КБ и вставил его в новый документ Word 2003.Размер полученного файла .doc составил 2725 КБ (или 2697 КБ в формате docx).Преобразование этого в PDF-файл дает мне PDF-файл размером 2701 КБ.Итак, я вижу разницу в 25 КБ, но разница составляет всего около 1% из-за размера данных изображения.Это примерно половина того, что вы получили, но, возможно, ваша версия word более подробная при создании docx?

Для PDF-файла Acrobat показывает использование пространства в виде изображения размером 2691 КБ, служебных данных 8,27 КБ и шрифтов 1 КБ.PDF — довольно разреженный формат по синтаксису, который ограничивает накладные расходы, и большая часть его содержит повторяющиеся строки, поэтому его легко сжимать.

Если вы хотите просмотреть содержимое PDF-файла в виде дерева, вы можете загрузить демо-версию CosПравить.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top