Question

Ceci est un peu plus d'une question de plaisir qu'un sérieux, mais comment le format Adobe PDF font des documents si ... portable?

Je viens de créer un petit document Word, 235KB taille, contenant plusieurs photos couleur et quelques phrases textuelles. Un fichier PDF créé à l'aide CutePDF (que je comprends est pas la méthode la plus efficace de la création de PDF) est seulement 176KB. C'est un taux de compression de 25%. Lorsque ces fichiers sont placés dans un dossier compressé, le PDF est capable de 3% de compression où le .docx ne peut prendre 2%. Je suis sûr que des fichiers plus volumineux auraient encore plus les différences de taille.

Ma question est, comment Adobe parvient à rendre leurs fichiers beaucoup plus petits? Je comprends qu'ils sont tirées de graphiques raster, mais mes 3 fichiers bitmap ne peuvent pas vraiment être aidé de raster beaucoup, peuvent-ils?

Était-ce utile?

La solution

Si vous avez Acrobat 9 il y a un bel outil intégré afin que vous puissiez voir comment le PDF a été mis en place (et compressions utilisé). Il y a un billet de blog expliquant comment l'utiliser à http : //pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

Autres conseils

Il y a quelques façons dont il peut compresserez ceci:

  1. Les fichiers PDF utilisent la compression LZW et zip.

  2. Si l'image est mise à l'échelle dans le document, ou une plus grande dpi sur le disque que vous autorisez dans CutePDF (par exemple, si CutePDF est défini pour 300dpi et l'image est de 600 dpi), il peut être mis à l'échelle dans le pdf.

  3. Microsoft stocke des informations TONNES au format docx, en XML. WAY plus que ce qui est vraiment nécessaire pour simplement exporter les informations (pour un exemple, essayez de copier et de coller votre texte dans une cellule de zone de texte, et de regarder l'info html qui sort - j'avais une limite sur la taille de la zone de texte pour un CMS, et une phrase de texte 7 gonflé à 950 caractères). Il en est ainsi il peut être modifié plus tard, et avec beaucoup d'informations ésotériques pour vous assurer que tout se affiche juste toutes les permutations possibles. Le pdf n'a pas besoin de cette information, et il peut juste faire la police et la taille, et la bande de toutes les informations, ce qui économise une tonne d'espace.

Lorsque vous utilisez ces petits fichiers tout frais généraux dans le format de document aura un effet disproportionné qui est la raison pour laquelle vous voyez ces grandes différences%.

Je pris un 2683KB JPEG et inséré dans un nouveau document Word 2003. Le fichier .doc résultant a été 2725KB (ou 2697KB comme docx). Transformer cela en un PDF me donne un PDF 2701KB. Donc, je vois une différence de 25KB, mais seulement environ 1% d'écart en raison de la taille des données d'image. Il est environ la moitié de ce que vous avez peut-être, mais la version de mot que vous avez est plus bavard lors de docx?

Pour le PDF, acrobate montre l'utilisation de l'espace comme l'image 2691K, les frais généraux et les polices 8.27K 1K. PDF est un format creux tout à fait dans sa syntaxe qui limite les frais généraux et une grande partie a répétition des chaînes est donc facilement compressible.

Si vous voulez voir ce que le PDF contient une vue arborescente, vous pouvez télécharger la version de démonstration de CosEdit .

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top