Como otimizar o tamanho do arquivo PDF?

https://stackoverflow.com/questions/819180

03-07-2019
|

Pergunta

Eu tenho um arquivo PDF de entrada (geralmente, mas nem sempre gerado por pdfTeX), o que eu quero converter para um PDF de saída, que é visualmente equivalente (não importa a resolução), tem os mesmos metadados (Unicode texto informativo , hyperlinks, contornos etc.), mas o tamanho do arquivo é tão pequeno quanto possível.

Eu sei sobre os seguintes métodos:

java -cp Multivalent.jar tool.pdf.Compress input.pdf (de http://multivalent.sourceforge.net/ ). Este recompresses todos os fluxos, remove objetos não utilizados, unifica objetos equivalentes, compressas espaço em branco, remove valores padrão, comprime a tabela de referência cruzada.
recompressing imagens adequadas com JBIG2 e PNGOUT.
Re-codificação de fontes Type1 como fontes CFF.
Unificar imagens equivalentes.
subconjuntos unificador da mesma fonte para um subconjunto maior.
Remover formas podem ser preenchidos.
Quando destilação ou de outra forma converter (por exemplo gs -sDEVICE=pdfwrite), certifique-se que não degrada a qualidade da imagem, e não aumenta (!) Os tamanhos de imagem.

Eu sei sobre as seguintes técnicas, mas eles não se aplicam no meu caso, uma vez que eu já tenho um PDF:

Usar fontes menores e / ou menos.
usar imagens vetoriais imagens em vez de bitmap.

Você tem outras idéias como otimizar PDF?

Solução

Otimizar arquivos PDF

Evite Refried Gráficos

Para gráficos que devem ser inseridos como bitmaps, prepará-los para as dimensões máximas de compressibilidade e mínimos. Use as melhores imagens de qualidade que você pode, a resolução do PDF de saída. Inserindo JPEGs compactados em PDFs e destilando-los pode recompress JPEGs, que pode criar artefatos visíveis. Use imagens e textos a preto e branco em vez de imagens a cores para permitir o uso do padrão JBIG2 mais recente que supera em compressão monocromática. Certifique-se de desligar miniaturas ao salvar PDFs para a Web. Use Vector Graphics

Use gráficos baseados em vetores, sempre que possível para imagens que normalmente seriam feitas em GIFs. imagens vetoriais podem se adaptar perfeitamente, está maravilhosa, e as suas fórmulas matemáticas geralmente ocupam menos espaço do que gráficos de bitmap que descrevem cada pixel (embora haja alguns casos em gráficos de bitmap são realmente menor do que gráficos vetoriais). Você pode também dados de imagem compressa vetor usando ZIP compressão, que é construído para o formato PDF. Acrobat Reader versão 5 e 6 também suporta o padrão SVG. Minimizar Fontes

Como você usar fontes, especialmente em PDFs menores, podem ter um impacto significativo sobre o tamanho do arquivo. Minimizar o número de fontes que você usa em seus documentos para minimizar o seu impacto no tamanho do arquivo. Cada fonte adicional totalmente incorporado pode facilmente levar 40K no tamanho do arquivo, razão pela qual a maioria dos autores criar "subsetted" fontes que incluem apenas os glifos efectivamente utilizadas. Flatten Fat Formas

formas Acrobat pode levar até um monte de espaço em seus PDFs. Novo no Acrobat 8 ??Pro você pode achatar campos de formulário na Avançado -> PDF Optimizer -> Descarte de diálogo Objetos. Achatamento formas faz com que os campos do formulário inutilizável e dados do formulário é mesclado com a página. Você também pode usar PDF Enhancer de Apago a reduzir formulários em 50%, removendo informações presentes no arquivo, mas nunca realmente utilizados. Você também pode combinar um PDF refried com as velhas páginas de formulário para criar um PDF híbrido no Acrobat (seção "Refried PDF" abaixo ver).

artigo

Outras dicas

De PDF especificação versão 1.5 existem dois novos métodos de compressão, objeto córregos e riachos referência cruzada.

Você menciona que a ferramenta Multivalent.jar compressa comprime a tabela de referência cruzada. Isto normalmente significa a tabela de referência cruzada é convertida numa corrente e, em seguida, comprimida.

O formato deste fluxo de referência cruzada não é fixo. Você pode mudar o tamanho dos três "colunas" de dados bit. Também é possível pré-processar os dados de transmissão, utilizando uma função preditor que vai melhorar o nível de compressão dos dados. Se você olhar dentro do PDF com um editor de texto que você pode ser capaz de encontrar a entrada /Predictor no dicionário fluxo de referência cruzada para verificar se a ferramenta que você está usando é tirar proveito desse recurso.

Usando um preditor na compressão pode ser útil para imagens também.

O segundo tipo de compressão oferecida é o uso de fluxos de objetos.

Muitas vezes, em um PDF que você tem muitos objetos semelhantes. Estes podem agora ser combinadas em um único objecto e, em seguida, comprimida. A documentação para a ferramenta Multivalentes Compress menciona que fluxos de objetos são usados, mas não tem muitos detalhes sobre a escolha real de quais objetos para agrupar. A compressão será melhor se você agrupar objetos semelhantes juntos em um fluxo de objeto.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow