pourquoi les deux PDFBox et pdfrenderer ne peuvent pas soutenir « polices supplémentaires »?
-
23-09-2019 - |
Question
I ai un pdf qui contient font 'UniCNS-UCS2-H', J'ai essayé à la fois PDFBox et pdfrenderer, ils ont tous exception throw: Inconnu codant pour 'UniCNS-UCS2-H'
et cette police a été inclus dans un fichier de police: Mingliu.ttc (il est un véritable fichier de collection de type, je ne sais pas est-ce important
?Que puis-je faire pour que ces deux bibliothèques prennent en charge des polices supplémentaires?
La solution
Le codage pour une police dans les documents PDF est spécifié dans l'objet dictionnaire de la police. La police que vous rencontrez est codé en utilisant « UniCNS-UCS2-H », qui, autant que je peux dire est une variante de l'encodage chinois.
PDFBox 4 ne supporte que les codages:
- PDFDocEncoding
- MacRomanEncoding
- StandardEncoding
- WinAnsiEncoding
Ceux-ci sont définis dans l'objet dictionnaire de la police dans le flux pdf
(Par exemple .../Encoding/WinAnsiEncoding/...
)
Lorsque PDFBox rencontre un codage inconnu, à l'exception que vous avez signalé est affiché.
Pour plus d'informations sur les polices dans les documents PDF, voir la section 9.5 par 9.8 de la PDF spécification