Pregunta

Tengo un pdf que contiene fuente 'UniCNS-UCS2-H', He intentado tanto PDFBox y pdfrenderer, todos ellos a excepción tiro: codificación desconocida de 'UniCNS-UCS2-H'

y esta fuente se incluye en un archivo de fuentes: Mingliu.ttc (que es un verdadero archivo de colección tipo, yo no sé qué es importante

?

¿qué puedo hacer para que estas dos bibliotecas admiten fuentes adicionales?

¿Fue útil?

Solución

La codificación para un tipo de letra en los documentos PDF se especifica en el objeto diccionario de fuentes. La fuente que está encontrando se codifica utilizando 'UniCNS-UCS2-H', que por lo que yo puedo decir es una variante de la codificación china.

PDFBox sólo admite 4 codificaciones:

  1. PDFDocEncoding
  2. MacRomanEncoding
  3. StandardEncoding
  4. WinAnsiEncoding

Estos se definen en el objeto diccionario de fuentes dentro de la corriente pdf
 (Por ejemplo .../Encoding/WinAnsiEncoding/...)

Cuando PDFBox se encuentra con una codificación desconocida, se muestra la excepción que ha informado.

Para obtener más información acerca de las fuentes de los documentos PDF, ver sección 9.5 al 9.8 de la PDF Especificación

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top