Pregunta

he visto este enlace: http://www.lucidimagination.com/Community / Hear-de-la-Expertos / Artículos / contenido-Extractor-Tika Lo que tengo es texto puro sin cualquier estilo de Tika para Solr la que buscar. ¿Es posible que el texto con su estilo de Solr? En otras palabras, necesitamos que el texto que con su estilo original después buscado por Solr.

¿Fue útil?

Solución

Si se piensa en ello, lo que es "estilo original" en un pdf? ¿Qué componentes del "estilo" ¿desea mantener?

No se trata sólo de la fuente y de peso, es de trazo, relleno, ángulo, trayectoria, gráficos, seguimiento, transparencia, transformaciones y más. Si tienes todo eso, ¿cómo se mostrará en la interfaz de usuario / Web?

Puede realmente no replicar el estilo original de ninguna manera que no sea mostrar el PDF original. Así que esa es la forma en que la gente suele hacer si quieren el formato original.

De lo contrario, sólo tiene que utilizar el texto puro.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top