Pregunta

Estoy buscando una biblioteca que puede abrir un archivos ppt, pptx, doc, docx analizarlo y extraer todos los objetos de la misma.

Por ejemplo, en ppt se puede extraer todas las propiedades de los objetos, como imágenes, texto, tablas formas automáticas, etc .. entonces me proporcione objeto lugar / tamaño y formato, como el tamaño de fuente / color / negrita, etc .. y para las imágenes la capacidad de guardar cada imagen en un archivo jpg. La biblioteca también debe ser capaz de tomar una instantánea de toda la diapositiva.

Aspose para hacer esto, pero no fue precisa en conseguir esta información. no se extraerá todas las propiedades y además es la exportación como imagen no es exacta. ¿Hay alguna idea en el uso de biblioteca de la oficina abierta para hacer eso?

Estoy abierto a usar Java o una biblioteca de C ++.

¿Fue útil?

Solución

At work we used the openoffice Java api to extract the images from ppt/pptx files. I used the docs from here. I am pretty sure you can use the info in that guide to do what you need.

good luck.

Otros consejos

One option is the apache poi library - there's examples around and there seems to be more material around than on the openoffice API.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top