Contando las páginas en un archivo PDF [cerrada]
-
27-09-2019 - |
Pregunta
Sé de varias herramientas / librerías que pueden hacer esto, pero me gustaría saber si esto es posible con sólo abrir el archivo como un archivo de texto y la búsqueda de una palabra clave.
Solución
echar un vistazo a esto: http://www.freevbcode.com/ShowCode. asp? id = 8153
Editar : no funciona, puede ser demasiado viejo
Encontrado esto:
public static int GetNoOfPagesPDF(string FileName)
{
int result = 0;
FileStream fs = new FileStream(FileName, FileMode.Open, FileAccess.Read);
StreamReader r = new StreamReader(fs);
string pdfText = r.ReadToEnd();
System.Text.RegularExpressions.Regex regx = new Regex(@"/Type\s*/Page[^s]");
System.Text.RegularExpressions.MatchCollection matches = regx.Matches(pdfText);
result = matches.Count;
return result;
}
PD: prueba! Funciona. ver aquí fuente
Otros consejos
[Editar: se basa en la pregunta editada]
Es posible mediante la lectura como archivo de texto y algunos análisis mínimo.
Si usted lee el pdf ti mismo, entonces usted tendrá que hacer el análisis. Cada página de un PDF está representada por un objeto de página.
A continuación se proporciona una comprensión acerca de la especificación PDF en definitiva para páginas y el enlace a la especificación PDF.
El paquete de utilidades xpdf (llamado xpdf-utils en debian) incluye una aplicación llamada PDFInfo. Se imprimirá el número de páginas en el archivo, entre otros datos.