Compter les pages dans un fichier PDF [fermé]
-
27-09-2019 - |
Question
Je connais plusieurs bibliothèques / outils qui peuvent le faire, mais je veux savoir si cela est possible avec juste d'ouvrir le fichier en tant que fichier texte et la recherche d'un mot-clé.
La solution
un coup d'oeil à ceci: http://www.freevbcode.com/ShowCode. asp? ID = 8153
Modifier : pas de travail, peut-être trop vieux
Trouvé ceci:
public static int GetNoOfPagesPDF(string FileName)
{
int result = 0;
FileStream fs = new FileStream(FileName, FileMode.Open, FileAccess.Read);
StreamReader r = new StreamReader(fs);
string pdfText = r.ReadToEnd();
System.Text.RegularExpressions.Regex regx = new Regex(@"/Type\s*/Page[^s]");
System.Text.RegularExpressions.MatchCollection matches = regx.Matches(pdfText);
result = matches.Count;
return result;
}
Ps: testé! Il fonctionne. voir ici source
Autres conseils
[Edit: en fonction de la question éditée]
Il est possible en lisant comme fichier texte et une analyse minimale.
Si vous lisez le pdf vous alors vous aurez besoin de faire l'analyse syntaxique. Chaque page dans un fichier PDF est représenté par un objet page.
Ce qui suit donne une compréhension sur la spécification pdf bref pour les pages et le lien vers la spécification PDF.
Le paquet utilitaires xpdf (appelée xpdf-utils dans debian) comprend une application appelée pdfinfo. Il imprimera le nombre de pages dans le fichier, entre autres données.
http: // www .linuxquestions.org / questions / programmation-9 / how-to-find-pdf page-count-699113 /