Frage

Ich kenne mehrere Werkzeuge / Bibliotheken, die dies tun können, aber ich möchte wissen, ob dies möglich ist, mit nur die Datei als Textdatei öffnen und der Suche nach einem Stichwort.

War es hilfreich?

Lösung

haben einen Blick auf diese: http://www.freevbcode.com/ShowCode. asp? id = 8153
Bearbeiten : nicht arbeiten, kann zu alt
sein Finde diese:

public static int GetNoOfPagesPDF(string FileName)
        {
            int result = 0;
            FileStream fs = new FileStream(FileName, FileMode.Open, FileAccess.Read);
            StreamReader r = new StreamReader(fs);
            string pdfText = r.ReadToEnd();
            System.Text.RegularExpressions.Regex regx = new Regex(@"/Type\s*/Page[^s]");
            System.Text.RegularExpressions.MatchCollection matches = regx.Matches(pdfText);
            result = matches.Count;
            return result;
        }

Ps: getestet! Es funktioniert. sehen hier Quelle

Andere Tipps

[Edit: auf der Basis der editierten Frage]

Es ist möglich, indem er sie als Textdatei und einige minimale Parsing zu lesen.

Wenn Sie das pdf lesen, um sich dann müssen Sie die Analyse tun. Jede Seite in einer PDF-Datei wird durch eine Seite Objekt dargestellt.

Im Folgenden wird ein Verständnis über die PDF-Spezifikation kurz für Seiten und den Link zum pdf spec.

Das xpdf Dienstprogramme-Paket (xpdf-utils in debian genannt) enthält eine Anwendung namens pdfinfo. Es wird die Anzahl der Seiten in der Datei unter anderen Daten ausdrucken.

http: // www .linuxquestions.org / Fragen / Programmierung-9 / how-to-find-pdf-Seite-count-699113 /

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top