我知道有几个工具/库可以做到这一点,但我想知道是否可以通过将文件作为文本文件打开并查找关键字来实现。

有帮助吗?

解决方案

看看这个: http://www.freevbcode.com/ShowCode。 ASP?ID = 8153 结果 修改:不工作,可能太旧点击 发现这一点:

public static int GetNoOfPagesPDF(string FileName)
        {
            int result = 0;
            FileStream fs = new FileStream(FileName, FileMode.Open, FileAccess.Read);
            StreamReader r = new StreamReader(fs);
            string pdfText = r.ReadToEnd();
            System.Text.RegularExpressions.Regex regx = new Regex(@"/Type\s*/Page[^s]");
            System.Text.RegularExpressions.MatchCollection matches = regx.Matches(pdfText);
            result = matches.Count;
            return result;
        }

PS:测试!它的工作原理。看到这里

其他提示

[编辑:基于编辑的问题]

可以通过将其作为文本文件读取并进行一些最小的解析来实现。

如果您自己阅读pdf,那么您将需要进行解析。PDF 中的每个页面都由一个页面对象表示。

下面提供了对 pdf 规范的理解(简称页面)以及 pdf 规范的链接。

在xpdf的实用程序包(称为的xpdf-utils的Debian中)包括被称为pdfinfo的应用程序。这将打印出的页数在文件中,除了其他数据之外。

的http:// WWW .linuxquestions.org /问题/编程-9 /如何找到的,PDF页面计数-699113 /

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top