Contando as páginas em um arquivo PDF [fechado
-
27-09-2019 - |
Pergunta
Conheço várias ferramentas/bibliotecas que podem fazer isso, mas quero saber se isso é possível apenas abrir o arquivo como um arquivo de texto e procurando uma palavra -chave.
Solução
Veja isso: http://www.freevbcode.com/showcode.asp?id=8153
Editar: não funciona, pode ser muito velho
Encontrei isto:
public static int GetNoOfPagesPDF(string FileName)
{
int result = 0;
FileStream fs = new FileStream(FileName, FileMode.Open, FileAccess.Read);
StreamReader r = new StreamReader(fs);
string pdfText = r.ReadToEnd();
System.Text.RegularExpressions.Regex regx = new Regex(@"/Type\s*/Page[^s]");
System.Text.RegularExpressions.MatchCollection matches = regx.Matches(pdfText);
result = matches.Count;
return result;
}
Outras dicas
Editar: com base na pergunta editada
É possível lendo -o como arquivo de texto e alguma análise mínima.
Se você ler o PDF, precisará fazer a análise. Cada página em um PDF é representada por um objeto de página.
O seguinte fornece um entendimento sobre a especificação PDF em abreviação de páginas e o link para a especificação PDF.
O pacote de utilitários XPDF (chamado XPDF-Utils no Debian) inclui um aplicativo chamado pdfinfo. Ele imprimirá o número de páginas no arquivo, entre outros dados.
http://www.linuxquestions.org/questions/programming-9/how-to-find-pdf-page-count-699113/