dot net: necessidade i para o arquivo pdf de análise para obter cada artigo com o título?

StackOverflow https://stackoverflow.com/questions/1058208

Pergunta

Eu quero analisar o arquivo pdf de tal forma que eu posso identificar o título de cada artigo e seu description.so que eu possa armazenar texto do título e DescriptionText em cache para pesquisa purpose.is há qualquer biblioteca ou ferramenta para isso?

Foi útil?

Solução

Primeiro, você pode instalar Adobe PDF IFilter dll. Depois, você pode ler as propriedades de qualquer arquivo .pdf usando este biblioteca (usando IFilter em C #). Ou, alternativamente, você também pode olhar para este biblioteca (Implementação de um TextReader para extrair vários arquivos conteúdo usando IFilter).

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top