Pergunta

Eu quero ser capaz de determinar a caixa delimitadora de áreas de texto, imagens e caminhos em uma página PDF, semelhante ao que é mostrado aqui:

http://www.windjack.com/products/screenshot/pdfcanscreenshot2.html

Olhando para a especificação PDF, eu posso ver como determinar as caixas delimitadoras de caminhos e imagens, mas eu não posso ver como chegar a eles por texto. Eu tenho que calcular tudo na mão, determinando a altura ea largura dos glifos do tamanho da fonte, etc., ou se existe uma maneira mais simples?

Foi útil?

Solução

Você pode ser capaz de começar com a solução para " Como posso obter informações do personagem deslocamento de um documento pdf? " Isso lhe dará x, y, largura e altura de caracteres e / ou textos no documento. A partir daí, a parte mais difícil é para limitar os grupos de caracteres em regiões espacialmente distintas. Não há nenhuma garantia de que o texto espacialmente agrupados em uma página será próximos uns dos outros na sintaxe do formato de arquivo ...

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top