Question

La réponse acceptée à la question bibliothèque C ++ reconnaissance d'images: les images contenant des mots à chaîne recommandé que vous:

  1. Upsize / Downsize votre image d'entrée à 300 DPI.

Comment puis-je faire cela ... Je suis sous l'impression que le Département était pour les moniteurs, pas les formats d'image.

Était-ce utile?

La solution

Je pense que le terme plus précis ici rééchantillonnage . Vous voulez une résolution de pixels suffisamment élevé pour soutenir OCR précis. Taille des lettres (par exemple dans points de ) est typiquement mesurée en unités de longueur, non pixels. Depuis 72 points = 1 pouce, nous avons besoin de pixels par point 300/72 pour une résolution de 300 dpi ( « pixels par pouce »). Cela signifie une police de 12 points typique a une hauteur (ou plus précisément, la ligne de base à ligne de base distance en texte simple interligne) de 50 pixels.

Idéalement, vos documents sources doivent être scannés à une résolution appropriée pour la taille de la police donnée, de sorte que la police dans l'image est d'environ 50 pixels de haut. Si la résolution est trop haute / basse, vous pouvez facilement rééchantillonnez l'image en utilisant un programme graphique (par exemple GIMP ) . Vous pouvez aussi le faire à travers une programmation bibliothèque graphique, comme ImageMagick qui a des interfaces pour de nombreux langages de programmation.

Autres conseils

DPI est logique chaque fois que vous êtes une image relative en pixels à un dispositif physique avec une taille d'image. Dans le cas de l'OCR, cela signifie généralement la résolution de l'analyse, à savoir combien de pixels vous obtiendrez pour chaque pouce de la numérisation. Un caractère de 12 points est destiné à être imprimé à 12/72 pouces par ligne, et un caractère majuscule afin de remplir environ 80% de celui; il serait donc environ 40 pixels de haut lorsque numérisée à 300 DPI.

De nombreux formats d'image ont un DPI enregistré en eux. Si l'image a été numérisée, cela devrait être le réglage précis du scanner. Si elle venait d'un appareil photo numérique, il dit toujours 72 DPI, qui est une valeur par défaut mandatée par la spécification EXIF; c'est parce qu'un appareil ne peut pas connaître la taille originale de l'image. Lorsque vous créez une image avec un programme d'imagerie, vous pourriez avoir la possibilité de définir le DPI à une valeur arbitraire. Ceci est une commodité pour vous de spécifier la façon dont vous voulez que l'image finale à utiliser, et n'a aucune incidence sur les détails contenus dans l'image.

Voici une question précédente qui demande les détails de redimensionner une image: Comment puis-je mise à l'échelle de haute qualité d'une image?

logiciel OCR est généralement conçu pour fonctionner avec les tailles de police « normales ». D'un point de vue de l'image, cela signifie qu'il cherchera des lettres peut-être autour de la plage de hauteur de 30 à 100 pixels. Les images de résolution beaucoup plus élevée produiraient des lettres qui apparaissent beaucoup trop grand pour le logiciel OCR pour traiter efficacement. De même, des images de résolution inférieure ne fournirait pas suffisamment de pixels pour le logiciel à reconnaître les lettres.

« Comment pourrais-je faire cela ... J'avais l'impression que dpi était pour les moniteurs, et non pas les formats d'image. »

DPI signifie points par pouce. Qu'est-ce que cela a à voir avec les moniteurs? Eh bien, nous avons un pixel en trois sous-pixels RVB. Plus le DPI, plus de détails vous fourrer dans cet espace.

DPI est une mesure utile pour les écrans et les impressions, mais rien d'utile ... en fait, rien pour l'image eux-mêmes formats.

La raison de DPI étant marqué dans certains formats est de charger les appareils d'afficher à cette résolution, mais d'après ce que je comprends, la quasi-totalité ignorent que l'enseignement et fait de son mieux pour optimiser l'image pour une sortie particulière.

Vous pouvez modifier 72 dpi à 1 dpi ou 6000 dpi dans un format d'image et il ne fera pas une différence que ce soit sur un moniteur. « Upsize / réduire les effectifs à 300 dpi » n'a aucun sens. Rééchantillonnage ne change pas DPI soit. Essayez-le dans Photoshop, désactivez l'option « Resample » lors du changement de DPI et vous verrez aucune différence. Il ne sera pas plus ou moins important.

DPI est totalement dénuée de sens pour les formats d'image, l'OMI.

Si votre objectif est d'OCR, le DPI est logique que le nombre de points dans l'image pour chaque pouce dans le document original numérisé. Si votre dpi est trop faible, l'information est parti pour toujours, et même l'interpolation bicubique ne va pas à un travail brillant récupérer. Si votre dpi est trop élevé, il est facile de jeter les bits.

Pour faire le travail; Je suis un grand fan du jeu d'outils netpbm / pbmplus; l'outil pour commencer est pnmscale, mais si vous avez une image bitmap que vous voulez examiner les outils connexes tels que pbmreduce.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top