Pregunta

Necesito una biblioteca que pueda detectar objetos en una imagen (usa detección de bordes). Esto NO está relacionado con captchas. Estoy trabajando en un bot MTGO que usa OCR y que funciona en cualquier resolución de pantalla. Para que se transfiera a cualquier resolución de pantalla, mi idea es escanear un rango estrecho en una página de resultados (las cartas que tiene un jugador se pueden enumerar en filas de texto) y encontrar cada objeto en ese rango. Luego, tomar las coordenadas de píxel más bajas y más altas de cada objeto para encontrar dónde comienza y termina la fila (en el eje y) para poder usar OCR para leer cada línea.

¿Fue útil?

Solución

Si no conoce la colección de ejemplos de OpenCV , podrían ayudarlo en la dirección correcta ... también hay Camellia que no usa " edge detección " per-se pero podría obtener los resultados que necesita con un poco de trabajo.

Otros consejos

No es barato, pero he usado Intel Processing Primitives y quedé muy impresionado con su rendimiento. Funcionan en procesadores Intel y AMD, así como en Windows y Linux

Quizás esto sea útil:

La Simd Library es una biblioteca gratuita de procesamiento de imágenes de código abierto, diseñada para programadores C y C ++. Proporciona muchos algoritmos útiles de alto rendimiento para el procesamiento de imágenes, tales como: conversión de formato de píxeles, escalado y filtración de imágenes, extracción de información estadística de imágenes, detección de movimiento. Los algoritmos están optimizados con el uso de diferentes extensiones de CPU SIMD. En particular, la biblioteca admite las siguientes extensiones de CPU: SSE, SSE2, SSSE3, SSE4.1, SSE4.2, AVX y AVX2 para x86 / x64, VMX (Altivec) y VSX (Power7) para PowerPC, NEON para ARM. La Biblioteca Simd tiene C API y también contiene útiles clases y funciones de C ++ para facilitar el acceso a C API. La biblioteca admite enlaces dinámicos y estáticos, compiladores de Windows y Linux de 32 y 64 bits, MSVS y G ++, proyectos de MSVS y sistemas de compilación CMake.

Eche un vistazo a los SDK de imágenes de herramientas de plomo ? No es gratis, pero es muy completo.

tesseract-ocr ? (Licencia Apache 2.0)

Framewave basado en Biblioteca de rendimiento AMD que proporciona funciones para el procesamiento de imágenes. Compruebe también las Bibliotecas de procesamiento de imágenes C / C ++ multiplataforma rápidas

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top