Pregunta

Necesito implementar Escala única retinex y multiescala retinex algoritmo en C#,
He buscado un poco pero no podía encontrar ninguna utilidad práctica de los proyectos y artilces con código
Por lo que he entendido correctamente que debo:

  1. Convertir de RGB a YUV
  2. El desenfoque de la imagen utilizando el filtro de desenfoque Gaussiano
  3. Utilice I'(x, y) = 255*log10( I(x, y)/G(x, y) ) + 127.5
    I - es la iluminación, la G - núcleo Gaussiano, I' - el resultado de la imagen
  4. Convertir de nuevo YUV a RGB

Este código no está funcionando correctamente

 public static Image<Bgr, byte> SingleScaleRetinex(this Image<Bgr, byte> img, int gaussianKernelSize, double sigma)
            {
                var radius = gaussianKernelSize / 2;
                var kernelSize = 2 * radius + 1;

                var ycc = img.Convert<Ycc, byte>();

                var sum = 0f;
                var gaussKernel = new float[kernelSize * kernelSize];
                for (int i = -radius, k = 0; i <= radius; i++, k++)
                {
                    for (int j = -radius; j <= radius; j++)
                    {
                        var val = (float)Math.Exp(-(i * i + j * j) / (sigma * sigma));
                        gaussKernel[k] = val;
                        sum += val;
                    }
                }
                for (int i = 0; i < gaussKernel.Length; i++)
                    gaussKernel[i] /= sum;

                var gray = new Image<Gray, byte>(ycc.Size);
                CvInvoke.cvSetImageCOI(ycc, 1);
                CvInvoke.cvCopy(ycc, gray, IntPtr.Zero);

                // Размеры изображения
                var width = img.Width;
                var height = img.Height;

                var bmp = gray.Bitmap;
                var bitmapData = bmp.LockBits(new Rectangle(Point.Empty, gray.Size), ImageLockMode.ReadWrite, PixelFormat.Format8bppIndexed);

                unsafe
                {
                    for (var y = 0; y < height; y++)
                    {
                        var row = (byte*)bitmapData.Scan0 + y * bitmapData.Stride;
                        for (var x = 0; x < width; x++)
                        {
                            var color = row + x;

                            float val = 0;

                            for (int i = -radius, k = 0; i <= radius; i++, k++)
                            {
                                var ii = y + i;
                                if (ii < 0) ii = 0; if (ii >= height) ii = height - 1;

                                var row2 = (byte*)bitmapData.Scan0 + ii * bitmapData.Stride;
                                for (int j = -radius; j <= radius; j++)
                                {
                                    var jj = x + j;
                                    if (jj < 0) jj = 0; if (jj >= width) jj = width - 1;

                                    val += *(row2 + jj) * gaussKernel[k];

                                }
                            }

                            var newColor = 127.5 + 255 * Math.Log(*color / val);
                            if (newColor > 255)
                                newColor = 255;
                            else if (newColor < 0)
                                newColor = 0;
                            *color = (byte)newColor;
                        }
                    }
                }
                bmp.UnlockBits(bitmapData);

                CvInvoke.cvCopy(gray, ycc, IntPtr.Zero);
                CvInvoke.cvSetImageCOI(ycc, 0);

                return ycc.Convert<Bgr, byte>();

            }
¿Fue útil?

Solución

mira: http://www.fer.unizg.hr/IPG/Resources/Color_ConsTancy

Estos algoritmos son modificaciones del algoritmo retinex (con mejoras de velocidad), aunque el autor les dio nombres divertidos :)

Hay un código fuente completo (C ++, pero está escrito muy bien).

Otros consejos

Lo siento por necro-posting, pero parece que hay un error en el paso 3 del procedimiento que puede inducir a error a alguien que pasa por.

Con el fin de solicitar la corrección, que quiere dividir fuente de la imagen por Gauss-filtrada copia de la misma, no el núcleo Gaussiano sí mismo.Aproximadamente, en pseudo-código:

I_filtered(x,y) = G(x,y) * I(x,y)
I'(x,y) = log(I(x,y) / I_filtered(x,y))

Y, a continuación, aplicar la fundición de I'(x,y) necesarios de tipo numérico (uint8, como puedo consultar desde el post original).

Más sobre el tema puede encontrarse en este papel:

Ri(x, y) = log(Ii(x, y)) − log(Ii(x, y) ∗ F(x, y))

donde Ii es la imagen de entrada en el i-ésimo canal de color, Ri es el retinex de la imagen de salida en la i-ésima canal de y F es normalizada en función de sonido envolvente..

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top