A implementação do algoritmo Retinex

https://stackoverflow.com//questions/20006582

20-12-2019
|

Pergunta

Preciso implementar Único Scale retinex e multiscale algoritmo retinex em C#,
Eu procurei um pouco, mas não consegui encontrar qualquer prática útil projetos e artilces com o código
Como eu entendi corretamente, eu deveria:

Converter de RGB para YUV
Borrar a imagem usando o filtro Gaussian blur
Utilize o I'(x, y) = 255*log10( I(x, y)/G(x, y) ) + 127.5
Eu - é a iluminação, o G - kernel Gaussiano, eu' - o resultado da imagem
Converter de volta YUV para RGB

Este código não está funcionando corretamente

 public static Image<Bgr, byte> SingleScaleRetinex(this Image<Bgr, byte> img, int gaussianKernelSize, double sigma)
            {
                var radius = gaussianKernelSize / 2;
                var kernelSize = 2 * radius + 1;

                var ycc = img.Convert<Ycc, byte>();

                var sum = 0f;
                var gaussKernel = new float[kernelSize * kernelSize];
                for (int i = -radius, k = 0; i <= radius; i++, k++)
                {
                    for (int j = -radius; j <= radius; j++)
                    {
                        var val = (float)Math.Exp(-(i * i + j * j) / (sigma * sigma));
                        gaussKernel[k] = val;
                        sum += val;
                    }
                }
                for (int i = 0; i < gaussKernel.Length; i++)
                    gaussKernel[i] /= sum;

                var gray = new Image<Gray, byte>(ycc.Size);
                CvInvoke.cvSetImageCOI(ycc, 1);
                CvInvoke.cvCopy(ycc, gray, IntPtr.Zero);

                // Размеры изображения
                var width = img.Width;
                var height = img.Height;

                var bmp = gray.Bitmap;
                var bitmapData = bmp.LockBits(new Rectangle(Point.Empty, gray.Size), ImageLockMode.ReadWrite, PixelFormat.Format8bppIndexed);

                unsafe
                {
                    for (var y = 0; y < height; y++)
                    {
                        var row = (byte*)bitmapData.Scan0 + y * bitmapData.Stride;
                        for (var x = 0; x < width; x++)
                        {
                            var color = row + x;

                            float val = 0;

                            for (int i = -radius, k = 0; i <= radius; i++, k++)
                            {
                                var ii = y + i;
                                if (ii < 0) ii = 0; if (ii >= height) ii = height - 1;

                                var row2 = (byte*)bitmapData.Scan0 + ii * bitmapData.Stride;
                                for (int j = -radius; j <= radius; j++)
                                {
                                    var jj = x + j;
                                    if (jj < 0) jj = 0; if (jj >= width) jj = width - 1;

                                    val += *(row2 + jj) * gaussKernel[k];

                                }
                            }

                            var newColor = 127.5 + 255 * Math.Log(*color / val);
                            if (newColor > 255)
                                newColor = 255;
                            else if (newColor < 0)
                                newColor = 0;
                            *color = (byte)newColor;
                        }
                    }
                }
                bmp.UnlockBits(bitmapData);

                CvInvoke.cvCopy(gray, ycc, IntPtr.Zero);
                CvInvoke.cvSetImageCOI(ycc, 0);

                return ycc.Convert<Bgr, byte>();

            }

Solução

Olha só:http://www.fer.unizg.hr/ipg/resources/color_constancy

Estes algoritmos são modificações do algoritmo Retinex (com melhoria de velocidade) embora o autor deu-lhes nomes engraçados :)

Há um total de código fonte C++, mas é muito bem escrito).

Outras dicas

Desculpe por necro-lançamento, mas parece que há um erro na etapa 3 do procedimento que pode enganar alguém passando.

Para aplicar a correção, você quer dividir a imagem de origem por Gauss-cópia filtrada, e não o próprio kernel Gaussiano.Aproximadamente, em pseudo-código:

I_filtered(x,y) = G(x,y) * I(x,y)
I'(x,y) = log(I(x,y) / I_filtered(x,y))

E, em seguida, aplicar a carcaça de I'(x,y) para exigido tipo numérico (uint8, como eu, pode referir-se a partir do post original).

Mais sobre o assunto pode ser encontrado em este papel:

Ri(x, y) = log(Ii(x, y)) − log(Ii(x, y) ∗ F(x, y))

onde Ii é a imagem de entrada no i-ésimo canal de cor, Ri é o retinex de imagem de saída do i-ésimo canal e F é normalizada a função surround..

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow