Вопрос

мне нужно реализовать Одномасштабный алгоритм Retinex и многомасштабный алгоритм Retinex в С#,
Я немного поискал, но не нашел полезных практических проектов и статей с кодом.
Как я правильно понял, мне нужно:

  1. Преобразование RGB в YUV
  2. Размытие изображения с помощью фильтра размытия по Гауссу.
  3. Используйте I'(x, y) = 255*log10( I(x, y)/G(x, y)) + 127,5.
    I - освещенность, G - ядро ​​Гаусса, I' - результат изображения.
  4. Конвертировать обратно YUV в RGB

Этот код работает неправильно

 public static Image<Bgr, byte> SingleScaleRetinex(this Image<Bgr, byte> img, int gaussianKernelSize, double sigma)
            {
                var radius = gaussianKernelSize / 2;
                var kernelSize = 2 * radius + 1;

                var ycc = img.Convert<Ycc, byte>();

                var sum = 0f;
                var gaussKernel = new float[kernelSize * kernelSize];
                for (int i = -radius, k = 0; i <= radius; i++, k++)
                {
                    for (int j = -radius; j <= radius; j++)
                    {
                        var val = (float)Math.Exp(-(i * i + j * j) / (sigma * sigma));
                        gaussKernel[k] = val;
                        sum += val;
                    }
                }
                for (int i = 0; i < gaussKernel.Length; i++)
                    gaussKernel[i] /= sum;

                var gray = new Image<Gray, byte>(ycc.Size);
                CvInvoke.cvSetImageCOI(ycc, 1);
                CvInvoke.cvCopy(ycc, gray, IntPtr.Zero);

                // Размеры изображения
                var width = img.Width;
                var height = img.Height;

                var bmp = gray.Bitmap;
                var bitmapData = bmp.LockBits(new Rectangle(Point.Empty, gray.Size), ImageLockMode.ReadWrite, PixelFormat.Format8bppIndexed);

                unsafe
                {
                    for (var y = 0; y < height; y++)
                    {
                        var row = (byte*)bitmapData.Scan0 + y * bitmapData.Stride;
                        for (var x = 0; x < width; x++)
                        {
                            var color = row + x;

                            float val = 0;

                            for (int i = -radius, k = 0; i <= radius; i++, k++)
                            {
                                var ii = y + i;
                                if (ii < 0) ii = 0; if (ii >= height) ii = height - 1;

                                var row2 = (byte*)bitmapData.Scan0 + ii * bitmapData.Stride;
                                for (int j = -radius; j <= radius; j++)
                                {
                                    var jj = x + j;
                                    if (jj < 0) jj = 0; if (jj >= width) jj = width - 1;

                                    val += *(row2 + jj) * gaussKernel[k];

                                }
                            }

                            var newColor = 127.5 + 255 * Math.Log(*color / val);
                            if (newColor > 255)
                                newColor = 255;
                            else if (newColor < 0)
                                newColor = 0;
                            *color = (byte)newColor;
                        }
                    }
                }
                bmp.UnlockBits(bitmapData);

                CvInvoke.cvCopy(gray, ycc, IntPtr.Zero);
                CvInvoke.cvSetImageCOI(ycc, 0);

                return ycc.Convert<Bgr, byte>();

            }
Это было полезно?

Решение

Посмотрите: http://www.fer.unizg.hr/ip/resources/color_Constancy

Эти алгоритмы являются модификациями алгоритма ретинекса (со скоростью улучшения), хотя автор дал им забавные имена :)

Есть полный исходный код (C ++, но он написан очень красиво).

Другие советы

Извините за некропостинг, но похоже, что в шаге 3 вашей процедуры есть ошибка, которая может ввести в заблуждение проходящего мимо человека.

Чтобы применить коррекцию, вам нужно разделить исходное изображение на его копию, отфильтрованную по Гауссу, а не на само ядро ​​Гаусса.Примерно, в псевдокоде:

I_filtered(x,y) = G(x,y) * I(x,y)
I'(x,y) = log(I(x,y) / I_filtered(x,y))

А затем применить приведение I'(x,y) к требуемому числовому типу (uint8, как я понимаю из исходного поста).

Дополнительную информацию по этой теме можно найти в Эта бумага:

Ri(x, y) = log(Ii(x, y)) − log(Ii(x, y) ∗ F(x, y))

где Ii— входное изображение на i-м цветовом канале, RiВыходное изображение Retinex на канале I-TH и F — это нормализованная функция объемного звучания..

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top