A implementação do algoritmo Retinex
-
20-12-2019 - |
Pergunta
Preciso implementar Único Scale retinex e multiscale algoritmo retinex em C#,
Eu procurei um pouco, mas não consegui encontrar qualquer prática útil projetos e artilces com o código
Como eu entendi corretamente, eu deveria:
- Converter de RGB para YUV
- Borrar a imagem usando o filtro Gaussian blur
- Utilize o I'(x, y) = 255*log10( I(x, y)/G(x, y) ) + 127.5
Eu - é a iluminação, o G - kernel Gaussiano, eu' - o resultado da imagem - Converter de volta YUV para RGB
Este código não está funcionando corretamente
public static Image<Bgr, byte> SingleScaleRetinex(this Image<Bgr, byte> img, int gaussianKernelSize, double sigma)
{
var radius = gaussianKernelSize / 2;
var kernelSize = 2 * radius + 1;
var ycc = img.Convert<Ycc, byte>();
var sum = 0f;
var gaussKernel = new float[kernelSize * kernelSize];
for (int i = -radius, k = 0; i <= radius; i++, k++)
{
for (int j = -radius; j <= radius; j++)
{
var val = (float)Math.Exp(-(i * i + j * j) / (sigma * sigma));
gaussKernel[k] = val;
sum += val;
}
}
for (int i = 0; i < gaussKernel.Length; i++)
gaussKernel[i] /= sum;
var gray = new Image<Gray, byte>(ycc.Size);
CvInvoke.cvSetImageCOI(ycc, 1);
CvInvoke.cvCopy(ycc, gray, IntPtr.Zero);
// Размеры изображения
var width = img.Width;
var height = img.Height;
var bmp = gray.Bitmap;
var bitmapData = bmp.LockBits(new Rectangle(Point.Empty, gray.Size), ImageLockMode.ReadWrite, PixelFormat.Format8bppIndexed);
unsafe
{
for (var y = 0; y < height; y++)
{
var row = (byte*)bitmapData.Scan0 + y * bitmapData.Stride;
for (var x = 0; x < width; x++)
{
var color = row + x;
float val = 0;
for (int i = -radius, k = 0; i <= radius; i++, k++)
{
var ii = y + i;
if (ii < 0) ii = 0; if (ii >= height) ii = height - 1;
var row2 = (byte*)bitmapData.Scan0 + ii * bitmapData.Stride;
for (int j = -radius; j <= radius; j++)
{
var jj = x + j;
if (jj < 0) jj = 0; if (jj >= width) jj = width - 1;
val += *(row2 + jj) * gaussKernel[k];
}
}
var newColor = 127.5 + 255 * Math.Log(*color / val);
if (newColor > 255)
newColor = 255;
else if (newColor < 0)
newColor = 0;
*color = (byte)newColor;
}
}
}
bmp.UnlockBits(bitmapData);
CvInvoke.cvCopy(gray, ycc, IntPtr.Zero);
CvInvoke.cvSetImageCOI(ycc, 0);
return ycc.Convert<Bgr, byte>();
}
Solução
Olha só:http://www.fer.unizg.hr/ipg/resources/color_constancy
Estes algoritmos são modificações do algoritmo Retinex (com melhoria de velocidade) embora o autor deu-lhes nomes engraçados :)
Há um total de código fonte C++, mas é muito bem escrito).
Outras dicas
Desculpe por necro-lançamento, mas parece que há um erro na etapa 3 do procedimento que pode enganar alguém passando.
Para aplicar a correção, você quer dividir a imagem de origem por Gauss-cópia filtrada, e não o próprio kernel Gaussiano.Aproximadamente, em pseudo-código:
I_filtered(x,y) = G(x,y) * I(x,y)
I'(x,y) = log(I(x,y) / I_filtered(x,y))
E, em seguida, aplicar a carcaça de I'(x,y)
para exigido tipo numérico (uint8
, como eu, pode referir-se a partir do post original).
Mais sobre o assunto pode ser encontrado em este papel:
Ri(x, y) = log(Ii(x, y)) − log(Ii(x, y) ∗ F(x, y))
onde
Ii
é a imagem de entrada no i-ésimo canal de cor,Ri
é o retinex de imagem de saída do i-ésimo canal eF
é normalizada a função surround..