我怎么能进一步优化该色差功能?
-
27-09-2019 - |
题
我有此功能在CIE Lab色彩空间计算颜色差异,但它缺乏速度。因为我不是一个Java专家,我不知道任何Java大师四周有一些提示,可以在这里提高速度。
在代码是基于在注释块中提到的MATLAB函数。
/**
* Compute the CIEDE2000 color-difference between the sample color with
* CIELab coordinates 'sample' and a standard color with CIELab coordinates
* 'std'
*
* Based on the article:
* "The CIEDE2000 Color-Difference Formula: Implementation Notes,
* Supplementary Test Data, and Mathematical Observations,", G. Sharma,
* W. Wu, E. N. Dalal, submitted to Color Research and Application,
* January 2004.
* available at http://www.ece.rochester.edu/~gsharma/ciede2000/
*/
public static double deltaE2000(double[] lab1, double[] lab2)
{
double L1 = lab1[0];
double a1 = lab1[1];
double b1 = lab1[2];
double L2 = lab2[0];
double a2 = lab2[1];
double b2 = lab2[2];
// Cab = sqrt(a^2 + b^2)
double Cab1 = Math.sqrt(a1 * a1 + b1 * b1);
double Cab2 = Math.sqrt(a2 * a2 + b2 * b2);
// CabAvg = (Cab1 + Cab2) / 2
double CabAvg = (Cab1 + Cab2) / 2;
// G = 1 + (1 - sqrt((CabAvg^7) / (CabAvg^7 + 25^7))) / 2
double CabAvg7 = Math.pow(CabAvg, 7);
double G = 1 + (1 - Math.sqrt(CabAvg7 / (CabAvg7 + 6103515625.0))) / 2;
// ap = G * a
double ap1 = G * a1;
double ap2 = G * a2;
// Cp = sqrt(ap^2 + b^2)
double Cp1 = Math.sqrt(ap1 * ap1 + b1 * b1);
double Cp2 = Math.sqrt(ap2 * ap2 + b2 * b2);
// CpProd = (Cp1 * Cp2)
double CpProd = Cp1 * Cp2;
// hp1 = atan2(b1, ap1)
double hp1 = Math.atan2(b1, ap1);
// ensure hue is between 0 and 2pi
if (hp1 < 0) {
// hp1 = hp1 + 2pi
hp1 += 6.283185307179586476925286766559;
}
// hp2 = atan2(b2, ap2)
double hp2 = Math.atan2(b2, ap2);
// ensure hue is between 0 and 2pi
if (hp2 < 0) {
// hp2 = hp2 + 2pi
hp2 += 6.283185307179586476925286766559;
}
// dL = L2 - L1
double dL = L2 - L1;
// dC = Cp2 - Cp1
double dC = Cp2 - Cp1;
// computation of hue difference
double dhp = 0.0;
// set hue difference to zero if the product of chromas is zero
if (CpProd != 0) {
// dhp = hp2 - hp1
dhp = hp2 - hp1;
if (dhp > Math.PI) {
// dhp = dhp - 2pi
dhp -= 6.283185307179586476925286766559;
} else if (dhp < -Math.PI) {
// dhp = dhp + 2pi
dhp += 6.283185307179586476925286766559;
}
}
// dH = 2 * sqrt(CpProd) * sin(dhp / 2)
double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);
// weighting functions
// Lp = (L1 + L2) / 2 - 50
double Lp = (L1 + L2) / 2 - 50;
// Cp = (Cp1 + Cp2) / 2
double Cp = (Cp1 + Cp2) / 2;
// average hue computation
// hp = (hp1 + hp2) / 2
double hp = (hp1 + hp2) / 2;
// identify positions for which abs hue diff exceeds 180 degrees
if (Math.abs(hp1 - hp2) > Math.PI) {
// hp = hp - pi
hp -= Math.PI;
}
// ensure hue is between 0 and 2pi
if (hp < 0) {
// hp = hp + 2pi
hp += 6.283185307179586476925286766559;
}
// LpSqr = Lp^2
double LpSqr = Lp * Lp;
// Sl = 1 + 0.015 * LpSqr / sqrt(20 + LpSqr)
double Sl = 1 + 0.015 * LpSqr / Math.sqrt(20 + LpSqr);
// Sc = 1 + 0.045 * Cp
double Sc = 1 + 0.045 * Cp;
// T = 1 - 0.17 * cos(hp - pi / 6) +
// + 0.24 * cos(2 * hp) +
// + 0.32 * cos(3 * hp + pi / 30) -
// - 0.20 * cos(4 * hp - 63 * pi / 180)
double hphp = hp + hp;
double T = 1 - 0.17 * Math.cos(hp - 0.52359877559829887307710723054658)
+ 0.24 * Math.cos(hphp)
+ 0.32 * Math.cos(hphp + hp + 0.10471975511965977461542144610932)
- 0.20 * Math.cos(hphp + hphp - 1.0995574287564276334619251841478);
// Sh = 1 + 0.015 * Cp * T
double Sh = 1 + 0.015 * Cp * T;
// deltaThetaRad = (pi / 3) * e^-(36 / (5 * pi) * hp - 11)^2
double powerBase = hp - 4.799655442984406;
double deltaThetaRad = 1.0471975511965977461542144610932 * Math.exp(-5.25249016001879 * powerBase * powerBase);
// Rc = 2 * sqrt((Cp^7) / (Cp^7 + 25^7))
double Cp7 = Math.pow(Cp, 7);
double Rc = 2 * Math.sqrt(Cp7 / (Cp7 + 6103515625.0));
// RT = -sin(delthetarad) * Rc
double RT = -Math.sin(deltaThetaRad) * Rc;
// de00 = sqrt((dL / Sl)^2 + (dC / Sc)^2 + (dH / Sh)^2 + RT * (dC / Sc) * (dH / Sh))
double dLSl = dL / Sl;
double dCSc = dC / Sc;
double dHSh = dH / Sh;
return Math.sqrt(dLSl * dLSl + dCSc * dCSc + dHSh * dHSh + RT * dCSc * dHSh);
}
解决方案
cos
是昂贵的,特别是在第4行。你可能在计算COS(N A + B)其中b是一个常数,n是小的整数。这意味着你可以预先计算COS(B)和sin(B),并在运行时计算只是COS(HP)和sin(HP)。你可以得到COS(N A + B)通过使反复使用的
cos(a+b) = cos(a)*cos(b)-sin(a)*sin(b)
您会被交易了几个sin
s和cos
s的一些乘法和加法,几乎可以肯定是值得的。
您可以做的更好,如果你感觉雄心勃勃。你从hp
越来越atan2
间接。该图案可以trig-function(rational-function(inverse-trig-function(x)))
频繁通过多项式和根其是快于三角函数来评价的某种组合来代替。
我不知道pow
是如何在Java中实现,但如果它使用日志,你可能会更好使用Cp7
越来越Cp2=Cp*Cp;Cp4=Cp2*Cp2;Cp7=Cp4*Cp2*Cp;
更新:获得更多的投机性,现在我没有时间来实际重写代码。电源优化和TRIG优化实际上是变相同样的事情!在Trig优化是应用于复杂的数字功率优化的版本。更重要的是,该行
double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);
是复数平方根操作的一部分。这让我觉得,这个代码的大块实际上可以写入使用复数消除几乎所有的三角函数。我不知道你的复杂数字运算是如何虽然...
其他提示
通常,任何一个实现这一点,并有严重的速度问题,系统是不会做随机颜色。它会做一些不同的颜色。即使全不同颜色的巨人的形象通常将只有几千元的颜色。我非常强烈推荐一个缓存算法。但如果速度是你应该卷起关注你自己的(你要只图元,速度)。
没有太多的优化与实际颜色距离例程本身可以做到,但我写了一个缓存系统,为这件事和它去的快100倍的数量级。距离常规从铺天盖地的主导因素去昙花一现。你不应该设法减少的速度。你可能会伊克了一些东西。但是,适当降低的时候,你调用的东西的数量。
您有两个集的输入和它非常非常长的时间之后,以便产生一组输出,并执行。每缓存索引7个双打。这是14个字节。对于一个14兆的内存占用(或左右,忽略哈希或什么不是,可能我们在说双)。您可以存储一百万条目,这就够了,如果你有一个像1K典型不同的颜色,你会得到较高的90%的高速缓存命中。你甚至可以减少巨大此,如果你从RGB转换您最初的色彩实验室(这些转换应该被缓存太)。你会看到一个速度,如果你喜欢打的5%的时间。你会得到命中时可能99%(除非你是奇做一些像随机颜色比较)。从我的观察它使CIEDE2000花费相当多关于时间欧几里德RGB相同。