この色差関数をさらに最適化するにはどうすればよいですか？

https://stackoverflow.com/questions/3049213

27-09-2019
|

質問

CIEラボカラースペースの色の違いを計算するためにこの関数を作成しましたが、速度がありません。私はJavaの専門家ではないので、ここで速度を向上させることができるJavaの第一人者がいくつかのヒントを持っているのだろうかと思います。

コードは、コメントブロックに記載されているMATLAB関数に基づいています。

/**
 * Compute the CIEDE2000 color-difference between the sample color with
 * CIELab coordinates 'sample' and a standard color with CIELab coordinates
 * 'std'
 *
 * Based on the article:
 * "The CIEDE2000 Color-Difference Formula: Implementation Notes,
 * Supplementary Test Data, and Mathematical Observations,", G. Sharma,
 * W. Wu, E. N. Dalal, submitted to Color Research and Application,
 * January 2004.
 * available at http://www.ece.rochester.edu/~gsharma/ciede2000/
 */
public static double deltaE2000(double[] lab1, double[] lab2)
{
    double L1 = lab1[0];
    double a1 = lab1[1];
    double b1 = lab1[2];

    double L2 = lab2[0];
    double a2 = lab2[1];
    double b2 = lab2[2];

    // Cab = sqrt(a^2 + b^2)
    double Cab1 = Math.sqrt(a1 * a1 + b1 * b1);
    double Cab2 = Math.sqrt(a2 * a2 + b2 * b2);

    // CabAvg = (Cab1 + Cab2) / 2
    double CabAvg = (Cab1 + Cab2) / 2;

    // G = 1 + (1 - sqrt((CabAvg^7) / (CabAvg^7 + 25^7))) / 2
    double CabAvg7 = Math.pow(CabAvg, 7);
    double G = 1 + (1 - Math.sqrt(CabAvg7 / (CabAvg7 + 6103515625.0))) / 2;

    // ap = G * a
    double ap1 = G * a1;
    double ap2 = G * a2;

    // Cp = sqrt(ap^2 + b^2)
    double Cp1 = Math.sqrt(ap1 * ap1 + b1 * b1);
    double Cp2 = Math.sqrt(ap2 * ap2 + b2 * b2);

    // CpProd = (Cp1 * Cp2)
    double CpProd = Cp1 * Cp2;

    // hp1 = atan2(b1, ap1)
    double hp1 = Math.atan2(b1, ap1);
    // ensure hue is between 0 and 2pi
    if (hp1 < 0) {
        // hp1 = hp1 + 2pi
        hp1 += 6.283185307179586476925286766559;
    }

    // hp2 = atan2(b2, ap2)
    double hp2 = Math.atan2(b2, ap2);
    // ensure hue is between 0 and 2pi
    if (hp2 < 0) {
        // hp2 = hp2 + 2pi
        hp2 += 6.283185307179586476925286766559;
    }

    // dL = L2 - L1
    double dL = L2 - L1;

    // dC = Cp2 - Cp1
    double dC = Cp2 - Cp1;

    // computation of hue difference
    double dhp = 0.0;
    // set hue difference to zero if the product of chromas is zero
    if (CpProd != 0) {
        // dhp = hp2 - hp1
        dhp = hp2 - hp1;
        if (dhp > Math.PI) {
            // dhp = dhp - 2pi
            dhp -= 6.283185307179586476925286766559;
        } else if (dhp < -Math.PI) {
            // dhp = dhp + 2pi
            dhp += 6.283185307179586476925286766559;
        }
    }

    // dH = 2 * sqrt(CpProd) * sin(dhp / 2)
    double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

    // weighting functions
    // Lp = (L1 + L2) / 2 - 50
    double Lp = (L1 + L2) / 2 - 50;

    // Cp = (Cp1 + Cp2) / 2
    double Cp = (Cp1 + Cp2) / 2;

    // average hue computation
    // hp = (hp1 + hp2) / 2
    double hp = (hp1 + hp2) / 2;

    // identify positions for which abs hue diff exceeds 180 degrees
    if (Math.abs(hp1 - hp2) > Math.PI) {
        // hp = hp - pi
        hp -= Math.PI;
    }
    // ensure hue is between 0 and 2pi
    if (hp < 0) {
        // hp = hp + 2pi
        hp += 6.283185307179586476925286766559;
    }

    // LpSqr = Lp^2
    double LpSqr = Lp * Lp;

    // Sl = 1 + 0.015 * LpSqr / sqrt(20 + LpSqr)
    double Sl = 1 + 0.015 * LpSqr / Math.sqrt(20 + LpSqr);

    // Sc = 1 + 0.045 * Cp
    double Sc = 1 + 0.045 * Cp;

    // T = 1 - 0.17 * cos(hp - pi / 6) +
    //       + 0.24 * cos(2 * hp) +
    //       + 0.32 * cos(3 * hp + pi / 30) -
    //       - 0.20 * cos(4 * hp - 63 * pi / 180)
    double hphp = hp + hp;
    double T = 1 - 0.17 * Math.cos(hp - 0.52359877559829887307710723054658)
            + 0.24 * Math.cos(hphp)
            + 0.32 * Math.cos(hphp + hp + 0.10471975511965977461542144610932)
            - 0.20 * Math.cos(hphp + hphp - 1.0995574287564276334619251841478);

    // Sh = 1 + 0.015 * Cp * T
    double Sh = 1 + 0.015 * Cp * T;

    // deltaThetaRad = (pi / 3) * e^-(36 / (5 * pi) * hp - 11)^2
    double powerBase = hp - 4.799655442984406;
    double deltaThetaRad = 1.0471975511965977461542144610932 * Math.exp(-5.25249016001879 * powerBase * powerBase);

    // Rc = 2 * sqrt((Cp^7) / (Cp^7 + 25^7))
    double Cp7 = Math.pow(Cp, 7);
    double Rc = 2 * Math.sqrt(Cp7 / (Cp7 + 6103515625.0));

    // RT = -sin(delthetarad) * Rc
    double RT = -Math.sin(deltaThetaRad) * Rc;

    // de00 = sqrt((dL / Sl)^2 + (dC / Sc)^2 + (dH / Sh)^2 + RT * (dC / Sc) * (dH / Sh))
    double dLSl = dL / Sl;
    double dCSc = dC / Sc;
    double dHSh = dH / Sh;
    return Math.sqrt(dLSl * dLSl + dCSc * dCSc + dHSh * dHSh + RT * dCSc * dHSh);
}

解決

cos 特に4つの連続して高価です。あなたはcosを計算しているように見えます（na+b）ここで、bは定数で、nは小整数です。これは、cos（b）とsin（b）を事前に計算し、実行時にcos（hp）とsin（hp）を計算できることを意味します。 cos（na+b）繰り返し使用することにより

cos(a+b) = cos(a)*cos(b)-sin(a)*sin(b)

あなたはいくつか取引するでしょう sin砂 cosいくつかの乗算や追加の場合、ほぼ確実に価値があります。

あなたが野心的に感じているなら、あなたはより良くすることができます。あなたは得ています hp 間接的にanから atan2. 。パターン trig-function(rational-function(inverse-trig-function(x))) トリグ関数よりも評価するのが速い多項式と根の組み合わせに置き換えることができます。

方法がわかりません pow Javaで実装されていますが、ログを使用する場合は、取得する方が良いかもしれません Cp7 使用 Cp2=Cp*Cp;Cp4=Cp2*Cp2;Cp7=Cp4*Cp2*Cp;

更新：実際にコードを書き換える時間がないので、もう少し投機的になります。電力の最適化とトリガー最適化は、実際には変装して同じものです！ Trig Optimizationは、複雑な数値に適用される電力最適化のバージョンです。さらに、ライン

double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

複雑な数の平方根操作の一部です。これにより、このコードの大部分が実際に書かれて、複雑な数字を使用して、ほぼすべてのトリグ関数を排除することができると思います。私はあなたの複雑な数の算術がどのようにあるのかわかりません...

他のヒント

一般に、これを実装し、深刻な速度の問題を抱えるシステムは、ランダムな色を実行することはありません。いくつかの明確な色をします。さまざまな色でいっぱいの巨大な画像でさえ、通常、数千色しか持てません。キャッシュアルゴリズムを非常に強くお勧めします。ただし、速度が懸念事項である場合は、自分でロールアップする必要があります（プリミティブのみ、速度が必要です）。

実際の色の距離ルーチン自体を使用することはあまり最適化されていませんが、私はこのことのためにキャッシュシステムを書き、100倍速く順序で進みました。距離ルーチンは、圧倒的な支配的な要因からブリップになりました。その速度を下げようとしないでください。あなたは何かを吐き出すかもしれません。しかし、あなたが物を適切に呼び出す回数を減らします。

2つのセット入力があり、単一のセット出力を生成し、非常に長い時間を経てそれを行います。キャッシングインデックスごとに7倍。それは14バイトです。 14メグのメモリフットプリントの場合（または、ハッシュなどを無視するなど、おそらく二重に話している可能性が高い）。 100万のエントリを保存できますが、1Kの典型的な異なる色があれば、90％のキャッシュヒットが高くなることがあります。 RGBからラボに初期色を変換する場合は、これを大幅に減らすこともできます（これらの変換もキャッシュする必要があります）。 5％の時間のようにヒットした場合、スピードが上昇します。そして、あなたはおそらく99％の時間のヒットを得るでしょう（あなたがランダムな色の比較のような奇妙な何かをしていない限り）。私の観察から、Ciede2000はユークリッドRGBとほぼ同じ時間を取るようになります。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow