Как я могу дополнительно оптимизировать эту разницу в цвете?

StackOverflow https://stackoverflow.com/questions/3049213

Вопрос

Я сделал эту функцию для расчета цветных различий в лаборатории CIE, но ему не хватает скорости. Так как я не эксперт Java, мне интересно, есть ли у Java Guru есть несколько советов, которые могут улучшить скорость здесь.

Код основан на функции MATLAB, упомянутой в блоке комментариев.

/**
 * Compute the CIEDE2000 color-difference between the sample color with
 * CIELab coordinates 'sample' and a standard color with CIELab coordinates
 * 'std'
 *
 * Based on the article:
 * "The CIEDE2000 Color-Difference Formula: Implementation Notes,
 * Supplementary Test Data, and Mathematical Observations,", G. Sharma,
 * W. Wu, E. N. Dalal, submitted to Color Research and Application,
 * January 2004.
 * available at http://www.ece.rochester.edu/~gsharma/ciede2000/
 */
public static double deltaE2000(double[] lab1, double[] lab2)
{
    double L1 = lab1[0];
    double a1 = lab1[1];
    double b1 = lab1[2];

    double L2 = lab2[0];
    double a2 = lab2[1];
    double b2 = lab2[2];

    // Cab = sqrt(a^2 + b^2)
    double Cab1 = Math.sqrt(a1 * a1 + b1 * b1);
    double Cab2 = Math.sqrt(a2 * a2 + b2 * b2);

    // CabAvg = (Cab1 + Cab2) / 2
    double CabAvg = (Cab1 + Cab2) / 2;

    // G = 1 + (1 - sqrt((CabAvg^7) / (CabAvg^7 + 25^7))) / 2
    double CabAvg7 = Math.pow(CabAvg, 7);
    double G = 1 + (1 - Math.sqrt(CabAvg7 / (CabAvg7 + 6103515625.0))) / 2;

    // ap = G * a
    double ap1 = G * a1;
    double ap2 = G * a2;

    // Cp = sqrt(ap^2 + b^2)
    double Cp1 = Math.sqrt(ap1 * ap1 + b1 * b1);
    double Cp2 = Math.sqrt(ap2 * ap2 + b2 * b2);

    // CpProd = (Cp1 * Cp2)
    double CpProd = Cp1 * Cp2;

    // hp1 = atan2(b1, ap1)
    double hp1 = Math.atan2(b1, ap1);
    // ensure hue is between 0 and 2pi
    if (hp1 < 0) {
        // hp1 = hp1 + 2pi
        hp1 += 6.283185307179586476925286766559;
    }

    // hp2 = atan2(b2, ap2)
    double hp2 = Math.atan2(b2, ap2);
    // ensure hue is between 0 and 2pi
    if (hp2 < 0) {
        // hp2 = hp2 + 2pi
        hp2 += 6.283185307179586476925286766559;
    }

    // dL = L2 - L1
    double dL = L2 - L1;

    // dC = Cp2 - Cp1
    double dC = Cp2 - Cp1;

    // computation of hue difference
    double dhp = 0.0;
    // set hue difference to zero if the product of chromas is zero
    if (CpProd != 0) {
        // dhp = hp2 - hp1
        dhp = hp2 - hp1;
        if (dhp > Math.PI) {
            // dhp = dhp - 2pi
            dhp -= 6.283185307179586476925286766559;
        } else if (dhp < -Math.PI) {
            // dhp = dhp + 2pi
            dhp += 6.283185307179586476925286766559;
        }
    }

    // dH = 2 * sqrt(CpProd) * sin(dhp / 2)
    double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

    // weighting functions
    // Lp = (L1 + L2) / 2 - 50
    double Lp = (L1 + L2) / 2 - 50;

    // Cp = (Cp1 + Cp2) / 2
    double Cp = (Cp1 + Cp2) / 2;

    // average hue computation
    // hp = (hp1 + hp2) / 2
    double hp = (hp1 + hp2) / 2;

    // identify positions for which abs hue diff exceeds 180 degrees
    if (Math.abs(hp1 - hp2) > Math.PI) {
        // hp = hp - pi
        hp -= Math.PI;
    }
    // ensure hue is between 0 and 2pi
    if (hp < 0) {
        // hp = hp + 2pi
        hp += 6.283185307179586476925286766559;
    }

    // LpSqr = Lp^2
    double LpSqr = Lp * Lp;

    // Sl = 1 + 0.015 * LpSqr / sqrt(20 + LpSqr)
    double Sl = 1 + 0.015 * LpSqr / Math.sqrt(20 + LpSqr);

    // Sc = 1 + 0.045 * Cp
    double Sc = 1 + 0.045 * Cp;

    // T = 1 - 0.17 * cos(hp - pi / 6) +
    //       + 0.24 * cos(2 * hp) +
    //       + 0.32 * cos(3 * hp + pi / 30) -
    //       - 0.20 * cos(4 * hp - 63 * pi / 180)
    double hphp = hp + hp;
    double T = 1 - 0.17 * Math.cos(hp - 0.52359877559829887307710723054658)
            + 0.24 * Math.cos(hphp)
            + 0.32 * Math.cos(hphp + hp + 0.10471975511965977461542144610932)
            - 0.20 * Math.cos(hphp + hphp - 1.0995574287564276334619251841478);

    // Sh = 1 + 0.015 * Cp * T
    double Sh = 1 + 0.015 * Cp * T;

    // deltaThetaRad = (pi / 3) * e^-(36 / (5 * pi) * hp - 11)^2
    double powerBase = hp - 4.799655442984406;
    double deltaThetaRad = 1.0471975511965977461542144610932 * Math.exp(-5.25249016001879 * powerBase * powerBase);

    // Rc = 2 * sqrt((Cp^7) / (Cp^7 + 25^7))
    double Cp7 = Math.pow(Cp, 7);
    double Rc = 2 * Math.sqrt(Cp7 / (Cp7 + 6103515625.0));

    // RT = -sin(delthetarad) * Rc
    double RT = -Math.sin(deltaThetaRad) * Rc;

    // de00 = sqrt((dL / Sl)^2 + (dC / Sc)^2 + (dH / Sh)^2 + RT * (dC / Sc) * (dH / Sh))
    double dLSl = dL / Sl;
    double dCSc = dC / Sc;
    double dHSh = dH / Sh;
    return Math.sqrt(dLSl * dLSl + dCSc * dCSc + dHSh * dHSh + RT * dCSc * dHSh);
}
Это было полезно?

Решение

cos дорого, особенно 4 подряд. Вы, кажется, вычисляете COS (NA + B) Где B постоянна, а N - небольшое целое число. Это означает, что вы можете предвкушать COS (B) и SIN (B) и во время выполнения вычислить только COS (HP) и SIN (HP). Вы можете получить COS (NA + B), делая повторное использование

cos(a+b) = cos(a)*cos(b)-sin(a)*sin(b)

Вы будете торгуем пару sinпесок cosS для некоторых мультипликаций и дополнений, почти наверняка стоящих.

Вы можете сделать лучше, если вы чувствуете себя амбициозным. Вы получаете hp косвенно от АН atan2. Отказ Шаблон trig-function(rational-function(inverse-trig-function(x))) Часто можно заменить некоторой комбинацией многочленов и корней, которые быстрее оценивают, чем функции Trig.

Я не знаю, как pow реализован в Java, но если он использует журналы, вам может быть лучше получить Cp7 с использованием Cp2=Cp*Cp;Cp4=Cp2*Cp2;Cp7=Cp4*Cp2*Cp;

Обновление: Получение немного более спекулятивного прямо сейчас, так как у меня нет времени, чтобы фактически переписать код. Оптимизация мощности и оптимизация Trig на самом деле одновременно одинаковы! Оптимизация Trig - это версия оптимизации мощности, примененной к сложным числам. Более того, линия

double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

является частью сложного числа квадратных корневых операций. Это заставляет меня думать, что большой кусок этого кода действительно может быть написан для использования сложных чисел, устраняющих практически все функции Trig. Я не знаю, как твой сложный номер арифметики - это ...

Другие советы

Обычно любая система, которая реализует это и имеет серьезные проблемы скорости, не собирается делать случайные цвета. Это будет делать несколько различных цветов. Даже гигантское изображение, полное разных цветов, обычно будет иметь всего несколько тысяч цветов. Я очень рекомендую алгоритм кэширования. Хотя, если бы скорость вызывает беспокойство, вы должны откатываться от собственного (вы хотите только примитивы, скорость).

Там не так много оптимизации, чтобы быть сделано с самой активной подпрограммой цветовой дистанции, но я написал систему кэширования для этой вещи, и она вышел на порядок в 100 раз быстрее. Дистанционная рутина отправилась от подавляющего доминирующего фактора до блока. Вы не должны стремиться уменьшить скорость этого. Вы можете что-то увидеть. Но уменьшить количество раз, когда вы призываете правильно.

У вас есть два набора входных данных, и он производит один набор выходных и делает это через очень очень долго. 7 удваивается на индекс кэширования. Это 14 байтов. Для площади памяти 14 мэг (или около того, игнорируя хэши или чего нет, скорее всего, мы говорим Двойной). Вы можете хранить миллион записей, и этого достаточно, если у вас есть 1К типичные разные цвета, вы получите высокие 90% S Cache Hits. Вы можете даже чрезвычайно уменьшить это, если вы преобразуете свои начальные цвета из RGB в Lab (эти преобразования должны быть кэшированы тоже). Вы увидите скорость, если вы попали в 5% времени. И вы получите хиты, вероятно, 99% от времени (если вы не делаете нечто странные, такие как случайные сравнения цвета). Из моих наблюдений заставляет Ciede2000 принимать практически столько же, сколько евклидовых РГБ.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top