Вычисление собственного вектора с использованием OpenCV
-
13-09-2019 - |
Вопрос
У меня есть эта матрица A, представляющая сходство интенсивностей пикселей изображения.Например:Рассмотрим 10 x 10
изображение.Матрица A в этом случае имела бы размерность 100 x 100
, и элемент A (i, j) имел бы значение в диапазоне от 0 до 1, представляющее сходство пикселя i с j с точки зрения интенсивности.
Я использую OpenCV для обработки изображений, а среда разработки - C в Linux.
Цель состоит в том, чтобы вычислить собственные векторы матрицы A, и я использовал следующий подход:
static CvMat mat, *eigenVec, *eigenVal;
static double A[100][100]={}, Ain1D[10000]={};
int cnt=0;
//Converting matrix A into a one dimensional array
//Reason: That is how cvMat requires it
for(i = 0;i < affnDim;i++){
for(j = 0;j < affnDim;j++){
Ain1D[cnt++] = A[i][j];
}
}
mat = cvMat(100, 100, CV_32FC1, Ain1D);
cvEigenVV(&mat, eigenVec, eigenVal, 1e-300);
for(i=0;i < 100;i++){
val1 = cvmGet(eigenVal,i,0); //Fetching Eigen Value
for(j=0;j < 100;j++){
matX[i][j] = cvmGet(eigenVec,i,j); //Fetching each component of Eigenvector i
}
}
Проблема: После выполнения я получаю, что почти все компоненты всех собственных векторов равны нулю.Я пробовал разные изображения, а также пытался заполнить A случайными значениями от 0 до 1, но результат был тот же.
Некоторые из возвращенных верхних собственных значений выглядят следующим образом:
9805401476911479666115491135488.000000
-9805401476911479666115491135488.000000
-89222871725331592641813413888.000000
89222862280598626902522986496.000000
5255391142666987110400.000000
Сейчас я размышляю о том, как использовать cvSVD() который выполняет разложение по сингулярным значениям реальной матрицы с плавающей запятой и может дать мне собственные векторы.Но перед этим я подумал о том, чтобы задать этот вопрос здесь.Есть ли что-то абсурдное в моем нынешнем подходе?Использую ли я правильный API, т.е. cvEigenVV() для правильной входной матрицы (моя матрица A является матрицей с плавающей запятой)?
ваше здоровье
Решение
Примечание для читателей:Этот пост на первый взгляд может показаться не имеющим отношения к теме, но, пожалуйста, обратитесь к обсуждению в комментариях выше.
Ниже приведена моя попытка реализовать Спектральная кластеризация алгоритм, применяемый к пикселям изображения в MATLAB.Я в точности следовал бумага упомянуто @Andriyev:
Эндрю Нг, Майкл Джордан и Яир Вайс (2002).О спектральной кластеризации:анализ и алгоритм.В T.Диттерих, С.Беккер и З.Гахрамани (Ред.), Достижения в области нейронных систем обработки информации 14.MIT Press
Код:
%# parameters to tune
SIGMA = 2e-3; %# controls Gaussian kernel width
NUM_CLUSTERS = 4; %# specify number of clusters
%% Loading and preparing a sample image
%# read RGB image, and make it smaller for fast processing
I0 = im2double(imread('house.png'));
I0 = imresize(I0, 0.1);
[r,c,~] = size(I0);
%# reshape into one row per-pixel: r*c-by-3
%# (with pixels traversed in columwise-order)
I = reshape(I0, [r*c 3]);
%% 1) Compute affinity matrix
%# for each pair of pixels, apply a Gaussian kernel
%# to obtain a measure of similarity
A = exp(-SIGMA * squareform(pdist(I,'euclidean')).^2);
%# and we plot the matrix obtained
imagesc(A)
axis xy; colorbar; colormap(hot)
%% 2) Compute the Laplacian matrix L
D = diag( 1 ./ sqrt(sum(A,2)) );
L = D*A*D;
%% 3) perform an eigen decomposition of the laplacian marix L
[V,d] = eig(L);
%# Sort the eigenvalues and the eigenvectors in descending order.
[d,order] = sort(real(diag(d)), 'descend');
V = V(:,order);
%# kepp only the largest k eigenvectors
%# In this case 4 vectors are enough to explain 99.999% of the variance
NUM_VECTORS = sum(cumsum(d)./sum(d) < 0.99999) + 1;
V = V(:, 1:NUM_VECTORS);
%% 4) renormalize rows of V to unit length
VV = bsxfun(@rdivide, V, sqrt(sum(V.^2,2)));
%% 5) cluster rows of VV using K-Means
opts = statset('MaxIter',100, 'Display','iter');
[clustIDX,clusters] = kmeans(VV, NUM_CLUSTERS, 'options',opts, ...
'distance','sqEuclidean', 'EmptyAction','singleton');
%% 6) assign pixels to cluster and show the results
%# assign for each pixel the color of the cluster it belongs to
clr = lines(NUM_CLUSTERS);
J = reshape(clr(clustIDX,:), [r c 3]);
%# show results
figure('Name',sprintf('Clustering into K=%d clusters',NUM_CLUSTERS))
subplot(121), imshow(I0), title('original image')
subplot(122), imshow(J), title({'clustered pixels' '(color-coded classes)'})
...и, используя простое изображение дома, которое я нарисовал краской, результаты были следующими:
и, кстати, первыми 4 использованными собственными значениями были:
1.0000
0.0014
0.0004
0.0002
и соответствующие собственные векторы [столбцы длины r*c=400]:
-0.0500 0.0572 -0.0112 -0.0200
-0.0500 0.0553 0.0275 0.0135
-0.0500 0.0560 0.0130 0.0009
-0.0500 0.0572 -0.0122 -0.0209
-0.0500 0.0570 -0.0101 -0.0191
-0.0500 0.0562 -0.0094 -0.0184
......
Обратите внимание, что выше выполнен шаг, о котором вы не упомянули в своем вопросе (матрица Лапласа и нормализация ее строк)
Другие советы
Я бы порекомендовал это статья.Автор реализует Eigenfaces для распознавания лиц.На странице 4 вы можете видеть, что он использует cvCalcEigenObjects для генерации собственных векторов из изображения.В статье показан весь этап предварительной обработки, необходимый для этих вычислений.
Вот не очень полезный ответ:
Что теория (или математические расчеты, записанные на листе бумаги) говорит вам, какими должны быть собственные векторы?Примерно.
Что говорит вам другая библиотека о том, какими должны быть собственные векторы?Что в идеале говорит вам такая система, как Mathematica или Maple (которую можно убедить выполнять вычисления с произвольной точностью), какими должны быть собственные векторы?Если не для производственной проблемы, то хотя бы для тестовой.
Я не эксперт в обработке изображений, поэтому не могу быть более полезным, но я провожу много времени с учеными, и опыт научил меня, что многих слез и гнева можно избежать, если сначала выполнить некоторые математические расчеты и сформировать ожидание того, какие результаты вы должны получить, прежде чем задаваться вопросом, почему у вас повсюду 0.Конечно, это может быть ошибка в реализации алгоритма, потеря точности или какая-то другая числовая проблема.Но вы пока не знаете и не должны следить за этими направлениями расследования.
С уважением
Отметка