fminsearch em R é pior do que no Matlab
-
21-12-2019 - |
Pergunta
Não é o meu de dados (x e y colunas são relevantes):https://www.dropbox.com/s/b61a7enhoa0p57p/Simple1.csv
O que eu preciso é para ajustar os dados com a polilinha.Matlab código que faz isso é:
spline_fit.m:
function [score, params] = spline_fit (points, x, y)
min_f = min(x)-1;
max_f = max(x);
points = [min_f points max_f];
params = zeros(length(points)-1, 2);
score = 0;
for i = 1:length(points)-1
in = (x > points(i)) & (x <= points(i+1));
if sum(in) > 2
p = polyfit(x(in), y(in), 1);
pred = p(1)*x(in) + p(2);
score = score + norm(pred - y(in));
params(i, :) = p;
else
params(i, :) = nan;
end
end
test.m:
%Find the parameters
r = [100,250,400];
p = fminsearch('spline_fit', r, [], x, y)
[score, param] = spline_fit(p, x, y)
%Plot the result
y1 = zeros(size(x));
p1 = [-inf, p, inf];
for i = 1:size(param, 1)
in = (x > p1(i)) & (x <= p1(i+1));
y1(in) = x(in)*param(i,1) + param(i,2);
end
[x1, I] = sort(x);
y1 = y1(I);
plot(x,y,'x',x1,y1,'k','LineWidth', 2)
E isso não funciona bem, a produzir seguinte otimização:[102.9842, 191.0006, 421.9912]
Eu já implementou a mesma idéia em R:
library(pracma);
spline_fit <- function(x, xx, yy) {
min_f = min(xx)-1;
max_f = max(xx);
points = c(min_f, x, max_f)
params = array(0, c(length(points)-1, 2));
score = 0;
for( i in 1:length(points)-1)
{
inn <- (xx > points[i]) & (xx <= points[i+1]);
if (sum(inn) > 2)
{
p <- polyfit(xx[inn], yy[inn], 1);
pred <- p[1]*xx[inn] + p[2];
score <- score + norm(as.matrix(pred - yy[inn]),"F");
params[i,] <- p;
}
else
params[i,] <- NA;
}
score
}
Mas eu fico muito maus resultados:
> fminsearch(spline_fit,c(100,250,400), xx = Simple1$x, yy = Simple1$y)
$xval
[1] 100.1667 250.0000 400.0000
$fval
[1] 4452.761
$niter
[1] 2
Como você pode ver, ele pára após 2 iterações e não produzir bons pontos.
Eu vou ser muito feliz para qualquer ajuda na resolução deste problema.
Também, se alguém sabe como implementar isso em C# usando qualquer biblioteca livre, que será ainda melhor.Eu sei onde será feita obter polyfit, mas não fminsearch.
Solução
O problema aqui é que a probabilidade de superfície é muito mal comportado -- há vários valores mínimos e descontínuo de saltos-que vai fazer os resultados que você obter com diferentes otimizadores de quase arbitrária.Eu admito que o MATLAB é otimizadores são extremamente robusto, mas eu diria que é praticamente uma questão de sorte (e de onde) se um otimizador vai ficar para o mínimo global para este caso, a menos que você use alguma forma de estocástico de otimização global, tais como simulated annealing.
Eu escolhi usar o R built-optimizer (que usa Nelder-Mead por padrão) ao invés de fminsearch
do pracma
pacote.
spline_fit <- function(x, xx = Simple1$x, yy=Simple1$y) {
min_f = min(xx)-1
max_f = max(xx)
points = c(min_f, x, max_f)
params = array(0, c(length(points)-1, 2))
score = 0
for( i in 1:(length(points)-1))
{
inn <- (xx > points[i]) & (xx <= points[i+1]);
if (sum(inn) > 2)
{
p <- polyfit(xx[inn], yy[inn], 1);
pred <- p[1]*xx[inn] + p[2];
score <- score + norm(as.matrix(pred - yy[inn]),"F");
params[i,] <- p;
}
else
params[i,] <- NA;
}
score
}
library(pracma) ## for polyfit
Simple1 <- read.csv("Simple1.csv")
opt1 <- optim(fn=spline_fit,c(100,250,400), xx = Simple1$x, yy = Simple1$y)
## [1] 102.4365 201.5835 422.2503
Isso é melhor do que o fminsearch
os resultados, mas ainda diferente do MATLAB resultados, e pior do que eles:
## Matlab results:
matlab_fit <- c(102.9842, 191.0006, 421.9912)
spline_fit(matlab_fit, xx = Simple1$x, yy = Simple1$y)
## 3724.3
opt1$val
## 3755.5 (worse)
O bbmle
o pacote oferece um experimental e não muito bem documentado, conjunto de ferramentas para explorar a otimização de superfícies:
library(bbmle)
ss <- slice2D(fun=spline_fit,opt1$par,nt=51)
library(lattice)
Um 2D "fatia" de todo o optim
-parâmetros estimados.Os círculos mostram o optim ajuste (sólido) e o valor mínimo dentro de cada fatia (abrir).
png("splom1.png")
print(splom(ss))
dev.off()
Uma 'fatia' entre o matlab e optim se encaixa mostra que a superfície é bastante acidentada:
ss2 <- bbmle:::slicetrans(matlab_fit,opt1$par,spline_fit)
png("slice1.png")
print(plot(ss2))
dev.off()