Как я могу провести регрессионный анализ в Sage?
Вопрос
Я безуспешно пытался это сделать:
find_fit(data, quadratic_residues)
Я пытаюсь найти наиболее подходящий вариант для данных о расходе воды: http://dl.getdropbox.com/u/175564/rate.png
---редактировать после комментария---
Новый кодекс:
var('x')
model(x) = x**2
find_fit((xlist, reqlist), model)
Сообщение об ошибке:
Traceback (click to the left for traceback)
...
TypeError: data has to be a list of lists, a matrix, or a numpy array
---редактировать
Сообщение об ошибке теперь:
Traceback (click to the left for traceback)
...
ValueError: each row of data needs 2 entries, only 5 entries given
Здесь то же самое, что и на картинке:http://dl.getdropbox.com/u/175564/sage.png
Решение
mydata = [[1,3],[2,7],[3,13],[4,24]]
var('a,b,c')
mymodel(x) = a*x^2 + b*x + c
myfit = find_fit(mydata,mymodel,solution_dict=True)
points(mydata,color='purple') + plot(
mymodel(
a=myfit[a],
b=myfit[b],
c=myfit[c]
),
(x,0,4,),
color='red'
)
Другие советы
Я думаю, ваша проблема в том, что quadratic_residues, вероятно, означает не то, что вы думаете.Если вы пытаетесь подобрать наилучшую квадратичную модель, я думаю, вы хотите сделать что-то вроде.
var('a, b, c, x')
model(x) = a*x*x + b*x + c
find_fit(data, model)
Попробовав использовать Стивен его пример, я также столкнулся с ошибкой:
ValueError: each row of data needs 5 entries, only 2 entries given
Вот более наглядный пример, который я протестировал для работы в sage 4.7.
sage: l=[4*i^2+7*i+134+random() for i in xrange(100)]
sage: var('a,b,c,x')
(a, b, c, x)
sage: model=a*x^2+b*x+c
sage: find_fit(zip(xrange(100),l),model,variables=[x])
[a == 4.0000723084513217, b == 6.9904742307159697, c == 134.74698715254667]
Очевидно, вам нужны переменные =[x], чтобы сообщить sage, какая из a, b, c и x соответствует переменной в вашей модели.