Estrapolando i coefficienti GLM per il prodotto dell'anno un è stato venduto in anni futuri?

https://datascience.stackexchange.com/questions/1024

16-10-2019
|

Domanda

Ho montare un GLM (Poisson) per un insieme di dati in cui una delle variabili è categorico per l'anno un cliente ha acquistato un prodotto della mia compagnia, che vanno dal 1999 al 2012. C'è una tendenza lineare dei coefficienti per il valori della variabile come l'anno di vendita aumenta.

C'è qualche problema con il tentativo di migliorare le previsioni per il 2013 e forse 2014 estrapolando per ottenere i coefficienti di quegli anni?

Soluzione

Credo che questo sia un caso per l'applicazione di analisi di serie temporali , in particolare previsione delle serie temporali ( http://en.wikipedia.org/wiki/Time_series ). Prendere in considerazione le seguenti risorse sul serie temporali di regressione :

http://www.wiley.com/WileyCDA/WileyTitle/productCd- 0471363553.html
http://www.stats.uwo.ca/faculty/ mirare / tsar / tsar.pdf (specialmente sezione 4.6)
http://arxiv.org/abs/0802.0219 (bayesiano)

Altri suggerimenti

Se si sospetta che la vostra risposta è lineare con l'anno, poi mettere anno in come termine numerico nel modello piuttosto che un categorica.

L'estrapolazione è quindi perfettamente valido sulla base delle solite ipotesi della famiglia GLM. Assicurati di ottenere in modo corretto gli errori sulle vostre stime estrapolate.

Proprio estrapolando i parametri da una variabile categoriale è sbagliato per una serie di motivi. Il primo mi viene in mente è che ci possono essere più osservazioni di alcuni anni rispetto ad altri, in modo che qualsiasi necessità estrapolazione lineare del peso stime coloro anno di più. Basta eyeballing una linea - o anche il montaggio di una linea per i coefficienti - non lo farà.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange