Domanda

I eseguita un'analisi di regressione con due set di dati, ciascuno dei quali ha 50 dimensioni. Un set di dati è chiamato Spatial % e l'altro Min values, e ho voluto verificare se i due sono correlati. Ho fatto l'analisi SPSS e il grafico a dispersione risultante è la seguente:

entrare descrizione dell'immagine qui

Non sono molto esperto, ma mi sembra che una linea non è la misura perfetta per questo grafico a dispersione. Sarebbe una linea elettrica in forma migliore? O che altro suggerisci?

È stato utile?

Soluzione

Ho cercato di stimare alcuni dei vostri valori dei dati dal grafico a dispersione che hai fornito.

Poi ho eseguito un modello di potere di regressione e si avvicinò con

$ y = (5,777 \ cdot 10 ^ {- 16}). \ Cdot 1.404 ^ {x} $

Grafico del modello

I valori stimati che ho usato sono al di sotto.

$ (70, 0,01), (75, 0.012), (80, 0.015), (90, 0.025), (95, 0.075), (98, 0,15), (99, 0.20), (99.5, 0.25 ), (99.9, 0.32) $

Naturalmente, il vostro modello attuale sarà diverso perché avete il set di dati effettivi. Ho appena eyeballed alcuni punti in modo da poter testare la forma di potere.

Altri suggerimenti

Regressione lineare non è una forma piacevole per questo problema.

regressione non lineare, come @jamesmf suggerito, può essere una buona opzione.

Ma, questo appare come una bella forma per esponenziale regressione .

Il grafico di regressione esponenziale simile a questa:

entrare descrizione dell'immagine qui

Quindi, regolare i parametri in base alle proprie dati dovrebbe andare bene.


Il Box-Cox trasformazione può essere utilizzato anche per il montaggio della trama .

Ho preso un set di dati di esempio, e dotato di una trasformazione di Box-Plot, con parametri rilevanti per trasformarla a guardare un po 'come la trama di dati:

entrare descrizione dell'immagine qui

Ci scusiamo per il rumore, in quanto è un'implementazione veloce e sporco. Ma, sì un Box Cox trasformazione dovrebbe anche essere un bel modo di forma.

Codice R per la trama di cui sopra:

lambda = +9.6 
plot(BoxCox(elec, lambda))

elet è un set di dati di esempio.

Hai ragione, una regressione lineare di base è improbabile per adattare questi dati. Avete bisogno di una qualche forma di regressione non lineare.

forme di base di questo (tra cui regressione esponenziale, menzionati da @ Dawny33) può essere trovata nella maggior parte dei fogli di calcolo, tra cui Excel. Pacchetti come scikit imparano e altri vi permetterà una maggiore flessibilità.

ho il sospetto che il vostro $ X $ valori, in quanto sono le percentuali, si trovano in $ [0100 [$. Per quanto riguarda i valori $ $ y, sembrano positivi. Ma molti sono molto vicino a $ 0 $. Quindi mi sento di primo decidere se $ y $ s di sotto di una soglia dovrebbe essere messo da parte prima come valori anomali, come avranno una grande influenza sui primi attacchi di base. È possibile reintrodurre in seguito con le procedure di montaggio robusti.

Una domanda importante è: sono $ y $ S delimitata o no? La pista sembra molto ripida, quindi bisogna indovinare se il derivato è infinita a $ x = 100 $, per aiutarvi a scegliere modelli.

Credo che una prima idea è quella di realizzare un cambiamento di variabile sul $ x $ asse, con $ x'= \ frac {1} {{(100-x)} ^ \ alpha} $ e provare alcuni $ \ alpha $ valori, per vedere se appaiono i modelli più chiare.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top