Domanda

Si consideri un reparto vendite, che fissa un obiettivo di vendita per ogni giorno. L'obiettivo complessivo non è importante, ma l'eccedenza o il minorenne è. Per esempio, se Lunedi di settimana 1 ha un obiettivo di 50 e vendiamo 60, quel giorno ottiene un punteggio di 10. Martedì scorso, il nostro obiettivo è 48 e vendiamo 46 per un punteggio di -2. Alla fine della settimana, segniamo settimana in questo modo:

[0,0]=10,[0,1]=-2,[0,2]=1,[0,3]=7,[0,4]=6

In questo esempio, sia Lunedi (0,0) e Giovedi e Venerdì (0,3 e 0,4) sono "caldo"

Se guardiamo i risultati di settimana 2, vediamo:

[1,0]=-4,[1,1]=2,[1,2]=-1,[1,3]=4,[1,4]=5

Per la settimana 2, la fine della settimana è caldo, e Martedì è caldo.

Quindi, se confrontiamo le settimane uno e due, vediamo che la fine della settimana tende ad essere migliore rispetto alla prima parte della settimana. Così, ora aggiungiamo settimane 3 e 4:

[0,0]=10,[0,1]=-2,[0,2]=1,[0,3]=7,[0,4]=6
[1,0]=-4,[1,1]=2,[1,2]=-1,[1,3]=4,[1,4]=5
[2,0]=-8,[2,1]=-2,[2,2]=-1,[2,3]=2,[2,4]=3
[3,0]=2,[3,1]=3,[3,2]=4,[3,3]=7,[3,4]=9

Da questo, vediamo che la fine della settimana è migliore teoria è vero. Ma vediamo anche che fine del mese è meglio che l'inizio. Naturalmente, vorremmo confrontare prossimo questo mese con il mese prossimo, o confrontare un gruppo di mesi per i risultati trimestrali o annuali.

Non sono un ragazzo matematica o statistiche, ma sono abbastanza sicuro che ci sono algoritmi progettati per questo tipo di problema. Dal momento che non ho uno sfondo di matematica (e non ricordo alcun algebra dai miei giorni precedenti), dove dovrei cercare aiuto? Questo tipo di logica "hotspot" ha un nome? Ci sono formule o algoritmi che possono Tagliate a dadi e confrontare array multidimensionali?

Qualsiasi aiuto, puntatori o consiglio è apprezzato!

È stato utile?

Soluzione

Questi dati in realtà non è multidimensionale, è solo una serie di tempo semplice, e ci sono molti modi di analizzarlo. Io suggerirei di iniziare con il Fourier Transform , rileva "ritmi" di una serie, così questi dati avrebbe mostrato un picco a 7 giorni, e anche una trentina, e se si ha esteso il set di dati da pochi anni avrebbe mostrato un picco di un anno per le stagioni ei giorni festivi. Questo dovrebbe tenervi impegnati per un po ', fino a quando si è pronti a utilizzare i dati reali multidimensionali, ad esempio con l'aggiunta di informazioni meteo, dati del mercato azionario, i risultati degli ultimi eventi sportivi e così via.

Altri suggerimenti

Il seguente potrebbe essere relativo al sistema: oscillatori stocastici in analisi tecnica, che vengono utilizzati per determinare se un titolo è stato ipercomprato o ipervenduto.

Sono qui semplificare eccessivamente, ma essenzialmente si dispone di due calcoli in movimento:

  • 14 giorni stocastico: 100 * (prezzo di chiusura di oggi - basso degli ultimi 14 giorni) / (alto degli ultimi 14 giorni - basso degli ultimi 14 giorni)
  • 3 giorni stocastico: stesso calcolo, ma rispetto a 3 giorni
  • .

I stocastico 14 giorni e 3 giorni avranno la tendenza a seguire la stessa curva. I vostri stocastico cadrà da qualche parte tra 1.0 e 0.0; stocastico sopra 0,8 sono considerati ipercomprato o ribassista sotto di 0,2 indica ipervenduto o ribassista. Più in particolare, quando il vostro 3 giorni stocastico "incrocia" i 14 giorni stocastico in una di quelle regioni, si ha predittore di slancio dei prezzi.

Anche se alcune persone considerano l'analisi tecnica per essere voodoo, evidenza empirica indica che ha qualche potere predittivo. Per quello che il suo valore, uno stocastico è un modo molto semplice ed efficace per visualizzare la quantità di moto di prezzi nel corso del tempo.

Mi sembra che un OLAP approccio (come le tabelle pivot in MS Excel) in forma il problema perfettamente.

Che cosa si vuole fare è abbastanza semplice - basta calcolare le href="http://en.wikipedia.org/wiki/Autocorrelation" autocorrelazione di i dati e guardare il correlogramma . Dal correlogramma è possibile vedere i periodi 'nascosti' dei dati e quindi è possibile utilizzare queste informazioni per analizzare i periodi.

Ecco il risultato - i numeri e la loro autocorrelazione normalizzato

.
10    1,000
-2    0,097
 1   -0,121
 7    0,084
 6    0,098
-4    0,154
 2   -0,082
-1   -0,550
 4   -0,341
 5   -0,027
-8   -0,165
-2   -0,212
-1   -0,555
 2   -0,426
 3   -0,279
 2    0,195
 3    0,000
 4   -0,795
 7   -1,000
 9  

ho usato Excel per ottenere i valori. Ma la sequenza nella colonna A e aggiungere il =CORREL($A$1:$A$20;$A1:$A20) equazione per B1 cellulare e copiarlo poi fino a B19. Se si aggiunge la linea di un diagramma, si può ben vedere la struttura dei dati.

Si può già fare ipotesi ragionevoli sui periodi di modelli - si sta guardando le cose come settimanale e mensile. Per cercare i modelli settimanali, per esempio, appena nella media tutti i lunedì insieme e così via. Lo stesso vale per i giorni del mese, per i mesi dell'anno.

Certo, si potrebbe utilizzare un complesso algoritmo per scoprire che c'è un modello settimanale, ma si sa già aspettarsi che. Se pensate che ci possa essere davvero modelli sepolto che non avresti mai sospetta (c'è una strana comunità di persone che fanno uso di una settimana di 5 giorni e frequente il vostro business), con tutti i mezzi, utilizzare uno strumento forte - ma se si sa che tipo di cose da cercare, non c'è davvero alcun bisogno.

Daniel ha l'idea giusta quando ha suggerito di correlazione, ma non credo di autocorrelazione è ciò che si desidera. Invece vorrei suggerire correlando ogni settimana con l'altra settimana. Picchi nel vostro correlazione - cioè valori prossimi a 1 - suggeriscono che i valori delle settimane si rassomigliano (cioè sono peiodic) per quel particolare passaggio

.

Per esempio, quando si attraversa correlare

0 0 1 2 0 0

con

0 0 0 1 1 0

il risultato sarebbe stato

 2 0 0 1 3 0

il valore più alto è 3, che corrisponde a spostamento (destra) il secondo array 4

0 0 0 1 1 0 -->  0 0 1 1 0 0

e thenn moltiplicando componente saggio

0   0   1   2   0   0
0   0   1   1   0   0
----------------------
0 + 0 + 1 + 2 + 0 + 0 = 3

Si noti che quando si correlare è possibile creare il proprio "falso" settimana e cross-correlato tutte le vostre reali settimane, l'idea è che siete alla ricerca di "forme" dei vostri valori settimanali che corrispondono alla forma della vostra settimana falso con la ricerca di picchi nel risultato di correlazione.

Quindi, se siete interessati a trovare settimane che sono vicini vicino alla fine della settimana è possibile utilizzare la settimana "falso"

 -1 -1 -1 -1  1  1

e se si ottiene una elevata risposta nel primo valore della correlazione questo significa che la settimana reale che si correlato con ha circa questa forma.

Questa è probabilmente oltre la portata di quello che stai cercando, ma un approccio tecnico, che vi darà la possibilità di fare le previsioni, guardare le cose come la significatività statistica, ecc, sarebbe simili modelli Box-Jenkins ARIMA o.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top