Domanda

Sto lavorando su un'applicazione distribuzione dei dati che riceve i dati da una fonte e distribuisce i dati in applicazione di destinazione multipla. Dopo aver distribuito con successo diversi messaggi ogni secondo per 8 giorni, mancava un unico messaggio e non ha espresso correttamente ai clienti.

Mentre stavo guardando i log ho cercato di trovare qualcosa lì che era speciale per il momento il gionro miss -. Sia nei dati, il suo tasso o di qualche altra condizione, ma non riusciva a trovare nulla

C'è qualche tecnica di data mining che posso usare per identificare in che modo l'evento specifico si differenzia da altri eventi?

È stato utile?

Soluzione

Puoi guardare outlier rilevamento . Una tecnica di base è quello di tracciare diverse variabili per un sacco di messaggi e vedere se questo messaggio si letteralmente fuori. Un modo per visualizzare più di due dimensioni contemporaneamente sia parallele coordinate . Forse si dovrebbe anche guardare, diciamo, bidoni di mezz'ora, calcolare le loro statistiche e vedere se c'era un problema attorno a questo messaggio.

Altri suggerimenti

Non credo di data mining è lo strumento giusto qui.

Vorrei aggiungere un po 'di registrazione sistematica (alle interfacce, difficile dedurre cambiamenti di stato interni, e nel tuo caso il motivo per cui la decisione di distribuire o non è stato preso) e provare a riprodurre il problema, poi capire dai log esattamente che cosa è andato sbagliato. Anche se potrebbe essere difficile con milioni di messaggi e un bug che si verifica raramente come questo.

Siamo spiacenti, non riesco a vedere come questo è tutt'altro che un fraintendimento di ciò che data mining è.

Si conosce già il messaggio turbato, e, quindi, si sa che è un 'outlier.' Allora, cosa stai 'mining' per?

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top