i registri di data mining per individuare un bug
-
05-09-2019 - |
Domanda
Sto lavorando su un'applicazione distribuzione dei dati che riceve i dati da una fonte e distribuisce i dati in applicazione di destinazione multipla. Dopo aver distribuito con successo diversi messaggi ogni secondo per 8 giorni, mancava un unico messaggio e non ha espresso correttamente ai clienti.
Mentre stavo guardando i log ho cercato di trovare qualcosa lì che era speciale per il momento il gionro miss -. Sia nei dati, il suo tasso o di qualche altra condizione, ma non riusciva a trovare nulla
C'è qualche tecnica di data mining che posso usare per identificare in che modo l'evento specifico si differenzia da altri eventi?
Soluzione
Puoi guardare outlier rilevamento . Una tecnica di base è quello di tracciare diverse variabili per un sacco di messaggi e vedere se questo messaggio si letteralmente fuori. Un modo per visualizzare più di due dimensioni contemporaneamente sia parallele coordinate . Forse si dovrebbe anche guardare, diciamo, bidoni di mezz'ora, calcolare le loro statistiche e vedere se c'era un problema attorno a questo messaggio.
Altri suggerimenti
Non credo di data mining è lo strumento giusto qui.
Vorrei aggiungere un po 'di registrazione sistematica (alle interfacce, difficile dedurre cambiamenti di stato interni, e nel tuo caso il motivo per cui la decisione di distribuire o non è stato preso) e provare a riprodurre il problema, poi capire dai log esattamente che cosa è andato sbagliato. Anche se potrebbe essere difficile con milioni di messaggi e un bug che si verifica raramente come questo.
Siamo spiacenti, non riesco a vedere come questo è tutt'altro che un fraintendimento di ciò che data mining è.
Si conosce già il messaggio turbato, e, quindi, si sa che è un 'outlier.' Allora, cosa stai 'mining' per?