Domanda

Il titolo della domanda non è probabilmente corretto perché parte della mia domanda è per cercare di ottenere un po 'più di comprensione sul problema.

Sto cercando i vantaggi di rendere i dati in modo che viene importato in un database (semplice esempio: tabella di Excel in database di Access) dovrebbe essere data utilizzando lo stesso schema e dovrebbe essere valida per i requisiti di business

.

Ho una tabella di Excel contenente nessuno dati normalizzati e un database di Access con le tabelle normalizzate.

La tabella Excel viene da più soggetti terzi, nessuno dei quali si attaccano allo stesso formato tra di loro o il database.

Alcune delle fonti, inoltre, non forniscono tutti i dati rilevanti.

Esempio di quello che potrebbe essere fornito

contact_key, la data, CONTACT_TITLE, reject_name, reject_cost, count_of_unique_contact

count_of_unique_contact è derivato da CONTACT_TITLE distinte di e non deve essere importato. contact_key non viene a volte fornita. titolo è a volte sconosciuto e passato come tale "n / a", "name = ?? 1342", "# N / A", ecc piuttosto casuale. reject_name è spesso perdere farro. i campi sono talvolta nemmeno inclusa, ad esempio data e contact_key mancano.

Sto cercando di trovare le informazioni per aiutare a spiegare i problemi con quanto sopra. Problemi solo relative a dati non corretti o campi rendendo difficile avere dati utili nel database come non essere in grado di riferire una tendenza a respingere i costi in un mese, quando la data non è in dotazione. Normalizzare il file di Excel non è un'opzione disponibile per me.

Richiesta i valori e campi nei file di Excel per soddisfare i requisiti di business e il formato per essere la stessa per ogni terza parte che li invia è quello che voglio fare, ma la richiesta è caduta nel vuoto.

voglio spiegare al cliente che inserire dati falsi e controllo per invalidi / rejects / contatti esistenti per tutto il tempo è sbagliato e farlo sta per fallire o al miglior essere difficile senza un costante mantenimento di un sistema povero.

Qualcuno ha qualche informazione su questo problema?

Grazie

È stato utile?

Soluzione

Questo è un problema comune; questo viene indicato in ambienti di elaborazione dati come "garbage in, garbage out". In sostanza, quello che si sta eseguendo contro è che i dati forniti sono di scarsa qualità; siete sulla strada giusta per riconoscere che il problema è che sarà difficile (se non impossibile) per utilizzare questi dati per estrarre tutte le informazioni utili.

In una certa misura, questo è un problema che deve essere fissato alla fonte; qualunque sia la vostra fonte dei dati è, hanno bisogno di essere convinti che la qualità dei dati deve migliorare. A breve termine, è possibile disinfettare i tuoi dati; il termine si riferisce alla rimozione o la pulizia delle voci cattive a fare il resto dei dati (i dati di "buono") importabili nel database. A seconda del proprio quello che la percentuale dei tuoi dati è male, si può o non può essere in grado di fare cose utili con i dati sterilizzati una volta si importa.

A un certo punto, dal momento che non stai ricevendo la trazione con la gestione della qualità dei dati, dovrete semplicemente per mostrare loro che il sistema non funziona come previsto perché la qualità dei dati è male. Avranno bisogno di migliorare i loro processi in quel punto per migliorare la qualità dei dati che si ottiene in quel punto. Fino ad allora, però, tenere premuto per i dati di meglio; indagare il processo di sanificazione dei dati e vedere cosa si può fare con i dati rimanenti. Buona fortuna!

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top