Domanda

Mi scuso come io non so se questo è più di una domanda di matematica che appartiene a mathoverflow o se si tratta di una domanda di informatica che appartiene Qui.

Detto questo, credo che ho capito le tra i dati, le informazioni e la conoscenza . La mia comprensione è che le informazioni trasporta sia i dati e significa . Una cosa che non mi è chiaro è se l'informazioni è di dati. L'informazione è considerata un particolare tipo di dati, o è qualcosa di completamente diverso?

È stato utile?

Soluzione

La parole data, information e knowlege sono concetti di valore a base utilizzati per categorizzare, in modo soggettivo , la "concisione" generale e "utilità" di un particolare informazioni set.
Queste parole non hanno significato preciso perché sono relative al lo scopo fondamentale e la metodologia di elaborazione delle informazioni; Nel campo della teoria dell'informazione questi non hanno alcun significato a tutti, perché tutti e tre sono la stessa cosa:. Una raccolta di "informazioni" (nel senso Information-teorico)
Eppure sono utili, in context , per riassumere la natura generale di un'informazione impostato come vagamente spiegato di seguito.

L'informazione è ottenuti (o talvolta indotti) dai dati, ma può essere più ricco, nonché un detergente (per cui sono stati corretti alcuni valori) e "semplice" (per cui alcuni dati irrilevante è stata rimosso). Quindi, nel senso teoria degli insiemi, Informazioni non un sottoinsieme di Dati , ma un insieme separato [che interseca in genere, un po ', con i dati ma può anche avere elementi della propria].

Conoscenza (talvolta chiamato intuizione ) è ancora un altro livello in su, è sulla base di informazioni e troppo non è un [teoria degli insiemi] sottoinsieme di informazioni. Infatti conoscenza in genere non ha riferimento diretto agli elementi di informazione, ma piuttosto racconta una "meta storia" sulle informazioni / dati.

L'idea infondata che lungo la Dati -> Informazioni -> catena della conoscenza, i livelli più alti sono sottoinsiemi di quelle inferiori, probabilmente deriva dal fatto che non c'è [in genere] riduzione del volume di [senso IT] informazioni. Ma qualitativamente queste informazioni è diverso, quindi non vera [set teoria] rapporto sottoinsieme.

Esempio :

  • I dati grezzi di borsa di Wall Street è ... Dati
    Un "mare di dati"! Qualcuno ha difficoltà a trovare quello che lui / lei ha bisogno, direttamente, da questi dati. Questi dati possono essere necessario normalizzata. Ad esempio, il prezzo di informazioni può talvolta essere espresso in una stringa di testo con 1/32 ° di una precisione di dollari, in altri casi i prezzi possono venire come un vero e proprio intero binario con 1/8 di precisione dollaro. Anche il campo che indicano, ad esempio, l'ID acquirente, o l'ID del venditore possono includere errori di battitura, e quindi puntare alla sbagliato venditore / acquirente. ecc

  • Un foglio di calcolo realizzato da quanto precede è ... Informazioni
     Vari processi sono stati applicati ai dati:
       -cleaning / correzione di diversi valori
       -cross riferimento (ad esempio la ricerca dei codici associati, come l'aggiunta di una colonna per visualizzare il nome effettivo del singolo / società accanto alla colonna compratore ID)
       -merging record quando duplicati appartenenti allo stesso evento (ma dire da fonti diverse) sono utilizzati per corroborare l'un l'altro, ma sono anche combinati in un singolo record.
       -aggregating: per esempio fare la somma di tutti i valori di transazione per un determinato stock (piuttosto che mostrare tutte le singole transazioni
    . Tutto questo (e poi alcuni) rivolto i dati in informazioni, vale a dire un corpo di [senso IT] Le informazioni che sono facilmente utilizzabile, dove si possono trovare in fretta un po 'di "dati", come dire che l'apertura e la velocità di chiusura per lo stock di IBM 8 giugno 2009.
    Si noti che pur essendo più comodo da usare, in parte più esatto / precisa, e anche bollito giù, non v'è vero [senso] informazioni in là che non poteva essere individuato o calcolato dall'originale relativamente semplice (se solo painstaking ) processi.

  • Una relazione di analista finanziario può contenere ... conoscenza
    Per esempio, se il rapporto indica [esempio fasullo] che ogni volta che il prezzo del petrolio va oltre una certa soglia, il valore dell'oro iniziare a scendere, ma poi rapidamente picchi di nuovo, intorno al periodo del prezzo del coftassa e il tè si stabilizzano. Questo particolare intuizione costituiscono la conoscenza. Questa conoscenza può essere stata nascosta nei dati da solo, per tutto il tempo, ma è diventato evidente solo quando si applica un po 'di fantasia statisticamente analisi e / o richiesto l'aiuto di un esperto umano per trovare o confermare tali modelli.

Tra l'altro, nel senso Teoria della parola informazione, "dati", "informazioni" e "knowledge" tutti contengono [IT senso] informazioni.
Si potrebbe forse ottenere sul pendio scivoloso di affermando che "Mentre andiamo in alto nella catena l'entropia diminuisce", ma che è solo vagamente vero perché

  • diminuzione di entropia non è direttamente o sistematicamente legata alla "utilità per il consumo umano"
    (Un esempio tipico è che un file di testo zippato ha meno entropia ancora è alcuna lettura divertente)
  • v'è effettivamente una perdita di informazioni (oltre all'entropia perdita)
    (Ad esempio, quando i dati sono aggregare il [senso] informazioni sui singoli record perdersi)
  • non c'è, soprattutto nel caso di informazioni -> knowlege, un cambiamento nel livello di abstration

Un ultimo punto (ancora tutti, se non ho confuso ...) è l'idea che la catena data->info->knowledge è efficace relativa per la destinazione d'uso / scopo della [IT-sense] Informazioni .
ewernli in un commento qui sotto fornisce l'esempio del controllo ortografico, vale a dire quando l'attenzione è rivolta l'ortografia inglese, la carta più perspicace da un genio Wallstreet è semplicemente una stringa di parole, in modo efficace "dati grezzi", alcune delle quali hanno bisogno di miglioramento (lungo la catena scopo dell'ortografia.
Allo stesso modo, un linguista con migliaia di articoli di giornale che in genere (possiamo sperare ...) contengono almeno una certa comprensione / conoscenza (in senso generale), può solo prendere in considerazione questi articoli dati grezzi, che lo aiuterà a / lei crea automaticamente Francese lessico -Tedesco (questo sarà informazioni), e mentre si lavora al progetto, egli può scoprire uno slittamento semantico sistematico l'uso di parole comuni betwen i due lingue, e quindi di raccogliere comprensione delle culture diverse.

Altri suggerimenti

Definire le informazioni ed i dati prima, con molta attenzione.

Quali sono le informazioni e ciò che è dato è molto dipendente dal contesto. Un esempio estremo è una foto di voi in un partito che email. Per te è informazione, ma per il provider di servizi Internet è solo ai dati di essere trasmessi.

A volte basta aggiungere il giusto contesto cambia i dati di informazioni.

Quindi, di rispondergli domanda: No, l'informazione non è un sottoinsieme di dati. Potrebbe essere almeno quanto segue.

  1. Un superset, quando si aggiunge contesto

  2. Un sottoinsieme, ago-in-a-pagliaio problema

  3. Una funzione dei dati, ad esempio in un digest

Non ci sono probabilmente più situazioni.

Questo è come la vedo io ...

Dati è sporco e crudo. Probabilmente avete troppo di esso.

... Jason ... 27 ... Denton ...

Le informazioni sono i dati necessari, organizzato e significativo.

Jason.age=27
Jason.city=Denton

La conoscenza è il motivo per cui ci sono i wiki, i blog: per tenere traccia di intuizioni e di esperienze. Notare che questi sono attributi umani (e di comunità). Fatta eccezione forse per un progetto scientifico strano, nessun computer è su Facebook dire alla gente ciò che crede in.

informazioni è un valorizzazione dei dati:

  • Dati è inerte
  • informazioni perseguibile

Si noti che le informazioni senza dati è solo un parere; -)

Le informazioni potrebbero essere dati se si ha qualche modo di rappresentare il contenuto aggiuntivo che rende le informazioni. Un programma che cerca di 'capire' testo scritto potrebbe trasformare il testo in un formato che consente l'elaborazione più complessa del significato di quel testo. Questo formato è stato trasformato in una sorta di dati che rappresenta le informazioni, se compreso nel contesto del sistema di elaborazione complessiva. Dall'esterno del sistema appare come dati, mentre all'interno del sistema è l'informazione che viene inteso.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top