Domanda

Sono nuovo di questa comunità e, auspicabilmente, la mia domanda sarà ben adattarsi qui. Come parte della mia analisi dei dati di laurea corso che ho scelto di fare il progetto sul riconoscimento dell'attività umana utilizzando insiemi di dati di smartphone. Per quanto mi riguarda questo argomento si riferisce a Machine Learning e Support Vector Machines. Io non sono così familiarità con queste tecnologie eppure così ho bisogno di aiuto.

Ho deciso di seguire questa idea di progetto http: //www.inf .ed.ac.uk / insegnamento / corsi / DME / 2014 / datasets.html (primo progetto sulla parte superiore) L'obiettivo del progetto è determinare quale attività che una persona è impegnata in (ad esempio, camminare, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, seduti, in piedi, posa) dai dati registrati da uno smartphone (Samsung Galaxy S II) sulla vita del soggetto. Utilizzando il suo accelerometro incorporato e giroscopio, i dati includono 3-assiale accelerazione lineare e la velocità angolare 3-assiale ad una velocità costante di 50 Hz.

Tutti i set di dati è dato in una cartella con alcuni Descrizione e caratteristica etichette. I dati sono suddivisi per 'test' e file 'treno', in cui i dati sono rappresentati in questo formato:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

E questo è solo un piccolo esempio di ciò che il file contiene.

Io non so davvero che cosa questi dati rappresenta e come può essere interpretata. Anche per l'analisi, la classificazione e il raggruppamento dei dati, quali strumenti dovrò uso? C'è un modo posso mettere questi dati in Excel con le etichette inclusi e per esempio l'uso R o pitone per estrarre i dati di esempio e lavorare su questo?

Eventuali suggerimenti / suggerimenti sarebbe molto apprezzato.

È stato utile?

Soluzione

Le definizioni di dati sono nella pagina qui:

attributo Informazioni in fondo

o si può vedere all'interno della cartella ZIP activity_labels file chiamato, che ha le intestazioni delle colonne all'interno di esso, assicuratevi di leggere attentamente il file README, ha alcune utili informazioni in esso. Si può facilmente portare in un file .csv in R con il comando read.csv.

Per esempio, se si è il nome del file samsungdata è possibile aprire R ed eseguire questo comando:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

Se sei già all'interno della directory di lavoro in R si può semplicemente eseguire il seguente

data <- read.csv("samsungdata.csv", header = TRUE)

Quando la denominazione data può essere cambiato in qualsiasi cosa tu voglia chiamare il set di dati.

Altri suggerimenti

Ecco come si presenta (o molto simili set di dati) viene utilizzata per corsi Coursera. Pulizia questo insieme di dati è compito per Ottenere e pulizia dei dati , ma viene utilizzato anche per caso di studio per < a href = "https://class.coursera.org/exdata-002" rel = "noreferrer"> analisi esplorativa dei dati . Il video da questo caso studio è disponibile in video per la settimana 4 di EDA corso-ware. Potrebbe aiutare con iniziare con questi dati.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top