Frage

Ich bin neu in dieser Community und hoffentlich wird meine Frage hier gut passen. Im Rahmen meines Bachelor -Datenanalyse -Kurses habe ich das Projekt zur Erkennung menschlicher Aktivitäten mithilfe von Smartphone -Datensätzen durchführen. Für mich bezieht sich dieses Thema auf maschinelles Lernen und Support Vector -Maschinen. Ich bin mit diesen Technologien noch nicht gut vertraut, also brauche ich Hilfe.

Ich habe beschlossen, dieser Projektidee zu folgen http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (Erstes Projekt oben) Das Projektziel besteht darin . Unter Verwendung seines eingebetteten Beschleunigungsmessers und des Gyroskops umfassen die Daten eine 3-axiale lineare Beschleunigung und 3-axiale Winkelgeschwindigkeit bei einer konstanten Geschwindigkeit von 50 Hz.

Der gesamte Datensatz wird in einem Ordner mit einer gewissen Beschreibung und den Feature -Beschriftungen angegeben. Die Daten werden für "Test" und "Zug" -Dateien unterteilt, in denen Daten in diesem Format dargestellt werden:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

Und das ist nur eine sehr kleine Stichprobe dessen, was die Datei enthält.

Ich weiß nicht wirklich, was diese Daten darstellen und wie es interpretiert werden kann. Welche Tools müssen ich auch zur Analyse, Klassifizierung und Clusterbildung der Daten verwenden? Gibt es eine Möglichkeit, diese Daten mit enthaltenen Beschriftungen in Excel zu bringen und beispielsweise R oder Python zu verwenden, um Beispieldaten zu extrahieren und daran zu arbeiten?

Alle Hinweise/Tipps wären sehr geschätzt.

War es hilfreich?

Lösung

Die Datensatzdefinitionen sind hier auf der Seite:

Attributinformationen unten

Oder Sie können in dem ZIP -Ordner die Datei namens Activity_Labels sehen, in der Ihre Spaltenüberschriften in sich enthalten sind. Stellen Sie sicher, dass Sie die Readme sorgfältig lesen. Es enthält einige gute Informationen. Sie können leicht eine einbringen .csv Datei in r verwenden die read.csv Befehl.

Zum Beispiel, wenn Sie die Datei nennen samsungdata Sie können R öffnen und diesen Befehl ausführen:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

Oder wenn Sie sich bereits im Arbeitsverzeichnis in R befinden, können Sie einfach Folgendes ausführen

data <- read.csv("samsungdata.csv", header = TRUE)

Wo der Name data Kann auf alles geändert werden, was Sie Ihren Datensatz nennen möchten.

Andere Tipps

Es sieht so aus (oder sehr ähnlichem Datensatz) wird für Coursera -Kurse verwendet. Das Reinigen dieses Datensatzes ist Aufgabe für Daten erhalten und reinigen, aber es wird auch für Fallstudien für verwendet Explorationsdatenanalyse. Video aus dieser Fallstudie ist in Videos für Woche 4 von EDA Course Ware erhältlich. Es kann Ihnen helfen, mit diesen Daten zu beginnen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top