reconnaissance L'activité humaine en utilisant problème de jeu de données sur les smartphones

https://datascience.stackexchange.com/questions/211

16-10-2019
|

Question

Je suis nouveau dans cette communauté et nous espérons que ma question va bien s'adapter ici. Bien sûr dans le cadre de mes analyses de données de premier cycle je choisir de faire le projet sur la reconnaissance de l'activité humaine en utilisant des ensembles de données sur les smartphones. Pour autant que je suis préoccupé ce sujet concerne l'apprentissage machine et Support Vector Machines. Je ne suis pas bien au courant de cette technologie pourtant si je besoin d'aide.

J'ai décidé de suivre cette idée de projet http: //www.inf .ed.ac.uk / enseignement / cours / dme / 2014 / datasets.html (premier projet sur le dessus) Le but du projet est de déterminer quelle activité une personne est engagée dans (par exemple, WALKING, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, Sitting, Couché) à partir des données enregistrées par un smartphone (Samsung Galaxy S II) sur la taille du sujet. Utilisation de l'accéléromètre intégré et gyroscope, les données comprennent l'accélération 3-axial linéaire et la vitesse angulaire 3-axiale à une vitesse constante de 50 Hz.

Tous l'ensemble de données est donnée dans un dossier avec des étiquettes de description et fonctionnalité. Les données sont partagées pour les fichiers « test » et « former » dans lequel les données sont représentées dans ce format:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

Et c'est seulement un très petit échantillon de ce que le fichier contient.

Je ne sais pas vraiment ce que représente ces données et comment peut être interprété. En outre pour l'analyse, la classification et le regroupement des données, quels outils dois-je utiliser? Est-il possible que je peux mettre ces données dans Excel avec des étiquettes fournies et par exemple l'utilisation R ou Python pour extraire des données échantillons et les travaux sur ce sujet?

Les conseils / conseils serait très apprécié.

La solution

Les définitions des ensembles de données sont sur la page ici:

informations d'attributs au bas

ou vous pouvez voir dans le dossier ZIP le fichier nommé activity_labels, qui a vos têtes de colonne à l'intérieur, assurez-vous de lire le readme, il a de bonnes informations en elle. Vous pouvez apporter facilement dans un fichier .csv dans R en utilisant la commande read.csv.

Par exemple, si vous vous appelez samsungdata de fichier que vous pouvez ouvrir R et exécutez la commande suivante:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

Ou si vous êtes déjà à l'intérieur du répertoire de travail en R, vous pouvez simplement exécuter la commande suivante

data <- read.csv("samsungdata.csv", header = TRUE)

Si le data de nom peut être modifié à tout ce que vous voulez appeler votre ensemble de données.

Autres conseils

Il ressemble à ceci (ou un ensemble de données très similaire) est utilisé pour les cours Coursera. Nettoyage cet ensemble de données est une tâche pour Obtenir et nettoyage de données , mais il est également utilisé pour l'étude de cas pour < a href = "https://class.coursera.org/exdata-002" rel = "noreferrer"> analyse exploratoire des données . Vidéo de cette étude de cas est disponible dans les vidéos pour la semaine 4 cours EDA-ware. Il pourrait vous aider à partir de ces données.

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange