el reconocimiento de la actividad humana que usa smartphone problema conjunto de datos

https://datascience.stackexchange.com/questions/211

16-10-2019
|

Pregunta

soy nuevo en esta comunidad y espero que mi pregunta será así encajar aquí. Como parte de mis análisis de datos de grado curso que he optar por hacer el proyecto en el reconocimiento de la actividad humana utilizando conjuntos de datos de teléfonos inteligentes. En lo que a mí preocupación este tema se refiere al aprendizaje automático y máquinas de vectores soporte. No estoy bien familiarizado con esta tecnología aún así que voy a necesitar algo de ayuda.

he decidido seguir esta idea de proyecto http: //www.inf / cursos / DME / 2014 / datasets.html (primer proyecto en la parte superior) .ed.ac.uk / enseñanza El objetivo del proyecto es determinar qué actividad que una persona está participando en (por ejemplo, caminar, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, sentado, de pie, ponedoras) de datos registrados por un teléfono inteligente (Samsung Galaxy S II) en la cintura del sujeto. A través de su acelerómetro incorporado y giroscopio, los datos incluyen 3-axial aceleración lineal y la velocidad angular 3-axial a una velocidad constante de 50 Hz.

Todo el conjunto de datos se da en una carpeta con algunas Descripción y característica etiquetas. Los datos se dividen por 'prueba' y archivos 'entrenar' en el que los datos se representan en este formato:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

Y eso es sólo una pequeña muestra de lo que contiene el archivo.

Yo realmente no sé lo que esto representa los datos y cómo se puede interpretar. También para el análisis, clasificación y agrupación de los datos, qué herramientas necesitaré para su uso? ¿Hay alguna manera de poder poner estos datos en Excel con etiquetas incluidos y, por ejemplo, el uso R o Python para extraer datos de la muestra y el trabajo en esto?

¿Alguna pista / consejos sería muy apreciada.

Solución

Las definiciones de conjuntos de datos están en la página aquí:

información de atributos en la parte inferior

o se puede ver dentro de la carpeta de los postal activity_labels archivo llamado, que tiene sus títulos de las columnas en el interior de la misma, asegúrese de leer cuidadosamente el README, que tiene algo de información bien en ella. Fácilmente puede llevar en un archivo .csv en I usando el comando read.csv.

Por ejemplo, si usted nombra samsungdata archivo que puede abrir R y ejecutar este comando:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

O si no está ya en el interior del directorio de trabajo en I sólo se puede ejecutar el siguiente

data <- read.csv("samsungdata.csv", header = TRUE)

Cuando el nombre data se puede cambiar a lo que usted quiere llamar a su conjunto de datos.

Otros consejos

Parece que este (o conjunto de datos muy similar) se utiliza para los cursos de Coursera. Limpieza de este conjunto de datos es tarea para Obtención de datos y de limpieza , pero también se utiliza para el estudio de caso de < a href = "https://class.coursera.org/exdata-002" rel = "noreferrer"> análisis exploratorio de datos . El vídeo de este estudio de caso se encuentra disponible en los videos de la semana 4 de EDA curso-ware. Puede ser que le ayudará a partir de estos datos.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a datascience.stackexchange