質問

私はこのコミュニティに慣れていますが、うまくいけば私の質問がここに適合するでしょう。学部のデータ分析コースの一環として、スマートフォンデータセットを使用して人間のアクティビティ認識に関するプロジェクトを行うことを選択しました。私が心配する限り、このトピックは機械学習とベクターマシンをサポートすることに関連しています。私はまだこのテクノロジーによく慣れていないので、助けが必要です。

私はこのプロジェクトのアイデアに従うことにしました http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (上部の最初のプロジェクト)プロジェクトの目標は、被験者のウエストにスマートフォン(Samsung Galaxy S II)によって記録されたデータから、人がどのような活動に従事しているかを決定することです(例:Walking、Walking_upStairs、Walking_upstairs、Sting、Standing、Laying) 。埋め込まれた加速度計とジャイロスコープを使用して、データには、50Hzの一定速度で3軸線形加速度と3軸角度速度が含まれます。

すべてのデータセットは、ある説明と機能ラベルを備えた1つのフォルダーに記載されています。データは、この形式でデータが表される「テスト」および「トレーニング」ファイルに分割されます。

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

そして、それはファイルに含まれるものの非常に小さなサンプルにすぎません。

このデータが何を表しているのか、どのように解釈できるかは本当にわかりません。また、データの分析、分類、クラスタリングのために、どのツールを使用する必要がありますか?このデータをラベルを含めてExcelに配置し、たとえばRまたはPythonを使用してサンプルデータを抽出してこれに取り組む方法はありますか?

ヒント/ヒントは大歓迎です。

役に立ちましたか?

解決

データセットの定義はこちらのページにあります:

下部の属性情報

または、zipフォルダー内にactivity_labelsという名前のファイルが表示されます。これには、列の見出しがあります。列を注意深く読んでください。簡単に持ち込むことができます .csv を使用してrのファイル read.csv 指図。

たとえば、ファイルに名前を付ける場合 samsungdata Rを開いて、このコマンドを実行できます。

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

または、Rのワーキングディレクトリの内部に既にある場合は、次のことを実行できます

data <- read.csv("samsungdata.csv", header = TRUE)

ここで、名前 data データセットを呼び出すものに変更することができます。

他のヒント

このように見えます(または非常によく似たデータセット)は、Courseraコースに使用されています。このデータセットのクリーニングはタスクです データの取得とクリーニング, 、しかし、それはケーススタディにも使用されます 探索的データ分析. 。このケーススタディのビデオは、EDAコースウェアの4週目のビデオで入手できます。このデータから始めるのに役立つかもしれません。

ライセンス: CC-BY-SA帰属
所属していません datascience.stackexchange
scroll top