質問

私たちは、調査の回答として感情を捉えています。分析目的で応答(感情)の値を割り当てる必要があります。これを達成するために割り当てることができる最適な範囲はありますか? (-100から100のように)。質問の例と一連の答えは次のとおりです。

質問:「今日はどうですか?」

回答:ひどい、悲しい、わかりました、良い、素晴らしい

私たちが考えることができる適切なアプローチは、等しい距離で1〜100の値を割り当てることです。これは統計的に有効ですか?これを達成する際に考慮すべきことは何ですか?この場合、加重平均などの統計を計算する必要があるため、正の整数のみが割り当てられます。負の数も割り当てられませんか?

役に立ちましたか?

解決

感情の最終的な範囲は完全にarbitrary意的です。間隔[a、b]に関係なく、内部に収まるように感情を調整できます。 [-100、100]は完全に合理的であり、一般的です。使用の例は、Gdeltからのものであり、この間隔はニュースドキュメントの平均トーンの間隔を提供します。

感情を等しく距離を置くことが統計的に正しいかどうかを尋ねることは意味がありません。これは完全にあなたのユースケースと意見に依存します。また、加重平均で負の数を使用できない理由はまったくありません。

あなたが何をしているのか、どのように感情を評価しているのかについて言及した場合、もっと言うことがあるかもしれません。

ライセンス: CC-BY-SA帰属
所属していません datascience.stackexchange
scroll top