質問

今、私は一見簡単だが挑戦的なタスクがあります。質問のデータセットを作成する必要があります。質問を2つのカテゴリに分類します。

  1. ファクトイドの質問:「フランスの現在の大統領は誰ですか。」
  2. 無料の質問:「以下のカメラを私のために評価していただけませんか?」

今、私はYahoo!の両方のカテゴリの割合を知る必要がありますそれに応じてデータセットを維持できるように答えますが、この統計を行う良い方法はわかりません。手動で提供することは本当に不可能に思えます。誰かがアイデアを持っていますか?本当に感謝しています。

役に立ちましたか?

解決

つまり、一方を他方から認識しますか?自動的に、サイトの終わりからの分類なしで?それはおそらく不可能になるでしょう。

あなたができる最善のことは、いくつかのメトリックを比較することだと思います。 「無料」の質問は、おそらくより多くのテキストにより多くの貢献をする傾向があります。 y!回答にディスカッションシステムがあれば、より重く議論されるでしょう...「ファクトイド」の質問 五月 より頻繁に「何が...」から始めます...など。

たぶん、100のランダムな質問を受け取り、手動でチェックしてパーセンテージを書き留めてください。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top