现在我有一个看似轻松但具有挑战性的任务。我需要开发一个数据集,我将这些问题分为两类:

  1. 事实问题:“谁是法国现任总统。”
  2. 免费问题:“请给我下面的摄像机吗?”

现在,我需要知道Yahoo!上这两个类别的百分比回答以便我可以相应地维护数据集,但是我不知道执行此统计数据的好方法。手动似乎真的不可能,有人有想法吗?我真的很感激,谢谢。

有帮助吗?

解决方案

你的意思是,彼此认识吗?自动从网站的末尾没有任何分类?这可能是不可能的。

我认为您能做的最好的就是比较一些指标。 “免费”问题可能会带来更多的贡献。如果y!答案有一个讨论系统……“ FACTOID”问题,他们将更加严格地讨论他们 可能 从“什么是……”开始,依此类推。

也许提取100个随机问题,进行手动检查并写下百分比。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top