在Yahoo!上分类回答

时间:2010-09-20 09:24:49

标签: api web-scraping data-mining yahoo-api

现在我有一项看似简单但具有挑战性的任务。我需要开发一组问题数据,并将问题分为两类:

  1. Factoid问题:“谁是现任法国总统。”
  2. 免费提问:“你能为我评价下面的相机吗?”
  3. 现在我需要知道Yahoo!上两个类别的百分比回答这样我可以相应地维护我的数据集,但我不知道做这个统计数据的好方法。手动操作似乎真的不可能,有没有人有想法?我真的很感激,谢谢。

1 个答案:

答案 0 :(得分:1)

你的意思是,从另一个中认出一个人?自动,没有任何分类从网站的结束?这可能是不可能的。

我认为你能做的最好的事情就是比较一些指标。 “免费”问题可能会更多地为更多文本做出贡献;如果Y!Answers有一个讨论系统,他们会被更多地讨论......“Factoid”问题可能以“What is ...”开头更多......等等。

也许可以获取100个随机问题,进行手动检查并记下百分比。