现在我有一项看似简单但具有挑战性的任务。我需要开发一组问题数据,并将问题分为两类:
现在我需要知道Yahoo!上两个类别的百分比回答这样我可以相应地维护我的数据集,但我不知道做这个统计数据的好方法。手动操作似乎真的不可能,有没有人有想法?我真的很感激,谢谢。
答案 0 :(得分:1)
你的意思是,从另一个中认出一个人?自动,没有任何分类从网站的结束?这可能是不可能的。
我认为你能做的最好的事情就是比较一些指标。 “免费”问题可能会更多地为更多文本做出贡献;如果Y!Answers有一个讨论系统,他们会被更多地讨论......“Factoid”问题可能以“What is ...”开头更多......等等。
也许可以获取100个随机问题,进行手动检查并记下百分比。