如何将文本段落分类为预定义的类别?

时间:2014-04-09 10:05:59

标签: java linked-list dbpedia gate

我有一个类别列表,如体育,游戏,宗教,金融,市场价格,I.T,健康,成人,商业,B2B,政府,政治,教育等。 现在我想将文本段落分类为这些类别,实际上我从特定的URL中提取整个文本,并希望将文本分类到我的类别中,此时我使用的是dbpedia,我也使用了很多技术,但不幸的是我仍然没有达到我的目标,有人可以帮助我......我将感激不尽。

1 个答案:

答案 0 :(得分:2)

有一篇陈旧但非常好的论文涵盖了文本分类的任务。作为介绍,它对您非常有用:

自动文本分类中的机器学习,Fabrizio Sebastiani,2002 http://orb.essex.ac.uk/CE/CE807/Readings/sebastiani02.pdf