如何分类HTML文件?

时间:2019-03-23 10:52:20

标签: nlp classification opennlp

我正在尝试根据HTML文件的内容对其进行分类。使用JSoup,我已经检索了HTML文件的标题和描述部分。然后,使用opennlp句子检测器识别出一组句子。

但是,我不确定如何继续进行。我可以简单地在这些句子中查找某些关键字并进行分类,但是再次感觉就像我在写一个简单的if..else..语句,而没有充分利用NLP的潜力。

我想训练我的代码进行分类,但是我不确定如何实现。

0 个答案:

没有答案