使用神经网络对网页进行分类?

时间:2020-05-21 21:15:19

标签: java neural-network nlp

所以我正在研究一个Java项目,并且有一个WebCrawler,它可以从找到的网站中检索并下载html。您输入一个单词(例如Java单词),然后我的程序在google中搜索网站并下载html数据。

因此,现在我正在尝试使用神经网络来预测网站是否正是我想要的,是的,我知道我将需要大量数据,并且必须手动输入网络。我受困的是将html转换为神经网络的数字。

起初,我虽然只是将html转换为纯文本,然后为每个字母分配一个数字,但是只有一个文档,该文档由一堆数字组成,这些数字组成单词。我不确定神经网络将如何看待这个问题,所有这些数字只是一个输入,还是每个词都是神经网络的输入,这将导致输入数不确定的问题,如果网络允许将此作为​​一种输入,这将是对网站进行分类的一种可行方法吗?

0 个答案:

没有答案