查找用于对文本文档进行分类的神经网络输入参数

时间:2011-11-18 19:20:38

标签: neural-network input-parameters

我需要训练神经网络将一些文本文档分类为布尔类(NN有一个输出“是”或“否”值)。
是否有任何算法可以找到最佳输入参数(例如单词,术语,句子和/或单词& ...的频率/重复的存在)?
如果没有,你能给我一个起点来找到这些参数(我该如何选择它们)?

由于

1 个答案:

答案 0 :(得分:1)

我所知道的标准方法是使用单词/术语的向量,并使用学习或统计算法为它们分配负或正分数。甚至感知器学习也应该足够,你只需要一套好的正面和反面的例子。

我知道所有垃圾邮件过滤器的工作方式。他们工作得很好。