应用错误收集

神经训练网络的文本表示

时间：2016-05-03 20:19:36

标签： matlab neural-network nntool

我正在使用Matlab中的nntool开发一个神经训练网络，我输入了11250个不同长度的文本文件（从10到500个单词，或者如果我消除多余的单词，可以说10到200个单词），我没有'找到一种很好的方法来将这些输入文本表示为数字数据来运行我的训练算法。我想创建一个单词词汇表，但我发现词汇表包含16000个不同的单词，这些单词很大。某些文本文件之间存在一些共同点。

1 个答案:

答案 0 :(得分：0)

为了快速溶解，你应该寻找“一袋字”或“tfidf”。如果你不知道这是什么，你应该从这里开始：https://en.wikipedia.org/wiki/Vector_space_model或https://en.wikipedia.org/wiki/Document_classification。

你读过任何关于NLP的书吗？也许这个可能很有价值：http://www.nltk.org/book/一开始。

神经网络训练的数据集
神经网络设置，用于快速培训
训练神经网络进行函数逼近
用于图像分类的Encog神经网络：训练
用于训练和测试的神经网络数据
训练神经网络 -
神经训练网络的文本表示
培训RBF网络
神经网络不能长距离训练
用于神经网络训练（MATLAB）的向量输入

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？