我是机器学习和神经网络的新手。目前我正在coursera.org上学习有关神经网络的课程,但我并不了解所有内容。我的论文有点问题。我应该使用神经网络,但我不知道如何为我的问题选择正确的神经网络架构。
我有很多来自门户网站的数据(通常是报纸,杂志的在线版本)。有关于文章的信息,例如名称,文章的文字以及文章的发行。还有大量的序列数据可以捕获用户的行为。
我的目标是预测文章的受欢迎程度(读者数量或唯一身份用户对文章的点击次数)。我想从这些数据中制作载体,并用这些载体喂养我的神经网络。
我有两个问题:
1。如何创建正确的向量?
2。哪种神经网络架构最适合这个问题?
答案 0 :(得分:1)
这些是非常广泛的问题。如果您想要更准确的答案,则需要确定较小的问题。
如何创建正确的向量?
对于文本数据,通常使用vector space model。通常使用tf-idf weighting获得最佳结果。
哪种神经网络架构适合这个问题?
这很难说。我将从具有k
输入神经元的网络开始(其中k
是应用tf-idf后矢量的大小:您可能还想进行某种特征选择以减少特征数量一个很好的特征选择方法是using the chi squared test。)
然后,通过使用单个隐藏层给出标准网络布局,其中神经元的数量等于输入神经元和输出神经元的数量之间的平均值。然后看起来你只需要一个输出神经元来输出文章的流行程度(这可以是linear neuron或sigmoid神经元。)
对于隐藏图层中的神经元,您还可以尝试使用linear and sigmoid neurons。
还有许多其他事情你可以尝试:重量衰减,动量技术,多层网络,循环网络等。如果没有大量的实验,就不可能说出什么对你的问题最有效。