嘿我有一项任务要执行,这基本上是以某种方式检索与特定领域有关的powerpoint演示文稿或pdf文档。假设我想要检索有关生物信息学领域的ppt和pdf讲义。我想知道是否可以通过使用神经网络训练的神经机器人的方法来实现这个任务?我想在进一步实施之前确认这种方法并非完全错误。
如果有人想知道为什么在这种情况下需要神经网络或任何学习算法,这里是我的计划(这可能是错误的,或者可能有更简单的方法来实现这一点,所以请随意纠正我):
我生成由神经网络训练的神经机器人(不确定这种训练是如何发生的,我假设通过使用某些ppt和pdf文件的样本训练集的监督学习)然后这些机器人检索类似于什么的页面他们通过培训学到了。
上述方法是完成此任务的正确方法吗?
答案 0 :(得分:8)
神经网络很复杂。您似乎有一个通用的文档分类问题。最简单的地方是使用某种朴素的贝叶斯模型与单词功能袋。我要采取的下一步是在同一个功能集上使用线性SVM或逻辑回归。如果你在尝试简单的事情后仍然没有达到你想要的性能,那么可能继续尝试使用神经网络。
就像你不会说的那样,我想写一个电子邮件服务器,我将从编写操作系统开始,我更倾向于在更简单的事情之前使用神经网络失败了。