如何使用神经网络找到子串中的主要部分?

时间:2016-03-01 19:23:06

标签: machine-learning neural-network conv-neural-network recurrent-neural-network

我很困惑。是否有可能在句子中找到主词或子串(在训练集的帮助下)。我正在解析空缺并尝试构建一个文本管理的应用程序,这可以解决文本中提到的技能。是的,也许这是使用技能词典进行某种全球文本搜索的任务,但我真的很好奇,NN可以帮忙吗? 正如你猜测的那样,我是ML的新手。

2 个答案:

答案 0 :(得分:0)

简短回答:没有NN无法帮助。

答案很长:也许他们可以,如果你真的,真的想要他们并且有大量的时间和技巧。 问题是神经网络用于处理数字而不是单词。 大多数类型的神经网络依赖于决定两个值是否彼此接近的能力。对于语言环境中的字符串,这仍然不容易。

因此,如果你不想在接下来的几年里研究神经网络,我会寻找一种不同的方法;)

答案 1 :(得分:0)

Word2Vec是神经网络的基本应用程序,可以帮助创建单词的数字表示,您可以使用它来构建对句子的智能解释。

更有趣的是,使用LSTM可以处理上下文,并识别句子中的关键词,如本文所述:http://www.clsp.jhu.edu/~guoguo/papers/icassp2015_myhotword.pdf。这是一篇关于识别句子中关键词的论文,以便更快,更有用的语音识别软件应用。这是github:https://github.com/MajerMartin/lstm-dtw-keyword-spotting。在这篇文章中解释太多了,但这应该让你忙碌,让你开始训练神经网络进行关键词识别。