Google的Word2vec已被证明在NLP任务中非常强大。我对这个工具很陌生,不清楚它究竟能做些什么。
假设我们有一句话:“我本周末将去纽约。”
基于这句话,我们有很多选择来改变它。例如:
1)“我本周末将和爸爸一起去纽约。”
2)“我本周末将去洛杉矶。”
3)“本周末我不会去纽约。”
我想从word2vec得到的是,在给定基本句子的情况下,如何预测其中一个变换最有可能?或者,给定一个变换,我们可以计算基本句子之上的概率。
另外一个问题是,除了word2vec之外,还有其他工具可以达到同样的目的吗?
答案 0 :(得分:2)
你可能想看看经常性的网。它们在自然语言生成中有应用。
http://deeplearning4j.org/recurrentnetwork https://karpathy.github.io/2015/05/21/rnn-effectiveness/
还要考虑Doc2vec,它可以对整个句子进行矢量化,而不是单个单词或短n-gram,并且可以按照相似性对句子进行聚类。