我知道很多人肯定已经提出了一些要求,但我不能 阅读所有内容,并符合我的要求。这就是为什么我在这里问这个问题,对于给您带来的不便深表歉意。
我读过很多文章,要使用word2vec编写句子,可以添加一个句子中每个单词的向量,然后可以找到差异。
加法的原因是句子相同但词序不同,加法会使它们相同。
但是对于以下句子:“昨天,我不去那里”和“昨天我不去那里”,这里的用例将会下降。
我想知道是否有任何算法可以使word2vec理解形容词的用法,然后处理ngram而不是unigram。例如,使用textrank算法从文本中找出重要单词,然后在其上创建单词嵌入,然后添加它们以找出相似性。
这种方法有意义吗?还是像空中射击一样?有什么更好的方法可以建议我继续工作吗?
非常感谢您的建议。