我正在使用DeepLearning4j的Word2Vec模块作为一种分析文章摘要中单词之间距离的方法,我读过的许多论文都说,利用利用左倾斜上下文单词的三角形窗口可能会更有效地计算距离。当尝试将窗口大小参数更改为更靠左的窗口时,它将无法编译,是否可以在DL4J中使用,或者我是否停留在矩形上下文窗口中?下面是我当前的代码,其中实现了2个矩形窗口。
word2Vec = new Word2Vec.Builder().minWordFrequency(2).iterations(1).layerSize(100).stopWords(fileUtilities.getStopList()).allowParallelTokenization(true).seed(42).windowSize(2)
.iterate(sentenceIterator).tokenizerFactory(tokenizerFactory).seed(144).build();