我正在读一本有关使用句点相互信息(PMI)的NLP模型自动完成句子的日记。这篇论文的标题为Aubrie M. Woods的“利用语言功能来完成句子”。在那里说:
将PMI应用于句子完成任务的第一步 涉及从中构造一个词-语境频率矩阵 训练语料库。
我不知道单词上下文频率矩阵是什么以及如何构造它?我猜这与单词频率矩阵有些相关,在单词频率矩阵中会计算单词的出现次数。但是单词上下文呢?
单词-上下文矩阵的设置如下:
让X代表具有n行和m列的单词上下文矩阵。第x [i:]行 对应于单词i,列x [:j]对应于上下文j。
我不知道作者所指的上下文。我想看一个例子。谢谢。