词-语境频率矩阵示例

时间:2019-06-24 07:54:18

标签: nlp frequency linguistics word-frequency

我正在读一本有关使用句点相互信息(PMI)的NLP模型自动完成句子的日记。这篇论文的标题为Aubrie M. Woods的“利用语言功能来完成句子”。在那里说:

  

将PMI应用于句子完成任务的第一步   涉及从中构造一个词-语境频率矩阵   训练语料库。

我不知道单词上下文频率矩阵是什么以及如何构造它?我猜这与单词频率矩阵有些相关,在单词频率矩阵中会计算单词的出现次数。但是单词上下文呢?

单词-上下文矩阵的设置如下:

  

让X代表具有n行和m列的单词上下文矩阵。第x [i:]行   对应于单词i,列x [:j]对应于上下文j。

我不知道作者所指的上下文。我想看一个例子。谢谢。

0 个答案:

没有答案