应用错误收集

具有不同背景的gensim

时间：2017-10-12 08:20:21

标签： machine-learning nlp word2vec

我正在使用housekeeping parameters。我想在不相关的文本示例上训练模型，例如：“猫是棕色的。它几点了？”

我为模型创建了以下输入：

[["The", "cat", "is", "brown"], ["What", "time", "is", "it"]]，但是我想知道模型是否假设“棕色”和“什么”在同一个背景下。

试图在api中找到答案，但找不到它。

1 个答案:

答案 0 :(得分：0)

The gensim API won't consider "brown" and "What" in the same context. Uneven windows are used near sentence boundaries. So, for your example, if the window size let's say is 1, the (context, target) pairs would look like as below:

([cat],The), ([The,is],cat), ([cat,brown],is), ([is],brown) ([time],What), ([What,is],time), ([time,it],is), ([is],it)

I hope this clears your doubt.

多个上下文与不同的版本
用不同的上下文创建意图
在python上使用gensim Word2Vec的不同型号
gensim（1.0.1）Doc2Vec与google预训练矢量
使用gensim的Word2Vec和自定义的单词 - 上下文对
具有不同背景的gensim
我可以使用单词上下文计数对作为gensim的Word2Vec的输入
gensim Doc2Vec区分相同的句子与正面和负面背景。？
如何加载有词汇限制的word2vec txt文件
如何使用word2vec计算向量

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？