应用错误收集

想象一下Gensim的短语＆＃39; 2D中的向量

时间：2017-04-03 14:03:06

标签： data-visualization gensim word2vec phrases

我正在使用Phrases类，并想要在2D空间中可视化矢量。为了用Word2Vec做到这一点，我使用了T-SNE并且它工作得很好。当我试图用短语做同样的事情时，它没有任何意义（单词出现在不相关的单词旁边）。

有关如何可视化短语输出的任何建议？

1 个答案:

答案 0 :(得分：0)

正如gensim mailing list所建议/报道的那样，关键问题在于只在Phrases中包含语料库会导致迭代器只提供一次数据传递。 Word2Vec模型需要一个语料库，通过该语料库可以进行多次传递以进行词汇发现，然后进行多次训练。（如果仔细观察INFO级别的日志记录，应该有迹象表明“训练”在这种情况下几乎立即结束。）

在2D矢量内对矢量进行排序
如何在Java中可视化2D矢量数组
如何可视化R中的字符向量？
可视化不完整的2D数组
使用gensim的Doc2Vec生成句子向量
Python - 使用sklearn MDS类在2D中可视化Doc2Vec多维向量
想象一下Gensim的短语＆＃39; 2D中的向量
如何从gensim的word2vec中提取词汇量向量？
使用gensim的短语获取三元组时出错
使用gensim的Phraser和预先训练的矢量

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？