我试图使用相似性(可能是余弦)来聚类一些句子,然后可能使用分类器将文本放入预定义的类中。
我的想法是使用tensorflow生成单词嵌入,然后为每个句子平均它们。接下来使用聚类/分类算法。
tensorflow是否提供了现成的word2vec生成算法?
一包单词模型会产生良好的输出吗?
答案 0 :(得分:1)
否,tensorflow不提供即用型word2vec ,但确实有a tutorial on word2vec。
是,一袋文字可以产生令人惊讶的良好输出(但不是最先进的),并且有一个好处<强>快得多。我有少量的数据(成千上万的句子),并且在分类方面取得了> 0.90的F1分数。