machine-learning - 文本挖掘和机器学习

文本挖掘和机器学习

时间：2016-11-06 18:40:07

标签： machine-learning nlp cluster-analysis text-mining named-entity-recognition

我有一个单词和文本的数据集，我想制作聚类（通过K-means）或任何其他无监督/监督学习方法来区分单词，例如，'John'这个词将被归类为名称（和将与其他人名称聚集在一起），'巴西'作为一个地方等... 有没有我可以用来解决问题的模型。我听说过N-gram，但我不知道如何在x，y图或其他情况下绘制Ngrams概率 P.S如果你有任何精彩的例子

1 个答案:

答案 0 :(得分：0)

word2vec和嵌入怎么样？
https://deeplearning4j.org/word2vec

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？