根据相似性为单词指定类别

时间:2018-06-18 10:19:20

标签: python nlp text-classification lda

我有大约100万个句子文件的语料库。让我们说: -

  句子1:"曼彻斯特城和曼彻斯特联队之间的激动人心的比赛以抽签结束#34;

我想根据上面的类别分配句子消息属于" sports"并再次将其分配到更多类别,如" football"体育类别。 我想将文本分为四类:#34;娱乐","体育","政治","技术"。 我使用过Word2vec的方法,但它只能说出两个句子之间的关系。我究竟能做到这一点?我没有任何预定义的标签数据,只有百万条记录。 我真正想做的事情是this

0 个答案:

没有答案