没有机器学习、深度学习的文本分类

时间:2021-03-20 01:13:17

标签: python nlp text-classification

我想做一个文本分类器。但不使用任何已找到的分类算法。也许我会使用 Twitter 数据进行分类。因此,我必须在没有训练数据集的情况下以某种方式进行分类。现在我正在考虑使用词频进行分类。我找不到任何符合我想法的项目。我需要任何项目或文章你能帮我吗

1 个答案:

答案 0 :(得分:-1)

哇!首先,这是一项艰巨的任务,并且考虑到机器学习通常的工作情况,对于此类任务,我敦促您尝试为分类器找到训练数据并使用机器学习(我发现 Textblob 是一个很棒且易于使用的工具)文本分类库)。

为了更直接地回答您的问题,您真的必须对这个问题进行抽象思考,因为您可以尝试大量潜在的事情来产生可靠的结果。尽管 Word2Vec 通过机器学习工作,但其中包含许多有趣且有用的概念。有关详细信息,请参阅维基百科页面 here。例如,您可以查看“词嵌入”。此外,余弦相似度等概念也可能有用。

快乐编码!