CNN可以对短文分类多少班?

时间:2017-03-09 06:00:12

标签: machine-learning nlp deep-learning conv-neural-network text-classification

我知道CNN(conv-neural-network)可以分类超过10万张ImageNet图像。

我发现CNN只能将10-20个文本类分类为this paper

CNN可以将短文分类多少个? 班级编号的上限是多少?

1 个答案:

答案 0 :(得分:2)

分类器能够以良好的精度/召回进行分类的类别数量由(但不限于)决定:

  • 每个类别有多么不同?
  • 你可以从内容中获得多少功能(短文本肯定比图像信息少得多) - 因为你正在使用CNN作为文本,我认为这些功能只是字符或单词。
  • 这些功能如何区分不同类别?
  • 您有多少高质量的标签示例? (我们没有用于短文本的公共标签大型多类别数据集)

如果不知道上述问题的答案,很难给你一个数字。