我正在研究一个文本分类问题,其中类/标签的数量很大(数万或更多)。你会用什么方法/方法?你能指出我的相关论文吗?
答案 0 :(得分:0)
您的文字实体有多长?如果它们是文档,那么Refined Experts是一个非常好的工作,因为你有大量的文档类。这项工作确实在超过10万个班级进行了实验,但一个重要的事实是班级是按层次组织的。他们使用分层SVM来构建他们的分类器。如果按层次结构组织,SVM适用于大型类。你可以通过谷歌学者找到很多相关的作品。
如果您的类没有按层次结构组织,那么您将问题建模为n二进制分类问题。如果你完成这个presentation,你可能会有所了解。