什么是文本分类的适当训练集大小(情感分析)

时间:2015-04-13 10:15:10

标签: nlp nltk

我只想了解(根据您的经验),如果我必须创建一个情绪分析分类模型(使用NLTK),那么什么是良好的训练数据大小。例如,如果我的训练数据将包含推文,并且我打算将它们分类为正面,负面和中立,那么每个类别应该有多少推文,以便让合理的模型工作?

我知道有很多参数,比如数据质量,但如果必须开始,那么可能是一个很好的数字。

1 个答案:

答案 0 :(得分:0)

对于那些不熟悉确切数据,标签和您想要使用它的应用程序的人来说,这是一个非常难以回答的问题。但作为一个大概的估计,我会说从每个例子开始,然后从那里开始。