标签: machine-learning nlp
我的数据不平衡,正面评价(90%)比负面评价(10%)多,我应该遵循以下选项。
class_weight='balanced'
答案 0 :(得分:0)
不幸的是,对于自然语言数据,没有很多好的选择。 -一种快速的方法的确是对肯定类别进行低采样,对否定类别进行过度采样,以带来更多的平衡。 -一种更复杂的方法是使用GANs to create more negative examples。