如果给定特定类的0个样本,如何对不平衡数据集进行分类?

时间:2018-04-10 16:17:59

标签: machine-learning classification data-science supervised-learning multiclass-classification

基本上我有训练集和测试集,训练集是我将测试各种模型和功能选择,我知道训练集的输出标签,它们有10个不同的类别,但我被告知/假设其中一个特定类在训练集中有0个给定样本/出现。

我该如何处理?

我知道我可以使用不平衡集的过采样/欠采样,但如果其中一个类出现0,它会有用吗?

1 个答案:

答案 0 :(得分:0)

您的用例属于最近作为零数据学习引入的零镜头学习的范畴。它依赖于以可以在给定样本之外推广的方式构建底层类的可分离表示。这不是一个容易解决的问题,但根据您的数据和问题空间,它可能是可行的。一些资源可以帮助您入门:

  1. Zero-Data Learning
  2. Deep Learning Book: Representation Learning