我有一个火车数据集,其中包含以下形式的信息:
feature 1, ..., feature N, label
1 x1, ..., xn, A
2 x1, ..., xn, B
3 x1, ..., xn, C
...
4 x1, ..., xn, not A
5 x1, ..., xn, not B
...
在测试数据集中,应该预测标签A,B,C。
我想使用第4行和第5行中的信息,以避免过拟合。
我可以使用哪些sklearn类/工具来利用4和5等行中的“ not A”和“ not B”信息?