需要一个包含更多标签(输出基数)而不是功能(输入基数)的数据集

时间:2015-04-15 17:20:13

标签: machine-learning dataset bigdata multilabel-classification

对于分类或回归问题,如果

' X'是输入矩阵大小为X X n 和 ' Y'是预期的输出/标签矩阵大小为m X k。

然后我需要一个数据集,其中k> = n。 (如果也可能' Y'应该是高密度标签)

这是标签/输出数超过输入要素空间的地方。 你能给我一个这样的数据集。

此致

2 个答案:

答案 0 :(得分:0)

Here是许多多标签数据集,其中一个具有500个名义属性和983个标签。 您还可以使用其他数据集并删除某些功能(随机或通过功能选择),以使其计数小于标签。

答案 1 :(得分:0)

LIBSVM Data上有很多这样的数据集。 它包含许多分类,回归,多标签和字符串数据集。许多来自UCI,Statlog,StatLib和其他馆藏。