有没有一种方法可以生成仅包含0和1的数据集?我想创建一个数据集,该数据集具有4个具有0和1的特征,并且还要将此数据集标记为0和1。数据应被标记为0的50%和被标记为1的50%并且是线性的。
数据集示例:
A B C D Class
0 0 0 0 0
0 0 0 1 1
0 0 1 1 1
1 1 1 1 0
答案 0 :(得分:0)
基本上,您可以将任务简化为生成范围为[0,15]的随机整数,并将其映射回其二进制表示形式。然后,您可以为他们提供标签,例如对于数字<= 7和1否则为0,对于奇数和其他1为0,或者某些自定义映射。