生成100K数据集,其要素和类仅为0和1且为线性

时间:2019-02-25 10:38:14

标签: python dataframe

有没有一种方法可以生成仅包含0和1的数据集?我想创建一个数据集,该数据集具有4个具有0和1的特征,并且还要将此数据集标记为0和1。数据应被标记为0的50%和被标记为1的50%并且是线性的。

数据集示例:

A B C D Class
0 0 0 0   0
0 0 0 1   1
0 0 1 1   1
1 1 1 1   0

1 个答案:

答案 0 :(得分:0)

基本上,您可以将任务简化为生成范围为[0,15]的随机整数,并将其映射回其二进制表示形式。然后,您可以为他们提供标签,例如对于数字<= 7和1否则为0,对于奇数和其他1为0,或者某些自定义映射。