将汇总数据反转为可能的观测数据集

时间:2017-02-04 20:03:24

标签: python dataset aggregate auto-generate

是否有可能生成观察的二进制数据集,其中结果数据集的比例对应于已知的聚合信息?

例如,我有3个二元特征a,b,c,我知道总共有4个观测值,其中a存在,5个观测值,其中b存在,2个观测值,其中c存在。

a=4
b=5
c=2

我也知道应该有3个观察点,其中a& b存在,2其中a& c存在,2表示b& c存在。

a&b=3
a&c=2
b&c=2

最后,我知道总共应该有6个观察结果。

n=6

仅给出此信息,对于具有100个特征的更高维度情况,是否可以生成符合此条件的数据集?

    A B C
1   1 1 1
2   1 1 0
3   1 1 1
4   1 0 0
5   0 1 0
6   0 1 0

0 个答案:

没有答案