是否有可能生成观察的二进制数据集,其中结果数据集的比例对应于已知的聚合信息?
例如,我有3个二元特征a,b,c,我知道总共有4个观测值,其中a存在,5个观测值,其中b存在,2个观测值,其中c存在。
a=4
b=5
c=2
我也知道应该有3个观察点,其中a& b存在,2其中a& c存在,2表示b& c存在。
a&b=3
a&c=2
b&c=2
最后,我知道总共应该有6个观察结果。
n=6
仅给出此信息,对于具有100个特征的更高维度情况,是否可以生成符合此条件的数据集?
A B C
1 1 1 1
2 1 1 0
3 1 1 1
4 1 0 0
5 0 1 0
6 0 1 0