python中n维数据集的交集

时间:2017-06-15 11:01:31

标签: python python-2.7

我目前正在研究这些数据 -
10,000个样本的Data_A,每个样本具有170个特征
Data_B有1,000个样本,每个样本具有相同的170个特征

如果我们在170维空间上绘制Data_A,那么它将覆盖一些空间。所以,我只想知道Data_B中我的样本百分比属于那个空间。 我不需要想象任何东西,我只是一个子集。

(实际上,在我的Data_B中,我添加了800个样本,这些样本与Data_A中的样本类似,200个样本与Data_A中的样本完全不同)

我尝试过OneClassSVM但它没有给出好的结果,而且它的结果完全取决于它的参数(nu,gamma,内核等)。每当我有一套新的训练和测试数据时,我都必须调整这样的模型,我不想这样做。

在python中有没有其他简单的技术或模型来执行此操作?任何使用集合理论执行此操作的Python模块?

如果我无法正确解释问题陈述,请原谅我。

0 个答案:

没有答案