我目前正在研究这些数据 -
10,000个样本的Data_A,每个样本具有170个特征
Data_B有1,000个样本,每个样本具有相同的170个特征
如果我们在170维空间上绘制Data_A,那么它将覆盖一些空间。所以,我只想知道Data_B中我的样本百分比属于那个空间。 我不需要想象任何东西,我只是一个子集。
(实际上,在我的Data_B中,我添加了800个样本,这些样本与Data_A中的样本类似,200个样本与Data_A中的样本完全不同)
我尝试过OneClassSVM但它没有给出好的结果,而且它的结果完全取决于它的参数(nu,gamma,内核等)。每当我有一套新的训练和测试数据时,我都必须调整这样的模型,我不想这样做。
在python中有没有其他简单的技术或模型来执行此操作?任何使用集合理论执行此操作的Python模块?
如果我无法正确解释问题陈述,请原谅我。