我将this way中标准化的分位数用于我的数据集,然后将这个数据集的分位数值用于另一个数据集,并使用该值,对吗?
这是我的代码:
# quantile is a list of quantile values from the first dataset
for i in range(0, dataset.shape[1]):
uniq_i = np.unique(dataset[:, i]).tolist()
idxrnk = np.array(map(uniq_i.index, dataset[:, i]))
idxpos = (idxrnk + 1.0)/len(uniq_i)
idx_ = (idxpos *dataset.shape[0]).astype('int')-1
normalizedDataset[:, i] = quantile[idx_]