如何有效地标准化pandas数据框中的数字列

时间:2015-11-15 02:48:19

标签: python numpy pandas

在熊猫数据框中,我有任意混合的名义和实值列,我想标准化数字列。我有这段代码,它完成了这项工作......但是它使用两个.tolist()函数调用来使它工作。我很难理解索引,我觉得可能有一个更快的方法

class Standardizer():
  def __init__(self, matrix):
    self.means_ = matrix.mean()
    self.stds_ = matrix.std()

  def transform(self, matrix):
    matrix = matrix.fillna(self.means_)

    matrix[self.means_.index] = (matrix[self.means_.index] - self.means_.tolist()) / self.stds_.tolist()

    return matrix

0 个答案:

没有答案