数据分析 - 数据清理

时间:2018-05-31 02:30:49

标签: python matlab analytics data-analysis

在进行数据拟合的过程中,我得到了300个数据,但是数据之间的差异太大了,我想要30个最后一个值,有什么方法吗?以下是对这300个数据的简单分析,我有300个数字,而且我在网上搜索了很长时间。但没用。请帮助或尝试提供一些如何实现这一目标的想法:

mailchimp1.lists.subscribe(
  "xxxxxxxxx", 
  { email: "srividhya@xxxxxx.com" },
  {
       FNAME: "srividhya",
       LNAME: "prakash"
    }
)

1 个答案:

答案 0 :(得分:0)

如果你使用sklearn 你可以使用StandardScaler 只转换您认为差异太大的数据

来自sklearn.preprocessing导入StandardScaler

X_scaler = StandardScaler()
X_train = X_scaler.fit_transform(X_train)
X_test = X_scaler.transform(X_test)

供参考:http://scikit-learn.org/stable/auto_examples/applications/plot_prediction_latency.html#sphx-glr-auto-examples-applications-plot-prediction-latency-py