连续三维变量的离散化

时间:2017-02-02 10:18:22

标签: python machine-learning classification discretization

我目前正在研究具有3维连续变量(x,y,z)的机器学习分类问题,我还想添加已经是离散变量的时间(t)。我的数据的样子示例:

     x                    y                    z                   t 
[0.1 ,2.6, 0.0]   [0.1 ,2.0, -3.0]    [0.0 ,5.6, 5.0]         1486033702474

每个连续变量的平均值是否足够? 请问如何在Python中的任何ML库中表示/格式化这些变量以形成我的训练数据集?

1 个答案:

答案 0 :(得分:1)

计算中的变量总是离散的。术语“连续”根本不适用,因为计算机是数字机器,因此只能以有限的速率采样数据。如果您想降低数据的粒度,取决于您的具体情况,取平均值将是一个有效选项。获取Python中数据列表的含义:

mean_x = sum(x) * 1. / len(x)