我目前正在研究具有3维连续变量(x,y,z)的机器学习分类问题,我还想添加已经是离散变量的时间(t)。我的数据的样子示例:
x y z t
[0.1 ,2.6, 0.0] [0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0] 1486033702474
每个连续变量的平均值是否足够? 请问如何在Python中的任何ML库中表示/格式化这些变量以形成我的训练数据集?
答案 0 :(得分:1)
计算中的变量总是离散的。术语“连续”根本不适用,因为计算机是数字机器,因此只能以有限的速率采样数据。如果您想降低数据的粒度,取决于您的具体情况,取平均值将是一个有效选项。获取Python中数据列表的含义:
mean_x = sum(x) * 1. / len(x)