python-熊猫-数据框-数据填充多维统计信息

时间:2020-02-20 16:38:01

标签: pandas machine-learning statistics padding least-squares

我有一个数据框,其中的列说明了恒星的不同特征,行说明了不同恒星的测量结果。 (类似这样)

\ property _______ A _______A_error_________B_______B_error_________C_______C_error ...

star1

star2

star3

...

在某些测量中,特定属性的误差为-1.00,这意味着测量有错误。

在这种情况下,我想放弃测量。

一种方法是消除整个行(以及其他错误不是-1.00的属性)

我认为有可能用由分布基于所有其他测量值生成的值来填充错误的测量值,这意味着-给定其他良好的属性,该属性应具有该值以减少误差。整个数据集。

我指的是一个适当的名称吗? 您将如何应用这样的算法?

我是一个单独项目的学生,因此,我将非常感谢同样详细阐述理论的答案(:

编辑

进一步阅读后,我认为我指的是回归归因。

所以我想我的问题是-如何以最有效的方式在数据框中实现多维线性回归?

谢谢!

0 个答案:

没有答案