答案 0 :(得分:0)
解决此问题的方法很多。
答案 1 :(得分:0)
您的问题没有具体答案,这是统计中的普遍问题,称为“输入”。取决于应用程序,答案可能有很多。
首先想到的是解决您的问题的几种替代方法,但请不要忘记,“没有数据”几乎总是比“坏/错误的数据”要好。 如果您有足够多的行而没有带有NaN的行,则可以将其删除。否则,您可以考虑以下内容:
我建议您尝试所有方法,看看哪种方法更好,因为对于您的问题确实没有具体的答案。您可以创建机器学习模型而无需使用该列,而将其性能用作基线,并针对与基线相比的所有步骤执行性能(准确性)基准测试。
注意:我只是一位有一定见识的研究生,如果我所说的内容不正确,请予以注释!