如何在numpy Python中导入名义特征

时间:2016-07-04 00:49:06

标签: python numpy machine-learning scikit-learn

Botnet_Training_data = np.genfromtxt("training_data.txt", delimiter = ",")

这是我用来从文本文件导入数据的代码,但是当我打印数据时,这就是我所看到的:

print (Botnet_Training_data[0])

    [  0.00000000e+00   nan   nan   nan
   4.91000000e+02   0.00000000e+00   0.00000000e+00   0.00000000e+00]

我知道nan不是一个数字,但我想知道如何输入名义特征

和侧面问题是否sklearn支持名义功能?

1 个答案:

答案 0 :(得分:0)

我不确定你的名义'名义上的'。但是默认情况下genfromtxt将值导入为浮点数。如果它无法将字符串转换为浮点数,则会将nan放在该插槽中。

试试dtype=None,向我们展示结果的.shape.dtype

类似的答案提示dtype=Nonehttps://stackoverflow.com/a/27067667/901925 在这里https://stackoverflow.com/a/36092934/901925

我询问形状和dtype,因为它可能会生成一个1d结构化数组 - 这导致其他常见的genfromtxt问题。