Question

Botnet_Training_data = np.genfromtxt("training_data.txt", delimiter = ",")

这是我用来从文本文件导入数据的代码，但是当我打印数据时，这就是我所看到的：

print (Botnet_Training_data[0])

    [  0.00000000e+00   nan   nan   nan
   4.91000000e+02   0.00000000e+00   0.00000000e+00   0.00000000e+00]

我知道nan不是一个数字，但我想知道如何输入名义特征

和侧面问题是否sklearn支持名义功能？

Answer 1

我不确定你的名义＆＃39;名义上的＆＃39;。但是默认情况下genfromtxt将值导入为浮点数。如果它无法将字符串转换为浮点数，则会将nan放在该插槽中。

试试dtype=None，向我们展示结果的.shape和.dtype。

我询问形状和dtype，因为它可能会生成一个1d结构化数组 - 这导致其他常见的genfromtxt问题。