Botnet_Training_data = np.genfromtxt("training_data.txt", delimiter = ",")
这是我用来从文本文件导入数据的代码,但是当我打印数据时,这就是我所看到的:
print (Botnet_Training_data[0])
[ 0.00000000e+00 nan nan nan
4.91000000e+02 0.00000000e+00 0.00000000e+00 0.00000000e+00]
我知道nan不是一个数字,但我想知道如何输入名义特征
和侧面问题是否sklearn支持名义功能?
答案 0 :(得分:0)
我不确定你的名义'名义上的'。但是默认情况下genfromtxt
将值导入为浮点数。如果它无法将字符串转换为浮点数,则会将nan
放在该插槽中。
试试dtype=None
,向我们展示结果的.shape
和.dtype
。
类似的答案提示dtype=None
:https://stackoverflow.com/a/27067667/901925
在这里https://stackoverflow.com/a/36092934/901925
我询问形状和dtype,因为它可能会生成一个1d结构化数组 - 这导致其他常见的genfromtxt
问题。