无法正确地将数据导入Rapidminer

时间:2014-05-12 01:04:21

标签: csv import data-mining rapidminer

我要导入的数据位于:http://archive.ics.uci.edu/ml/machine-learning-databases/car/

car.data 51 K

此数据中没有缺失值,但导入数据后,快速挖掘机中有很多"?"s。我查看了源代码,这些数据显示为"?",在源代码中确实存在。可能是什么问题?

顺便说一句,如果我下载该文件,它的扩展名为.data。我该如何导入那种文件?我将其导入就像它是.csv文件一样,一开始看起来不错,但有"?"s个。

2 个答案:

答案 0 :(得分:0)

自从我使用Rapidminer之后的某个时间,但是AFAIK,您可以使用.data导入csv Import Wizard文件,并将文件类型设置为All Files

关于?值,您可以在导入文件时查看设置,并且可能必须调整Step 4 {下边菜单中的Import Wizard中的数据类型< / p>

答案 1 :(得分:0)

使用Read CSV运算符加载文件。

在“数据导入向导 - 第2步,共4步”屏幕中,找到列分离组框,然后选择单选按钮逗号“,”。默认分隔符为分号和car.csv以逗号分隔。

在下一步 - “数据导入向导 - 第3步,共4步” - 将第1行的注释从名称更改为 - (短划线字符) 。这告诉RapidMiner第一行包含数据而不是列标题。