我在txt文件中有一个8行的数据集,其中制表符分隔格式没有引号。 我有14列中的5列,日期值为dd.MM.yyyy格式。
问题1 我正在尝试导入该文件。在“格式化您的列”步骤中,如果我选择该列的类型为“日期”,则会出现错误,列中的所有单元格都会变为“?”
所以我选择了“多项式”并计划稍后将属性类型转换为日期。
问题2(真实的) 我导入了数据并放入“名义到日期”操作符。当我跑步时,我在第14.899行遇到错误:
Cannot parse date: Unparseable date: "0"
我找到了这一行,我看到列分隔错了。前一个单元格中的字符串中有一个制表符。因此,值将一个单元格移动了而这一行并不是唯一一个感动的行。
我想将具有错误数据类型值的行拆分为spesified属性。所以我不能手动纠正它们。
我怎样才能在Rapidminer中做到这一点?
还有其他想法来解决这些问题?