Rapid Miner - 读取CSV运算符中的数据集元数据信息列表问题

时间:2014-10-20 09:35:34

标签: rapidminer

我使用Rapidminer版本6进行数据分析。我试图读取6000行的csv文件。当我在读取csv运算符中配置元数据信息时,提取数据以仅显示元数据信息列表中的最后一个条目(列)。进程xml代码如下

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<process version="6.1.000">
  <context>
<input/>
<output/>
<macros/>
  </context>
  <operator activated="true" class="process" compatibility="6.1.000" expanded="true"     name="Process">
    <process expanded="true">
      <operator activated="true" class="read_csv" compatibility="6.1.000" expanded="true"  height="60" name="Read CSV" width="90" x="45" y="30">
        <parameter key="csv_file" value="C:\Users\jeganathan.velu\Desktop\Book1.csv"/>
    <parameter key="column_separators" value=","/>
    <list key="annotations"/>
    <list key="data_set_meta_data_information">
      <parameter key="1" value="interest_rate_bps.true.integer.regular"/>
      <parameter key="1" value="Deposit.true.integer.regular"/>
      <parameter key="2" value="Location.true.nominal.regular"/>
    </list>
  </operator>
  <connect from_op="Read CSV" from_port="output" to_port="result 1"/>
  <portSpacing port="source_input 1" spacing="0"/>
  <portSpacing port="sink_result 1" spacing="0"/>
  <portSpacing port="sink_result 2" spacing="0"/>
</process>

但该工具仅输出最后一列的位置而不是元信息列表中配置的所有三列

如果我为10列配置元数据,则只从csv

中读取第10列数据

请求您的帮助,以确定我是在做错事还是这个错误?甲

先谢谢, Jeganathan Velu。

1 个答案:

答案 0 :(得分:0)

我在你的过程中看到了问题 如果您将属性类型从“常规”更改为“属性”,那么您会发现它有效。我认为'常规'是常用属性的引用方式,但后来(至少在ReadCSV运算符中)已经改变为'属性'。