这里的问题很简单:例如,如果我读取一个.csv文件,我如何在运行时知道该文件包含哪些列? 我想将该.csv文件转换为JSON,但我不知道如何动态设置JSON Output步骤的字段,以包括该文件的所有行。你能帮我扩展我的知识吗?
预先感谢
答案 0 :(得分:1)
这绝对是元数据注入的好用例。该步骤具体称为ETL Metadata Injection
。您可能需要使用脚本步骤动态获取字段(有Java,JavaScript和Python脚本步骤可用,如果您是企业客户,则还有R)。我认为没有内置步骤可以在运行时动态发现字段。
一旦有了字段,就可以使用元数据注入步骤将字段名称注入CSV输入或文本文件输入步骤以及JSON输出步骤。
这是ETL Metadata Injection
步骤上的官方帮助文档:https://help.pentaho.com/Documentation/8.1/Products/Data_Integration/Transformation_Step_Reference/ETL_Metadata_Injection