使用Pentaho中的变量JSON字段

时间:2017-05-11 12:55:17

标签: json parsing pentaho kettle

我是Pentaho的新用户,我正试图在Kettle步骤中解析JSON。

Steps

JSON parsing

我知道如何解析所有未更改的JSON字段,但是有些字段我无法确定长度,因为它们是数组。在以下示例中,查看字段“palavras_chave”:

AcctGatherProfileType/hdf5

另一段代码:

{
    "identificacao": "Manejo Floinga. ",
    "historico": "A técni.",
    "descricao": "A.sasasa ",
    "objetivos": "Existem. ",
    "sustentabilidade": "Co.",
    "vantagens_desvantagens": "VANTAGENS: resi",
    "custos": "INVESTIMENTOS e CUSTOS: a",
    "direitos": "Tecnologia livre. ",
    "instituicao": "Tecnologia ",
    "assistencia_manutencao_te": " ",
    "experiencia": "Existem cerca de ",
    "entraves_adocao": "ENTRAção. ",
    "condicoes_requeridas": "Aio.",
    "fornecedores": "Sódocumentlarizada.",
    "usuarios": "Produtecolementar. ",
    "programa": "Eme.",
    "avaliacao_impacto": " reidos. ",
    "transferencia_tecnologia": "públrsos.",
    "outros": "Até 1000 cs",
    "visualizacao_tecnologia": "Consu",
    "palavras_chave": [
        "Caaga",
        "uso vel",
        "padeireiros",
        "manrestal"
    ],
    "referencias": "Livro '.pdf",
    "replicabilidade": "Atéa. ",
    "fonte": "Meiro"
},

如何解析可变长度的输入并在Kettle中使用它?如果我使用Python进行编程,我只需要在数组上进行交互,并在循环内部执行循环。

有没有办法在这里做到这一点?这个概念是错的吗?

1 个答案:

答案 0 :(得分:0)

我找到了答案,我正在寻找一种方法来规范我的数据(我不知道这是以前的术语),一个名叫marabu的成员来自pentaho论坛帮助。 这样做的方法很简单,我们想要规范化数据,我们应该选择“输出中的Rownum”选项,并给它一个如下名称。 The rownum option

之后我可以使用rownum字段来保持对每个json的每个id的引用,这样我就可以在关系dbms中插入正确的引用。这一步就在这里。 the kettle step