Question

我是Pentaho的新用户，我正试图在Kettle步骤中解析JSON。

我知道如何解析所有未更改的JSON字段，但是有些字段我无法确定长度，因为它们是数组。在以下示例中，查看字段“palavras_chave”：

AcctGatherProfileType/hdf5

另一段代码：

{
    "identificacao": "Manejo Floinga. ",
    "historico": "A técni.",
    "descricao": "A.sasasa ",
    "objetivos": "Existem. ",
    "sustentabilidade": "Co.",
    "vantagens_desvantagens": "VANTAGENS: resi",
    "custos": "INVESTIMENTOS e CUSTOS: a",
    "direitos": "Tecnologia livre. ",
    "instituicao": "Tecnologia ",
    "assistencia_manutencao_te": " ",
    "experiencia": "Existem cerca de ",
    "entraves_adocao": "ENTRAção. ",
    "condicoes_requeridas": "Aio.",
    "fornecedores": "Sódocumentlarizada.",
    "usuarios": "Produtecolementar. ",
    "programa": "Eme.",
    "avaliacao_impacto": " reidos. ",
    "transferencia_tecnologia": "públrsos.",
    "outros": "Até 1000 cs",
    "visualizacao_tecnologia": "Consu",
    "palavras_chave": [
        "Caaga",
        "uso vel",
        "padeireiros",
        "manrestal"
    ],
    "referencias": "Livro '.pdf",
    "replicabilidade": "Atéa. ",
    "fonte": "Meiro"
},

如何解析可变长度的输入并在Kettle中使用它？如果我使用Python进行编程，我只需要在数组上进行交互，并在循环内部执行循环。

有没有办法在这里做到这一点？这个概念是错的吗？

Answer 1

我找到了答案，我正在寻找一种方法来规范我的数据（我不知道这是以前的术语），一个名叫marabu的成员来自pentaho论坛帮助。这样做的方法很简单，我们想要规范化数据，我们应该选择“输出中的Rownum”选项，并给它一个如下名称。 The rownum option

之后我可以使用rownum字段来保持对每个json的每个id的引用，这样我就可以在关系dbms中插入正确的引用。这一步就在这里。 the kettle step

使用Pentaho中的变量JSON字段

1 个答案: