我是Pentaho的新用户,我正试图在Kettle步骤中解析JSON。
我知道如何解析所有未更改的JSON字段,但是有些字段我无法确定长度,因为它们是数组。在以下示例中,查看字段“palavras_chave”:
AcctGatherProfileType/hdf5
另一段代码:
{
"identificacao": "Manejo Floinga. ",
"historico": "A técni.",
"descricao": "A.sasasa ",
"objetivos": "Existem. ",
"sustentabilidade": "Co.",
"vantagens_desvantagens": "VANTAGENS: resi",
"custos": "INVESTIMENTOS e CUSTOS: a",
"direitos": "Tecnologia livre. ",
"instituicao": "Tecnologia ",
"assistencia_manutencao_te": " ",
"experiencia": "Existem cerca de ",
"entraves_adocao": "ENTRAção. ",
"condicoes_requeridas": "Aio.",
"fornecedores": "Sódocumentlarizada.",
"usuarios": "Produtecolementar. ",
"programa": "Eme.",
"avaliacao_impacto": " reidos. ",
"transferencia_tecnologia": "públrsos.",
"outros": "Até 1000 cs",
"visualizacao_tecnologia": "Consu",
"palavras_chave": [
"Caaga",
"uso vel",
"padeireiros",
"manrestal"
],
"referencias": "Livro '.pdf",
"replicabilidade": "Atéa. ",
"fonte": "Meiro"
},
如何解析可变长度的输入并在Kettle中使用它?如果我使用Python进行编程,我只需要在数组上进行交互,并在循环内部执行循环。
有没有办法在这里做到这一点?这个概念是错的吗?
答案 0 :(得分:0)
我找到了答案,我正在寻找一种方法来规范我的数据(我不知道这是以前的术语),一个名叫marabu的成员来自pentaho论坛帮助。 这样做的方法很简单,我们想要规范化数据,我们应该选择“输出中的Rownum”选项,并给它一个如下名称。 The rownum option
之后我可以使用rownum字段来保持对每个json的每个id的引用,这样我就可以在关系dbms中插入正确的引用。这一步就在这里。 the kettle step