Question

以下是来自csv文件的示例数据，其中每一代都是上一代的子代。

parant,gen1,gen2,get3,gen4,gen5,gen6
query1,AggregateExpression,abc,def,emg,cdf,bcf
query1,And,cse,rds,acd,,
query2,Arithmetic,cbd,rsd,msd,,
query2,Average,as,vs,ve,ew,
query2,BinaryExpression,avsd,sfds,sdf,,
query2,Comparison,sdfs,sdfsx,,,
query3,Count,sfsd,,,,
query3,methods1,add,asd,fdds,sdf,sdf
query3,methods1,average,sdfs,bf,fd,
query4,methods2,distinct,cz,asd,ada,
query4,methods2,eq,sdfs,sdfxcv,sdf,rtyr
query4,methods3,eq,vcx,xcv,cdf,

我需要创建一个以下格式的json文件，其中父项是索引，子项始终是字典列表，并且上一代的大小是计算否。父母出现的时间（上一代）。第一行细分示例：

{
"name": "query1",
"children": [
    {
        "name": "AggregateExpression",
        "children": [
            {
                "name": "abc",
                "children": [
                    {
                        "name": "def",
                        "children": [
                            {
                                "name": "emg",
                                "children": [
                                    {
                                        "name": "cdf",
                                        "children": [
                                            {
                                                "name": "bcf", "size": 1
                                            }
                                        ]

                                    }
                                ]
                            }
                        ]
                    }
                ]
            }
        ]
    }
]
}

我曾尝试使用groupby（）和to_json（）但无法完成。但是如果我需要使用lambda或循环，仍然在努力构建逻辑。欢迎提出任何建议或解决方案。感谢。

将pandas Dataframe转换为嵌套的json密钥对

0 个答案: