如何使用Pandas / python3将json转换为csv?

时间:2019-10-17 01:05:03

标签: json python-3.x csv converters

我尝试将JSON文件转换为csv文件。我已经在迭代博客和这里的stackoverflow上检查了大多数交付的解决方案。但是我尝试过的事情没有解决...

我正在收集来自不同网站的请求和响应标头,并使用'json'保存传入的数据。

出于分析目的,我想将这些数据转换为csv或excel,也可以选择转换为SQLite。

在这种情况下,收集数据意味着标头未知,并且可能随时间变化。

我尝试了一些熊猫,但没有成功。

我的Json数据如下:

[
    {
        "request_headers": {
            "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.71 Safari/537.36",
            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
            "Connection": "keep-alive",
            "Upgrade-Insecure-Requests": "1",
            "Cookie": "NID=189=rWuM7h_22U5ed7lJX9ewHyxOHJbRB0pgrlemwaGWLZtxDxweyi6e97D6kJ8ONYTz7OwtTl7SWj7qKED8Sspu7VfOnm9uZztJenCp68GjWIsMqOXrueIByIFgi-sLWjzLoDr7UnR1svQFa9tgHPDguKxVoV9-5uRpJsWQIJ30iZs; 1P_JAR=2019-10-13-16; CONSENT=WP.27f3c1",
            "DNT": "1",
            "Accept-Encoding": "gzip, deflate",
            "Accept-Language": "it-IT,de;q=0.9,en-US;q=0.8,en;q=0.7"
        },
        "status_code": 200,
        "url": "https://www.google.com/?gws_rd=ssl",
        "headers": {
            "Set-Cookie": "1P_JAR=2019-10-13-16; expires=Tue, 12-Nov-2019 16:11:15 GMT; path=/; domain=.google.com; SameSite=none, NID=189=K1LFDX7rwYGGQ74fbrLC7oPToRGnrEjLM-oFj2m5p4uYbHtKlmEaDmBW0qb7PZeYOXq7SFvdYlUCmqZmAU2Rrd1rMPqN2uKs0Iid30HiVFJKReQl8Dkjpm9iAgHjgbxgb0ouEQKo6dSCNSbLOyQTMnRLBqhvSavOsOT4DtmeCrs; expires=Mon, 13-Apr-2020 16:11:15 GMT; path=/; domain=.google.com; HttpOnly",
            "Transfer-Encoding": "chunked",
            "Content-Type": "text/html; charset=UTF-8",
            "P3P": "CP=\"This is not a P3P policy! See g.co/p3phelp for more info.\"",
            "Server": "gws",
            "X-Frame-Options": "SAMEORIGIN",
            "Strict-Transport-Security": "max-age=31536000",
            "Alt-Svc": "quic=\":443\"; ma=2592000; v=\"46,43\",h3-Q048=\":443\"; ma=2592000,h3-Q046=\":443\"; ma=2592000,h3-Q043=\":443\"; ma=2592000",
            "Date": "Sun, 13 SEP 2018 16:11:15 GMT",
            "X-XSS-Protection": "0",
            "Expires": "-1",
            "Content-Encoding": "gzip",
            "Cache-Control": "private, max-age=0"
        }
    },

我想要一个可以读取任何json文件的转换器。首先,键被认为是每一列的标题(例如,用户代理,传输编码,缓存控制,日期a.s.o),并且给定的值应在相应的列/行之内。

所以你有 用户代理|日期|网址| status_code Firefox |太阳,... | www.google.com | 200 镀铬|星期六... www.google.com | 301 边缘星期三,... 。

谢谢!

PS:如果您知道任何链接可以帮助我找到合适的解决方案,我也很高兴。

1 个答案:

答案 0 :(得分:0)

这是我目前的解决方案:

import pandas as pd
df = pd.read_json('file.json')
df.to_csv('file.csv')