如何在python中动态拆分字符串?

时间:2019-06-02 20:50:20

标签: split data-analysis

这是数据集

{'gender': 'Female', 'document_type': 'driving_licence', 'date_of_expiry': '2025-08-23', 'issuing_country': 'GBR'}
{'gender': 'Male', 'document_type': 'driving_licence', 'date_of_expiry': '2026-11-22', 'issuing_country': 'GBR'}
{'gender': 'Male', 'nationality': 'POL', 'document_type': 'national_identity_card', 'date_of_expiry': '2024-07-21', 'issuing_country': 'POL'}
{'gender': 'Female', 'nationality': 'LTU', 'document_type': 'national_identity_card', 'date_of_expiry': '2023-06-27', 'issuing_country': 'LTU'}
{'document_type': 'driving_licence', 'date_of_expiry': '2044-12-14', 'issuing_country': 'GRC'}

....超过100,000行

我需要将其安排在特定的列标题下,例如性别,国籍,证件类型,到期日,签发国家

此外,某些字段(例如document_type)可以包含不同的值

我尝试拆分字符串,但是由于列标题是随机顺序,所以它不起作用。 我相信我需要使用列名称(即性别)运行搜索查询,然后以最接近的','结尾。我不知道该怎么写

0 个答案:

没有答案