Question

这是数据集

{'gender': 'Female', 'document_type': 'driving_licence', 'date_of_expiry': '2025-08-23', 'issuing_country': 'GBR'}
{'gender': 'Male', 'document_type': 'driving_licence', 'date_of_expiry': '2026-11-22', 'issuing_country': 'GBR'}
{'gender': 'Male', 'nationality': 'POL', 'document_type': 'national_identity_card', 'date_of_expiry': '2024-07-21', 'issuing_country': 'POL'}
{'gender': 'Female', 'nationality': 'LTU', 'document_type': 'national_identity_card', 'date_of_expiry': '2023-06-27', 'issuing_country': 'LTU'}
{'document_type': 'driving_licence', 'date_of_expiry': '2044-12-14', 'issuing_country': 'GRC'}

....超过100,000行

我需要将其安排在特定的列标题下，例如性别，国籍，证件类型，到期日，签发国家

此外，某些字段（例如document_type）可以包含不同的值

我尝试拆分字符串，但是由于列标题是随机顺序，所以它不起作用。我相信我需要使用列名称（即性别）运行搜索查询，然后以最接近的'，'结尾。我不知道该怎么写

如何在python中动态拆分字符串？

0 个答案: