这是数据集
{'gender': 'Female', 'document_type': 'driving_licence', 'date_of_expiry': '2025-08-23', 'issuing_country': 'GBR'}
{'gender': 'Male', 'document_type': 'driving_licence', 'date_of_expiry': '2026-11-22', 'issuing_country': 'GBR'}
{'gender': 'Male', 'nationality': 'POL', 'document_type': 'national_identity_card', 'date_of_expiry': '2024-07-21', 'issuing_country': 'POL'}
{'gender': 'Female', 'nationality': 'LTU', 'document_type': 'national_identity_card', 'date_of_expiry': '2023-06-27', 'issuing_country': 'LTU'}
{'document_type': 'driving_licence', 'date_of_expiry': '2044-12-14', 'issuing_country': 'GRC'}
....超过100,000行
我需要将其安排在特定的列标题下,例如性别,国籍,证件类型,到期日,签发国家
此外,某些字段(例如document_type)可以包含不同的值
我尝试拆分字符串,但是由于列标题是随机顺序,所以它不起作用。 我相信我需要使用列名称(即性别)运行搜索查询,然后以最接近的','结尾。我不知道该怎么写