Python根据列数据预测列标题

时间:2018-09-26 08:04:27

标签: python pandas dataframe

我有很多CSV文件,其中包含不同的列名但数据相似,例如:


account  name    address
   1      2         3     
   4      5         6     

lookup  accountname accountaddress
   7      8         9     
   10     11       12     

其中accountlookup是相同的字段,nameaccountname是相同的,依此类推。有没有一种方法可以将所有这些规范化或分类为一个公共列名?我无法将其映射到哈希表中,因为列名从不相似,每次创建一个新文件时,列名都不同,并且它们在表中出现的顺序也不同。

1 个答案:

答案 0 :(得分:0)

您可以尝试以下操作:

  1. 使用dictreader解析csv数据 row_list = [] with open(file_path) as f: cf = csv.DictReader(f, delimiter=<field separator>, fieldnames=[<columnslist>]) for row in cf: tmp_row = collections.OrderedDict() for column in cf.fieldnames: tmp_row[column] = row[column] row_list.append(tmp_row) return row_list

然后使用dictwriter将对象row_list转储到csv文件中。