清理连接在一起并放入通用CSV的多个CSV的CSV

时间:2015-02-22 23:07:24

标签: python csv pandas header dataframe

我想使用pandas / python。

我有多个CSV,这些CSV具有常见的列名,但这些列的顺序不同。

它们已合并为一个CSV,每个CSV的所有标题都会保留。

示例标题是:

  • 标题,描述,工作位置
  • ....,...,...
  • 职位,招聘组织,行业,职称
  • ...,...,...,...
  • description,dateposted,joblocation,industry
  • ......,....,....

我如何:

  1. 遍历标题中的每一行,直到下一个CSV的开头
  2. 将每行中的单元格查找到其所属的列标题,并将该列中的所有单元格移动到正确的主模式'
  3. 转到下一个CSV部分并执行相同操作,将每个单元格放在正确的列标题下面。

1 个答案:

答案 0 :(得分:1)

我意识到您已经遇到了将csv文件合并到一个主文件中的麻烦,但可能有更好的方法。

如果您构建了一个数据框列表,并且每个数据框代表一个csv文件,您可以利用pandas的concat。一个非常有用的功能,用于将多个帧与公共标题组合成一个帧

http://pandas.pydata.org/pandas-docs/dev/generated/pandas.tools.merge.concat.html