如何在python脚本中合并没有标题名称的列?

时间:2017-01-20 14:57:20

标签: python excel csv pandas

我的Python脚本解析了一些Excel文件的文本。它从Excel文件中剥离空白区域并更改分隔符 (来自":" - >",") 我的脚本输出到CSV文件。大部分数据看起来像this (Excel中的数据是什么样的)

由于存在额外的逗号或两个逗号而由单个列分隔。

CSV ==逗号分隔值。

我已经尝试使用if语句来添加或减去逗号以试图支持它,但它最终完全弄乱了它的第一个相对顺序。让我疯了!

尝试以另一种方式使用pip安装pandas库(数据操作库)。

是否可以在单个数据框中合并 no 列标题的列?关于单独的DataFrame有很多建议,但对于单个DataFrame很多。

此外,如何在保留行位置的同时合并列。电子邮件位于正确的行位置,但不在列位置。

或者我完全走错了轨道,对于简单的解析脚本,熊猫是否过度杀伤?我一直在学习python,因为我一直试着完成脚本,所以我可能错过了一个简单的方法。

一些示例数据:

C5XXEmployeeNumXX,C5XXEmployeeNumXX,JohnSmith,1,,John,,Smith,,IT Supp.Centre,EU,,London1,,,59XXXX,ITServiceDesk,LOND01,,,,Notmaintained,,,,,,,,john.smith@company.com,

解析逻辑片段

    for line in f:

    #finds the identifier for users
    if ':LON ' in line:

        #parsing logic.
        #Delimitters are swapped. Whitespace is scrubbed
        line = line.replace(':', ',')
        line = line.replace(' ', '')

1 个答案:

答案 0 :(得分:0)

您可以使用您选择的分隔符/分隔符。退房:https://docs.python.org/2/library/csv.html#csv.Dialect.delimiter

此外,关于订单,如果您正在阅读列表,它应该没问题,但如果您正在读取字典中行的内容,那么订单不会被保留是正常的。