Question

我的Python脚本解析了一些Excel文件的文本。它从Excel文件中剥离空白区域并更改分隔符（来自＆＃34;：＆＃34; - ＆gt;＆＃34;，＆＃34;）我的脚本输出到CSV文件。大部分数据看起来像this （Excel中的数据是什么样的）

由于存在额外的逗号或两个逗号而由单个列分隔。

CSV ==逗号分隔值。

我已经尝试使用if语句来添加或减去逗号以试图支持它，但它最终完全弄乱了它的第一个相对顺序。让我疯了！

尝试以另一种方式使用pip安装pandas库（数据操作库）。

是否可以在单个数据框中合并 no 列标题的列？关于单独的DataFrame有很多建议，但对于单个DataFrame很多。

此外，如何在保留行位置的同时合并列。电子邮件位于正确的行位置，但不在列位置。

或者我完全走错了轨道，对于简单的解析脚本，熊猫是否过度杀伤？我一直在学习python，因为我一直试着完成脚本，所以我可能错过了一个简单的方法。

一些示例数据：

C5XXEmployeeNumXX,C5XXEmployeeNumXX,JohnSmith,1,,John,,Smith,,IT Supp.Centre,EU,,London1,,,59XXXX,ITServiceDesk,LOND01,,,,Notmaintained,,,,,,,,john.smith@company.com,

解析逻辑片段

    for line in f:

    #finds the identifier for users
    if ':LON ' in line:

        #parsing logic.
        #Delimitters are swapped. Whitespace is scrubbed
        line = line.replace(':', ',')
        line = line.replace(' ', '')

Answer 1

您可以使用您选择的分隔符/分隔符。退房：https://docs.python.org/2/library/csv.html#csv.Dialect.delimiter。

此外，关于订单，如果您正在阅读列表，它应该没问题，但如果您正在读取字典中行的内容，那么订单不会被保留是正常的。

如何在python脚本中合并没有标题名称的列？

1 个答案: