我的Python脚本解析了一些Excel文件的文本。它从Excel文件中剥离空白区域并更改分隔符 (来自":" - >",") 我的脚本输出到CSV文件。大部分数据看起来像this (Excel中的数据是什么样的)
由于存在额外的逗号或两个逗号而由单个列分隔。
CSV ==逗号分隔值。
我已经尝试使用if语句来添加或减去逗号以试图支持它,但它最终完全弄乱了它的第一个相对顺序。让我疯了!
尝试以另一种方式使用pip安装pandas库(数据操作库)。
是否可以在单个数据框中合并 no 列标题的列?关于单独的DataFrame有很多建议,但对于单个DataFrame很多。
此外,如何在保留行位置的同时合并列。电子邮件位于正确的行位置,但不在列位置。
或者我完全走错了轨道,对于简单的解析脚本,熊猫是否过度杀伤?我一直在学习python,因为我一直试着完成脚本,所以我可能错过了一个简单的方法。
一些示例数据:
C5XXEmployeeNumXX,C5XXEmployeeNumXX,JohnSmith,1,,John,,Smith,,IT Supp.Centre,EU,,London1,,,59XXXX,ITServiceDesk,LOND01,,,,Notmaintained,,,,,,,,john.smith@company.com,
解析逻辑片段
for line in f:
#finds the identifier for users
if ':LON ' in line:
#parsing logic.
#Delimitters are swapped. Whitespace is scrubbed
line = line.replace(':', ',')
line = line.replace(' ', '')
答案 0 :(得分:0)
您可以使用您选择的分隔符/分隔符。退房:https://docs.python.org/2/library/csv.html#csv.Dialect.delimiter。
此外,关于订单,如果您正在阅读列表,它应该没问题,但如果您正在读取字典中行的内容,那么订单不会被保留是正常的。