导入csv

时间:2019-06-07 08:52:18

标签: python pandas dataframe

我是Python / Pandas的新手。我想知道是否有一个代码可以帮助我修复我们从系统中拉出的.csv内列如何向右移动-一列充满了用户输入(包含混乱字符“,”),因此通常在加载用户后输入列分散在几列而不是一列上,也错误地将其他列移到右侧。

我在excel中手动修复了此问题,手动进行了过滤,删除,将列移动到正确的位置-每天需要20分钟。 enter image description here

我想问一下是否有代码可以尝试正确地清理和排列列,或者像现在这样更容易在excel中进行手动修复。谢谢!

2 个答案:

答案 0 :(得分:2)

pandas正在更改列,因为它在导入文件中看到“分隔符”。

在Excel中,对于每个换行符,计算逗号出现的次数。使用上面的示例,每行应该有3个。

我的快速而又肮脏的解决方案是将文件中的最后三个逗号替换为用户几乎无法键入的字符,我通常选择竖线“ |”字符。

尝试将其导入熊猫,在下面指定一个新的delimier / separator示例:

import pandas as pd
df = pd.read_csv(filepath, sep="|")
df.head()

答案 1 :(得分:0)

您不能使用纯数据传输格式的CSV布局。希望有第3方库可以与.xlsx文件herehere一起播放。