我想读取一个CSV文件并将其保存为pandas中的数据框。
但我遇到了问题,因为我有这样的行:
BG,6141.6,6141.6,,3.0,,,ic
如您所见,有三个分隔符:',,,'
,',,'
和,
如何将其正确加载到pandas中?
答案 0 :(得分:2)
使用正则表达式分隔符[,]+
- 一个或多个,
:
import pandas as pd
from pandas.compat import StringIO
temp=u"""iBG,6141.6,6141.6,,3.0,,,ic"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="[,]+", header=None, engine='python')
print (df)
0 1 2 3 4
0 iBG 6141.6 6141.6 3.0 ic