我使用以下方法将rpt数据读取到pandas:
import pandas as pd
df = pd.read_fwf("2014-1.rpt", skiprows=[1], nrows=150)
我实际上是按照anwser here 但是,对于某些列,分离不准确。这是我得到的样本:
Country Order Date Device Category
UK 2014-01-03 Desktop Shoes
IT 2014-01-03 Desktop Shoes
FR 2014-01-04 Desktop Dress
FR 2014-01-04 Tablet Dress
US 2014-01-05 Desktop Bags
US 2014-01-06 Desktop Bags
UK 2014-01-07 Tablet Dress
例如,它将Order Date和Device列作为单个列读取。实际上,这只是一个例子,有很多这样的列。 怎么解决?你有什么主意吗? 实际上这些有问题的列可能有固定的宽度
答案 0 :(得分:3)
这个问题很老,但这是一个答案。您可以使用pandas将其作为csv读取。我已经将它用于各种rpt文件并且它已经有效了。
import pandas as pd
df = pd.read_csv("2014-1.rpt", skiprows=[1], nrows=150)