我正在使用read_fwf和列分隔符列表将2个.dat文件读入pandas数据帧。在一种情况下,数据框的最后一列删除了前导零(我想要的),但在另一种情况下却没有。
以下是我编写的用于加载每个文件的代码:
fhand=open(r'xyz')
divider=[(0,10),(11,15),(15,24),(24,35),(35,57),(61,75),(72,99)]
df=pd.read_fwf(fhand,colspecs=divider)
df.columns= ['Date','FundID','ID','Ticker','SecName','Quantity','Other']
df.pop('Date')
df.pop('Other')
这是每个文件源的一行,我在其中突出显示了正在读入数量列的内容。 File 1 Data File 2 Data