如何重新格式化数据帧,抑制指数

时间:2016-08-01 22:23:50

标签: python pandas

如何重新格式化pandas数据框,以便没有科学记数法,如指数符号?而且,serial_num应该是整数。

我尝试了df = pd.read_csv(StringIO('data.csv')),但它没有用。

df = pd.read_csv('data.csv')
print df

    id   serial_num    membershipid    date 
0   1   ["374740"]   8.6948585e+7    2016-05-06 
1   2   ["277474"]   5.2444556e+7    2016-05-06 
2   3   ["394005"]   8.5948585e+7    2016-05-06 

#Output should be this instead;

   id    serial_num  membershipid    date   
0   1     374740     86948585        2016-05-06 
1   2     277474     52444556          2016-05-06 
2   3     394005     85948585       2016-05-06 

1 个答案:

答案 0 :(得分:1)

尝试:

df.membershipid = df.membershipid.astype(int)
df.serial_num = df.serial_num.str.extract(r'"(.*)"', expand=False).astype(int)

enter image description here