解析python pandas中的列值

时间:2017-06-17 11:29:29

标签: python pandas parsing

我在df和20列中有大约200,000行,而一列包含该站的名称。它看起来像这样:

00001 OPPT YY G
00002 LIMO DA G
000016 KAPAL VS G
0000663 TAPS VS G
...

从列值中获取数字的最佳方法是什么? 期望的输出:

00001
00001
000016
0000663

由于

3 个答案:

答案 0 :(得分:1)

假设Col1是您的专栏

df
Out: 
                Col1
0    00001 OPPT YY G
1    00002 LIMO DA G
2  000016 KAPAL VS G
3  0000663 TAPS VS G

拆分空间并取第一个元素:

df['Col1'].str.split().str[0]
Out: 
0      00001
1      00002
2     000016
3    0000663
Name: Col1, dtype: object

答案 1 :(得分:0)

所以你可以使用这个函数:例如,如果你的数据帧是df而你的第一列包含这些数据,那么:

(df.T).ix[0]

我希望这会对你有所帮助。

答案 2 :(得分:0)

可能是这样的:

df['col_1'] = df['col_1'].replace(r'^(\b\d+\b).*$', r'\1', regex=True)