我在df和20列中有大约200,000行,而一列包含该站的名称。它看起来像这样:
00001 OPPT YY G
00002 LIMO DA G
000016 KAPAL VS G
0000663 TAPS VS G
...
从列值中获取数字的最佳方法是什么? 期望的输出:
00001
00001
000016
0000663
由于
答案 0 :(得分:1)
假设Col1
是您的专栏
df
Out:
Col1
0 00001 OPPT YY G
1 00002 LIMO DA G
2 000016 KAPAL VS G
3 0000663 TAPS VS G
拆分空间并取第一个元素:
df['Col1'].str.split().str[0]
Out:
0 00001
1 00002
2 000016
3 0000663
Name: Col1, dtype: object
答案 1 :(得分:0)
所以你可以使用这个函数:例如,如果你的数据帧是df而你的第一列包含这些数据,那么:
(df.T).ix[0]
我希望这会对你有所帮助。
答案 2 :(得分:0)
可能是这样的:
df['col_1'] = df['col_1'].replace(r'^(\b\d+\b).*$', r'\1', regex=True)