Question

我在df和20列中有大约200,000行，而一列包含该站的名称。它看起来像这样：

00001 OPPT YY G
00002 LIMO DA G
000016 KAPAL VS G
0000663 TAPS VS G
...

从列值中获取数字的最佳方法是什么？期望的输出：

由于

Answer 1

假设Col1是您的专栏

df
Out: 
                Col1
0    00001 OPPT YY G
1    00002 LIMO DA G
2  000016 KAPAL VS G
3  0000663 TAPS VS G

拆分空间并取第一个元素：

df['Col1'].str.split().str[0]
Out: 
0      00001
1      00002
2     000016
3    0000663
Name: Col1, dtype: object

Answer 2

所以你可以使用这个函数：例如，如果你的数据帧是df而你的第一列包含这些数据，那么：

(df.T).ix[0]

我希望这会对你有所帮助。

Answer 3

可能是这样的：

df['col_1'] = df['col_1'].replace(r'^(\b\d+\b).*$', r'\1', regex=True)