如何从新闻摘要中提取股票代码NUMBER?

时间:2019-11-13 15:18:56

标签: python string pandas

我有一个Pandas表,需要从存储在列中的文本中提取股票代码“ 00981”,“ 00823”。该代码为(00000)格式。该代码将位于文本摘要中的其他位置。请指教。

final Yaml yaml = new Yaml(new ListConstructor<>(Stage.class));

所需的输出:

News
1 example(00981)example example example。 
2 example example example (00823)text text text 

2 个答案:

答案 0 :(得分:0)

这将找到所有用括号括起来的5位数字:

import re

x = re.findall('\(\d{5}\)', my_string)

答案 1 :(得分:0)

这对我有用:

print(df)
           News
0          1 example(00981)example example example。 
1      2 example example example (00823)text text...
--
df['stock_num'] = df['News'].str.extract('(\d{5})').astype(int)
print(df)
                                                    News stock_num
0          1 example(00981)example example example。      981
1      2 example example example (00823)text text...     823

要将字符串更改为数字,可以使用.astype()方法或pd.to_numeric(df['stock_number'])