我有一个Pandas表,需要从存储在列中的文本中提取股票代码“ 00981”,“ 00823”。该代码为(00000)格式。该代码将位于文本摘要中的其他位置。请指教。
final Yaml yaml = new Yaml(new ListConstructor<>(Stage.class));
所需的输出:
News
1 example(00981)example example example。
2 example example example (00823)text text text
答案 0 :(得分:0)
这将找到所有用括号括起来的5位数字:
import re
x = re.findall('\(\d{5}\)', my_string)
答案 1 :(得分:0)
这对我有用:
print(df)
News
0 1 example(00981)example example example。
1 2 example example example (00823)text text...
--
df['stock_num'] = df['News'].str.extract('(\d{5})').astype(int)
print(df)
News stock_num
0 1 example(00981)example example example。 981
1 2 example example example (00823)text text... 823
要将字符串更改为数字,可以使用.astype()
方法或pd.to_numeric(df['stock_number'])