从熊猫数据框中的模式中提取字符串

时间:2020-05-09 07:17:40

标签: python regex pandas

我有一个数据框,其中的一列充满了字符串,如下所示:

1 Janus Henderson Research Fund Class N 2 Calvert Equity Fund Class A 3 Invesco Diversified Dividend Fund R5 Class 4 Prudential Day One 2035 Fund Class R3 5 TETON Convertible Securities Fund Class C ...
24991 BlackRock Asian Dragon Fund,Inc.Class R 24993 MFS Blended Research International Equity Fund... 24994 ClearBridge Small Cap Fund Class A 24995 Federated Equity Income Fund, Inc. Class A Shares

im希望提取每行的类。 例如,第1行作为N类,第2行作为A类,依此类推..有些行没有单词class在一起,我想将其作为NA。还有一些行在单词class之前有class标签。我该如何提取呢? 任何指导表示赞赏

1 个答案:

答案 0 :(得分:0)

您可以编写一个解析函数,该函数接收一行并查找单词“ Class”,然后返回其旁边的内容。 例如,此功能可以使用txt.split('Class')。编写此函数后,可以使用apply()(数据框方法)将其分别应用于每一行。