我有一个数据框,其中的一列充满了字符串,如下所示:
1 Janus Henderson Research Fund Class N
2 Calvert Equity Fund Class A
3 Invesco Diversified Dividend Fund R5 Class
4 Prudential Day One 2035 Fund Class R3
5 TETON Convertible Securities Fund Class C
...
24991 BlackRock Asian Dragon Fund,Inc.Class R
24993 MFS Blended Research International Equity Fund...
24994 ClearBridge Small Cap Fund Class A
24995 Federated Equity Income Fund, Inc. Class A Shares
im希望提取每行的类。 例如,第1行作为N类,第2行作为A类,依此类推..有些行没有单词class在一起,我想将其作为NA。还有一些行在单词class之前有class标签。我该如何提取呢? 任何指导表示赞赏
答案 0 :(得分:0)
您可以编写一个解析函数,该函数接收一行并查找单词“ Class”,然后返回其旁边的内容。
例如,此功能可以使用txt.split('Class')
。编写此函数后,可以使用apply()
(数据框方法)将其分别应用于每一行。