使用正则表达式映射序列时如何修复np.cumsum函数

时间:2019-04-24 22:25:45

标签: regex python-3.x pandas numpy nlp

我有一个类似的列表:

**x** 
Chapter 1 
some text
Chapter 2
Chapter 3
Chapter 4
Chapter 5"

我寻找的输出是一个像这样的系列:

1
1
2
3
4
5

我写了这段代码

pattern = r"chapter \d" 
x.map(lambda x: np.cumsum(bool(re.search(pattern,str(x), flags=re.I))))

它给了我输出:

[1]
[0]
[1]
[1]
[1]
[1]

你们可以帮我解决此代码吗?您也可以提出更好的解决方案。谢谢

1 个答案:

答案 0 :(得分:1)

感谢大家帮助我修复代码。我确实看到了使用ffill的替代解决方案,这很棒。

我在下面使用了2种衬垫解决方案:

true