我想在pandas dataframe中拆分一列,我正在使用这段代码:
df['entry'] = df['entry'].str.split('.')
现在的问题是我想拆分更大的文本元素,例如:
我很满意。我是另一个内容。
但是在数据中还有这样的东西:
我是10.2内容。
我不想分开数字。所以我需要一些条件,例如:
如果数字之间有点,请不要拆分。
我怎么能用熊猫做到这一点?
答案 0 :(得分:2)
使用否定Back-referencing:
更新处理"我是St. Content。"
['I am content', ' I am another content', ' I am 10.2 content', ' I am St. Content', '']
<强>输出:强>
{{1}}