我正在使用python,想在出现以下字符串之前剪切数据集:“客户信息”。目标是该字符串之前的所有内容都在我的新数据集中,而字符串之后的部分则被裁剪掉。
我尝试了一些方法(两种方法),但是没有用。请参阅下面的代码。
df = dataset.copy()
df.Description = df.Description.str.split('Customer Information').str[0].str.strip()
df['Description'] = [x.lstrip('').rstrip('Customer Information') for x in df['Description']]
此字符串的预期结果(“测试客户信息:多行客户信息”)应为:
“测试”
我的实际结果是:“测试客户信息:多行客户信息”
答案 0 :(得分:1)
为什么不呢?
df.Description=df.Description.str.split('Customer Information').str.get(0)
这是我的测试方式:
Item Description
0 1 abc Customer Information abc
1 1 aaa Customer Information abc
2 1 bbb Customer Information abc
3 1 ccc Customer Information abc
Item Description
0 1 abc
1 1 aaa
2 1 bbb
3 1 ccc