我有一个csv文件列包含:
The_Guardian2017-01-30_17-44_part199.pdf.txt_00076 ___ 1486548173000___4982 The_Guardian2017-01-30_17-44_part286.pdf.txt_000D7 ___ 1486548174948___5316 The_Guardian2017-01-30_17-44_part343.pdf.txt_00117 ___ 1486548176288 ___ 9737
............
我想在
之后删除所有字符串.txt的
看起来像这样:
The_Guardian2017-01-30_17-44_part199.pdf.txt
有什么建议吗?
答案 0 :(得分:1)
<强>查找强>
^(.*?\.txt).*$
<强>替换强>
$1
上述解决方案可以在Notepad ++和其他类似的编辑器中开箱即用。正则表达式匹配并捕获所有内容,直到第一个 .txt
,忽略后面的所有内容。
答案 1 :(得分:0)
使用Python。
import re
text = "The_Guardian2017-01-30_17-44_part199.pdf.txt_00076___1486548173000___4982"
#Method 1
print(text.split('_0')[0])
#Method 2
print(text[:-29])
#Method 3
m = re.match('^(.*?\.txt)',text)
print(m.group(1))