Demo here

Question

我有一个csv文件列包含：

The_Guardian2017-01-30_17-44_part199.pdf.txt_00076 ___ 1486548173000___4982 The_Guardian2017-01-30_17-44_part286.pdf.txt_000D7 ___ 1486548174948___5316 The_Guardian2017-01-30_17-44_part343.pdf.txt_00117 ___ 1486548176288 ___ 9737

............

我想在

之后删除所有字符串

.txt的

看起来像这样：

The_Guardian2017-01-30_17-44_part199.pdf.txt

有什么建议吗？

Answer 1

<强>查找

^(.*?\.txt).*$

<强>替换

$1

上述解决方案可以在Notepad ++和其他类似的编辑器中开箱即用。正则表达式匹配并捕获所有内容，直到第一个 .txt，忽略后面的所有内容。

Demo here

Answer 2

使用Python。

import re

text = "The_Guardian2017-01-30_17-44_part199.pdf.txt_00076___1486548173000___4982"

#Method 1
print(text.split('_0')[0])

#Method 2
print(text[:-29])

#Method 3
m = re.match('^(.*?\.txt)',text)
print(m.group(1))

删除.txt之后的所有字符串

2 个答案:

Demo here