删除.txt之后的所有字符串

时间:2017-02-08 11:05:26

标签: regex csv

我有一个csv文件列包含:

  

The_Guardian2017-01-30_17-44_part199.pdf.txt_00076 ___ 1486548173000___4982   The_Guardian2017-01-30_17-44_part286.pdf.txt_000D7 ___ 1486548174948___5316   The_Guardian2017-01-30_17-44_part343.pdf.txt_00117 ___ 1486548176288 ___ 9737

............

我想在

之后删除所有字符串
  

.txt的

看起来像这样:

  

The_Guardian2017-01-30_17-44_part199.pdf.txt

有什么建议吗?

2 个答案:

答案 0 :(得分:1)

<强>查找

^(.*?\.txt).*$

<强>替换

$1

上述解决方案可以在Notepad ++和其他类似的编辑器中开箱即用。正则表达式匹配并捕获所有内容,直到第一个 .txt,忽略后面的所有内容。

Demo here

答案 1 :(得分:0)

使用Python。

import re

text = "The_Guardian2017-01-30_17-44_part199.pdf.txt_00076___1486548173000___4982"

#Method 1
print(text.split('_0')[0])

#Method 2
print(text[:-29])

#Method 3
m = re.match('^(.*?\.txt)',text)
print(m.group(1))