使用Notepad ++清理文本

时间:2012-11-30 12:18:55

标签: java regex text notepad++

我有推文文档,它包含类似的行:

RichardJ0nes -- Should I upgrade to an iPhone 5? Decisions, decisions!
AnthonyMOliva -- @AnthonyMOliva AT&T offering iPhone 5 refurbished starting at $99: Two months after making its debut, refur... http://t.co/IsPDzIrD #BBC
mittrashi -- RT @timesofindia: Apple iPhone 5S, iPad 5 already in the works? - The Times of India http://t.co/s782BHp5

我想清理这份文件。 首先,我想清理用户名(例如:RichardJ0nes - 或@AnthonyMOliva),其次我要清理链接(例如http://t.co/s782BHp5)。

应该是这样的:

Should I upgrade to an iPhone 5? Decisions, decisions!
AT&T offering iPhone 5 refurbished starting at $99: Two months after making its debut, refur... 
Apple iPhone 5S, iPad 5 already in the works? - The Times of India

我尝试在记事本++上使用正则表达式做一些事情,但我无法清理文本

我尝试用
删除第一个用户名 找到.*\(--\) 替换:\1

但它对记事本++不起作用。我该怎么办,请给我一个想法?

2 个答案:

答案 0 :(得分:5)

搜索(^\S+\s--|\bhttps?://\S+|(?:^|(?<=\s))[@#]\S+)\s?并将其替换为空字符串。

答案 1 :(得分:2)

在记事本++中按ctrl+f,转到替换标签,在底部选择搜索模式中的正则表达式,然后执行以下操作

  1. 搜索:.* -- (.*)$并将所有内容替换为\1
  2. 搜索:@[^ ]*并将所有内容全部替换(将替换输入留空)
  3. 搜索:http[^ ]*并将所有内容全部替换(将替换输入留空)