TextCrawler Regex删除所有内容并保留特定内容

时间:2014-01-07 07:46:12

标签: regex text web-crawler

我有一个大文本文件,除了一些有意义的特定内容之外,我想删除所有内容。

在文本文件的每一行中,它将包括:junk_data_user_id=xyzabc123456&=_esjunk_data

有时会是junk_data_user_id=abcxyz123456

我想要的只是保留user_id=xyzabc123456并删除其他所有内容

我尝试过使用表达式user_id=.*&

的textcrawler

但结果如下

user_id=abcxyz123456&junkdata

2 个答案:

答案 0 :(得分:3)

这个怎么样:

user_id=[^&]+

[^&]表示'not&'

如果您还想支持asd user_id=xyzabc123456 something else等搜索,请使用:

user_id=\w+

哪个匹配:

'USER_ID = xyzabc123456'

此处\w是一个单词字符

答案 1 :(得分:0)

将你的表达限制在除数字和字母之外的所有内容上:

user_id=[0-9a-z]+