如何在notepad ++中提取包含下划线的字符串

时间:2015-04-11 02:43:41

标签: string notepad++

我必须在notepad ++中仅提取包含下划线的字符串。我的文件就像

T-cell_stimulation
transcription_factor
NF-kappa_B
kappa_B_site
HIV-1_long_terminal_repeat
HIV-1
HIV-2_enhancer
HIV-2
monocyte
T_cell
cis-acting_element
kappa_B_site
purine-rich_binding_site

我想要的输出是

T-cell_stimulation
transcription_factor
NF-kappa_B
kappa_B_site
HIV-1_long_terminal_repeat
HIV-2_enhancer
T_cell
cis-acting_element
kappa_B_site
purine-rich_binding_site

2 个答案:

答案 0 :(得分:0)

查看Notepad ++的regex搜索。

类似以下内容:

.*_.*

答案 1 :(得分:0)

我通过python中的代码解决了我的问题  代码是

import re;
file = "C:/Python26/test.txt";
f=open("rzlt.txt",'w')
pattern ='\w+_\w+[_\w+]*|\w+-\w+[-\w+]*';
with open(file,'r') as rf:
    lines = rf.readlines();
    c=0;
    for word in lines:
        if re.match(pattern, word):
            f.write( word)
            c=c+1;
    print c;
f.close();