我必须在notepad ++中仅提取包含下划线的字符串。我的文件就像
T-cell_stimulation
transcription_factor
NF-kappa_B
kappa_B_site
HIV-1_long_terminal_repeat
HIV-1
HIV-2_enhancer
HIV-2
monocyte
T_cell
cis-acting_element
kappa_B_site
purine-rich_binding_site
我想要的输出是
T-cell_stimulation
transcription_factor
NF-kappa_B
kappa_B_site
HIV-1_long_terminal_repeat
HIV-2_enhancer
T_cell
cis-acting_element
kappa_B_site
purine-rich_binding_site
答案 0 :(得分:0)
答案 1 :(得分:0)
我通过python中的代码解决了我的问题 代码是
import re;
file = "C:/Python26/test.txt";
f=open("rzlt.txt",'w')
pattern ='\w+_\w+[_\w+]*|\w+-\w+[-\w+]*';
with open(file,'r') as rf:
lines = rf.readlines();
c=0;
for word in lines:
if re.match(pattern, word):
f.write( word)
c=c+1;
print c;
f.close();