找到并替换下一个和下一个,而不是找到第一个和最后一个

时间:2013-12-13 11:47:26

标签: regex textwrangler

真正基本的问题,但我不能让这个工作。我的示例文本在页面底部提供。

我想留下的唯一一行是看起来像这样:“178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95”。我目前在OSX上使用TextWrangler(终端和我不是朋友)提供正则表达式替换。 我试图分步进行,我的第一步是试图摆脱所有的蛋白质序列。

在TextWrangler中,我搜索了这个:

  

工作顺序([^;] *)-------------------------------------- ----------------------

并且一无所获。但是,我最终得到的几乎是一个空文档,因为TextWrangler似乎找到了“工作序列”的第一个实例,但是“-----------------的最后一个实例” -------------------------------------------”。我如何改变所以这是一个逐步的过程,找到两者的第一个实例并替换为空,然后是第二个实例等?

来自瑞典的致谢和问候

  

蛋白质的结果摘要:sp | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3      Translocon TM分析结果      分区:水到双层      窗口范围:19-30

     

易位TM预测区段的数量:2

     

178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95

     

438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63

     

工作顺序长度= 630):

     

MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS      ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP      EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR      TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN      LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK      SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL      AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVT      QYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP      GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD      FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ      PGREEGSPLELERLKLEPhEGLLLRFPYAA

     
     

蛋白质的结果摘要:sp | Q9NPC4 | A4GAT_HUMAN OS = Homo sapiens GN = A4GALT PE = 2 SV = 1      Translocon TM分析结果      分区:水到双层      窗口范围:19-30

     

易位TM预测区段的数量:1

     

19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04

     

工作顺序长度= 353):

     

MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP      CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG      NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI      ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh      YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN      PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL

     

1 个答案:

答案 0 :(得分:1)

你告诉它要寻找“工作顺序”而不是任何不是';'的东西' - '字符的第一行(和下一行和下一行)不是 - 。这就是为什么它匹配一切。它确实匹配' - '字符的最后一行,因为你告诉它最后应该有一个字符。我认为这对你有用

Working sequence([^-]*)------------------------------------------------------------