Question

真正基本的问题，但我不能让这个工作。我的示例文本在页面底部提供。

我想留下的唯一一行是看起来像这样：“178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95”。我目前在OSX上使用TextWrangler（终端和我不是朋友）提供正则表达式替换。我试图分步进行，我的第一步是试图摆脱所有的蛋白质序列。

在TextWrangler中，我搜索了这个：

工作顺序（[^;] *）-------------------------------------- ----------------------

并且一无所获。但是，我最终得到的几乎是一个空文档，因为TextWrangler似乎找到了“工作序列”的第一个实例，但是“-----------------的最后一个实例” -------------------------------------------”。我如何改变所以这是一个逐步的过程，找到两者的第一个实例并替换为空，然后是第二个实例等？

来自瑞典的致谢和问候

蛋白质的结果摘要：sp | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3      Translocon TM分析结果      分区：水到双层      窗口范围：19-30

易位TM预测区段的数量：2

178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95

438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63

工作顺序长度= 630）：

MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS      ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP      EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR      TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN      LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK      SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL      AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVT      QYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP      GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD      FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ      PGREEGSPLELERLKLEPhEGLLLRFPYAA


蛋白质的结果摘要：sp | Q9NPC4 | A4GAT_HUMAN OS = Homo sapiens GN = A4GALT PE = 2 SV = 1      Translocon TM分析结果      分区：水到双层      窗口范围：19-30

易位TM预测区段的数量：1

19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04

工作顺序长度= 353）：

MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP      CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG      NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI      ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh      YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN      PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL

Answer 1

你告诉它要寻找“工作顺序”而不是任何不是';'的东西' - '字符的第一行（和下一行和下一行）不是 - 。这就是为什么它匹配一切。它确实匹配' - '字符的最后一行，因为你告诉它最后应该有一个字符。我认为这对你有用

Working sequence([^-]*)------------------------------------------------------------

找到并替换下一个和下一个，而不是找到第一个和最后一个

1 个答案: