真正基本的问题,但我不能让这个工作。我的示例文本在页面底部提供。
我想留下的唯一一行是看起来像这样:“178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95”。我目前在OSX上使用TextWrangler(终端和我不是朋友)提供正则表达式替换。 我试图分步进行,我的第一步是试图摆脱所有的蛋白质序列。
在TextWrangler中,我搜索了这个:
工作顺序([^;] *)-------------------------------------- ----------------------
并且一无所获。但是,我最终得到的几乎是一个空文档,因为TextWrangler似乎找到了“工作序列”的第一个实例,但是“-----------------的最后一个实例” -------------------------------------------”。我如何改变所以这是一个逐步的过程,找到两者的第一个实例并替换为空,然后是第二个实例等?
来自瑞典的致谢和问候
蛋白质的结果摘要:sp | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3 Translocon TM分析结果 分区:水到双层 窗口范围:19-30
易位TM预测区段的数量:2
178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95
438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63
工作顺序长度= 630):
MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVT QYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ PGREEGSPLELERLKLEPhEGLLLRFPYAA
蛋白质的结果摘要:sp | Q9NPC4 | A4GAT_HUMAN OS = Homo sapiens GN = A4GALT PE = 2 SV = 1 Translocon TM分析结果 分区:水到双层 窗口范围:19-30
易位TM预测区段的数量:1
19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04
工作顺序长度= 353):
MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL
答案 0 :(得分:1)
你告诉它要寻找“工作顺序”而不是任何不是';'的东西' - '字符的第一行(和下一行和下一行)不是 - 。这就是为什么它匹配一切。它确实匹配' - '字符的最后一行,因为你告诉它最后应该有一个字符。我认为这对你有用
Working sequence([^-]*)------------------------------------------------------------