如何在带空格的单词后获取序列

时间:2019-10-23 18:24:50

标签: python string parsing bioinformatics genbank

对于学校来说,我必须在一个带有大量空格的单词后解析一个字符串,但是我却无法理解。 因为文件是Genbank。

例如:

#----------Facebook ----------

    driver.get("http:facebook.com/")
    driver.maximize_window()

    pyautogui.click(414, 750);
    pyautogui.dragTo(151, 750);
    pyautogui.click(151, 750);


#Login

    time.sleep(1.5)
    pyautogui.click(811, 211); pyautogui.typewrite('login')
    time.sleep(.5)
    pyautogui.click(975, 213); pyautogui.typewrite('password')
    pyautogui.click(1135, 213);

    time sleep(20) #---write security google token
    time.sleep(10) #--------loading of home site
    pyautogui.click(235, 370);
    time.sleep(5)
    pyautogui.click(839, 179);
    time.sleep(1.5)
    pyautogui.click(839, 225);

#navigation
    time.sleep(5)
    pyautogui.click(229, 472);
    time.sleep(15) # user picks date

#Add likes
    pyautogui.click(x, y);
    pyautogui.dragTo(691, 361);

我尝试过的是这个。

BLA                                                                                                             
      1 sjafhkashfjhsjfhkjsfkjakshfkjsjkf
      2 isfshkdfhjksfkhksfhjkshkfhkjsakjfhk
      3 kahsfkjshakjfhksjhfkskjfkaskfksj

//

但是我得到的是:

if line.startswith("BLA"):

       start = line.find("BLA")
       end = line.find("//")
       line = line[:end]
       s_string = ""
       string = list()
       if s_string:
           string.append(line)


        else:
            line = line.strip()
            my_seq += line

这是它唯一得到的东西,我希望得到的输出像

**output**
BLA

所以我不知道该怎么办,我试图像最后输出那样得到它。但是没有成功。老师告诉我,我必须喜欢。如果BLA为True,则可以对其进行迭代。而且,如果看到“ //”,则必须停止操作,但是当我尝试使用True语句时,我什么也没得到。

我试图在线搜索它,它说我必须使用bio seqIO进行搜索。但是老师说我们不能用那个。

1 个答案:

答案 0 :(得分:0)

这是我的解决方法:

lines = """BLA
  1 sjafhkashfjhsjfhkjsfkjakshfkjsjkf
  2 isfshkdfhjksfkhksfhjkshkfhkjsakjfhk
  3 kahsfkjshakjfhksjhfkskjfkaskfksj

//"""

lines = lines.strip().split("//")
lines = lines[0].split("BLA")
lines = [i.strip() for i in lines]
print("BLA", " ", lines[1])
  

输出:

BLA   1 sjafhkashfjhsjfhkjsfkjakshfkjsjkf
      2 isfshkdfhjksfkhksfhjkshkfhkjsakjfhk
      3 kahsfkjshakjfhksjhfkskjfkaskfksj