根据列表中的项目,打开具有相似名称的文件,并将内容附加到df

时间:2018-03-29 21:01:54

标签: python regex

给定myList = ['a', 'b', 'c']和一个文件夹,如

['a_3432.bed', 'a_4958.bed', 'b_3432.bed', 'b_4958.bed', 'c_3432.bed', 
'c_4958.bed', 'd_3432.bed', 'd_4958.bed', etc]

我想打开文件并根据列表中的每个项目将其内容附加到数据框中。类似的东西:

import pandas as pd

for item in myList:
    open('a*.bed') as infile:
        df = pd.DataFrame()
        for line in infile:
            df.append(line)

我没有使用正则表达式,但我认为它们可能是关键,因为我知道它们用于识别模式。

1 个答案:

答案 0 :(得分:0)

您希望标准glob模块找到匹配的文件(glob模式,如伪代码中的模式,与正则表达式相似但不相同),并且可能fileinput来处理所有他们在一起。