我在不同的文本文件中有很多数据。每个文件名都包含一个由我选择的单词,但它们也包含很多" gibberish"。例如,我有一个名为datapoints-(my chosen name)-12iu8w9e8v09wr-140-ad92-dw9
所以datapoints
字符串在所有文本文件中,(my chosen name)
是我定义的,知道如何在我的代码中提取,但最后一位是随机的。而且我不想在我拥有的每个文本文件中删除该部分,这将耗费一些时间。
我只想加载这些文本文件,但我不确定如何在不使用" gibberish"的情况下定位每个文件。到底。我只想说:"加载文件,包括(我选择的名字)"然后不用担心其余的事情。
答案 0 :(得分:2)
import glob
your_words = ['word1', 'word2']
files = []
# find files matching 'datapoint-your words-*.txt'
for word in your_words:
# The * is a wildcard, your words are filled in the {}. one by one
files.extend(glob.glob('datapoint-{}-*.txt'.format(word)))
print files