class __init__:
path = "articles/"
files = os.listdir(path)
files.reverse()
def iterate(Files, Path):
def handleXml(content):
months = ['', 'January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'November', 'December']
parse = re.compile('<(.*?)>(.*?)<(.*?)>').findall(content)
day = parse[1][1]
month = months[int(parse[2][1])]
dayN = parse[3][1]
year = parse[4][1]
hour = parse[5][1]
min = parse[6][1]
amPM = parse[7][1]
title = parse[9][1]
author = parse[10][1]
article = parse[11][1]
category = parse[12][1]
if len(Files) > 5:
del Files[5:]
for file in Files:
file = "%s%s" % (Path, file)
f = open(file, 'r')
handleXml(f.read())
f.close()
iterate(files, path)
它在启动时运行,如果我检查文件数组,它包含所有文件名。 但是当我遍历它们时它们只是不工作,只显示第一个。 如果我返回文件我只得到前两个,如果我甚至在重复文件上返回解析它不相同。 这些都没有任何意义。
我正在尝试使用Python创建一个简单的博客,并且因为我的服务器有一个非常旧版本的Python我不能使用像glob这样的模块,所有东西都需要尽可能基本。
files数组包含目录中的所有文件,这对我来说已经足够了。我不需要浏览文章目录中的其他目录。
但是当我尝试输出解析时,即使是重复的文件,我也会得到不同的结果。
谢谢,
答案 0 :(得分:1)
可能是因为:
del Files[5:]
它也会删除原始列表中的最后5个条目。您可以尝试:
,而不是使用del
for file in Files[:5]:
#...
答案 1 :(得分:0)
如评论中所述,缺少实际的递归 即使它存在于代码的某个其他位置,递归调用也是错误的典型位置,因此我建议您仔细检查它。
但是,为什么不使用os.walk?它遍历所有路径,无需重新发明(递归)轮。它已经在2.3中引入了,我不知道你的python有多大。