Question

我已经被困了几个小时，如何将我的已爬网数据写入多个文件。我写了一个废弃网站的代码，并提取网站中每个链接的所有主体。一个例子是抓取新闻网站，然后提取所有链接，然后提取每个链接的所有正文。我已经成功完成了但现在我现在担心的是，不要使用下面的代码将它们全部存储到文件中

def save_data(data):
the_file = open('raw_data.txt', 'w')
for title_text, body_content, url in data:
    the_file.write("%s\n" % [title_text, body_content, url])

如何编写代码，以便将每篇文章存储在不同的文件中。所以我会有类似Article_00，Article_01，Article_01 ...... 感谢

Answer 1

如果要将数据保存在多个文件中，则必须打开多个文件进行写入。

使用enumerate获取您正在迭代的数据集的计数器，因此您可以在文件名中使用它，如下所示：

def save_data(data):
    for i, (title_text, body_content, url) in enumerate(data):
        file = open('Article_%02d' % (i,), 'w+')
        file.write("%s\n" % [title_text, body_content, url])
        file.close()

如何将数据写入目录中的多个文件

1 个答案: