我已经被困了几个小时,如何将我的已爬网数据写入多个文件。我写了一个废弃网站的代码,并提取网站中每个链接的所有主体。一个例子是抓取新闻网站,然后提取所有链接,然后提取每个链接的所有正文。我已经成功完成了但现在我现在担心的是,不要使用下面的代码将它们全部存储到文件中
def save_data(data):
the_file = open('raw_data.txt', 'w')
for title_text, body_content, url in data:
the_file.write("%s\n" % [title_text, body_content, url])
如何编写代码,以便将每篇文章存储在不同的文件中。所以我会有类似Article_00,Article_01,Article_01 ...... 感谢
答案 0 :(得分:0)
如果要将数据保存在多个文件中,则必须打开多个文件进行写入。
使用enumerate
获取您正在迭代的数据集的计数器,因此您可以在文件名中使用它,如下所示:
def save_data(data):
for i, (title_text, body_content, url) in enumerate(data):
file = open('Article_%02d' % (i,), 'w+')
file.write("%s\n" % [title_text, body_content, url])
file.close()