我有一个python程序,可下载文章文本,然后将其转换为txt文件。程序当前吐出程序所在目录中的txt文件。我想将这个文本安排在特定于他们来自的新闻源的文件夹中。我可以将数据保存在python程序本身的文件夹中,并在新闻源文件更改时更改目录吗?或者我应该创建一个shell脚本,在它需要的文件夹中运行python程序?或者是否有更好的方法来排序我缺少的这些文件?
以下是Python程序的代码:
import feedparser
from goose import Goose
import urllib2
import codecs
url = "http://rss.cnn.com/rss/cnn_tech.rss"
feed = feedparser.parse(url)
g = Goose()
entryLength = len(feed['entries'])
count = 0
while True:
article = g.extract(feed.entries[count]['link'])
title = article.title
text = article.cleaned_text
file = codecs.open(feed['entries'][count]['title'] + ".txt", 'w', encoding = 'utf-8')
file.write(text)
file.close()
count = count + 1
if count == entryLength:
break
答案 0 :(得分:1)
如果您只提供保存功能文件名,它们将保存到当前目录。但是,如果您为它们提供路径,那么您的文件将会在那里结束。 Python负责处理它。
folder = 'whatever' #the folder you wish to save the files in
name = 'somefilename.txt'
filename = os.path.join(folder, filename)
使用该文件名将使文件最终位于文件夹中' #39;
编辑:我发现您现在已经发布了您的代码。正如下面的评论中提到的br1ckb0t,在你的代码中,你可以编写类似codecs.open(folder + feed['entries']...
的内容。如果你这样做,请确保在文件夹中添加斜杠,否则它最终会作为文件名的一部分结束。