我的程序从网页上获取了URL,并将网页中的.html文件保存在我的桌面上。现在我需要使用那些相同的.html文件并将它们作为输入设置到我的下一个程序中。我的问题是如何将所有这些大约400+的文件作为输入函数来完成剩下的工作?我目前也在使用python 2.7,但如果我需要使用它,我可以使用最新的python。
答案 0 :(得分:1)
这应该解决你的问题 yourpath ='path // to // file'
sparse.csr_matrix(m).multiply(sparse.csr_matrix(c)).todense()
# matrix([[ 0, 2, 6],
# [ 0, 5, 12],
# [ 0, 8, 18]], dtype=int64)
答案 1 :(得分:0)
您的第二个函数可以采用如下文件名列表:
def process(files):
for f in files:
# do stuff
您可以通过
获取文件列表import os
files = os.listdir('/path/to/files')
答案 2 :(得分:0)
您可以使用glob.glob()
返回与模式匹配的所有文件路径名,然后迭代所有文件并逐个处理它们
html_files = glob.glob("/path/to/*html")
for html_file in html_files:
with open(html_file) as inputs:
for line in inputs:
# do your work on the line