Python:使用许多文件作为输入

时间:2017-03-01 17:14:45

标签: python python-2.7 file input indexing

我的程序从网页上获取了URL,并将网页中的.html文件保存在我的桌面上。现在我需要使用那些相同的.html文件并将它们作为输入设置到我的下一个程序中。我的问题是如何将所有这些大约400+的文件作为输入函数来完成剩下的工作?我目前也在使用python 2.7,但如果我需要使用它,我可以使用最新的python。

3 个答案:

答案 0 :(得分:1)

这应该解决你的问题     yourpath ='path // to // file'

sparse.csr_matrix(m).multiply(sparse.csr_matrix(c)).todense()

# matrix([[ 0,  2,  6],
#         [ 0,  5, 12],
#         [ 0,  8, 18]], dtype=int64)

答案 1 :(得分:0)

您的第二个函数可以采用如下文件名列表:

def process(files):
    for f in files:
        # do stuff

您可以通过

获取文件列表
import os
files = os.listdir('/path/to/files')

答案 2 :(得分:0)

您可以使用glob.glob()返回与模式匹配的所有文件路径名,然后迭代所有文件并逐个处理它们

html_files = glob.glob("/path/to/*html")

for html_file in html_files:
    with open(html_file) as inputs:
        for line in inputs:
            # do your work on the line