Question

读取文件后，我尝试在循环内附加数据帧，但仍不附加完整的数据集。

columns = list(df)
data= []

for file in glob.glob("*.html"):
   df = pd.read_html(file)[2]
   
   zipped_date = zip(columns , df.values)
        
   a_dictionary = dict(zipped_date)
        
   data.append(a_dictionary)

full_df = full_df .append(data, False)

Answer 1

也许可以在循环内创建一个数据帧列表，然后连接它们：

for file in glob.glob("*.html"):
   data.append( pd.read_html(file)[2] )

full_df = pd.concat(data, ignore_index=True)

Answer 2

使用pd.concat：

df = pd.concat([pd.read_html(file)[2] for files in glob.glob("*.html")])

在循环内附加数据框-Python

2 个答案: