读取文件后,我尝试在循环内附加数据帧,但仍不附加完整的数据集。
columns = list(df)
data= []
for file in glob.glob("*.html"):
df = pd.read_html(file)[2]
zipped_date = zip(columns , df.values)
a_dictionary = dict(zipped_date)
data.append(a_dictionary)
full_df = full_df .append(data, False)
答案 0 :(得分:0)
也许可以在循环内创建一个数据帧列表,然后连接它们:
for file in glob.glob("*.html"):
data.append( pd.read_html(file)[2] )
full_df = pd.concat(data, ignore_index=True)
答案 1 :(得分:0)
使用pd.concat:
df = pd.concat([pd.read_html(file)[2] for files in glob.glob("*.html")])