Python在Excel中打开html文件

时间:2018-06-05 17:33:25

标签: python excel openpyxl

我有一堆.html格式的采购订单,我需要提取数据并放入一个简单的Excel工作表。虽然我可以使用beutifulsoup来做到这一点,但我宁愿在内置的转换器中使用excel,它已经做得更好。然后直接使用excel文件。有没有办法使用python打开html文档,然后再次将其保存在.xlsx中。我尝试使用openpyxl,但它没有使用html文件。

2 个答案:

答案 0 :(得分:1)

您可以使用Python自动化Excel应用程序的实例,打开每个文件,并保存为.xlsx

import win32com.client
excelApp = win32com.client.Dispatch('Excel.Application')
book = excelApp.Open(path_to_html_file)
book.SaveAs(path_to_html_file + '.xlsx', 51)

答案 1 :(得分:0)

如果所需数据在html表中,则可以使用tablepyxl将html读入excel。