标签: python html docx
我将许多docx文件转换为htm以便使用python脚本进行检查。系统处于脱机状态,无法更新以使用docx库。将文件转换为htm后,有一个与htm文件同名的文件夹。如果我删除该文件夹,它将删除位于该文件夹之外的htm文件。如何分离这两个,以便我可以删除该文件夹。谢谢。
答案 0 :(得分:0)
分离文件夹的另一种方法是将每个文件的内容复制到具有相同名称的.txt文件中。然后,我可以解析其中的数据。这很好,我不需要担心文件夹,因为我将新文件保存在不同的目录中。