Python:搜索特定XML标记的.xlsx文件

时间:2016-02-18 19:58:05

标签: python xml xlsx

我想在.xlsx文件中搜索某个XML标记 - 例如,检查.xlsx文件中是否存在任何标记。

我目前的计划是取消压缩.xlsx文件,然后搜索所有.xml文件以查找相关标签。是否有一个标准的库,或更简单的方法吗?

1 个答案:

答案 0 :(得分:0)

def xlsxHasEntity(filename):                                                                                            
   input_zip = ZipFile(filename)                                                   
   xml_files = [name for name in input_zip.namelist() if name.endswith("xml")]  
   raw_files = {name: input_zip.read(name) for name in xml_files}                                                      
   for raw_filename in raw_files:                                                  
      if "<!ENTITY" in raw_files[raw_filename]:                                    
         return True                                                               
   return False  

以上是我目前的解决方案,似乎有效。如果有人在将来遇到这个问题,我想我会分享它。