Excel到XML进行数据剥离

时间:2010-10-15 18:49:01

标签: xml excel scrape

我正在尝试从数千个相同的Excel 2007/2010文件中删除数据。我宁愿使用刮削技术来做到这一点。是否有可能刮取Excel文件,因为据我所知,该文件基本上是某种XML格式。

那么,是否可以将Excel文件转换为XML或其他标记格式?

2 个答案:

答案 0 :(得分:1)

XLSX格式实际上是一个ZIP文件,但具有不同的扩展名。如果您使用自己喜欢的zip程序解压缩它,您会发现工作表数据位于xl \ worksheets中。每个工作表都保存为单独的XML文档。您应该能够像迈克尔建议的那样使用XSLT来提取您需要的数据。

答案 1 :(得分:0)

默认情况下,Excel 2010文件采用XML格式。那么你当前的Excel文件是什么文件格式(即它们有什么扩展名)?你的问题在这个问题上有些含糊不清。如果它们已经是XML格式,则可以使用XSLT来删除它们。