我需要创建一个脚本,从复杂的Excel 2003文件中提取一些数据(在单个工作表中包含多个工作表和不同的表),并生成需要针对给定XSD文件进行验证的不同XML文件。
我的首选语言是Python; 要创建和验证XML文件,我将使用lxml 您对解析XLS文件有何建议? xlrd是用于复杂Excel文件的正确工具吗? 或者我是否需要手动转换所有工作表,逐行读取文件,拆分和获取数据?
我也接受C#,VB6,VBA建议。
答案 0 :(得分:2)
Xlrd没问题。我们广泛使用它来导入XLS文件,其中包含多个工作表和带有多个工作表的公式以及以自定义(非Latin-1)编码方式呈现的数据。
答案 1 :(得分:2)
[免责声明:我是xlrd的作者]
xlrd非常适合这种工作。从PyPI获取最新版本。从找到的here教程中获取风味。 XLSX支持是alpha测试;如果您需要,请给我发电子邮件。 save-as-CSV方法的尴尬和损失是促使我编写xlrd的原因之一。
答案 2 :(得分:1)
我确信这项任务的最简单的解决方案是将Excel VBA与MSXML解析器一起使用。查看here以获取一些链接,了解如何在VBA中使用MSXML解析器来读取XML文件;我认为你可以轻松地使用它来编写XML文件。
答案 3 :(得分:0)
我无法回答xlrd / python是否适合这项工作 - 因为我不太了解python。
但是有很多方法可以访问excel数据......主要是你将VBA直接内置到Excel中。
然后你有Ado.net See David Hayden's article here,它允许你通过任何DotNet语言访问数据......甚至IronPython