我想以类似SAX的方式使用OpenXML SDK v2.0阅读Excel 2007+文档。我正在使用此博客文章作为粗略指南:http://blogs.msdn.com/b/brian_jones/archive/2010/05/27/parsing-and-reading-large-excel-files-with-the-open-xml-sdk.aspx
但是,在我的文档中,我混合了字符串和数值。因此,字符串值存储为SharedString,因此当为这样的单元格读取CellValue时,我得到一个数字,我读过的是索引(因此需要获取InnerText)。这似乎增加了太多的复杂性。反正我是否只是将工作表中的所有单元格视为文本/字符串,并以类似于博客文章示例的方式遍历所有获取值的单元格?
由于
答案 0 :(得分:10)
以下是否有用?
List<string> listShared = new List<string>();
using (SpreadsheetDocument xl = SpreadsheetDocument.Open("YourFile.xlsx", false))
{
SharedStringItem ssi;
using (OpenXmlReader oxrShared = OpenXmlReader.Create(xl.WorkbookPart.SharedStringTablePart))
{
while (oxrShared.Read())
{
if (oxrShared.ElementType == typeof(SharedStringItem))
{
ssi = (SharedStringItem)oxrShared.LoadCurrentElement();
// this assumes the shared string is a simple text format, instead of rich text.
listShared.Add(ssi.Text.Text);
}
}
}
WorksheetPart wsp = xl.WorkbookPart.WorksheetParts.First();
Cell c;
using (OpenXmlReader oxrCells = OpenXmlReader.Create(wsp))
{
while (oxrCells.Read())
{
if (oxrCells.ElementType == typeof(Cell))
{
c = (Cell)oxrCells.LoadCurrentElement();
// c.CellReference holds a string such as "A1"
if (c.DataType != null)
{
if (c.DataType == CellValues.SharedString)
{
// use whichever from-string-to-number conversion
// you like.
//listShared[Convert.ToInt32(c.CellValue.Text)];
}
else if (c.DataType == CellValues.Number)
{
// "normal" value
//c.CellValue.Text;
}
// there's also boolean, which you might be interested
// as well as other types
}
else
{
// is by default a Number. Use this:
//c.CellValue.Text;
}
}
}
}
}
注意:没有错误绑定检查或无效检查。它旨在说明如何以最简单的方式获取共享字符串。
此外,共享字符串列表被假定为“简单”共享字符串,这意味着没有富文本。
逻辑是您将工作表中的共享字符串列表加载到可以轻松操作的List中。然后,当您遍历单元格时,如果您看到数据类型为SharedString的单元格,则可以再次检查List。如果单元格的数据类型为Number,则只需照常进行。