我需要使用start&& end row no从excel中提取图像。并开始&&结束没有
我目前的代码如下: -
var excelApp = new Application();
var wb = excelApp.Workbooks.Open(filePath, Type.Missing, Type.Missing,
Type.Missing, Type.Missing, Type.Missing, Type.Missing,
Type.Missing, Type.Missing, Type.Missing, Type.Missing,
Type.Missing, Type.Missing, Type.Missing, Type.Missing);
var ws = (Worksheet)wb.Worksheets["Sheet1"];
int startCol = 0;
int startRow =0;
int endCol = 0;
int endRow = 0;
foreach (var pic in ws.Pictures())
{
int startCol = pic.TopLeftCell.Column;
int startRow = pic.TopLeftCell.Row;
int endCol = pic.BottomRightCell.Column;
int endRow = pic.BottomRightCell.Row;
}
当所有图像不同时,上面的代码工作正常,但是当我将相同的图像放在不同的单元格中时,它只选择第一个图像。
例如,
我put abc.jpeg at B1 cell and xyz.jpeg at C5 cell
然后results are
正常工作
two object first startRow=1,endRow=1,startCol=1,endCol=1 and
second startRow=5,endRow=5,startCol=2,endCol=2
但如果我put abc.jpeg at B1 cell and C5 cell
然后result is one object
并startRow=1,endRow=1,startCol=1,endCol=1
用于两张图片。它没有拍摄第二张图片。
为什么它会受到影响?有没有使用interop或npoi的解决方案
答案 0 :(得分:4)
TL; DR - NPOI与Excel Interop的行为相同,在同一图像添加两次时返回一个图像。出于同样的原因,它可能会这样做。 EPPlus(这篇文章中的最后一个测试)以你期望的方式处理这个场景,分别识别图片的两个实例并在工作表上返回它们的位置。
我首先尝试使用NPOI。我创建了一个工作簿,并将相同的图片插入到两个位置的第一张图片中。
-----
| |
-----
-----
| |
-----
使用NPOI
using Microsoft.VisualStudio.TestTools.UnitTesting;
using NPOI.XSSF.UserModel;
using System.IO;
namespace ExcelImageTests
{
[TestClass]
public class NpoiExcelImages
{
[TestMethod]
public void FindsTwoDistinctImagesInFile()
{
XSSFWorkbook workbook;
using (var file = new FileStream(@"C:\Users\path-to-my-file\sotest.xlsx",
FileMode.Open, FileAccess.Read))
{
workbook = new XSSFWorkbook(file);
}
var pictures = workbook.GetAllPictures();
Assert.AreEqual(2, pictures.Count);
}
}
}
这是我对NPOI的看法。测试失败。 NPOI统计一张图片,而不是两张。
奇怪的是它在表格层面也没有参考形状,图片或图纸。返回的图片是XSSFPictureData
类型,包含图片的二进制数据。它没有涉及工作表和图片之间的关系。我怀疑这就是为什么它只返回一个。其中一个图像嵌入了两次。
确认我添加了与前两张不同的另一张照片。现在测试通过了。工作表上可以看到三张图片,但GetAllPictures()
返回了两张不同的图片。
您提到了Interop和NPOI,但另一种选择是EPPlus。它更常用,在NPOI几分钟后我就能明白为什么。 NPOI返回很多object
类型,就像Excel Interop一样,你必须知道它们是什么,所以你可以将它们转换为这些类型。
EPPlus只是好多了。这是与EPPlus相同的测试:
using Microsoft.VisualStudio.TestTools.UnitTesting;
using OfficeOpenXml;
using System.IO;
namespace ExcelImageTests
{
[TestClass]
public class EPPlusExcelImages
{
[TestMethod]
public void FindsTwoDistinctImagesInFile()
{
var file = new FileInfo(@"C:\Users\path-to-my-file\sotest.xlsx");
using (var package = new ExcelPackage(file))
{
var workbook = package.Workbook;
var sheet = workbook.Worksheets[1];
Assert.AreEqual(2, sheet.Drawings.Count)
var drawingOne = sheet.Drawings[0];
var drawingTwo = sheet.Drawings[1];
// From returns the position of the upper left corner of the picture.
// To returns the position of the lower right corner.
Assert.IsTrue(drawingOne.From.Row < drawingTwo.From.Row);
Assert.IsTrue(drawingOne.From.Column < drawingTwo.From.Column);
Assert.IsTrue(drawingOne.To.Row < drawingTwo.To.Row);
Assert.IsTrue(drawingOne.To.Column < drawingTwo.To.Column);
}
}
}
}
此测试通过。它检测到两个图像,并正确地告诉我它们的相对位置。你没有我的工作表,但我检查过,行和列都是正确的。
一个奇怪的细节是工作表索引是从1开始的,但行和列是从0开始的。但这没什么大不了的。
此外,虽然从包中返回的所有对象都是IDisposable
,但大多数示例仅显示处置包本身。一个人注意到其他对象的Dispose
方法是空的。这很奇怪。但它比Excel Interop更好,你必须释放COM对象。