为了进行一些统计分析,我需要在Excel工作表的列中提取值。我一直在使用Apache POI包来读取Excel文件,当需要迭代行时,它可以正常工作。但是我找不到任何关于在API(link text)中获取列数或通过谷歌搜索的内容。
由于我需要获取不同列的最大值和最小值并使用这些值生成随机数,因此无需拾取单个列,唯一的另一个选择是迭代行和列以获取值并逐个比较,听起来不那么节省时间。
有关如何解决此问题的任何想法?
谢谢,
答案 0 :(得分:18)
Excel文件是基于行而不是基于列的,因此获取列中所有值的唯一方法是依次查看每一行。没有更快的方法来获取列,因为列中的单元格不会存储在一起。
你的代码可能想成为:
List<Double> values = new ArrayList<Double>();
for(Row r : sheet) {
Cell c = r.getCell(columnNumber);
if(c != null) {
if(c.getCellType() == Cell.CELL_TYPE_NUMERIC) {
valuesadd(c.getNumericCellValue());
} else if(c.getCellType() == Cell.CELL_TYPE_FORMULA && c.getCachedFormulaResultType() == Cell.CELL_TYPE_NUMERIC) {
valuesadd(c.getNumericCellValue());
}
}
}
然后,它将为您提供该列中的所有数字单元格值。
答案 1 :(得分:0)
我知道这是一个老问题,但我遇到了同样的问题,必须以不同的方式解决。
我的代码无法轻易改编,并且会获得很多不必要的复杂性。所以我决定通过反转列和行来改变excel表,如下所示:(http://www.howtogeek.com/howto/12366/)
你也可以通过VBA反转它,如下所示:
Convert row with columns of data into column with multiple rows in Excel 2007
希望它可以帮助那些人
答案 2 :(得分:0)
只是想添加,如果你的文件中有标题并且你不确定列索引但是想要在特定标题(列名)下选择列,例如,你可以尝试这样的事情
for(Row r : datatypeSheet)
{
Iterator<Cell> headerIterator = r.cellIterator();
Cell header = null;
// table header row
if(r.getRowNum() == 0)
{
// getting specific column's index
while(headerIterator.hasNext())
{
header = headerIterator.next();
if(header.getStringCellValue().equalsIgnoreCase("column1Index"))
{
column1Index = header.getColumnIndex();
}
}
}
else
{
Cell column1Cells = r.getCell(column1);
if(column1Cells != null)
{
if(column1Cells.getCellType() == Cell.CELL_TYPE_NUMERIC)
{
// adding to a list
column1Data.add(column1Cells.getNumericCellValue());
}
else if(column1Cells.getCellType() == Cell.CELL_TYPE_FORMULA && column1Cells.getCachedFormulaResultType() == Cell.CELL_TYPE_NUMERIC)
{
// adding to a list
column1Data.add(column1Cells.getNumericCellValue());
}
}
}
}