我正在使用POI库中的HSSFSheet来解析excel电子表格,如下所示
我的目标是通过Biomarkers CD3,CD4,......将这些密度值读入数据库。为了找出每种生物标记物有多少种不同的密度类型(IM,CT,N,TZ),程序需要了解前两行中单元格的垂直对齐方式。使用行迭代器解析excel的传统方法存在问题:
(1)第一行是ID,MRN,组织,协议,CD3,CD4,CD20,第二行是从LAB02-152-01开始。因此,密度标题行以某种方式被跳过。
(2)即使用一些技巧拾取密度标题行,通过读入文件的方式也会丢失从一行到另一行的相关性。换句话说,程序忽略列对齐,因此不知道哪个密度在一个特定的生物标记物下面。
需要有关如何处理如此复杂的Excel表格的建议。