使用POI Java在Word文档中的表格的单元格中提取内容

时间:2016-05-25 23:28:42

标签: java text apache-poi extract

我一直在使用Java和POI从Word文档(docx)中提取数据。基本上我想提取两列表中包含的数据。我希望程序区分左列和右列并将各种值存储在数组中,事实是它逐行提取文本:

table.getText()

我使用了这种方法,但它没有区分细胞。它只是从一行中获取所有文本。

我使用的代码可以找到here

我找不到提取每个单元格中文本的方法

2 个答案:

答案 0 :(得分:2)

基于https://poi.apache.org/apidocs/index.html的javadocs,我会尝试类似:

table.getRow(0).getCell(0).getText();

您可能希望将其置于循环中以检索其自身的每一行中的文本。这些东西都不可迭代,所以你必须使用for循环来检索数据。 getRow()getCell()中的整数是表行和单元格的基于零的索引。

当您查看javadoc时,这些类都在org.apache.poi.xwpf.usermodel中。如果你想深入挖掘,你需要获得资源。

答案 1 :(得分:0)

出于所有意图和目的,我发现link对我必须做的事情非常有用。我不是计算机科学家,编程只是一种爱好,我发现POI文档有点难以理解。