标签: java pdf apache-tika
我从pdf文件中提取数据,其中包含普通文本和粗体,斜体和下划线字样。我正在使用apache Tika和PDFTextStripper类。我正在逐行阅读整个pdf并将其存储在String[] arryOfLine。
String[] arryOfLine
如果特定字符串包含粗体,斜体和下划线字,我们能找到任何方法吗?