标签: java boilerpipe
我正在使用samppipe来提取文本表单网站。
ArticleSentencesExtractor.getInstance().getText(inputHTMLStream)
我没有看到任何定制的可能性。我想将<p>sentence</p>元素与两个换行符分开。这可能 - 怎么样?
<p>sentence</p>