将HTML转换为句子

时间:2016-10-14 00:44:16

标签: java html text

我想知道是否有办法将HTML转换为句子,例如,使用JSoup。我正在寻找的是:

List<String> convertToSentences(String html);

有时,句子由点,问号和感叹号分隔,有时由HTML结构分隔,例如<ul><p>&#39;

例如,给定以下HTML:

<p>Hello World. What a great day.</p>    // [Hello world, What a great day]
<ul><li>One</li><li>Two</li></ul>        // [One, Two]
<p>Today is <strong>great</great></p>    // [Today is great]

那里有没有哪个图书馆有这样的东西?

0 个答案:

没有答案