我想知道是否有办法将HTML转换为句子,例如,使用JSoup。我正在寻找的是:
List<String> convertToSentences(String html);
有时,句子由点,问号和感叹号分隔,有时由HTML结构分隔,例如<ul>
&<p>
&#39;
例如,给定以下HTML:
<p>Hello World. What a great day.</p> // [Hello world, What a great day]
<ul><li>One</li><li>Two</li></ul> // [One, Two]
<p>Today is <strong>great</great></p> // [Today is great]
那里有没有哪个图书馆有这样的东西?