如何删除"प"从html代码中使用jsoup同时提取文本

时间:2016-07-22 14:10:29

标签: java regex jsoup

当我使用这个程序时 那" content = content.replaceAll("&。*?;","");"语法不能删除"& #____;"从提取的文本中,所有单词如"& #____;"显示为问题"?"马克。告诉我如何删除"& #____;"来自文字..

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

class JavaSoup1
{
 public static void main(String []args)throws Exception 
 {
       Document doc = Jsoup.connect("http://www.iitbhu.ac.in/").get();

       String content=doc.text();

       content=content.replaceAll("&.*?;","");

       System.out.println(content);
 }
}

0 个答案:

没有答案