将段落从文本文件匹配到忽略html标记的html文件

时间:2013-01-15 04:00:54

标签: java regex

我需要一个正则表达式来匹配文本文件和html文件。

"<b>Dog</b> and Cat"

这将等于

"Dog and Cat"

我正在使用Java。

1 个答案:

答案 0 :(得分:0)

以下是您需要的代码段。

String text, html;
BufferedReader br;
int i;int tags=0;

br=new BufferedReader(new InputStreamReader(System.in));
System.out.println("Enter HTML code");//If you want to read ferom file, replace the code
html=br.readLine();
for(i=0;i<html.length();i++){
if(html.charAt(i)=='<'){tags++;continue;}
if(html.charAt(i)=='>'){tags--;continue;}
if(tags==0)text=text+html.charAt(i);
}