您正在使用HTTP Client
步骤获取网站的源代码。我需要删掉一行的特定部分。
示例行:<a href="....." ......>TEXT I WANT</a>
所以我想我会在PDI中使用UDJC并首先将文本块拆分为String[] lines = code.split("\n+");
行,然后循环遍历数组并使用if条件(即正则表达式检查)看看我是否有权利线。
for(String line : lines){
if line.matches(".*a href.*"){
String outputString = code;
break;
}
}
(我也在IDE中尝试将其作为没有PDI的纯Java)但我从来没有受到过打击。知道如何解决这个问题吗?或者是否有更快更容易的方法来获得我想要的块?
答案 0 :(得分:1)
我做了类似你喜欢的过滤步骤
变换步骤:
"<a href"
//检查输出