Question

您正在使用HTTP Client步骤获取网站的源代码。我需要删掉一行的特定部分。

示例行：<a href="....." ......>TEXT I WANT</a>

所以我想我会在PDI中使用UDJC并首先将文本块拆分为String[] lines = code.split("\n+");行，然后循环遍历数组并使用if条件（即正则表达式检查）看看我是否有权利线。

for(String line : lines){
        if line.matches(".*a href.*"){
            String outputString = code;
            break;
        }
    }

（我也在IDE中尝试将其作为没有PDI的纯Java）但我从来没有受到过打击。知道如何解决这个问题吗？或者是否有更快更容易的方法来获得我想要的块？

Answer 1

我做了类似你喜欢的过滤步骤

变换步骤：