如何获取长字符串,并创建以特定字符序列开头和结尾的较小字符串

时间:2019-04-26 23:33:57

标签: java regex

在我的程序中,我使用了jsoup来解析URL并生成html文档。但是,我从中获取数据的站点只是一小段纯文本,没有任何元素或其他功能。我需要仔细阅读本文档,并创建以某种字符模式开头和结尾的字符串。我一直在研究正则表达式。

目前,我认为实现目标的最佳方法是将HTML文档转换为字符串。我要创建的每个子字符串都以“ {{world”:“”开头,并以“”}”结尾,但是这些块之间的信息可以更改,并且长度可变。

我需要知道如何使用正则表达式检测那些字符串并从中创建字符串,或者是否有更好的方法来完成我要尝试的操作,

1 个答案:

答案 0 :(得分:0)

您可以使用String.split分割字符串。如果所需的部分用}{"world":""分隔,则可以使用类似的内容作为分隔符:

String string = "{\"world\":\"whatever\"}{\"world\":\"something\"}";
String[] parts = string.split("}{\"world\":");
String part1 = parts[0]; // {"world":"whatever"
String part2 = parts[1]; // "something"}

然后我想您可以使用String.replace从每个零件中切出不需要的零件:

String part1Cut = part1.replace("{\"world\":", ""); // "whatever"
String part2Cut = part2.replace("}", ""); // "something"

我相信可以有一种更简洁的方法(我在处理字符串方面经验不足),但是我只是想将这些方法带给您,以防您不了解它们。 / p>