如何从站点HTML解析特定字符串

时间:2017-04-13 02:53:04

标签: java parsing jsoup html-parsing text-parsing

我从Stackoverflow发现我可以轻松地使用Jsoup解析网站。

例如,我可以编写以下代码来解析维基百科网站上的newsHeadlines。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

这是我的问题。 如果我想解析这个网站https://campusoperations.temple.edu/parking-transportation/garages-lots?campus=4,请抓住停车场'地址字符串并放入字符串变量,所以我最终有字符串变量,如

String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122"
String bellGarage = "1840 N. 11th Street Philadelphia, PA 19122"

我应该写什么代码?

当我使用chrome&#39更多工具>打开html文件时,我似乎无法找到相应的HTML元素。开发者工具。

为了更好地理解, 我不想手动输入" 1855 N. 15th Street Philadelphia,PA 19122"。我希望从网站解析该字符串,最后得到一个字符串:String fifteenStreetLot = "1855 N. 15th Street Philadelphia, PA 19122";

1 个答案:

答案 0 :(得分:1)

首先,我可以在您的链接上看到下一个:

<div class="thoroughfare">1840 N. 11th Street</div>
<div class="addressfield-container-inline locality-block country-US"><span class="locality">Philadelphia</span>, <span class="state">PA</span> <span class="postal-code">19122</span></div>

使用css选择器,如

div.thoroughfare

div.adressfield-container-inline 

你可以得到你需要的部分内容。