嗨大家我试图分别在桌面上解析每一行,然后将其内容放在一个字符串中。喜欢这个页面http://reviews.cnet.com/consoles/sony-playstation-3-60gb/4507-10109_7-31355103.html
我的目标是解析不包括标签的每一行的每个值,例如
存储器| 60 GB CPU | 8核心
等。
所以我只需要解析表格中每个规范的值,然后将每个规范的值放在一个单独的字符串中
所以我需要一个名称为memory的字符串,该字符串具有来自URL的解析值和一个名称为CPU的字符串,该字符串具有从URL中提取的解析值,依此类推。 我该如何开始?
Document doc = Jsoup.connect("http://reviews.cnet.com/consoles/sony-playstation-3-60gb/4507-10109_731355103.html").get();for (Element table : doc.select("table.tablehead")) {
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
if (tds.size() > 6) {
System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
String CPU = row.text();
}}}