我必须像这样解析html代码:
Set objExcel = CreateObject("Excel.Application")
Set objWorkbook = objExcel.Workbooks.Open(xlsfile)
set objsheet = objExcel.ActiveWorkbook.Worksheets(1)
i=16400
UserID= objsheet.Cells(i,2).value
我尝试过这样的事情:
td.select(“
)”),但是出现异常。
我能够在b标签中获取文本,但是如何在b和br标签之间获取文本。
答案 0 :(得分:2)
您想获得<td/>
下的所有文本节点,但没有一个命名节点。 JSoup有一个称为textNodes()
的方法,该方法返回以下内容:
Element td = ...;
StringBuilder sb = new StringBuilder();
for (TextNode textNode : td.textNodes()) {
sb.append(textNode.text());
}
return sb.toString();