应用错误收集

使用Codename One解析HTML页面的最佳方法是什么？

时间：2017-02-02 11:19:47

标签： codenameone

我想解析HTML以从没有服务的网页中读取信息。

使用JavaSE我可能会使用jsoup和HTML清理程序来使HTML格式良好，并在将中间格式作为XML处理之前过滤掉不相关的部分。

然而，使用Codename One的任意库并不是那么简单，因为运行时没有JavaSE的全部范围。

有没有人使用Codename One进行HTML解析，哪种方法最好？

1 个答案:

答案 0 :(得分：0)

Codename One中的内置gsub('_\\.', '\\.', paste("plot", "var","m",".pdf", sep = "_")) # [1] "plot_var_m.pdf"即使在形成为SGML（格式错误的XML）时也可以解析HTML。它应该产生足够好的结果。

或者您可以使用XMLParser使用JavaScript加载HTML并使用DOM查询来解析数据，我认为甚至可以在不显示组件的情况下实现，但我并非100％确定这一点。