我一直在研究这个问题,但我找不到一种简单的方法来从网站上读取一个表并将其翻译成一个表/列表View,它基本上可以用数字来解释并进行操作(通常通过计算)。从本质上讲,我想从网站中获取数字并将其解析为已识别的整数。
我意识到这将使用SQL或某种HTML解析器,但是对教程页面或一些示例代码的任何指导都将受到高度赞赏。我需要这个作为我的Android应用程序的一部分,所以使用Java。该网站不仅包含表格的图像,而且还是一个完整的页面。
提前谢谢你。
示例网页(表格模糊,但列将是这样的)
答案 0 :(得分:0)
我认为最简单的方法是获取网站HTML源代码并将其传递给DOM解析器。您需要以下课程:DocumentBuilderFactory
,DocumentBuilder
。解析过程后,您将获得一个Document
对象。 HTML源代码的每个标记,属性名称,属性值等都存储在那里,所需的整数值也是如此。您可以通过访问其节点来获取这些值。看一下这个链接如何解析DOM文档并获取它的值:http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/。但是使用你提取的HTML源代码而不是文件输入:
String htmlSourceCode = "<html>blabla</html>"; //your fetched HTML source code
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(new ByteArrayInputStream(htmlSourceCode.getBytes()));
doc.getDocumentElement().normalize();