http://support.xbox.com/en-us/contact-us使用javascript创建一些列表。我希望能够解析这些列表的文本。因此,对于上面的页面,我想返回以下内容:
Billing and Subscriptions
Xbox 360
Xbox LIVE
Kinect
Apps
Games
我在尝试使用JSoup一段时间后才注意到它是使用javascript生成的。我不知道如何解析页面的javascript生成内容。
我从哪里开始?
答案 0 :(得分:1)
你总是可以导入整个页面然后在页面上执行一个字符串分隔符(使用return等)并查找包含信息的字符串,然后返回你想要的字符串并从该字符串中拉出一些字符串。这是一种肮脏的方式,不确定是否有一种干净的方法。
答案 1 :(得分:1)
您需要使用像Cobra这样的HTML + JavaScript库。它将解析HTML中的DOM元素,并应用由JavaScript引起的任何DOM更改。
答案 2 :(得分:0)
我不认为文本是由javascript生成的...如果我禁用javascript那些选项可以在这个位置的html中找到(jquery选择器只是因为它比手工编写更容易找到xpath没有启用javascript:))
'div#ShellNavigationBar ul.NavigationElements li ul li a'
无论直接回答您的查询,您都必须评估文档范围内的javascript,我希望它在Java中相当复杂。您可以更好地识别生成相关内容的javascript文件,并直接解析它。