我应该使用Xpath还是regexp?

时间:2016-08-11 09:29:43

标签: javascript java regex xpath import.io

我不是语言方面的专家,也不了解它。我正在从一个半动态的网站上提取数据。

例如,我需要有两列“家庭购买计划建议 - 客户类型”和“家庭购买计划建议 - 投资类型”,列出客户和投资类型(可以是几个)他们可以进入一个单元格,但有一些分隔符,如“;”。

这是表格显示的内容

How the table appears

代码如下所示:

就购房计划提供建议

SELECT 1000000000+ORA_HASH (userID || SYSTIMESTAMP || SYS_GUID ()) AS hash
FROM DUAL;

2 个答案:

答案 0 :(得分:2)

如果没有其他列表具有这些类但不应该考虑这个xpath,则此xpath有效。

//ul[@class='PermCondsLimitationsList']/li[@class='PermCondsLimitationsItem Popover']/(text()|span/text()))[normalize-space(.)]

经过测试here

获得标题:

//ul[@class='PermissionConditionsList']/li[@class='PermissionsConditionsItem']/text()[normalize-space(.)]

组合:

//ul[@class='PermissionConditionsList']/li[@class='PermissionsConditionsItem']/(text()|ul[@class='PermCondsLimitationsList']/li[@class='PermCondsLimitationsItem Popover']/(text()|span/text()))[normalize-space(.)]

但要以某种格式获得两者,XSLT可能会更有用。

答案 1 :(得分:0)

如果您有chrome,则可以通过右键单击所需区域并转到 - >来查看元素的xpath。检查。将突出显示源代码的相关部分。从那里你可以通过右键单击突出显示代码并转到Copy - >来获取xpath。复制XPath。