如何在Nokogiri中提取部分文本

时间:2019-02-22 18:39:39

标签: ruby nokogiri

希望如此,在此澄清了我正在使用nokogiri提取javascript数据。一切工作正常,除了需要解决的一个小细节,而且我不知道如何删除变量数据。

我想提取部分文字

<script>
    window.pageData={JsonDataType}
</script>

我只想要输出{JsonDataType}。 我的代码顺便得到了一切

script = page.at("//head/script[3]").text

2 个答案:

答案 0 :(得分:0)

您将申请regex完成以下任务。

match = script.match(/window\.pageData=(?<data>.*)/i),并在match[:data]中捕获数据。

我假设script是字符串,否则正则表达式规则可能不起作用。

答案 1 :(得分:0)

答案取决于上下文。

如果您清楚地知道页面的结构,则可以这样做:

{{1}}