希望如此,在此澄清了我正在使用nokogiri提取javascript数据。一切工作正常,除了需要解决的一个小细节,而且我不知道如何删除变量数据。
我想提取部分文字
<script>
window.pageData={JsonDataType}
</script>
我只想要输出{JsonDataType}
。
我的代码顺便得到了一切
script = page.at("//head/script[3]").text
答案 0 :(得分:0)
您将申请regex
完成以下任务。
match = script.match(/window\.pageData=(?<data>.*)/i)
,并在match[:data]
中捕获数据。
我假设script
是字符串,否则正则表达式规则可能不起作用。
答案 1 :(得分:0)
答案取决于上下文。
如果您清楚地知道页面的结构,则可以这样做:
{{1}}