我想使用wget过滤网站上的特定字词。
我要过滤的单词是 hPa 及其值。
请参阅:https://www.foreca.de/Deutschland/Berlin/Berlin
我无法找到有关如何过滤掉特定字符串的有用信息。
这是我迄今为止所尝试过的:
#!/bin/bash
LAST=$(wget -l1 https://www.foreca.de/Deutschland/Berlin/Berlin -O - | sed -e 'hPa')
echo $LAST
感谢您帮助我。
答案 0 :(得分:1)
使用xpath的完全成熟的解决方案:
for(lines <- handler.getLines()){
println(">"+lines)
}
$ saxon-lint --html --xpath '//div[contains(text(), "hPa")]/text()' \
'https://www.foreca.de/Deutschland/Berlin/Berlin'