我尝试的片段(使用HXT和HandsomeSoup):
#!/usr/bin/env runhaskell
import Text.HandsomeSoup
import Text.XML.HXT.Core
main = do
let html = "<html><body><a href='a'>b</a><a href='x'>y<p>z</p></a></body></html>"
let doc = parseHtml html
val <- runX $ doc >>> css "a" >>> deepest getText
print val
输出:
["b","y","z"]
期望的输出:
["b","yz"]
基本上我正在寻找类似jQuery的text()
函数。
Edit2:在jQuery中,它实际上是一个单行:
const texts = $('a').map((id, e) => $(e).text()).get();