获取所有元素的组合文本

时间:2017-02-18 08:51:23

标签: html parsing haskell hxt

我尝试的片段(使用HXT和HandsomeSoup):

#!/usr/bin/env runhaskell

import           Text.HandsomeSoup
import           Text.XML.HXT.Core

main = do
  let html = "<html><body><a href='a'>b</a><a href='x'>y<p>z</p></a></body></html>"
  let doc = parseHtml html
  val <- runX $ doc >>> css "a" >>> deepest getText
  print val

输出:

["b","y","z"]

期望的输出:

["b","yz"]

基本上我正在寻找类似jQuery的text()函数。

Edit2:在jQuery中,它实际上是一个单行:

const texts = $('a').map((id, e) => $(e).text()).get();

0 个答案:

没有答案