Question

所以我需要阅读一个大型XML文件。我不想将它解析为DOM树并将其全部保存在内存中。我正在寻找的是一个能够在Haskell中提供对XML数据的快速，非缓存，仅向前访问的读者。

编辑：在同一主题上似乎有一些问题，但我没有在那里找到答案。所以我想要的是：

一个XML游标（快速，单向，没有懒惰，没有缓存，随你进行的处理）lib
如何使用它的示例。

编辑： Text.XML.Enumerator.Parse似乎是the answer：这是一个不错的选择吗？

Answer 1

我用于类似任务的最佳模块是来自Text.XML.Stream.Parse包的xml-conduit。模块索引包含API的这个简单示例：

{-# LANGUAGE OverloadedStrings #-}
import Control.Monad.Trans.Resource
import Data.Conduit (($$))
import Data.Text (Text, unpack)
import Text.XML.Stream.Parse

data Person = Person Int Text
    deriving Show

parsePerson = tagName "person" (requireAttr "age") $ \age -> do
    name <- content
    return $ Person (read $ unpack age) name

parsePeople = tagNoAttr "people" $ many parsePerson

main = do
    people <- runResourceT $
            parseFile def "people.xml" $$ force "people required" parsePeople
    print people

Haskell中的一种快速，无缓存，XML-cursor /枚举器/类似读者的解析器？

1 个答案: