如何在管道中使用管道掉落功能?

时间:2012-05-31 13:37:53

标签: haskell pipe conduit

我有一个简单的任务 - 从文件中读取一堆行并对每一行做一些事情。除了第一个 - 这是一些可以忽略的标题。

所以我想我会试试导管。

printFile src = runResourceT $ CB.sourceFile src =$= 
    CT.decode CT.utf8 =$= CT.lines =$= CL.mapM_ putStrLn

冷却。

所以现在我只想放弃第一行...而且似乎有一个功能 -

printFile src = runResourceT $ CB.sourceFile src =$= 
    CT.decode CT.utf8 =$= CT.lines =$= drop 1 =$= CL.mapM_ putStrLn

嗯 - 但现在我注意到drop有类型签名Sink a m ()。有人向我建议我可以使用Monad实例来管道并使用drop来有效地删除一些元素 - 所以我尝试了这个:

drop' :: Int -> Pipe a a m ()
drop' n = do
  CL.drop n
  x <- await
  case x of 
    Just v -> yield v
    Nothing -> return ()

哪个不进行类型检查,因为管道的monad实例仅适用于相同类型的管道 - Sinks将Void作为其输出,因此我不能像这样使用它。

我快速浏览了一下管道和管道核心,我注意到管道核心具有我预期的功能,管道是一个最小的库,但文档显示了它将如何实现。

所以我很困惑 - 也许我错过了一个关键概念..我看到了函数

sequence ::  Sink input m output -> Conduit input m output

但这似乎不是正确的想法,因为输出值是()

CL.sequence (CL.drop 1) :: Conduit a m ()    

我可能只是回去使用lazy-io,因为我不需要任何流媒体 - 但我有兴趣看到正确的方法。

1 个答案:

答案 0 :(得分:6)

首先,简单的答案是:

... =$= CT.lines =$= (CL.drop 1 >> CL.mapM_ putStrLn)

更长的解释:实际上有两种不同的方法可以实现drop。无论哪种方式,它都会首先从输入中删除n个元素。关于它下一步做什么有两种选择:

  • 说已经完成了
  • 开始输出输入流中的所有剩余项目

以前的行为是Sink将执行的行为(以及我们drop实际执行的行为),而后者是Conduit的行为。事实上,你可以通过monadic组合从前者产生后者:

dropConduit n = CL.drop n >> CL.map id

然后您可以在开头描述时使用dropConduit。这是展示monadic成分和融合之间差异的好方法;前者允许两个函数在同一输入流上操作,而后者允许一个函数将流提供给另一个。

我没有基准测试,但我相当确定monadic组合会更有效率。