今天早些时候,我为iteratees编写了一个小型测试应用程序,该应用程序组成了一个iteratee,用于使用iteratee编写进度来实际复制数据。我最终得到了这样的价值观:
-- NOTE: this snippet is with iteratees-0.8.5.0
-- side effect: display progress on stdout
displayProgress :: Iteratee ByteString IO ()
-- side effect: copy the bytestrings of Iteratee to Handle
fileSink :: Handle -> Iteratee ByteString IO ()
writeAndDisplayProgress :: Handle -> Iteratee ByteString IO ()
writeAndDisplayProgress handle = sequence_ [fileSink handle, displayProgress]
在查看枚举器库时,我看不到sequence_
或enumWith
的类似物。我想要做的就是编写两个迭代,以便它们作为一个整体。我可以丢弃结果(无论如何它会是()
)或保留它,我不在乎。 Control.Arrow中的(&&&)是我想要的,只适用于迭代而不是箭头。
我尝试了这两个选项:
-- NOTE: this snippet is with enumerator-0.4.10
run_ $ enumFile source $$ sequence_ [iterHandle handle, displayProgress]
run_ $ enumFile source $$ sequence_ [displayProgress, iterHandle handle]
第一个复制文件,但不显示进度;第二个显示进度,但不复制文件,所以很明显内置sequence_对枚举器迭代的影响是运行第一个迭代直到它终止然后运行另一个,这不是我想要的。我希望并行运行迭代,而不是串行运行。我觉得我错过了一些明显的东西,但在阅读枚举器库的wc
示例时,我看到了这个好奇的评论:
-- Exactly matching wc's output is too annoying, so this example
-- will just print one line per file, and support counting at most
-- one statistic per run
我想知道这句话是否表明在枚举框架中组合或组合迭代是不可能的。普遍接受的正确方法是什么?
修改:
似乎没有内置的方法来做到这一点。关于添加像enumSequence和manyToOne这样的组合器的Haskell邮件列表的讨论,但到目前为止,枚举器包中似乎没有任何实际提供此功能的内容。
答案 0 :(得分:2)
在我看来,而不是试图让两个Iteratees
并行使用序列,最好通过一个简单计算传递它的字节的Enumeratee
来提供流。 / p>
这是一个复制文件并打印每个块后复制的字节数的简单示例。
import System.Environment
import System.IO
import Data.Enumerator
import Data.Enumerator.Binary (enumFile, iterHandle)
import Data.Enumerator.List (mapAccumM)
import qualified Data.ByteString as B
printBytes :: Enumeratee B.ByteString B.ByteString IO ()
printBytes = flip mapAccumM 0 $ \total bytes -> do
let total' = total + B.length bytes
print total'
return (total', bytes)
copyFile s t = withBinaryFile t WriteMode $ \h -> do
run_ $ (enumFile s $= printBytes) $$ iterHandle h
main = do
[source, target] <- getArgs
copyFile source target