我在其他地方看到了文本文件的答案,但我需要为压缩文件执行此操作。
我有一个6G二进制文件,需要拆分成100M块。我在某处错过了unix的“head”模拟器吗?
答案 0 :(得分:13)
没关系。你走了:
function split($inFile, $outPrefix, [Int32] $bufSize){
$stream = [System.IO.File]::OpenRead($inFile)
$chunkNum = 1
$barr = New-Object byte[] $bufSize
while( $bytesRead = $stream.Read($barr,0,$bufsize)){
$outFile = "$outPrefix$chunkNum"
$ostream = [System.IO.File]::OpenWrite($outFile)
$ostream.Write($barr,0,$bytesRead);
$ostream.close();
echo "wrote $outFile"
$chunkNum += 1
}
}
假设:bufSize适合内存。
答案 1 :(得分:11)
结论问题的答案:你如何将它们重新组合在一起?
function stitch($infilePrefix, $outFile) {
$ostream = [System.Io.File]::OpenWrite($outFile)
$chunkNum = 1
$infileName = "$infilePrefix$chunkNum"
$offset = 0
while(Test-Path $infileName) {
$bytes = [System.IO.File]::ReadAllBytes($infileName)
$ostream.Write($bytes, 0, $bytes.Count)
Write-Host "read $infileName"
$chunkNum += 1
$infileName = "$infilePrefix$chunkNum"
}
$ostream.close();
}
答案 2 :(得分:0)
我回答了bernd_k在这个问题的评论中提到的问题,但我会在这种情况下使用 - ReadCount
而不是-TotalCount
,例如。
Get-Content bigfile.bin -ReadCount 100MB -Encoding byte
这会导致Get-Content
在块大小为文本编码行或字节编码字节时读取文件块。请记住,当它执行此操作时,您将获得一个传递给管道的数组,而不是单个字节或文本行。