使用Windows批处理脚本拆分文件

时间:2012-12-06 13:23:58

标签: file batch-file split

我有一个csv文件,我需要将其拆分为n个文件,这样每个拆分文件不应超过100 MB。我需要在Windows批处理脚本中实现它。我尝试了下面的方法,但是因为我的未分割文件是GBs

,所以花了很多时间
@echo off
setlocal enableextensions enabledelayedexpansion
set count=1
set maxbytesize=100000000
set size=1
type NUL > output_1.csv

FOR /F  "tokens=*" %%i in (myfile.csv) do (
FOR /F "usebackq" %%A in ('!filename!_!count!.csv') do (
set size=%%~zA) 
if !size! LSS !maxbytesize! (
echo %%i>>!filename!_!count!.csv) else (
set /a count+=1 
echo %%i>>!filename!_!count!.csv 
))

请告诉我是否有更好的方法来实现这一目标。我不能去任何其他脚本语言,因为我的服务器是Windows

1 个答案:

答案 0 :(得分:1)

假设您的线条大小大致相同,这就行了。

它的优点是它只是一个2遍解决方案,一个用于计算线条,另一个用于打印它们。

@rem echo off

@rem usage: batchsplit.bat <file-to-split> <size-limit>
@rem it will generate files named <file-to-split>.part_NNN

setlocal EnableDelayedExpansion

set FILE_TO_SPLIT=%1
set SIZE_LIMIT=%2

for /f %%s in ('dir /b %FILE_TO_SPLIT%') do set SIZE=%%~Zs
for /f %%c in ('type "%FILE_TO_SPLIT%"^|find "" /v /c') do set LINE_COUNT=%%c

set /a AVG_LINE_SIZE=%SIZE%/%LINE_COUNT%
set /a LINES_PER_PART=%SIZE_LIMIT%/%AVG_LINE_SIZE%

set "cmd=findstr /R /N "^^" %FILE_TO_SPLIT%"

for /f "tokens=1,2* delims=:" %%a in ('!cmd!') do @(
    set /a ccc = %%a / %LINES_PER_PART%
    echo %%b >> %FILE_TO_SPLIT%.part_!ccc!
)

将其保存为batchsplit.bat并使用以下命令运行:

batchsplit.bat myfile.csv 100000000