我有一个csv文件,我需要将其拆分为n个文件,这样每个拆分文件不应超过100 MB。我需要在Windows批处理脚本中实现它。我尝试了下面的方法,但是因为我的未分割文件是GBs
,所以花了很多时间@echo off
setlocal enableextensions enabledelayedexpansion
set count=1
set maxbytesize=100000000
set size=1
type NUL > output_1.csv
FOR /F "tokens=*" %%i in (myfile.csv) do (
FOR /F "usebackq" %%A in ('!filename!_!count!.csv') do (
set size=%%~zA)
if !size! LSS !maxbytesize! (
echo %%i>>!filename!_!count!.csv) else (
set /a count+=1
echo %%i>>!filename!_!count!.csv
))
请告诉我是否有更好的方法来实现这一目标。我不能去任何其他脚本语言,因为我的服务器是Windows
答案 0 :(得分:1)
假设您的线条大小大致相同,这就行了。
它的优点是它只是一个2遍解决方案,一个用于计算线条,另一个用于打印它们。
@rem echo off
@rem usage: batchsplit.bat <file-to-split> <size-limit>
@rem it will generate files named <file-to-split>.part_NNN
setlocal EnableDelayedExpansion
set FILE_TO_SPLIT=%1
set SIZE_LIMIT=%2
for /f %%s in ('dir /b %FILE_TO_SPLIT%') do set SIZE=%%~Zs
for /f %%c in ('type "%FILE_TO_SPLIT%"^|find "" /v /c') do set LINE_COUNT=%%c
set /a AVG_LINE_SIZE=%SIZE%/%LINE_COUNT%
set /a LINES_PER_PART=%SIZE_LIMIT%/%AVG_LINE_SIZE%
set "cmd=findstr /R /N "^^" %FILE_TO_SPLIT%"
for /f "tokens=1,2* delims=:" %%a in ('!cmd!') do @(
set /a ccc = %%a / %LINES_PER_PART%
echo %%b >> %FILE_TO_SPLIT%.part_!ccc!
)
将其保存为batchsplit.bat
并使用以下命令运行:
batchsplit.bat myfile.csv 100000000