如何加快将大型XML文件拆分为较小的TXT文件的速度?

时间:2019-07-18 14:51:11

标签: xml file unix split

我正在尝试将大型XML文件拆分为较小的文件。我需要每15行分割,同时跳过第一个和最后一个XML标签,同时将较小的TXT文件命名为它们的父名称(加上分割号后缀)

我尝试了xml_split命令,但是遇到与Parser.pm有关的Perl模块错误。

cd ${inDir}

ls ${inDir}/*xml | while read xName

do

egrep -v <1st and last XML Tag> | split -15 -d -a6

xmlName=$(basename ${xName} | cut -d"." -f1)

find . -type f -name 'x*' | xargs -i basename {} | while read splitName
do

sxName=$(echo ${splitName} | cut -d"/" -f2)

mv ${splitName} ${xmlName}-${sxName}.txt

done

done

我只是在寻找一种更快/更有效的方式来完成分割/重新命名。

0 个答案:

没有答案