我正在尝试使用其他应用优化工作流程。该应用程序从文件中提取XML,然后将该XML上载到指定的服务器上。但是,XML只有一些有用的信息(通常是前5kbs,来自10-20mb的XML)。我试图创建一个脚本来打开xml或拆分它,然后获取有用的5kb数据并覆盖原始XML。到目前为止,我还没有这么多运气。有人可以给我一些帮助。
答案 0 :(得分:1)
您可以编写一个XSLT文件来提取所需内容,并调用xsltproc
命令将其应用于您的大XML文件。
但是,由于您的应用程序首先生成该XML文件,为什么不生成上传到服务器的最小版本?
答案 1 :(得分:0)
这是我到目前为止所提出的。
#!/bin/bash
FILES=/private/var/root/Documents/XML/*.xml
for f in $FILES
do
echo "Processing $f file..."
split -b 20000 "$f" tmp
mv tmpaa "$f"
rm tmp*
done