如何从cmd提示符(脚本)中的txt文件中读取文件名,然后使用Windows中的cmd行将文件的子集合并为PDF文件

时间:2014-09-10 14:50:17

标签: shell pdf scripting pdf-generation windows-scripting

我有一个以下格式的文本文件:

2014-05-13  03:35 PM            48,841 SUR2-**C01**-00-000-PCE-1001-002.pdf
2014-05-13  03:36 PM            43,599 SUR2-**C01**-00-000-PCE-1002-001.pdf
2014-05-13  03:35 PM            51,900 SUR2-**C02**-00-000-PCE-1000-001.pdf
2014-05-13  03:35 PM            53,622 SUR2-**C02**-00-000-PCE-1000-002.pdf
2014-05-13  03:35 PM            52,145 SUR2-**C02**-00-000-PCE-1000-003.pdf
2014-05-13  03:35 PM            50,426 SUR2-**C02**-00-000-PCE-1000-004.pdf

我需要解析此文件,并提取与C01或C02匹配的文件,并将这些文件发送到组合的PDF文件,一个用于C01,另一个用于C02。

如何解析文件,字符串匹配C01或C02上的文件名?

然后,我如何获取上述解析结果,并使用找到的文件名,从命令行或脚本中将它们组合成PDF?

1 个答案:

答案 0 :(得分:1)

合并-C01.bat

1.使用 awk 将文件解析为数组

set LIST=($(awk '/C01/{print $5}' file.txt))

2.使用 pdf合并工具(pdftk)合并数组中的文件

for %%i in %LIST% do pdftk out.pdf %%i cat output out.pdf