用于搜索OCR PDF文件夹的脚本

时间:2011-12-13 17:58:12

标签: bash shell pdf

我写了一个脚本来搜索一个文件夹,让我知道PDF有什么字体(快速了解它是否已经过OCR,除非有人知道更好的字体)

我的脚本无法做到的是搜索主DIR中的所有文件夹?

有什么想法?

!/bin/bash
SAVEIFS=$IFS
IFS=$(echo -en "\n\b")
PDFDIR=/home/user/Temp/Docs/*.pdf
for f in $PDFDIR
do
echo "******************PDF***********************"
pdffonts $f
echo "$f"
echo "******************PDf***********************"
done > output.txt
# restore $IFS
IFS=$SAVEIFS 

2 个答案:

答案 0 :(得分:2)

您最好使用find

find /home/usr/Temp/Docs -name \*.pdf -exec echo "***PDF***" -print -exec pdffonts {} \; -exec echo "***END PDF***" \;

答案 1 :(得分:0)

改变这个:

PDFDIR=/home/user/Temp/Docs/*.pdf
for f in $PDFDIR

到此:

PDFDIR=/home/user/Temp/Docs
for f in $(find $PDFDIR -type f -name "*.pdf")