在将docx转换为PDF时,inotifywait触发事件两次

时间:2017-09-29 05:36:05

标签: shell inotify inotifywait

我有shell脚本,inotifwait设置如下:

inotifywait -r  -e close_write,moved_to  -m "<path>/upload" --format '%f##@@##%e##@@##%w'

有一些docx文件驻留在监视目录中,一些脚本通过以下命令将docx转换为PDF:

soffice --headless --convert-to pdf:writer_pdf_Export <path>/upload/somedoc.docx --outdir  <path>/upload/

生成PDF后,会以某种方式触发事件两次。参赛作品如下:

somedoc.pdf##@@##CLOSE_WRITE,CLOSE##@@##<path>/upload/
somedoc.pdf##@@##CLOSE_WRITE,CLOSE##@@##<path>/upload/

这里还有什么问题?

此致

2 个答案:

答案 0 :(得分:1)

我认为你无法控制外部程序。但我假设您正在将此输出用于管道,然后将其输入到其他位置。在这种情况下,您可以避免连续几秒钟内发生的事件

因此我们将%T添加到--format--timefmt "%s"以获取纪元时间。以下是更新的命令

$ inotifywait -r  -e close_write,moved_to --timefmt "%s"  -m "/home/vagrant" --format '%f##@@##%e##@@##%w##T%T' -q | ./process.sh
test.txt##@@##CLOSE_WRITE,CLOSE##@@##/home/vagrant/
Skipping this event as it happend within 2 seconds. TimeDiff=2
test.txt##@@##CLOSE_WRITE,CLOSE##@@##/home/vagrant/

这是通过使用touch test.txt完成的,每秒多次。正如你所看到的那样甚至被跳过了。 process.sh是一个简单的bash脚本

#!/bin/bash

LAST_EVENT=
LAST_EVENT_TIME=0
while read line
do
  DEL="##T"
  EVENT_TIME=$(echo "$line" | awk -v delimeter="$DEL" '{split($0,a,delimeter)} END{print a[2]}')
  EVENT=$(echo "$line" | awk -v delimeter="$DEL" '{split($0,a,delimeter)} END{print a[1]}')
  TIME_DIFF=$(( $EVENT_TIME - $LAST_EVENT_TIME))
  if [[ "$EVENT" == "$LAST_EVENT" ]]; then
     if [[ $TIME_DIFF -gt 2 ]]; then
        echo "$EVENT"
     else
        echo "Skipping this event as it happend within 2 seconds. TimeDiff=$TIME_DIFF"
     fi
  else
    echo $EVENT
    LAST_EVENT_TIME=$EVENT_TIME
  fi
  LAST_EVENT=$EVENT
done < "${1:-/dev/stdin}"

在您的实际脚本中,您将禁用echo,如果这个仅用于演示目的

答案 1 :(得分:1)

它被触发了两次,因为这就是soffice在内部表现的方式。 有一天,它可能会开始写10次,并且在一次运行中在这些写入之间进行sleep 2,我们的程序无法完成,我认为不应该预测它并依赖它。

所以我尝试从不同的角度解决问题 - 让我们将转换后的文件放入临时目录,然后将其移动到目标目录,如下所示:

soffice --headless --convert-to pdf:writer_pdf_Export <path>/upload/somedoc.docx --outdir <path>/tempdir/ && mv <path>/tempdir/somedoc.pdf <path>/upload/

并按以下方式使用inotifywait

inotifywait -r -e moved_to  -m "<path>/upload" --format '%f##@@##%e##@@##%w'

优势在于您不再依赖于soffice的内部逻辑。 如果您无法调整生成pdf文件的脚本的行为,那么您确实需要采用@Tarun建议的解决方法。