所以我有一张发票需要我做一份报告。它平均长约250页。所以我正在尝试创建一个脚本,它将提取发票的特定值并进行报告。这是我的问题:
我知道这是很多问题,但我对Linux命令可以做什么感到困惑。你们能引导我走向正确的方向吗?感谢
PS:我正在使用CentOS 5.2
答案 0 :(得分:0)
怎么样:
pdftotext YOUR.pdf | sed 's/^\([^ ]\+\) \{21\}.*/\1/' > OUTPUT
pdftotext YOUR.pdf | sed 's/.* \{21\}\(.*\)/\1/' >> OUTPUT
但您也应该查看pdftotext
的{{1}}和-raw
选项。还有更多的方法可以做到这一点......