pdf字数统计后的具体单词

时间:2016-03-16 19:37:17

标签: pdf word-count

我有多个pdf文件,我需要计算文本中特定标题或单词出现后的单词数。例如,给定的标题显示在2页文档的第二页的顶部,然后仅计算第2页上的文字。您知道现有的任何字数统计程序是否已包含此类功能吗?

非常感谢你的帮助

克里斯

1 个答案:

答案 0 :(得分:0)

如果您正在寻找命令行自动化,那么

  1. 您需要先使用pdftotext

    将PDF转换为文本文件

    $ pdftotext transcript.pdf

  2. 然后使用[wc][2]实用程序计算单词:

    $ wc -w transcript.txt