通常我正在使用grep -r --color word /path/dir
进行搜索,但这对二进制文件不起作用。所以我想编写一个类似的Perl脚本。因此,我正在搜索一个可以在Linux机器上读取doc文件的模块(也许类似于Spreadsheet :: ParseExcel for ms-word-documents)。
答案 0 :(得分:3)
有很多单词到文本转换器(如antidoc,wv,catdoc,unoconv ......)。你可以通过他们的输出grep。这也是msysgit对doc文件编目的作用。
答案 1 :(得分:1)
不试图听起来很麻烦,这是使用闭源专有文档的危险。您可能会被使用开发人员提供的工具困住。
对于您的实际问题,您可以执行以下操作: