我试图从.txt文件中删除某些文本

时间:2012-09-18 02:47:12

标签: text lines

我有pdf文件,在pagei的右上角和左侧有安全标记,将它们转换为.pdb文件,以便在我的手机上读取它们,并将安全标记中的写入放入.pdb文件中,以便每隔几个文件页面有:

PDF Transform

PDF Transform

Y

Y

Y

er

Y

er

B

2

B

2

B

.0

B

.0

A

A

Click here to buy

Click here to buy

w

w

w

w

w .

w

A B B YY.com

.A B BYY.com

我尝试使用calibre将它们转换为多种类型的文件,但它会显示在所有文件中。

如果我将它们转换为.txt文件,任何人都可以创建一个批处理文件来删除多个文件中的这些文本行吗?

1 个答案:

答案 0 :(得分:0)

我不确定您使用的是哪种操作系统,但这适用于* nix,安装了SED的osx,不确定是否可以在Windows中使用SED:

for filename in *.txt; do sed ${filename} -e '1,20d' -e '/^PDF Transform/,/^A B B YY\.com/d' > newfiles/${filename}; done

如果您知道它是静态的并且位于文件内部的相同位置,则第一个-e命令会删除第1-20行。第二个命令将删除PDF Transform和YY.com之间的所有内容,包括这些行。您可以使用许多或一个-e命令来获得所需内容。它假定newfiles文件夹确实存在。我没有测试这个,所以正则表达式可能会关闭。