根据文件内的文本拆分文件

时间:2013-08-23 15:08:09

标签: bash loops filter while-loop

我正在尝试将此文件拆分为其他文件。因此,它将从输入文件中获取"data.pdf"中的所有行,并生成一个名为data.pdf.txt的文本文件

我试图拆分的数据在下面第5栏。

输入:

/mnt/Hector/Data/benign/binary/benign-pete/ d16feafae3adf1ee0f77e6a84a476b18    0   S043GUIv02  code.bin.pe32.gui   PE32 executable for MS Windows (GUI) Intel 80386 32-bit
/mnt/Hector/Data/benign/binary/benign-pete/ e9f6b4a413ed42987e1bfff13954faaa    0   S043GUIv02  code.bin.pe32.gui   PE32 executable for MS Windows (GUI) Intel 80386 32-bit
/mnt/Hector/Data/benign/binary/benign-pete/ 01d0cd964020a1f498c601f9801742c1    19  S040PDFv02  data.pdf    PDF document
/mnt/Hector/Data/benign/binary/benign-pete/ 0299a1771587043b232f760cbedbb5b7    0   S040PDFv02  data.pdf    PDF document

谢谢我一直坚持这个并且不能正确地做到

2 个答案:

答案 0 :(得分:1)

awk '{ print >> $5.txt }' < input.txt

答案 1 :(得分:1)

检查第5列是否为data.pdf。如果是,则将结果打印在data.pdf.txt

$ awk '$5 == "data.pdf"' your_file
/mnt/Hector/Data/benign/binary/benign-pete/ 01d0cd964020a1f498c601f9801742c1    19  S040PDFv02  data.pdf    PDF document
/mnt/Hector/Data/benign/binary/benign-pete/ 0299a1771587043b232f760cbedbb5b7    0   S040PDFv02  data.pdf    PDF document

并且像这样,它使用以下内容创建“data.pdf.txt”:

$ awk '$5 == "data.pdf"' your_file > data.pdf.txt