我有一个包含1000个XML文件的文件夹,所有XML文件中都包含以下标记。
<Employee_Name><![CDATA[ABC CORP]></<Employee_Name>
你能帮我一个使用AWK的UNIX命令,它会给我一个上面提到的标签的唯一值列表。通过上面的例子,我将只获得ABC CORP。
答案 0 :(得分:1)
cat file | awk 'BEGIN {FS="\["} {print $3;}' | awk 'BEGIN {FS="\]"} {print $1}'
答案 1 :(得分:0)
grep '<Employee_Name>' file| awk -F"><" '{print substr($2,2)}' | sort -u