我有一个带有蛋白质序列的文本文件。我想将所有小写字母替换为大写字母'C'。我怎么能用awk做到这一点?
>1CHE
aHKLbMaHc
>2HV3
PNMRrYnf
>5GH3
LKDeVmqQ
desired output
>1CHE
CHKLCMCHC
>2HV3
PNMRCYCC
>5GH3
LKDCVCCQ
答案 0 :(得分:6)
echo 'changecase' | tr [:lower:] C
答案 1 :(得分:0)
我会使用sed
:
sed '/^>/!s/[a-z]/C/g' file.txt
如果你想要awk
,请点击这里:
awk '!/^>/ { gsub(/[a-z]/, "C") }1' file.txt
结果:
>1CHE
CHKLCMCHC
>2HV3
PNMRCYCC
>5GH3
LKDCVCCQ