每行一个单词组织汉字

时间:2013-03-08 14:19:43

标签: shell command-line

我试图组织一个像这样的汉字文本文件:

跌价

跌倒

跌停板

跌價

跌宕

跌幅

跌盪

跌眼鏡

我需要将它们排成每行一个单词。但我不知道如何获得单词边界。我的意思是操作英语,我们可以通过空间找到它,所以正则表达式就像是\ [A-za-z],对于汉字,我不知道该怎么做。有人能告诉我如何将它们组织成每行一个单词的格式吗?

1 个答案:

答案 0 :(得分:1)

您可以使用.

awk '$0{gsub(/./,"&\n");printf $0}' input

测试

kent$  echo "跌价

跌倒

跌停板

跌價

跌宕

跌幅

跌盪

跌眼鏡"|awk '$0{gsub(/./,"&\n");printf $0}'             
跌
价
跌
倒
跌
停
板
跌
價
跌
宕
跌
幅
跌
盪
跌
眼
鏡