将html实体解码为中文字符

时间:2018-03-26 15:47:09

标签: html linux shell locale

需要帮助 我的curl输出显示中文字符(在Linux终端上)

기타/부재시 집 앞에 놓고가셔&#46104
  1. 我需要输出中文字符,如(기타/부재시집앞에놓고가셔되) OR-OR-OR
  2. 如何在终端上将这些html转换为实体到中文字符 请注意我的机器上没有安装php。所以我不能使用html_entity_decode或其他php解码方法
  3. 我的机器上安装了perl和python。

1 个答案:

答案 0 :(得分:0)

通过这个简单的Perl替换来管道输出:

perl -CO -pe 's/&#(\d+);/chr $1/ge'
  • -p逐行读取输入并在处理后打印每个
  • -CO打开输出的UTF-8编码
  • /e评估s///替换的替换部分为代码
  • chr只返回字符集中给定数字的字符。