尝试将手册页连接到纯文本文件时重复字符

时间:2016-03-30 04:24:39

标签: bash manpage

我尝试将一些手册页转换为纯文本文件。但是当我打开文件时,许多单词都有不必要的重复字符。

例如,执行<div id="alert-block"> <span class="alert-error">{email_error}</span> </div>会更改awk.txt文件中的部分:

  • NAME NNAAMMEE
  • 大纲 SSYYNNOOPPSSIISS
  • 描述 DDEESSCCR​​RIIPPTTIIOONN

我认为这将是一项简单的任务。为什么会这样?

1 个答案:

答案 0 :(得分:2)

手册页包含格式化信息(例如,用于指示某些单词是否应为粗体)。因此,在文件中重定向输出时,某些字符可能会重复出现。

您可能想尝试:

man awk | col -b > awk.txt

col在做什么:

  

col - 过滤来自输入的反向换行

     

概要

     

col [-bfhpx] [-l num]

     

说明

     

col实用程序过滤掉反向(和反向反向)换行符,以便输出的顺序正确,只有前向和后半   前进换行,和        尽可能用制表符替换空白字符。这在处理nroff(1)和tbl(1)的输出时非常有用。

     

col实用程序从标准输入读取并写入标准输出。

     

选项如下:

     

-b 不输出任何退格,只打印写入每个列位置的最后一个字符。