我尝试将一些手册页转换为纯文本文件。但是当我打开文件时,许多单词都有不必要的重复字符。
例如,执行<div id="alert-block">
<span class="alert-error">{email_error}</span>
</div>
会更改awk.txt文件中的部分:
我认为这将是一项简单的任务。为什么会这样?
答案 0 :(得分:2)
手册页包含格式化信息(例如,用于指示某些单词是否应为粗体)。因此,在文件中重定向输出时,某些字符可能会重复出现。
您可能想尝试:
man awk | col -b > awk.txt
col在做什么:
col - 过滤来自输入的反向换行
概要
col [-bfhpx] [-l num]
说明
col实用程序过滤掉反向(和反向反向)换行符,以便输出的顺序正确,只有前向和后半 前进换行,和 尽可能用制表符替换空白字符。这在处理nroff(1)和tbl(1)的输出时非常有用。
col实用程序从标准输入读取并写入标准输出。
选项如下:
-b 不输出任何退格,只打印写入每个列位置的最后一个字符。