为了简化我的问题,我主要考虑命令的手册页。例如«man grep»。 手册页或多或少是结构化的。大多数部分及其演示文稿都是标准的,可以在https://www.tldp.org/HOWTO/Man-Page/q3.html上找到解释。 (即使不知道groff,人工页面的来源,在groff中,并不是很难理解)
我的问题是:是否已有一个包含(更标准)手册页的数据库。或者至少是一个程序,将人工页面(可能是groff文件)作为输入并输出这样的数据库。 在这里,我的意思是数据库非常模糊。 Sqlite或mysql会很完美。但是csv的拉链也很棒。 让我举一个使用man grep的例子。
数据库将有一个选项表,每个选项都有一个条目。此条目包含: - 实际选项名称 - 缩写, - 此选项的功能描述 - 封闭部分。 。在CSV中,条目是 --extended-regexp,-E,将PATTERN解释为扩展正则表达式(ERE \,见下文)。 (-E由POSIX指定。),匹配器选择
它将有一个“退出”表,其中包含: 0,找到所选行 1,否则 2发生错误\,除非使用-q或--quiet或--silent选项并找到选定的行。
对于手册页的每个标准类型的部分等等。 还有一个表格,其中包含未成功放入其他表格的每个文本。
我希望它的某些部分很容易解析,例如创建选项表。但其他一些部分会很难,例如退出状态。这就是为什么我真的想知道这样的事情是否已经完成,为了不自己做。
答案 0 :(得分:0)
您可以下载手册页
git clone http://git.kernel.org/pub/scm/docs/man-pages/man-pages