如何使用Nokogiri将HTML转换为Markdown?

时间:2011-08-17 13:56:59

标签: html ruby nokogiri markdown

有没有办法将HTML转换为Markdown文字?

  • HTML很简单 - 它只是一个div元素,里面有几个<p>元素。
  • 可能有图像 - 我也希望保留它们。
  • 此外,可能会有几个像这样的“内嵌”图片:<img src='images/symbol_minus.gif' width='9' height='3' alt='&minus;' border='0' style='vertical-align:middle;' />这只是一个减号 - 我想用文字替换它们。

Nokogiri::XML::Element#text几乎是我想要的东西,但它剥离了图像。

1 个答案:

答案 0 :(得分:3)

正如@Konrads建议的那样,有一个重复的条目here。但是,该条目的答案中给出的链接已被破坏。

我用Google搜索了一些,发现有些叉子存活了下来:https://github.com/tomkrush/reverse-markdownhttps://gist.github.com/788039

如果这些叉子死了,只需google进行“反向降价”。你肯定会找到一些活着的东西。