如何使用Python支持脚注将HTML转换为Markdown?

时间:2015-06-26 08:16:36

标签: python html python-2.7 markdown multimarkdown

我正在使用Aaron Swartz's HTML2Text.py脚本在我的网络应用上将HTML转换为Markdown。但是,它不支持脚注(%a#img1.lightbox{:href => "#_"} %img{:src => "some_img.jpg"} 标记正在删除)。我想通过支持脚注来实现功能,但我无法弄清楚要做什么。

我尝试了这段代码,但它似乎没有用(我在脚本开头添加了<sup>):

self.sup = 0

并且还只是:

 if tag == "sup":
        if start:
            self.p(); self.o('[^] ', 0, 1); self.start = 1
            self.sup += 1
        else:
            self.sup -= 1
            self.p()

问题是if tag == "sup": self.sup() 标记被完全删除,<sup>标记丢失了他们的ID而<li>标记丢失了他们的rel,所以我得到了非工作链接。

任何人都可以帮我添加对此脚本中<a>标记和脚注的支持吗?

该脚本可用here(此处发布时间过长)。我使用的是Python 2.7.9。

谢谢:)

使用此代码

更新

<sup>

它会呈现 if tag == "sup" and start: if has_key(attrs, 'id'): id = attrs.get('id', '').replace("fnref:", "") self.o("[^" + escape_md(id) + "]") ,但它不包含<sup>,或者将其连接到底部的<a>和实际的脚注。

0 个答案:

没有答案