我正在使用Aaron Swartz's HTML2Text.py脚本在我的网络应用上将HTML转换为Markdown。但是,它不支持脚注(%a#img1.lightbox{:href => "#_"}
%img{:src => "some_img.jpg"}
标记正在删除)。我想通过支持脚注来实现功能,但我无法弄清楚要做什么。
我尝试了这段代码,但它似乎没有用(我在脚本开头添加了<sup>
):
self.sup = 0
并且还只是:
if tag == "sup":
if start:
self.p(); self.o('[^] ', 0, 1); self.start = 1
self.sup += 1
else:
self.sup -= 1
self.p()
问题是if tag == "sup":
self.sup()
标记被完全删除,<sup>
标记丢失了他们的ID而<li>
标记丢失了他们的rel,所以我得到了非工作链接。
任何人都可以帮我添加对此脚本中<a>
标记和脚注的支持吗?
该脚本可用here(此处发布时间过长)。我使用的是Python 2.7.9。
谢谢:)
使用此代码更新:
<sup>
它会呈现 if tag == "sup" and start:
if has_key(attrs, 'id'):
id = attrs.get('id', '').replace("fnref:", "")
self.o("[^" + escape_md(id) + "]")
,但它不包含<sup>
,或者将其连接到底部的<a>
和实际的脚注。