标签: python html diacritics
我有一个包含<i>rūpa</i>等字词的HTML文件。 如何将其转换为rūpa(r ū pa)?
<i>rūpa</i>
rūpa
有没有办法转换它?
我也知道这些是扩展二进制代码的html表示,(如果我错了,请纠正我)。
python是首选,但感谢任何语言的解决方案。