我认为标题解释了所有。我有一个字符串,我试图将其插入Beautiful Soup文档。我找到了Exponent notation,但我不知道是否以及如何将其应用于我的案例。
工作示例:
#!/usr/bin/python
from bs4 import BeautifulSoup
html_sample = """
<!DOCTYPE html>
<html><head lang="en"><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1"></head>
<body>
<div class="date">LAST UPDATE</div>
</body>
</html>
"""
si_unit = '3 m3/s'
soup = BeautifulSoup(html_sample)
forecast = soup.find("div", {"class": "date"})
forecast.string = si_unit
print(soup.prettify())
输出样本:
<!DOCTYPE html>
<html>
<head lang="en">
<meta charset="utf-8">
<meta content="width=device-width, initial-scale=1" name="viewport"/>
</meta>
</head>
<body>
<div class="date">
3 m3/s
</div>
</body>
</html>
我的问题是si单位不是指数级的。如何将值m(3)/ s转换/打印为指数?
有人知道要做这个棘手的操作吗? 提前感谢您的时间和精力。
更新:将输出从2 m3 / s修改为3 m3 / s,与给出的示例代码相同。
更新2:通过jumbopap为我的问题添加工作解决方案。
更新3:修改解决方案。
更新4:我使用ref Unicode Character 'SUPERSCRIPT THREE' (U+00B3)的Unicode字符串,以防其他人需要它。
第一步,根据字符串中间的空白区域将字符串分成两部分。第二步,将所有字符从si单元部分(我们想要修改指数的部分)拆分成一个列表。 第三,将所有字符连接成一个新的字符串,以便在BeautifulSoup中推送。
工作代码示例:
from bs4 import BeautifulSoup
html_sample = """
<!DOCTYPE html>
<html><head lang="en"><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1"></head>
<body>
<div class="date">LAST UPDATE</div>
</body>
</html>
"""
si_unit = '3 m3/s'
unit, si_unit = si_unit.split()
si_unit_list = list(si_unit)
soup = BeautifulSoup(html_sample, 'html.parser')
forecast = soup.find("div", {"class": "date"})
forecast.string = unit + si_unit_list[0] + u"\u00B3" + si_unit_list[2] + si_unit_list[3]
print(soup.prettify())
产生的输出:
<!DOCTYPE html>
<html>
<head lang="en">
<meta charset="utf-8">
<meta content="width=device-width, initial-scale=1" name="viewport"/>
</meta>
</head>
<body>
<div class="date">
3m³/s
</div>
</body>
</html>
答案 0 :(得分:3)
在字符串中使用superscript 3 character。你可以用美丽的汤作为HTML来美化并输出它。
>>> html = '<p>2³</p>'
>>> soup = BeautifulSoup.BeautifulSoup(html, 'html.parser')
>>> out = soup.prettify(formatter="html")
>>> file('tmp.html', 'wb').write(out)
>>>
结果: