如何在BeautifulSoup

时间:2016-01-15 15:14:11

标签: python beautifulsoup exponent

我认为标题解释了所有。我有一个字符串,我试图将其插入Beautiful Soup文档。我找到了Exponent notation,但我不知道是否以及如何将其应用于我的案例。

工作示例:

#!/usr/bin/python

from bs4 import BeautifulSoup

html_sample = """
<!DOCTYPE html>
<html><head lang="en"><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1"></head>
<body>
<div class="date">LAST UPDATE</div>
</body>
</html>
"""

si_unit = '3 m3/s'    

soup = BeautifulSoup(html_sample)
forecast = soup.find("div", {"class": "date"})
forecast.string = si_unit
print(soup.prettify())

输出样本:

<!DOCTYPE html>
<html>
 <head lang="en">
  <meta charset="utf-8">
   <meta content="width=device-width, initial-scale=1" name="viewport"/>
  </meta>
 </head>
 <body>
  <div class="date">
   3 m3/s
  </div>
 </body>
</html>

我的问题是si单位不是指数级的。如何将值m(3)/ s转换/打印为指数?

有人知道要做这个棘手的操作吗? 提前感谢您的时间和精力。

更新:将输出从2 m3 / s修改为3 m3 / s,与给出的示例代码相同。

更新2:通过jumbopap为我的问题添加工作解决方案。

更新3:修改解决方案。

更新4:我使用ref Unicode Character 'SUPERSCRIPT THREE' (U+00B3)的Unicode字符串,以防其他人需要它。

第一步,根据字符串中间的空白区域将字符串分成两部分。第二步,将所有字符从si单元部分(我们想要修改指数的部分)拆分成一个列表。 第三,将所有字符连接成一个新的字符串,以便在BeautifulSoup中推送。

工作代码示例:

from bs4 import BeautifulSoup

html_sample = """
<!DOCTYPE html>
<html><head lang="en"><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1"></head>
<body>
<div class="date">LAST UPDATE</div>
</body>
</html>
"""

si_unit = '3 m3/s'
unit, si_unit = si_unit.split()
si_unit_list = list(si_unit)

soup = BeautifulSoup(html_sample, 'html.parser')
forecast = soup.find("div", {"class": "date"})
forecast.string = unit + si_unit_list[0] + u"\u00B3" + si_unit_list[2] + si_unit_list[3]
print(soup.prettify())

产生的输出:

<!DOCTYPE html>
<html>
 <head lang="en">
  <meta charset="utf-8">
   <meta content="width=device-width, initial-scale=1" name="viewport"/>
  </meta>
 </head>
 <body>
  <div class="date">
   3m³/s
  </div>
 </body>
</html>

1 个答案:

答案 0 :(得分:3)

在字符串中使用superscript 3 character。你可以用美丽的汤作为HTML来美化并输出它。

>>> html = '<p>2³</p>'
>>> soup = BeautifulSoup.BeautifulSoup(html, 'html.parser')
>>> out = soup.prettify(formatter="html")
>>> file('tmp.html', 'wb').write(out)
>>>

结果:

enter image description here