Python:Replace()对写入文件没有任何影响

时间:2017-10-21 00:08:23

标签: python beautifulsoup urllib2

我正在为包含数学常量的网页开发Web解析器。我需要更换一些字符才能使它具有特定的格式,但我不知道为什么如果我打印它,我似乎工作正常;但是当我打开输出文件时,replace()实现的格式似乎没有生效。

那是代码

#!/usr/bin/env python3

from urllib.request import urlopen
from bs4 import BeautifulSoup

url = "http://www.ebyte.it/library/educards/constants/ConstantsOfPhysicsAndMath.html"
soup = BeautifulSoup(urlopen(url).read(), "html5lib")
f = open("ebyteParse-output.txt", "w")

table = soup.find("table", attrs={"class": "grid9"})

rows = table.findAll("tr")
for tr in rows:
    # If its a category of constants we write that as a comment
    if tr.has_attr("bgcolor"):
        f.write("\n\n# " + tr.find(text=True) + "\n")
        continue

    cols = tr.findAll("td")
    if (len(cols) >= 2):
        if (cols[0]["class"][0] == "box" or cols[0]["class"][0] == "boxi" and cols[1]["class"][0] == "boxa"):
            constant = str(cols[0].find(text=True)).replace(" ", "-")
            value = str(cols[1].find(text=True))
            value = value.replace(" ", "").replace("...", "").replace("[", "").replace("]", "")
            print(constant + "\t" + value)
            f.write(constant + "\t" + value)

    f.write("\n")

f.close()

这就是印刷品显示的内容:

enter image description here

这就是我在输出文件

上得到的

enter image description here

谢谢你, 萨尔瓦

1 个答案:

答案 0 :(得分:0)

我正在寻找的文件被捕获所以看不到任何变化。谢谢你的回答