用Python替换html文件中的单词

时间:2015-09-04 09:18:44

标签: python excel

我正在尝试阅读HTML文件,并用excel表中的等效单词替换几个单词。 以下是我的代码。

import urllib
import xlrd


workbook = xlrd.open_workbook('polish.xlsx', encoding_override="cp1252")
worksheet = workbook.sheet_by_index(0)
page = urllib.urlopen("source.html").read()

for x in range(0,96):

 if not type(worksheet.cell(x, 2).value) is float:
    print worksheet.cell(x, 2).value.encode("utf-8")
    print worksheet.cell(x, 3).value.encode("utf-8")

    page.replace(worksheet.cell(x, 2).value.encode("utf-8"), worksheet.cell(x, 3).value.encode("utf-8"))
print page

但替换功能不起作用。 page变量未显示任何更改。如何替换HTML文件中的文本?

1 个答案:

答案 0 :(得分:0)

在replace方法中将变量类型转换为字符串。

fist_var = worksheet.cell(x, 2).value.encode('ascii', 'ignore')
second_var = worksheet.cell(x, 3).value.encode('ascii', 'ignore')
for x in range(0,90):
 page.encode('ascii', 'ignore').replace(first_var, second_var)

这应该有效。希望这会有所帮助。