我正在使用Selenium抓取一个网站。当我得到一个元素列表(标题)的文本时,它就是这样打印的:
['Countyarrow_upward Reportingarrow_upward Totalarrow_upward Bennet (D)arrow_upward Biden (D)arrow_upward Bloomberg (D)arrow_upward Booker (D)arrow_upward Boyd (D)arrow_upward Buttigieg (D)arrow_upward
Castro (D)arrow_upward De La Fuente III (D)arrow_upward Delaney (D)arrow_upward Ellinger (D)arrow_upward Gabbard (D)arrow_upward Greenstein (D)arrow_upward Klobuchar (D)arrow_upward Patrick (D)arrow_upw
ard Sanders (D)arrow_upward Sestak (D)arrow_upward Steyer (D)arrow_upward Warren (D)arrow_upward Williamson (D)arrow_upward Yang (D)arrow_upward']
我显然只希望使用名称和“(D)”,所以我尝试使用replace()函数用空字符串替换Countyarrow_upward Reportingarrow_upward Totalarrow_upward
和arrow_upward
。这是我的代码:
headers = driver.find_elements_by_xpath('//*[@id="content"]/div/div[3]/div/div[2]/div/div[2]/div/div[2]/div[1]/div/table/thead/tr[1]')
header_text = []
for i in headers:
header_raw_text = i.text
header_raw_text.replace("Countyarrow_upward Reportingarrow_upward Totalarrow_upward ", "")
header_raw_text.replace("arrow_upward ", "")
header_text.append(header_raw_text)
print(header_text)
运行此代码时,上面得到的是相同的内容,而replace()函数不起作用。
非常感谢您的帮助!
答案 0 :(得分:2)
字符串是不可变的。因此header_raw_text.replace()
不会更改字符串本身。替换后,您必须重新分配结果。
header_raw_text = header_raw_text.replace("arrow_upward ", "")