Question

我还没有完整的代码，我被困在项目的概念层面。

我用硒氯化物自动化一些东西。

部分代码：

ws_number = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[5]/td[2]').get_attribute("textContent")
warr_type = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[16]/td[2]').get_attribute("textContent")
device_type = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[8]/td[2]').get_attribute("textContent")
partner = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[7]/td[2]').get_attribute("textContent")

我遇到了device_type的文本内容，因为它里面有垃圾信息。我需要将其剥离。

垃圾看起来像这样:(三星SM-G930F Fekete - BLACK）我需要的是（G930）。

我怎样才能轻松缩小范围？我如何将其与列表进行比较？

Answer 1

根据垃圾的变化程度，您可以使用正则表达式来清理内容。

import re

dirty = "Samsung SM-G930F Fekete - BLACK"
regex = "^.+-([A-Z]{1}[0-9]{3}).+$"

m = re.search(regex, dirty)

print(m.group(1))

这样的东西会给你你的“G930”。

带有列表

1 个答案: