我还没有完整的代码,我被困在项目的概念层面。
我用硒氯化物自动化一些东西。
部分代码:
ws_number = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[5]/td[2]').get_attribute("textContent")
warr_type = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[16]/td[2]').get_attribute("textContent")
device_type = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[8]/td[2]').get_attribute("textContent")
partner = driver.find_element(By.XPATH, '//*[@id="adatok_table"]/tbody/tr[7]/td[2]').get_attribute("textContent")
我遇到了device_type的文本内容,因为它里面有垃圾信息。我需要将其剥离。
垃圾看起来像这样:(三星SM-G930F Fekete - BLACK) 我需要的是(G930)。
我怎样才能轻松缩小范围? 我如何将其与列表进行比较?
答案 0 :(得分:0)
根据垃圾的变化程度,您可以使用正则表达式来清理内容。
import re
dirty = "Samsung SM-G930F Fekete - BLACK"
regex = "^.+-([A-Z]{1}[0-9]{3}).+$"
m = re.search(regex, dirty)
print(m.group(1))
这样的东西会给你你的“G930”。