我有一种方法可以抓取网页并将数据保存到文件中(请参阅下面的示例代码)。我需要测试结果数据的格式是否正确。
问题是,从一系列调用中接收到数据,并且进一步的调用使用了先前调用的结果。更糟糕的是,许多涉及的调用都是在具有不同参数的同一对象(Webdriver
,WebDriverWait
和expected_conditions
模块)上完成的。
我看到unittest.mock.Mock
可以模拟一个简单调用或一系列简单调用的结果,但是看不到如何实现像这样纠缠的东西。我看到的唯一方法是手动重新实现该方法进行的每个调用,并将我在该方法中传递的参数复制到那些实现中,以便它们知道每次调用返回什么。并针对其他所有测试用例再次执行此操作。这听起来像是编写和维护的绝对噩梦:代码比测试本身多几倍,并且与代码的复制比例接近1:1。因此,我拒绝继续进行下去,直到有人告诉我有更好的方法或证明没有更好的方法,并且每个人都真的这样做(我不相信),例如每当页面上的标签更改时,都会重写所有测试(这是实现的详细信息,因此通常,它完全不会影响测试代码)。
示例代码(适用于http://example.com):
import selenium.webdriver
from selenium.webdriver.common.by import By as by
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
def dump_accreditation_data(d, w, i, path):
f = codecs.open(os.path.join(path, "%d.txt" % i), "w", encoding="utf-8")
u = u'http://example.com/%s/accreditation' % i
d.get(u)
# page load
w.until(EC.visibility_of_element_located((by.XPATH,"//p"))) #the real code has a more complex expression here with national characters
w.until_not(EC.visibility_of_element_located((by.CSS_SELECTOR, '.waiter')))
print >> f, u
# organization name
e = w.until(EC.visibility_of_element_located((
by.CSS_SELECTOR, 'h1'
)))
org_name = e.text
print >> f, org_name
del e
#etc
e = d.find_element_by_xpath(u'//a[text()="More information..."')
print >> f, e.get_attribute('href')
#How it's supposed to be used:
d = selenium.webdriver.Firefox()
w = WebDriverWait(d, 10)
dump_accreditation_data(d, w, 123, "<output_path>")
答案 0 :(得分:1)
对于我的代码,我同意,对您描述的方式进行单元测试没有多大意义。但是,这不仅仅是因为要进行大量工作:测试的目标当然是在代码中发现错误。单元测试的目的是发现那些可以在隔离单元中发现的错误。但是,示例代码的很大一部分与与外部库的交互有关。
在算法级别上几乎没有代码,例如:
os.path.join(path, "%d.txt" % i)
或
u = u'http://example.com/%s/accreditation' % i
或创建输出文件内容。
也就是说,如果代码中存在错误,则它们很可能处于交互级别:使用正确的参数以正确的顺序,正确的格式等参数以正确的顺序调用正确的库函数。库,但是,您不会发现交互错误,因为模拟是您实现的,只会反映您(可能是错误的)对库行为的理解。
我对测试此代码的建议是:将算法代码与与库进行交互的代码分开。例如,您可以创建小的辅助函数来计算输出文件名和输入URL。您可以在代码的交互主导部分中,从网页中提取所有数据,然后(在单独的功能中)使用所有这些数据来创建输出文件内容。
这些帮助器功能随后都可以使用单元测试进行测试。您将通过集成测试来测试的其余功能。