我正在尝试为依赖于解析器(BeautifulSoup)的函数开发单元测试,而该解析器依赖于网络访问来获取网页。为了防止网络访问,我将所有HTML代码复制到文件中,每当我需要该网页时,我只需从文件中读取它。但是,我很难嘲笑解析器。
我的问题是:我应该尝试模拟解析器,如果答案是肯定的,那么如何?
以下是我尝试测试的方法,它位于data_processing.py
:
def get_ocw_course_info(url):
parser = get_parser(url)
url_name = parser.find('meta', {"name":"Search_Display"}).get('content').replace('|', '-')
description = parser.find('meta', {"name":"Description"}).get('content')
return dict(url=url,
url_name=url_name,
description=description)
以下是我为此功能开发的单元测试:
@patch('data_processing.get_parser')
def test_get_ocw_course_info_unit(self, *args, **kwargs):
data_processing.get_parser.return_value = BeautifulSoup(read_mock_html('mock_responses/ocw_pass.html'), 'lxml')
actual = data_processing.get_ocw_course_info('https://ocw.mit.edu/courses/aeronautics-and-astronautics/16-682-prototyping-avionics-spring-2006/assignments/')
expected = {'url': 'https://ocw.mit.edu/courses/aeronautics-and-astronautics/16-682-prototyping-avionics-spring-2006/assignments/',
'url_name': '16.682 Prototyping Avionics - Assignments',
'description': 'This section contains three of the four assignments from the class.',
}
self.assertEqual(actual, expected)
我省略了辅助函数的实现,因为它们或者是一个衬里,或者没有什么特别有趣的事情发生(我想名字应该是非常明显的)
答案 0 :(得分:0)
我认为你有两种选择:
get_parser
过程中接受可选参数get_ocw_course_info
(这将是某种可调用的),并使用简单的依赖注入为您的函数提供可测试的实现。 您可以通过mock.patch
轻松模拟解析器,这就是您的做法(不太了解您的问题)。
请注意,在装饰测试用例中,您将获得第二个参数,这是您可以配置的模拟:
@patch('data_processing.get_parser')
def test_get_ocw_course_info_unit(self, mock, *args, **kwargs):
mock.return_value = ...
或者,另一方面,您可以通过将其传递给修补程序装饰器来提供预定义的模拟:
def get_parser_mocked(): # some suitable return value
@patch('data_processing.get_parser', get_parser_mocked)
def test_get_ocw_course_info_unit(self, *args, **kwargs):
...