在单元测试中模拟解析器对象

时间:2016-12-18 16:29:48

标签: python unit-testing beautifulsoup

我正在尝试为依赖于解析器(BeautifulSoup)的函数开发单元测试,而该解析器依赖于网络访问来获取网页。为了防止网络访问,我将所有HTML代码复制到文件中,每当我需要该网页时,我只需从文件中读取它。但是,我很难嘲笑解析器。

我的问题是:我应该尝试模拟解析器,如果答案是肯定的,那么如何?

以下是我尝试测试的方法,它位于data_processing.py

def get_ocw_course_info(url):
    parser = get_parser(url)
    url_name  = parser.find('meta', {"name":"Search_Display"}).get('content').replace('|', '-')
    description = parser.find('meta', {"name":"Description"}).get('content')

    return dict(url=url,
                url_name=url_name,
                description=description)

以下是我为此功能开发的单元测试:

@patch('data_processing.get_parser')
    def test_get_ocw_course_info_unit(self, *args, **kwargs):
        data_processing.get_parser.return_value = BeautifulSoup(read_mock_html('mock_responses/ocw_pass.html'), 'lxml')

        actual = data_processing.get_ocw_course_info('https://ocw.mit.edu/courses/aeronautics-and-astronautics/16-682-prototyping-avionics-spring-2006/assignments/')
        expected = {'url': 'https://ocw.mit.edu/courses/aeronautics-and-astronautics/16-682-prototyping-avionics-spring-2006/assignments/', 
                    'url_name': '16.682 Prototyping Avionics - Assignments', 
                    'description': 'This section contains three of the four assignments from the class.', 
                    }
        self.assertEqual(actual, expected)

我省略了辅助函数的实现,因为它们或者是一个衬里,或者没有什么特别有趣的事情发生(我想名字应该是非常明显的)

1 个答案:

答案 0 :(得分:0)

我认为你有两种选择:

  1. 在我看来,最简单的方法是在get_parser过程中接受可选参数get_ocw_course_info(这将是某种可调用的),并使用简单的依赖注入为您的函数提供可测试的实现。
  2. 您可以通过mock.patch轻松模拟解析器,这就是您的做法(不太了解您的问题)。 请注意,在装饰测试用例中,您将获得第二个参数,这是您可以配置的模拟:

    @patch('data_processing.get_parser')
    def test_get_ocw_course_info_unit(self, mock, *args, **kwargs):
        mock.return_value = ...
    
  3. 或者,另一方面,您可以通过将其传递给修补程序装饰器来提供预定义的模拟:

    def get_parser_mocked(): # some suitable return value
    
    @patch('data_processing.get_parser', get_parser_mocked)
    def test_get_ocw_course_info_unit(self, *args, **kwargs):
        ...