我有一个网络刮刀,用来解析网站上的html,我正在尝试为它编写测试。
我正在尝试测试的类接收Nokogiri HTML对象并从中提取所需的数据。现在像往常一样html可能会有所不同,有时元素会丢失或诸如此类。我需要测试这些不同的情况。
所以我想做的是制作一堆html文件,每个文件代表一个特定元素缺失的情况等。对于每个html文件,我希望也构造一个我期望的数据的关联散列假设它正常工作,刮刀就可以提取。
所以我想编写一个测试来迭代这些html文件,并将被测试类提取的数据与预期数据进行比较,并报告它是否正确。
有关如何执行此操作的任何建议吗?