如何编写文本解析器的单元测试?

时间:2019-02-22 18:47:08

标签: python unit-testing parsing

对于背景知识,我有点像个自学成才的Python开发人员,只接受过一些正规培训,并在学校学习过一些CS课程。

目前,我正在研究一个Python程序,该程序将自动分析非常大的文本文件(数千行)中的信息,这是模拟软件的输出结果。我想进行测试驱动开发(TDD),但是我很难理解如何编写适当的单元测试。

我的麻烦是,我的某些功能(单元)的输出是海量数据结构,它们是文本文件的解析版本。我可以手动创建这些输出,然后进行测试,但这会花费很多时间。解析器的全部重点是节省时间并创建结构化的输出。到目前为止,只有我一直在进行的测试是手动尝试和出错,这也很麻烦。

所以我的问题是,是否有更直观的方法为解析器创建测试?

在此先感谢您的帮助!

1 个答案:

答案 0 :(得分:2)

通常,使用回归测试系统对解析器进行测试。您创建样本输入集并验证输出是否正确。然后将输入和输出放入库中。每次修改代码时,都在库上运行回归测试系统,以查看是否有任何更改。