我正在寻找一个用于比较大型分层数据集并提供某种形式的人类可读分析的PHP库或流程。目的是分析创建它们的过程中的回归。我目前在PHPUnit中测试的方法是:
迭代现有数据集(保存为序列化数据或直接从API加载),并使用应用程序API方法构建等效数据集。
比较两个数据集基本上是MD5,使用各种段并使用assertEquals()。如果失败,则手动将输出区分为实际学习内容。
它有效,但它的脆弱有几个原因,例如。添加新字段将始终导致失败。它是自动化工作流程的一部分,因此我需要一种方法来排除这些误报并通常更好地分析和报告。