通过php检测文档(表)中的列 - 算法

时间:2012-06-01 14:01:34

标签: php html algorithm dom

如果给出如下表所示的表,那么分别检测两列的最佳方法是什么?

那么我需要第一列的总colspans。

重要的是要记住,列的nr可以改变。

在此示例的情况下,第二列从“10欧元”(第二行)开始。第一部分等于2个colspans。另一部分是5个colspans。

关于如何做到这一点的任何(抽象)想法?

enter image description here

1 个答案:

答案 0 :(得分:1)

您必须考虑表格单元格之间的间隙并标记其位置,例如::

0 1 2 3 4     7
0   2 3 4 5 6 7
0 1 2   4 5   7
...
0   2         7

使用上述信息构建数组后,迭代它们并标记公共间隙位置:

0   2         7

由于0和7都位于表格的边缘,因此您可以将其剥离。然后,您将位置2作为行之间的公共间隙。

完成:)