根据数组的索引显示不同的HTML元素

时间:2018-09-09 02:25:55

标签: php python html arrays web-scraping

我正在使用Python抓取网页,然后下载其表数据<td>元素,并将其作为JSON存储在文件中。之后,我使用PHP处理该数据并将其显示在表中:

<?php
    $file_content = file_get_contents("./file.txt");
    $decoded_json = json_decode($file_content); // $decoded_json becomes an array with 72 elements (each of the elements is a string)
?>

我从中获取数据的表的每一行都有24列。基本上我现在有3行(数组中有72个元素)。我需要为每行分别创建3 <tr>和24 <td>-动态地 ,因为每次我抓取的行数都可能改变。另外,我需要在表的第18、21和24列旁边添加<input type="checkbox">。这是到目前为止我所拥有的(看起来至少与我想要实现的目标接近):

<table>
    <?php
        $i = 0;
        while ($i <= count($decoded_json)) {
            if ($i % 24 === 0) {
                echo "<tr><td>$decoded_json[$i]</td></tr>";
                $i++;
            } else {
                if ($i % 18 === 0 || $i % 21 === 0 || $i % 24 === 0) {
                    echo "<td>$decoded_json[$i]</td>";
                    echo '<td><input type="checkbox"></td>'; // It does not echo checkboxes correctly because of $i. 
                    $i++;
                } else {
                    echo "<td>$decoded_json[$i]</td>";
                    $i++;
                }  
            }
        }
    ?>
</table>

问题:

  • 这是一个可行的方法吗?

如果是:

  1. 如何确保数组中的每个24个元素仅创建一行(即使我的数组包含成千上万个元素)?现在,每23个元素都会创建1行,而第24个元素中的第1个元素总是被忽略。
  2. 如何在每行的第18、21和24列旁边添加一个复选框?因为我在每次迭代中都增加$i,所以数字在增加,但是我想我必须将每行的数字保持在1-24之间。

如果否:

  1. 您建议使用哪种方法?我更喜欢PHP。

P.S。我希望我很清楚。如果没有,请要求澄清。我的标题看起来有些模糊,但我不知道如何用一句话来说明我的问题。

编辑(回复@ggorlen评论): 这是文件内容:

["first", "768.51", "4,680", "0", "0%", "0", "0", "0%", "0", "0", "0%", "0", "0.00", "0.00%", "2", "0", "0%", "0", "0.00", "0.00%", "1", "768.51", "100.00%", "4,677", "second", "547.80", "27,392", "0", "0%", "0", "0", "0%", "0", "0", "0%", "0", "44.30", "8.09%", "138", "503.50", "91.91%", "27,254", "0", "0%", "0", "0", "0%", "0", "third", "509.41", "59,777", "0", "0%", "0", "0", "0%", "0", "0", "0%", "0", "0.00", "0.00%", "1", "412.94", "81.06%", "9,972", "22.15", "4.35%", "6,118", "74.32", "14.59%", "43,686"]

这就是我想要得到的(有点;我只需要每行第18、21和24列旁边的复选框):

<html><head><title>The Website Title</title></head>
<body>

<table border="1">

<td>first</td><td align="right">768.51</td> <td align="right">4,680</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0.00</td> <td align="right">0.00%</td> <td align="right"></td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0.00</td> <td align="right">0.00%</td> <td align="right"><a >1</a></td><td align="right">768.51</td> <td align="right">100.00%</td> <td align="right"><a >4,677</a></td></tr>

<tr>
<td>second</td><td align="right">547.80</td> <td align="right">27,392</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">44.30</td> <td align="right">8.09%</td> <td align="right"><a >138</a></td><td align="right">503.50</td> <td align="right">91.91%</td> <td align="right"><a >27,254</a></td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td></tr>

<tr>
<td>third</td><td align="right">509.41</td> <td align="right">59,777</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0</td> <td align="right">0%</td> <td align="right">0</td><td align="right">0.00</td> <td align="right">0.00%</td> <td align="right"><a>1</a></td><td align="right">412.94</td> <td align="right">81.06%</td> <td align="right"><a >9,972</a></td><td align="right">22.15</td> <td align="right">4.35%</td> <td align="right"><a>6,118</a></td><td align="right">74.32</td> <td align="right">14.59%</td> <td align="right">43,686<</td></tr>

</table>


</body></html>

1 个答案:

答案 0 :(得分:1)

您的代码已关闭。这个想法是用某种方式用行和列来表示一维数组。我的方法是将外部行循环增加所需的列数(24)。

对于每一行,我echo <tr>开头,然后在内部循环中遍历所有列,并适当地放置单元格和复选框。每个单元格的索引为$row + $col$col + $row < count($decoded_json)是安全检查)。最后,我关闭该行的</tr>,然后移至下一行,该行将从数组中的24个索引处开始。

这里是repl的测试对象。<​​/ p>

$columns = 24;
$checkboxes = array_flip([17, 20, 23]);

for ($row = 0; $row < count($decoded_json); $row += $columns) {
    echo '<tr>';

    for ($col = 0; $col < $columns && $col + $row < count($decoded_json); $col++) {
        echo '<td>' . $decoded_json[$row+$col] . '</td>';

        if (array_key_exists($col, $checkboxes)) {
            echo '<td><input type="checkbox"></td>';
        }
    }

    echo '</tr>';
}

这是经过整理的HTML输出:

table {
  border-collapse: collapse;
  font-family: monospace;
}

tr,
td {
  padding: 0.6em;
  border: 1px solid black;
}
<table>
  <tr>
    <td>first</td>
    <td>768.51</td>
    <td>4,680</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0.00</td>
    <td>0.00%</td>
    <td>2</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td><input type="checkbox"></td>
    <td>0.00</td>
    <td>0.00%</td>
    <td>1</td>
    <td><input type="checkbox"></td>
    <td>768.51</td>
    <td>100.00%</td>
    <td>4,677</td>
    <td><input type="checkbox"></td>
  </tr>
  <tr>
    <td>second</td>
    <td>547.80</td>
    <td>27,392</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>44.30</td>
    <td>8.09%</td>
    <td>138</td>
    <td>503.50</td>
    <td>91.91%</td>
    <td>27,254</td>
    <td><input type="checkbox"></td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td><input type="checkbox"></td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td><input type="checkbox"></td>
  </tr>
  <tr>
    <td>third</td>
    <td>509.41</td>
    <td>59,777</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0</td>
    <td>0%</td>
    <td>0</td>
    <td>0.00</td>
    <td>0.00%</td>
    <td>1</td>
    <td>412.94</td>
    <td>81.06%</td>
    <td>9,972</td>
    <td><input type="checkbox"></td>
    <td>22.15</td>
    <td>4.35%</td>
    <td>6,118</td>
    <td><input type="checkbox"></td>
    <td>74.32</td>
    <td>14.59%</td>
    <td>43,686</td>
    <td><input type="checkbox"></td>
  </tr>
</table>