我目前有一个17列宽的表,有30个记录。
基本上,它是来自另一个网站的表格,我正在抓取然后插入MySQL表格。
$html = str_get_html($newHTML); // get the HTML
$tdContents = ""; // declare variable
$rowArray = array(); // declare array for records
for ($j = 0; $j < 510; $j++) // loop through each TD element, 17 columns by 30 records so 510
{
$f = $html->find("td",$j); // get the td elements from the html
$tdContents = $f->innertext; // get the text inside the td
$rowArray[] = $tdContents; // store that text inside the array
if ($j == 16 || $j == 33 || $j == 50 || $j == 67 || $j == 84 || $j == 101 || $j == 118 || $j == 135 || $j == 152 || $j == 169 || $j == 186 || $j == 203 || $j == 220 || $j == 237 || $j == 254 || $j == 271 || $j == 288 || $j == 305 || $j == 322 || $j == 339 || $j == 356 || $j == 373 || $j == 390 || $j == 407 || $j == 424 || $j == 441 || $j == 458 || $j == 475 || $j == 492 || $j == 509) // every 17 td elements
{
$comma_separated = implode("','", $rowArray); // seperate the array contents with commas and apostrophes, set up for mysql
$comma_separated = "'" . $comma_separated . "'"; // add apostrophes to beginning and end of the string
$result = mysql_query("INSERT INTO standings_20112012 VALUES (".$comma_separated.")"); // insert the data into mysql
$rowArray = array(); // clear the array, for the next record
}
}
评论应该解释得很好。这将生成一个17 x 30的表格,其中包含我需要的所有信息。如果我再次运行它,它将插入另外30条记录,这很糟糕。我想只更新/覆盖已经创建的表。所以表中应该只有30条记录。然而,我对此深感不安。
任何帮助?
答案 0 :(得分:2)
向数据集添加唯一的主键。然后将您的mysql查询更改为INSERT IGNORE
,它将丢弃重复项。或者,如果您需要更新表中已有的内容,也可以使用ON DUPLICATE UPDATE
。