Php从ANSI编码的CSV生成UTF-8 XML,其中包含HTML标记

时间:2012-08-21 22:42:01

标签: php xml csv

我有一个csv文件,我想将其转换为xml,但CSV编码为ANSI,当生成xml文件时,所有特殊的字符如下:áéőúűóüöí看起来像这样:óÃzű

而且还有html标签搞乱了整个XML。 我试图添加strip_tags但这不起作用 现在我在产品之间有空节点,HTML代码遍布XML而不是节点之间 哦,因为CSV我必须放一个array_pop()来删除每行末尾的额外分号。

我的CSV看起来像这样:

title;seller_product_id;status;price;discount_price;warranty;manufacturer;weight;category;disable_shipping;photo_url_1;photo_url_2;photo_url_3;photo_url_4;seller_category;video_link;isbn13;gtin;product_code;warehouse_code;page_link;availability_237;shipping_fee_4_1;shipping_fee_4_2;description;
"tea csipkebogyó ízű 20*1,5g..";"5999881069013";1;"121";;1;;"60";8510;0;"http://mydomain/00003125_mid.jpg";"http://mydomain/00001634_mid.jpg";;;"Élelmiszer; Tea";;;;"5999881069013";"000000019231";" http://mydomain/producturl";"1744";;;<table width="975" cellspacing="0" cellpadding="0"><tbody><tr><td height="151" valign="top" style="background: url('http://mydomain/vlshop.PNG') no-repeat" colspan="2"></td></tr><tr><td style="font-family: Arial,Helvetica,sans-serif" colspan="2"><div style="text-align: justify"><div style="text-align: center"><span style="color: rgb(255, 0, 0)"><span style="font-size: large"><strong>Több termék vásárlása esetén használja a kosaras vásárlást!</strong></span></span></div><span style="color: rgb(255, 0, 0)"><span style="font-size: medium"><strong><br /><br />tea csipkebogyó ízű 20*1,5g..<br /><br />Cikkszám: 000000019231<br /><br />STAMFORD tea csipkebogyó ízű 20*1,5g..<br /><br />Csak új és garanciális termékeket árusítunk!<br />Csere és beszámítás nem lehetséges!<br /><br /><span style="font-size: large">Szállítási és fizetési információk:<br /></span><br />Lehetőség van a termékeket személyesen is átvenni:<br />- Munkanapokon 8-16 óráig: Szada, (Pest Megye)! </strong></span></span><span style="color: rgb(255, 0, 0)"><span style="font-size: medium"><strong><br /><br />Legalacsonyabb szállítás díjunk 660 Ft, ajánlott postázásra nincs lehetőség!<br /><br />Futárszolgálati díjaink előreutalás esetén:<br />- 0kg-2kg: 660 Ft<br />- 2kg-5kg: 800 Ft<br />- 5kg-30kg: 1200 Ft<br />- Utánvét +:  150 Ft<br /><br />A reggel 8 óráig beérkezett rendeléseket tudjuk aznap feldolgozni!<br />A fizetéssel és az átvétellel kapcsolatos igényeit kérjük tüntesse fel a megjegyzés rovatban!<br /><br /><br /></strong></span></span></div></td></tr></tbody></table>;

我正在使用它来创建XML:

<?php

error_reporting(E_ALL ^ E_NOTICE);
ini_set("display_errors", true);
function csv2xml($file, $container = 'data', $rows = 'row')
{
$r = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\r\n";
$r .= "<{$container}>\n";
$row = 0;
$cols = 0;
$titles = array();
$handle = @fopen($file, 'r');
if (!$handle) return $handle;
while (($data = fgetcsv($handle, 1000, ';')) !== FALSE)
{
array_pop($data);
if ($row > 0) $r .= "\t<{$rows}>\n";
if (!$cols) $cols = count($data);
for ($i = 0; $i < $cols; $i++)
{
if ($row == 0)
{
$titles[$i] = $data[$i];
continue;
}
//print_r($data[$i]);
$r .= "\t\t<{$titles[$i]}>";
$r .= strip_tags(str_replace('; ', '/', $data[$i]));
$r .= "</{$titles[$i]}>\n";
}
if ($row > 0) $r .= "\t</{$rows}>\n";
$row++;
}
fclose($handle);
$r .= "</{$container}>";
return $r;
}
$xml = csv2xml('feed.csv', 'products', 'product');
$xmlfile = @fopen('test.xml', 'wb') or die('Could not open XML file for writing');
fwrite($xmlfile, $xml) or die('Could not write string to XML file');
fclose($xmlfile);
echo "Successfully wrote the XML file";

?>

哦,无法编辑原始CSV,因为我从外部网址获取了该文件。

1 个答案:

答案 0 :(得分:0)

我解决了:) 我不得不增加长度参数,因为线条长度超过1000。 所以我的解决方案就是这个

while (($data = fgetcsv($handle, 4000, ';')) !== FALSE) {...}

不知怎的,这也解决了字符编码问题。