什么是自动化xml导入的正确方法

时间:2012-07-24 17:10:22

标签: php xml web-services

我编写了一个脚本,通过从源磁盘中选择数据并通过按钮提交将数据从xml文件导入mysql数据库。但是,如果使用第三方应用程序来自动执行此导入,该怎么办呢?检查xml路径的get参数是否存在并获取其内容并以与之前相同的方式导入是否合适?还是有更好的方法?

通过获取参数我的意思是这样的:

http://domain.com/import.php?path=externaldomain.com/xml/page.xml

2 个答案:

答案 0 :(得分:1)

取决于您导入的数据类型。如果从rss feed导入数据,则此方法很好。但是如果要导入个人数据,这可能不是一个好方法。

如果您正在处理其他人不应该看到的关键数据,我会建议更安全的东西。您可以开始考虑通过ftp导入xml文件,从服务器安全文件夹后面下载它们。请求第三方应用程序将xml文件上载到您选择的安全位置。在某种安全性背后的任何事情都比建议的个人数据方法更好。

答案 1 :(得分:0)

首先,我建议您使用cURL。无论你的XML有多大,你的内存问题都会减少。

$fp = fopen('/var/www/vhosts/my.com/xml/feed.xml', 'w'); // opening file handler to write feed in

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://domain.com/xml/page.xml'); // setting URL to take XML from
curl_setopt($ch, CURLOPT_ENCODING, 'gzip'); // If result is gziped
curl_setopt($ch, CURLOPT_SSLVERSION, 3); // OpenSSL issue
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);  // Wildcard certificate
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0); // disabling buffer output, bec. we want to write XML to the file first and don't need it to be returned into variable
curl_setopt($ch, CURLOPT_FILE, $fp); // here we should transfer opened file handler to the cURL and it should be writable!
$result = curl_exec($ch); // executing download
$reponse_code = (int)curl_getinfo($ch, CURLINFO_HTTP_CODE); // retrieving HTTP return code for our request. Was it successful or not.

因此,您可以将XML Feed直接下载/保存到SSL和GZIP后面,直接发送到该文件。

使用curl_getinfo(),您可以获得有关您的请求的各种信息。如果程序应该是自动化的,那么如果请求失败则决定做什么会很好。

比如果文件不大(我的意思是超过200 - 300 Mb的大文件),你可以使用SimpleXML仅在PHP5以后可用 )库并解析您的数据。如果您在PHP4下(今天仍然可以),请尝试查找libXML,这也非常有用。

如果您检索的文件相当庞大:)具有FILE权限的MySQL数据库是您的朋友。