我不太了解文件及其相关的安全性。我在XML文件中有很多数据,我计划将其解析为放入数据库。我从第三方人那里获得这些XML文件。我每天最少需要1000个文件。所以我会编写一个脚本来解析它们以进入我们的数据库。现在我对此有很多疑问。
答案 0 :(得分:3)
你想要validate the XML。这有两件事:
用于验证XML文档的php5 the syntax是:
$dom->validate('articles.dtd');
$dom->relaxNGValidate('articles.rng');
$dom->schemaValidate('articles.xsd');
当然,您需要使用XSD(XML架构)或DTD(文档类型定义)进行验证。
答案 1 :(得分:2)
我不能说第1点,但听起来相当简单 - 每个文件都可以独立解析 。
第2点和第3点实际上是关于文件的内容。简单地说,您可以通过解析它并要求解析器进行验证来检查它是否是有效的XML,这就是您需要做的所有事情。如果您希望它遵循特定的DTD,您可以根据它进行验证。 (有多种级别的验证,具体取决于您的数据。)
XML文件本身就是数据。虽然有“处理指令”可用作XML,但它们的指令与直接执行脚本的方式完全相同,只是解析文件应该没有任何害处。恶意文件可以做的两件事: