Marklogic使用信息工作室流加载数据(无效的实体引用)

时间:2016-03-12 16:58:38

标签: marklogic marklogic-8

我正在尝试使用信息工作室流加载数据。我有1 xml文档(1.65 GB)。当我加载它时,我收到此错误Connection con; Statement stmt; ResultSet rs; stmt=con.createStatement(ResultSet.TYPE_SCROLL_SENSITIVE, ResultSet.CONCUR_UPDATABLE); rs=stmt.executeQuery(SQL); rs.updateInt("CUSTOMER_ID", newID); rs.updateString("NAME", company); rs.updateString("CITY", city); rs.updateString("STATE", state); rs.updateRow(); 。我不知道如何解决它。

1 个答案:

答案 0 :(得分:0)

在XML中,实体引用类似于& - &而且;是一个引用字符的代码(在本例中是&符号)。 “无效的实体引用”表示MarkLogic的解析器无法识别其中的内容。它可能只是一个未转义的“&”在文本中,或者它可能是正确的形式,具有错误的值。检查错误日志以获取有关您要查找的内容或源文档中的位置的线索。

虽然我们正在使用它,但您可能不希望将1.65 GB文档作为一件事加载。内容是否会降低,这将成为良好的个人文档? (例如,RSS提要将是一个包含多个条目的XML文档。)如果您可以拆分该文档,则更有可能获得良好的行为。

要进行拆分,请尝试使用MarkLogic Content Pumpdocument splitting capability。 MLCP是为这类工作而建立的。