我有一个格式为...
的XML文档<?xml version="1.0" encoding="UTF-8"?>
<yahootable>
<row>
<various><![CDATA[ multiline
text, "&"
other <stuff> ]]>
</various>
<id>1</id>
<message><![CDATA[
sdfgsdfg
dsfsdfsd ]]>
</message>
</row>
<yahootable>
...并希望使用MySQL的LOAD XML LOCAL INFILE将其插入带有列的表中; (各种,身份,消息)。我似乎无法将未解析的CDATA标记中的任何数据存入数据库列。 CDATA标签之间的数据是完全被忽略的,还是我错过了什么?我期待CDATA只是逃避非法的XML字符并将其作为常规文本插入。
感谢。
答案 0 :(得分:5)
在保留CDATA内容的同时,我找不到使用LOAD XML INFILE
执行此操作的方法。但是,以下工作并使用良好的旧LOAD DATA INFILE
和ExtractValue()
来完成同样的事情:
如果我们有您的示例文件和此表:
CREATE TABLE `yahootable` (
`id` int(11) NOT NULL PRIMARY KEY,
`various` text,
`message` text
) ENGINE=InnoDB DEFAULT CHARSET=utf8
;
然后运行此语句会将文件的内容导入表中:
LOAD DATA INFILE
'/tmp/yahootable.xml'
INTO TABLE
yahootable
CHARACTER SET 'utf8'
LINES STARTING BY '<row>' TERMINATED BY '</row>'
(@tmp)
SET
id = ExtractValue(@tmp, '//id'),
various = ExtractValue(@tmp, '//various'),
message = ExtractValue(@tmp, '//message')
;
这通过告诉LOAD DATA INFILE每个<row>...</row>
是一个逻辑“行”,它存储在局部变量@tmp
中。然后我们将它作为XML片段传递给ExtractValue函数,并使用适当的XPath表达式从中选择我们想要的值。