使用python从SQL表生成XML

时间:2010-11-09 23:56:50

标签: python sql xml postgresql

我有一些XML如下:

<dd>
    <persson>
        <name>sam</name>
        <tel>9748</tel>
    </persson>
    <cat>
        <name>frank</name>
    </cat>
</dd>

我将其解析为两个SQL表,一个用于标记,一个用于pcdata。开始和停止列表示标签在结束时的位置。

Tags:
 start | stop |  tag   
-------+------+--------
     3 |    5 | name
     6 |    8 | tel
     2 |    9 | persson
    11 |   13 | name
    10 |   14 | cat
     1 |   15 | dd
(6 rows)

Pcdata:
 pos | pcdata 
-----+--------
   4 | sam
   7 | 9748
  12 | frank
(3 rows)

现在我想将这个数据库以原始形式解析回XML。我想编写一个函数,它接受两个表并将XML写入文件中。我正在使用python和psycopg2来做这件事。

3 个答案:

答案 0 :(得分:3)

H'mmm解码了你的“专栏”:

<dd><persson><name>sam</name><tel>9748</tel></persson>
1   2        3     4  5      6    7   8     9                    
<cat><name>frank</name></cat></dd>
10   11    12   13     14    15

我有一些问题要问你:你是怎么做到的?你为什么这么做?你想要实现什么目标?请注意,您的问题标题相当误导 - “SQL表格”仅仅是您停放数据的特殊表示的位置。

这是一些伪代码,可以做你想做的事情:

pieces = []
result = cursor.execute("select * from tags;")
for start, step, tag in result:
    pieces.append((start, "<" + tag + ">"))
    pieces.append((stop, "</" + tag + ">"))
result = cursor.execute("select * from pcdata;")
for pos, pcdata in result:
    pieces.append((pos, pcdata))
pieces.sort()
xml_stream = "".join(piece[1] for piece in pieces)
your_file_object.write(xml_stream)

在回答关于上述是否会在输出流中放置“位置”的问题时:不,它不会;以下代码段显示它正常工作。这些位置仅用于将汤分类为正确的顺序。在“加入”中,piece[0]指的是位置,但未使用,只有piece[1]这是必需的文字。

>>> pieces
[(3, '<name>'), (4, 'sam'), (5, '</name>')]
>>> ''.join(piece[1] for piece in pieces)
'<name>sam</name>'

在SQL评论问题上取消:

虽然用SQLite显示,但这是沼泽标准的SQL。如果您的数据库没有将||视为连接运算符,请尝试+

你忘了问的问题:“我如何在前面获得<?xml blah-blah ?>个问题?”。答:见下文。

console-prompt>sqlite3
SQLite version 3.6.14
Enter ".help" for instructions
Enter SQL statements terminated with a ";"
sqlite> create table tags (start int, stop int, tag text);
sqlite> insert into tags values(3,5,'name');
sqlite> insert into tags values(6,8,'tel');
sqlite> insert into tags values(2,9,'persson');
sqlite> insert into tags values(11,13,'name');
sqlite> insert into tags values(10,14,'cat');
sqlite> insert into tags values(1,15,'dd');
sqlite> create table pcdata (pos int, pcdata text);
sqlite> insert into pcdata values(4,'sam');
sqlite> insert into pcdata values(7,'9748');
sqlite> insert into pcdata values(12,'frank');
sqlite> select datum from (
   ...>     select 0 as posn, '<?xml version="1.0" encoding="UTF-8"?>' as datum
   ...>     union
   ...>     select start as posn, '<' || tag || '>' as datum from tags
   ...>     union
   ...>     select stop as posn, '</' || tag || '>' as datum from tags
   ...>     union
   ...>     select pos as posn, pcdata as datum from pcdata
   ...>     )
   ...> order by posn;
<?xml version="1.0" encoding="UTF-8"?>
<dd>
<persson>
<name>
sam
</name>
<tel>
9748
</tel>
</persson>
<cat>
<name>
frank
</name>
</cat>
</dd>
sqlite>

答案 1 :(得分:1)

简单的答案是不要。如果您使用的是Postgres 8.3或更高版本,请使用SQL构建XML。这会容易得多。

http://www.postgresql.org/docs/current/static/functions-xml.html

答案 2 :(得分:1)

首先,如果Postgres包含为您创建XML的机制,请使用它们。

其次,除非你真的知道自己在做什么,否则不要使用字符串操作来创建XML。即使这样,也不要。例如,如果任何列包含符号,那么只是连接数据库中的字符串值将产生格式不良的XML。

除非您要处理太多数据以适应内存,否则请使用John Machin的方法将数据解析为元素,并使用lxml.etree创建实际的XML元素。