将sqlplus结果假脱机到xml文件时不需要的新行

时间:2019-03-21 11:59:01

标签: xml linux oracle sqlplus spool

我正在尝试从数据库中提取一些数据到XML文件中。 为此,请使用bash脚本来调用sqlplus命令,并将结果假脱机到新文件中。

一旦提取结果,就会发生问题。我的xml文件不再有效,因为添加了一些不需要的新行...

这是我想要的例子:

<xml>
 <element>John</element>
 <element>some data</element>
 <element>a longer data line</element>
</xml>

这就是我得到的:

<xml>
 <element>John</element>
 <element>some data</eleme
 nt>
 <element>a longer data 
 line</element>
</xml>

似乎最长的行被剪切了,但是我在Sqlplus中将行大小设置为32767,这些行没有那么长...

这是我的sqlplus命令的样子:

sqlplus -s {connection} << EOF
set serveroutput on size unlimited
set feedback off
set termout off
set linesize 32767

spool file.xml;

DECLARE
l_xmltype XMLTYPE;
l_ctx dbms_xmlgen.ctxhandle;
v_clob CLOB;
v_clob_length INTEGER;
pos INTEGER;
buffer VARCHAR2(32767);
amount BINARY_INTEGER := 32767;

BEGIN

l_ctx := dbms_xmlgen.newcontext('SELECT a.rowid, a.* FROM mytable a');
l_xmltype := dbms_xmlgen.getXmlType(l_ctx);
dbms_xmlgen.closeContext(l_ctx);

v_clob := l_xmltype.getClobVal;
v_clob_length := length(v_clob);

WHILE pos < clob_length LOOP
 dbms_lob.read(v_clob, amount, pos, buffer);
 dbms_output.put_line(buffer);
 pos := pos + amount;
END LOOP;

END;
/
EOF
Spool off;

您有什么线索可以帮助我解决这个问题吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

正如@kfinity所建议的,这与CLOB处理有关,而且与dbms_output的工作方式有关。您正在读取32k的块中的CLOB,并使用put_line()写出每个块,它在每个32k块之后追加一个换行符。这些不与XML文档中的任何现有换行符对齐,因此您可以得到原始的换行符,然后再得到其他的换行符-看起来有些随机和中间文本,但实际上位于可预测的位置。

一个明显的解决方案是从put_line()切换到put(),但这会破坏最大缓冲区大小并抛出类似“ ORU-10028:行长溢出,每行限制32767字节”的信息。

您可以一次读取一行,而不必读取固定的32k块。 CLOB并不真正理解换行符,但是您可以查找换行符,例如:

WHILE pos < v_clob_length LOOP
  -- read to next newline if there is one, rest of CLOB if not
  if dbms_lob.instr(v_clob, chr(10), pos) > 0 then
    amount := dbms_lob.instr(v_clob, chr(10), pos) - pos;
    dbms_lob.read(v_clob, amount, pos, buffer);
    pos := pos + amount + 1; -- skip newline character
  else
    amount := 32767;
    dbms_lob.read(v_clob, amount, pos, buffer);
    pos := pos + amount;
  end if;

  dbms_output.put_line(buffer);
END LOOP;

if在当前位置之后寻找换行符。如果找到一个字符,则将其数量计算为从当前位置到该新行的字符数(或者减去一个-因为您不希望换行符本身),它将读取那么多字符,然后调整位置加上读取的数量加一(跳过换行符-您不需要/不需要,因为put_line()还会增加一)。

如果找不到它,那么它最多读取32k-希望只能读取一次;如果还有更多可能剩下的字符而没有换行符,那么它将进行第二次读取,但仍会添加该恶意额外的新行并中断该行。不过,使用dbms_output对此无能为力,您需要切换到utl_file写入服务器,而不是假脱机到客户机。