将句点分隔的文本文件加载到db2中

时间:2015-02-25 17:05:09

标签: db2 db2-luw

我需要将整个文本文件(仅包含ASCII文本)加载到数据库中(DB2 Express ed。)。该表只有两列EXAMPLE_TABLE(ID,TEXT)。 ID列是PK,包含自动生成的数据,而文本为VARCHAR(50)

现在我需要使用加载/导入实用程序将文本面中的每个句子保存到EXAMPLE_TABLE中,也就是说,每个句子都有一行。 row-id应该是自动生成的,但是已经在表创建时指定了。导入实用程序应考虑周期'。'作为分隔符(否则我不知道如何提取句子)。

如何在DB2中完成?

提前致谢!

1 个答案:

答案 0 :(得分:1)

使用分隔文件时,标准DB2 importload实用程序无法指定行记录终止符。 LF字符(或Windows上的CRLF)是您可以使用的唯一记录终止符。

因此,您需要预先处理文件(要么用换行符替换每个句点(.),要么在每个句点后插入换行符),然后才能使用import或{{ 1}},导致文件中的每个句子都在一个单独的行上。

您可以使用load

执行此操作
tr

请注意,您可能还需要在句点之后考虑空格,因此您不会在表格中每个“句子”的开头都有前导空格,并且您可能还需要考虑额外的空格(即每个段落之间的空行)。