从文件名中提取数据并使用存储过程将其存储在表中

时间:2018-09-12 18:09:27

标签: sql oracle stored-procedures

我在目录中有不同类型的文件(pdf,csv,doc,txt)。

文件名是这样的:

John.Doe.19900101.TX.pdf         //FirstName.LastName.DOB.StateOfResidence  
Bruce.Banner.19700101.PA.doc     
Steve.Rodgers.19760101.AR.csv    
Tony.Stark.19901210.CA.txt      

如何在Oracle中编写存储过程以读取目录中的文件并提取FirstName, LastName, DOB, State并将其存储在表中的适当列中?

Ex:对于文件John.Doe.19900101.TX.pdf,应按以下方式提取数据:

John in FirstName column  
Doe in LastName column   
19900101 in DOB column  
TX in State column  
whole file in CLOB column

1 个答案:

答案 0 :(得分:3)

您将必须在OS级别上工作,以从OS目录中收集文件名。考虑到您正在尝试从Unix风格中获取信息;跟随URL将帮助您将文件列表抓取到表甚至视图中。

您需要的代码是:

--drop directory SCRIPT_TEMP_DIR;

CREATE DIRECTORY SCRIPT_TEMP_DIR AS '/home/oracle/oracle_scripts'
;
GRANT EXECUTE ON DIRECTORY SCRIPT_TEMP_DIR TO USER_NAME
;  -- Here USER_NAME will be your SCHEMA/USER NAME

drop table USER_NAME.home_directory purge;

CREATE TABLE USER_NAME.home_directory
(
 filerecord VARCHAR2(15),
 flink VARCHAR2(2),
 fowner VARCHAR2(6),
 fgroup VARCHAR2(8),
 fsize VARCHAR2(32),
 fdate_part1 VARCHAR2(16),
 fdate_part2 VARCHAR2(16),
 fdate_year_or_time VARCHAR2(16),
 fname VARCHAR2(255)
)
 ORGANIZATION EXTERNAL
 (
 TYPE ORACLE_LOADER
 DEFAULT DIRECTORY SCRIPT_TEMP_DIR
 ACCESS PARAMETERS
 (
 records delimited by newline
 preprocessor SCRIPT_TEMP_DIR:'listing.sh'
 fields terminated by whitespace
 (
 filerecord ,
 flink ,
 fowner ,
 fgroup ,
 fsize ,
 fdate_part1 ,
 fdate_part2 ,
 fdate_year_or_time ,
 fname 
 )
 )
 LOCATION ('listing.sh')
 )
REJECT LIMIT UNLIMITED;

完成此操作后,您只需从创建的上表中进行选择。

SELECT *
  FROM USER_NAME.home_directory;

稍后,您可以应用substr / instr函数拆分信息。您也可以使用正则表达式功能来获取所需的信息。

SELECT fname, 
    regexp_substr(fname, '[^.]+', 1, 1) part1, 
    regexp_substr(fname, '[^.]+', 1, 2) part2,
    regexp_substr(fname, '[^.]+', 1, 3) part3
  FROM USER_NAME.home_directory;

这给您:

enter image description here

所需的URL为here 上面粘贴的代码已修改,您在授予目录权限的同时还需要更改USER_NAME。