我已经以ANSI编码从SQL Server 2008导出了.csv格式的表。我将它加载到HDFS并在HIVE中运行了一个create table命令。我已成功为其他25个表执行此操作,但由于某种原因,此表返回空值。 This is the table schema from SQL Server.
我的HIVE代码:
--creates corresponding table in staging for Job
create external table staging.Job(
jobid int
,datasourceid int
,regionid int
,jobsrcid varchar(20)
,jobnumber varchar(80)
,info1 varchar(40)
,info2 varchar(40)
,info3 varchar(40)
,info4 varchar(40)
,info5 varchar(40)
,info6 varchar(40)
,info7 varchar(40)
,info8 varchar(40)
,info9 varchar(40)
,info10 varchar(40)
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
-- stored as textfile to be compatible for importing a csv file
stored as textfile
LOCATION 'hdfs://[HDFS PATH]/staging/Job'
-- this command skips over the header line for the csv files
tblproperties("skip.header.line.count"="1")
;
--uploaded csv files first into HDFS, so no need for a -local argument
LOAD DATA INPATH '/labrat/Job2.csv' INTO TABLE staging.Job;
SELECT * from staging.Job;
最初这个表给出了我的问题,其中一个列说明它使用的是DT_NTEXT格式。我在所有列上都做了一个SELECT语句,但是那个有问题并且导出了那些。