Hive中的表格格式如下:
desc table_name;
col_id double
col_ts string
col_nm string
cols_nm string
col_cd string
col_state_cd string
我使用以下代码将其导出到csv:
hive -e 'set hive.cli.print.header=true; select * from table_name' | sed 's/[\t]/,/g' > /home/yourfile.csv
但是当我通过R读取它时, col_id 的数据类型会更改为字符串。 如何确保数据格式与Hive相同?
答案 0 :(得分:0)
尝试Hadley Wickham的readr package - 它非常适合猜测数据类型。
require(readr)
demo_tables <- read_csv("my_table.csv")