我想在存储在Hive中的表中读入R并想要删除进程中的所有逗号(以确保我的列没有搞砸)。我有以下命令
rHadoopClient::read.hive( "select regexp_replace( a_column, ',', '$$$' ), regexp_replace( b_column, ',', '$$$' ) from a_table" )
我收到以下错误:
失败:ParseException行1:63无法识别选择表达式中','',''35671'附近的输入
read.table出错(file = file,header = header,sep = sep,quote = quote,:输入中没有可用的行
rHadoopClient :: read.hive函数的结果是一个以逗号分隔的表,因此我必须更改查询中的逗号。
更新:切换单引号和双引号解决了问题。
答案 0 :(得分:1)
问题不在于逗号。如何选择多列?
问题是报价。
在外部使用单数引号,在内部使用双引号。