如何通过rHadoopClient在字符串中传递逗号?

时间:2017-05-11 10:20:06

标签: r hadoop hive

我想在存储在Hive中的表中读入R并想要删除进程中的所有逗号(以确保我的列没有搞砸)。我有以下命令

rHadoopClient::read.hive( "select regexp_replace( a_column, ',', '$$$' ), regexp_replace( b_column, ',', '$$$' )  from a_table" )

我收到以下错误:

  

失败:ParseException行1:63无法识别选择表达式中','',''35671'附近的输入
  read.table出错(file = file,header = header,sep = sep,quote = quote,:

     

输入中没有可用的行

rHadoopClient :: read.hive函数的结果是一个以逗号分隔的表,因此我必须更改查询中的逗号。

更新:切换单引号和双引号解决了问题。

1 个答案:

答案 0 :(得分:1)

问题不在于逗号。如何选择多列?

问题是报价。

在外部使用单数引号,在内部使用双引号。