处理配置单元中的转义字符(Regexp_replace)

时间:2015-04-02 09:23:04

标签: mapreduce hive regexp-replace

在通过hive查询加载数据时处理转义字符时遇到性能问题。

if (data.contains("\"")|data.contains("\b")|data.contains("\f")|        data.contains("\n")|data.contains("\r")|
        data.contains("\t")|
        data.contains("\"")|
        data.contains("|")
    ) 
{                                
    if (data.contains("\b")) 
        data = data.replace("\b", "\\b");

    if (data.contains("\f")) 
        data = data.replace("\f", "\\f");

    if (data.contains("\n")) 
        data = data.replace("\n", "\\n");

    if (data.contains("\r")) 
        data = data.replace("\r", "\\r");

    if (data.contains("\t")) 
        data = data.replace("\t", "\\t");

    if (data.contains("\"")) 
        data = data.replace("\"", "\\\"");

    data = "\""+data+"\"";

这里我们要使用任何功能是HIVE来处理数据。尝试regexp_replace ..但没有得到确切的一个... 请建议。

0 个答案:

没有答案