Hive Split功能可以在\ n上拆分变量

时间:2014-07-15 22:28:52

标签: regex split hive

任务:我想在hive表中拆分一个名为“website”的变量,以获取由字符空间分隔的所有网站或\ n

问题:当我使用以下任一查询时:

SELECT website,split(website, '[\\s]') as websites FROM temp_pages
SELECT website,split(website, '[\\s, \\n]') as websites FROM temp_pages

我无法达到预期的效果。 以下是我得到的结果

预期输出 - 在空间上分隔
输入http://www.insync4all.com http://www.insync4all.nl
输出:[“http://www.insync4all.com”,“http://www.insync4all.nl”]

意外输出 - 在 \ n 上分隔。
当有\ n字符而不是基于\ n字符拆分网站时,它会引入\\ n

输入:www.imtherealthing.com \ nwww.childmodelmagazine.com
输出:[“www.imtherealthing.com \\ nwww.childmodelmagazine.com”]

有人可以帮我分割\ n上的网站字段吗?理解在\ n情况下出了什么问题也很好。

0 个答案:

没有答案