任务:我想在hive表中拆分一个名为“website”的变量,以获取由字符空间分隔的所有网站或\ n
问题:当我使用以下任一查询时:
SELECT website,split(website, '[\\s]') as websites FROM temp_pages
SELECT website,split(website, '[\\s, \\n]') as websites FROM temp_pages
我无法达到预期的效果。 以下是我得到的结果
预期输出 - 在空间上分隔
输入:http://www.insync4all.com http://www.insync4all.nl
输出:[“http://www.insync4all.com”,“http://www.insync4all.nl”]
意外输出 - 在 \ n 上分隔。
当有\ n字符而不是基于\ n字符拆分网站时,它会引入\\ n
输入:www.imtherealthing.com \ nwww.childmodelmagazine.com
输出:[“www.imtherealthing.com \\ nwww.childmodelmagazine.com”]
有人可以帮我分割\ n上的网站字段吗?理解在\ n情况下出了什么问题也很好。