我有一个hive表,其文件是字符串,值是长字符串,包含一些特殊字符,如空格,'\'等,如下所示。
我正在尝试使用以下HQL查询字段。
从ops_lb中选择请求,其中dt = 140715并请求regexp'^ GET /updateUserBilling.username=zxzx_456。'limit 100;
并返回如下所示的字符串,似乎列分为三行。
怎么会这样?最大行数为186。
以下是我正在使用的更新的HQL:
从ops_lb中选择'000',request,'1111',http_user_agent,'222',其中dt = 140715并请求regexp'^ GET /updateUserBilling.username=zxzx_456。'和host =' api.usergrowth.pptv.com'限制10;
输出是:
000 GET /updateUserBilling?from=clt&format=json&data=1&username=zxzx_456&act=SHARE_VIDEO&version=3.5.2.0098&token=LVbR6iltJqvdBfbQFHDSbNXc22iPkMG9BGQ/RmGImcbpaTMFdgpcUfmSGXuWMRkv0gtd5g7oRsYc NULL NULL NULL
ICFVjr0RLNL1B + R59SshdPg7393inG1gHQGyx9sUHmNIymiE4U9nad0OHq3Lgzv8enbX8cKVsO1e NULL NULL NULL NULL
DpA80xALDxgOdfIMaRk =& index = 05& addstr = f13a2cf4c2cb6e12b96588dcfefa3cc8 HTTP / 1.1 1111 Mozilla / 4.0(兼容; MSIE 7.0; Windows NT 5.1; SV1)222 NULL
000 GET /updateUserBilling?from=clt&format=json&data=1&username=zxzx_456&act=SHARE_VIDEO&version=3.5.2.0098&token=LVbR6iltJqvdBfbQFHDSbNXc22iPkMG9BGQ/RmGImcbpaTMFdgpcUfmSGXuWMRkv0gtd5g7oRsYc NULL NULL NULL ICFVrr0RLNL1B + R59SshdPg7393inG1gHQGyx9sUHmNIymiE4U9nad0OHq3Lgzv8enbX8cKVsO1e NULL NULL NULL NULL DpA80xALDxgOdfIMaRk =& index = 08& addstr = 695d398d8b4939459da17fd77f7c687a HTTP / 1.1 1111 Mozilla / 4.0(兼容; MSIE 7.0; Windows NT 5.1; SV1)222 NULL
000 GET /updateUserBilling?from=clt&format=json&data=1&username=zxzx_456&act=SHARE_VIDEO&version=3.5.2.0098&token=LVbR6iltJqvdBfbQFHDSbNXc22iPkMG9BGQ/RmGImcbpaTMFdgpcUfmSGXuWMRkv0gtd5g7oRsYc NULL NULL NULL
ICFVjr0RLNL1B + R59SshdPg7393inG1gHQGyx9sUHmNIymiE4U9nad0OHq3Lgzv8enbX8cKVsO1e NULL NULL NULL NULL
DpA80xALDxgOdfIMaRk =& index = 09& addstr = 2968f55e6ac266c838d046c01a35a007 HTTP / 1.1 1111 Mozilla / 4.0(兼容; MSIE 7.0; Windows NT 5.1; SV1)222 NULL
000 GET /updateUserBilling?from=clt&format=json&data=1&username=zxzx_456&act=STORE_VIDEO&version=3.5.2.0098&token=LVbR6iltJqvdBfbQFHDSbNXc22iPkMG9BGQ/RmGImcbpaTMFdgpcUfmSGXuWMRkv0gtd5g7oRsYc NULL NULL NULL