Question

你好，我是hadoop环境的新人。我已经要求在csv上提供数据。

>LoadHomicide = LOAD '/user/admin/Crimes_samples.csv' USING PigStorage('\t') >AS >(Date:chararray,Block:chararray,PrimaryType:chararray,
>Description:chararray,
>LocationDescription:chararray,Arrest:chararray,Domestic:chararray,District:c>hararray,Year:chararray);

>uniq_arrest = FILTER LoadHomicide BY ($5 matches'%FALSE%');
>dump uniq_arrest;

我没有任何错误，但脚本的日志在这里给出了答案成功csv。

ID＆＃34;，＆＃34;案例编号＆＃34;，＆＃34;日期＆＃34;，＆＃34;阻止＆＃34;，＆＃34; IUCR＆＃34;，＆＃34;主要输入＆＃34;，＆＃34;说明＆＃34;，＆＃34;位置说明＆＃34;，＆＃34;逮捕＆＃34;，＆＃34;国内＆＃34;，＆＃34;击败＆＃34; ，＆＃34;区＆＃34;，＆＃34;沃德＆＃34;，＆＃34;社区＆＃34;，＆＃34; FBI代码＆＃34;，＆＃34; X坐标＆＃34;，＆＃34; Y坐标＆＃34;，＆＃34;年＆＃34;，＆＃34;更新时间＆＃34;，＆＃34;纬度＆＃34;，＆＃34;经度＆＃34;，＆＃34;位置和＃34;

0442761，＆＃34; HZ181379＆＃34;，3/9/16 11:55 PM，＆＃34; 023XX N HAMLIN AVE＆＃34;＆＃34; 0560＆＃34;＆＃34; ASSAULT＆＃34;＆＃34; SIMPLE＆＃34;＆＃34;公寓＆＃34;＆＃34;假＆＃34 ;, ＆＃34;假＆＃34;＆＃34; 2525＆＃34;＆＃34; 025＆＃34; 35＆＃34; 22＆＃34;＆＃34; 08A＆＃34;，1150660,1915214 ，2016,03 / 16 / 2016,41.92，-87.72，＆＃34;（41.923245915， -87.721845939）＆＃34; 10442848，＆＃34; HZ181470＆＃34;，3/9/16 11:55 PM，＆＃34; 0000X W JACKSON BLVD＆＃34;，＆＃34; 1310＆＃34;，＆＃34; CRIMINAL DAMAGE＆＃34 ;，＆＃34; TO PROPERTY＆＃34;，＆＃34; CTA GARAGE / OTHER PROPERTY＆＃34;＆＃34;假＆＃34;＆＃34;假＆＃34;＆＃34; 0113＆＃34;＆＃34; 001＆＃34，2，＆＃34; 32＆＃34 ;，＆＃34; 14＆＃34;，1176304,1898987,2016,03 / 16 / 2016,41.88，-87.63，＆＃34;（41.878177799， -87.628111493）＆＃34; 10442789，＆＃34; HZ181391＆＃34;，3/9/16 11:55 PM，＆＃34; 052XX W HURON ST＆＃34;，＆＃34; 1150＆＃34;，＆＃34; DECEPTIVE EXACTICE＆＃34 ;，＆＃34;信用卡欺诈＆＃34;＆＃34; ALLEY＆＃34;＆＃34;假＆＃34;＆＃34;假＆＃34;＆＃34; 1524＆＃34;＆＃34; 015＆＃34 ;, 28，＆＃34; 25＆＃34;＆＃34; 11＆＃34;，1141433,1904126,2016,03 / 16 / 2016,41.89，-87.76，＆＃34;（41.892994741， -87.756023813）＆＃34; 10447046，＆＃34; HZ185157＆＃34;，3/9/16 11:50 PM，＆＃34; 055XX N LINCOLN AVE＆＃34;，＆＃34; 0460＆＃34;，＆＃34; BATTERY＆＃34; ＆＃34; SIMPLE＆＃34;＆＃34; HOTEL

Answer 1

#include <stdio.h> /* using printf, gets, BUFSIZ */ int main(int argc, char *argv[]) { char input[BUFSIZ]; int n; char *labelPtr; int zeroCount=0; int oneCount=0; n=0; gets(input); while(input[n]) { labelPtr=&input[n]; printf("%d \n", *labelPtr); if (*labelPtr==0) { zeroCount++; } if(*labelPtr==1) { oneCount++; } n++; } printf("The number of characters is %d \n", n); printf("The number of zeros is %d \n", zeroCount); printf("The number of ones is %d \n", oneCount); }语法不正确。也没有第6个（$ 5指的是架构中的第6个字段，位置符号从$ 0开始）字段有＆＃34; false＆＃34;在它中。使用正确的字段和正确的语法。假设第6个字段有＆＃34; false＆＃34;在其中，这就是你将如何应用过滤器。

matches

猪：我的过滤器没有给出结果

1 个答案: