我正在尝试编写一个表达式,在列出目录内容时会过滤掉几种类型的目录和文件。也就是说,我想避免列出当前目录(。),上层目录(..),隐藏文件和其他更具体的目录。
这就是我现在所拥有的:
[\\.+]|cgi-bin|recycle_bin
但是,它与.
,..
,recycle_bin和cgi-bin
不匹配。如果我删除了所有|
个操作数并将表达式仅保留为[\\.+]
,则它可以正常工作(匹配.
,..
等)。这很奇怪,因为我很确定|
= OR。我想念一下吗?
更新1:这是我使用的代码:
regex_t regex;
int reti;
char msgbuf[100];
/* Compile regular expression */
reti = regcomp(®ex, "[\\.+]|cgi-bin|recycle_bin", 0);
if( reti )
{
fprintf(stderr, "Could not compile regex\n");
exit(1);
}
reti = regexec(®ex, entry->d_name, 0, NULL, 0);
if( !reti ){
printf("directoy %s found -> %s", path, entry->d_name);
printf("\n");
}
else if( reti == REG_NOMATCH ){
//if the directory is not filtered out, we add it to the watch list
printf("good dir %s", entry->d_name);
printf("\n");
}
else{
regerror(reti, ®ex, msgbuf, sizeof(msgbuf));
fprintf(stderr, "Regex match failed: %s\n", msgbuf);
}
答案 0 :(得分:3)
使用"extended REs"。使用regular ("obsolete") ones,|
是普通字符。
regcomp(..., REG_EXTENDED);
答案 1 :(得分:0)
按照pm的评论试试这个正则表达式:
^([.]{0,2}|cgi-bin|recycle_bin)$
[.]{0,2}
匹配.
和..
答案 2 :(得分:0)
这不是C正则表达式库的用途。它的目的是让你构建接受regexen作为输入的程序。没有正则表达式,这个问题可以解决得更好:
#define SIZE(x) (sizeof (x)/sizeof(*(x)))
char *unwanted[] = {
".",
"cgi-bin",
"recycle_bin",
};
int x;
for(x=0; x<SIZE(unwanted); x++)
if(strstr(entry->d_name, unwanted[x])!=NULL)
goto BadDir;
//good dir
BadDir:
忽略你现在的正则表达式意味着什么,你可能想要这样的东西:
char *begins[] = {".", "private_"};
char *equals[] = {"recycle_bin", "cgi-bin"};
char *contains[] = {"_reject_"};
for(x=0; x<SIZE(begins); x++)
if(strncmp(entry->d_name, begins[x], strlen(begins[x]))==0)
goto BadDir;
for(x=0; x<SIZE(equals); x++)
if(strcmp(entry->d_name, equals[x])==0)
goto BadDir;
for(x=0; x<SIZE(contains); x++)
if(strstr(entry->d_name, contains[x])!=NULL)
goto BadDir;
//good dir...
BadDir: