C语言中的目录和文件列表的正则表达式

时间:2012-05-05 18:15:28

标签: c regex linux

我正在尝试编写一个表达式,在列出目录内容时会过滤掉几种类型的目录和文件。也就是说,我想避免列出当前目录(。),上层目录(..),隐藏文件和其他更具体的目录。

这就是我现在所拥有的:

[\\.+]|cgi-bin|recycle_bin

但是,它与...,recycle_bin和cgi-bin不匹配。如果我删除了所有|个操作数并将表达式仅保留为[\\.+],则它可以正常工作(匹配...等)。这很奇怪,因为我很确定| = OR。我想念一下吗?

更新1:这是我使用的代码:

            regex_t regex;
            int reti;
            char msgbuf[100];

            /* Compile regular expression */
            reti = regcomp(&regex, "[\\.+]|cgi-bin|recycle_bin", 0);


            if( reti )
            { 
                fprintf(stderr, "Could not compile regex\n");
                exit(1);
            }

            reti = regexec(&regex, entry->d_name, 0, NULL, 0);
            if( !reti ){

                printf("directoy %s found -> %s", path, entry->d_name);
                printf("\n");

            }
            else if( reti == REG_NOMATCH ){

                //if the directory is not filtered out, we add it to the watch list
                printf("good dir %s", entry->d_name);                    
                printf("\n");

            }
            else{
                regerror(reti, &regex, msgbuf, sizeof(msgbuf));
                fprintf(stderr, "Regex match failed: %s\n", msgbuf);
            }

3 个答案:

答案 0 :(得分:3)

使用"extended REs"。使用regular ("obsolete") ones|是普通字符。

regcomp(..., REG_EXTENDED);

另见regcomp() description

答案 1 :(得分:0)

按照pm的评论试试这个正则表达式:

^([.]{0,2}|cgi-bin|recycle_bin)$

[.]{0,2}匹配...

答案 2 :(得分:0)

这不是C正则表达式库的用途。它的目的是让你构建接受regexen作为输入的程序。没有正则表达式,这个问题可以解决得更好:

#define SIZE(x) (sizeof (x)/sizeof(*(x)))
char *unwanted[] = {
     ".",
     "cgi-bin",
     "recycle_bin",
};
int x;
for(x=0; x<SIZE(unwanted); x++)
     if(strstr(entry->d_name, unwanted[x])!=NULL)
           goto BadDir;
//good dir
BadDir:

忽略你现在的正则表达式意味着什么,你可能想要这样的东西:

char *begins[] = {".", "private_"};
char *equals[] = {"recycle_bin", "cgi-bin"};
char *contains[] = {"_reject_"};

for(x=0; x<SIZE(begins); x++)
    if(strncmp(entry->d_name, begins[x], strlen(begins[x]))==0)
          goto BadDir;
for(x=0; x<SIZE(equals); x++)
    if(strcmp(entry->d_name, equals[x])==0)
          goto BadDir;
for(x=0; x<SIZE(contains); x++)
    if(strstr(entry->d_name, contains[x])!=NULL)
          goto BadDir;
//good dir...
BadDir: