使用字典检查列表中的七字谜

时间:2019-07-18 18:18:38

标签: python

我有一个单词列表,需要查找单词列表中的所有字谜。

我已经尝试创建函数/字典,但是遇到内存问题

words = word_list
sort_words = []
anagrams = {}
for word in words:
    word.split()
    word = ''.join(sorted(word))
    sort_words.append(word)

for i in range(len(sort_words)):
    word_anagram = []
    for j in range(len(sort_words)):
        if i == j:
            continue
        if sort_words[i] == sort_words[j]:
            word_anagram.append(words[j])
    anagrams[words[i]] = word_anagram 
print(anagrams)

是否应该使用其他密钥来消除内存错误?我认为这会很麻烦,因为该功能找到的字谜中会重复出现。如果是这样,我应该使用什么钥匙?

2 个答案:

答案 0 :(得分:2)

int main(int argc, char *argv[]) {
    pid_t pid = 0;
    int status;

    struct user_regs_struct regs;

    prctl(PR_SET_NO_NEW_PRIVS, 1, 0, 0, 0);
    prctl(PR_SET_DUMPABLE, 0);

    scmp_filter_ctx ctx;
    ctx = seccomp_init(SCMP_ACT_KILL); // default action: kill

    // build rules for whitelist of system calls
    for (int i = 0; i < size_of_whitelist_syscall; i++) {
        seccomp_rule_add(ctx, SCMP_ACT_ALLOW, whitelist_syscall[i], 0);
    }

    pid = fork();

    if (pid != 0) {
        while (waitpid(pid, &status, 0)) {
            if (WIFEXITED(status)) {
                fprintf(stderr, "terminated with code %d\n", WEXITSTATUS(status));
                break;
            } else if (WIFSIGNALED(status)) {
                if (WTERMSIG(status) == 31) {
                    fprintf(stderr, "terminated by system call violation\n");
                } else {
                    fprintf(stderr, "terminated by signal %d\n", WTERMSIG(status));
                }
                break;
            }

            ptrace(PTRACE_GETREGS, pid, NULL, &regs);


            //fprintf(stderr, "%s(%lld) from pid %d\n", callname(REG(regs)), REG(regs), pid);

            ptrace(PTRACE_SYSCALL, pid, NULL, NULL);
        }
    } else if (pid == 0) {
        FILE *fp_in = freopen("std.in", "r", stdin);
        FILE *fp_out = freopen("std.out", "w", stdout);
        FILE *fp_error = freopen("err.out", "a+", stderr);

        ptrace(PTRACE_TRACEME, 0, NULL, NULL);

        seccomp_load(ctx);
        execl("/usr/bin/java", "/usr/bin/java", "Test", NULL);
        //execl("/usr/bin/python3", "python", "./test.py", NULL);
        //execl("./test.out", "./test.out", NULL);
        seccomp_release(ctx);

        fclose(fp_in);
        fclose(fp_out);
        fclose(fp_error);

    exit(0);
    } else {
    perror("failed to fork");
    }

    return 0;
}


int whitelist_syscall[] = {
    SCMP_SYS(access),
    SCMP_SYS(arch_prctl),
    SCMP_SYS(brk),
    SCMP_SYS(clone),
    SCMP_SYS(close),
    SCMP_SYS(dup),
    SCMP_SYS(execve),
    SCMP_SYS(exit_group),
    SCMP_SYS(fcntl),
    SCMP_SYS(fstat),
    SCMP_SYS(futex),
    SCMP_SYS(getcwd),
    SCMP_SYS(getdents),
    SCMP_SYS(getegid),
    SCMP_SYS(geteuid),
    SCMP_SYS(getgid),
    SCMP_SYS(getpid),
    SCMP_SYS(getrandom),
    SCMP_SYS(getuid),
    SCMP_SYS(ioctl),
    SCMP_SYS(lseek),
    SCMP_SYS(lstat),
    SCMP_SYS(mmap),
    SCMP_SYS(mprotect),
    SCMP_SYS(munmap),
    SCMP_SYS(openat),
    SCMP_SYS(prlimit64),
    SCMP_SYS(read),
    SCMP_SYS(readlink),
    SCMP_SYS(rt_sigaction),
    SCMP_SYS(rt_sigprocmask),
    SCMP_SYS(set_robust_list),
    SCMP_SYS(set_tid_address),
    SCMP_SYS(sigaltstack),
    SCMP_SYS(stat),
    SCMP_SYS(sysinfo),
    SCMP_SYS(write)
};

int size_of_whitelist_syscall = sizeof(whitelist_syscall) / sizeof(int);

seccomp_load(ctx); execl("/usr/bin/java", "/usr/bin/java", "Test", NULL); //execl("/usr/bin/python3", "python", "./test.py", NULL); //execl("./test.out", "./test.out", NULL); 中的每个单词进行排序,并将其与作为关键字相关联。

因此,字谜通过排序后的字母关联,所有字谜都一起出现在列表中。

这具有线性的空间复杂度,因此您不应用尽内存。

答案 1 :(得分:0)

假设您的单词是0123456789 1023456789 1203456789 。如您所见,字符串的长度为10。如果要创建类似以下的字谜:

"\n"

该项目仅使用一次,您将获得10个!可能的字谜。 10!等于3628800。每个字有10位数字,表示10个字节。 10! * 10 = 36288000字节。这意味着 36.288 MB 。在这种情况下,我忽略了"\n"转义序列。如果我们需要考虑此转义序列,则需要10! * 11个字节,等于 39.9168 MB

如果单词的长度变为11,则需要439084800字节(11!* 11 = 439084800)。等于 439.0848 MB 。如果我们需要考虑"\n"转义序列,这次您将需要 479.0016 MB

如果单词的长度变为12,则需要5748019200字节(12!* 12 = 5748019200)。等于 5.7480192 GB 。如果我们需要考虑{{1}}转义序列,这一次您需要 6.2270208 GB

因此,进行此类计算时,您需要知道要生成的数据大小是否可以由您的硬件来完成。