我有一个单词列表,需要查找单词列表中的所有字谜。
我已经尝试创建函数/字典,但是遇到内存问题
words = word_list
sort_words = []
anagrams = {}
for word in words:
word.split()
word = ''.join(sorted(word))
sort_words.append(word)
for i in range(len(sort_words)):
word_anagram = []
for j in range(len(sort_words)):
if i == j:
continue
if sort_words[i] == sort_words[j]:
word_anagram.append(words[j])
anagrams[words[i]] = word_anagram
print(anagrams)
是否应该使用其他密钥来消除内存错误?我认为这会很麻烦,因为该功能找到的字谜中会重复出现。如果是这样,我应该使用什么钥匙?
答案 0 :(得分:2)
int main(int argc, char *argv[]) {
pid_t pid = 0;
int status;
struct user_regs_struct regs;
prctl(PR_SET_NO_NEW_PRIVS, 1, 0, 0, 0);
prctl(PR_SET_DUMPABLE, 0);
scmp_filter_ctx ctx;
ctx = seccomp_init(SCMP_ACT_KILL); // default action: kill
// build rules for whitelist of system calls
for (int i = 0; i < size_of_whitelist_syscall; i++) {
seccomp_rule_add(ctx, SCMP_ACT_ALLOW, whitelist_syscall[i], 0);
}
pid = fork();
if (pid != 0) {
while (waitpid(pid, &status, 0)) {
if (WIFEXITED(status)) {
fprintf(stderr, "terminated with code %d\n", WEXITSTATUS(status));
break;
} else if (WIFSIGNALED(status)) {
if (WTERMSIG(status) == 31) {
fprintf(stderr, "terminated by system call violation\n");
} else {
fprintf(stderr, "terminated by signal %d\n", WTERMSIG(status));
}
break;
}
ptrace(PTRACE_GETREGS, pid, NULL, ®s);
//fprintf(stderr, "%s(%lld) from pid %d\n", callname(REG(regs)), REG(regs), pid);
ptrace(PTRACE_SYSCALL, pid, NULL, NULL);
}
} else if (pid == 0) {
FILE *fp_in = freopen("std.in", "r", stdin);
FILE *fp_out = freopen("std.out", "w", stdout);
FILE *fp_error = freopen("err.out", "a+", stderr);
ptrace(PTRACE_TRACEME, 0, NULL, NULL);
seccomp_load(ctx);
execl("/usr/bin/java", "/usr/bin/java", "Test", NULL);
//execl("/usr/bin/python3", "python", "./test.py", NULL);
//execl("./test.out", "./test.out", NULL);
seccomp_release(ctx);
fclose(fp_in);
fclose(fp_out);
fclose(fp_error);
exit(0);
} else {
perror("failed to fork");
}
return 0;
}
int whitelist_syscall[] = {
SCMP_SYS(access),
SCMP_SYS(arch_prctl),
SCMP_SYS(brk),
SCMP_SYS(clone),
SCMP_SYS(close),
SCMP_SYS(dup),
SCMP_SYS(execve),
SCMP_SYS(exit_group),
SCMP_SYS(fcntl),
SCMP_SYS(fstat),
SCMP_SYS(futex),
SCMP_SYS(getcwd),
SCMP_SYS(getdents),
SCMP_SYS(getegid),
SCMP_SYS(geteuid),
SCMP_SYS(getgid),
SCMP_SYS(getpid),
SCMP_SYS(getrandom),
SCMP_SYS(getuid),
SCMP_SYS(ioctl),
SCMP_SYS(lseek),
SCMP_SYS(lstat),
SCMP_SYS(mmap),
SCMP_SYS(mprotect),
SCMP_SYS(munmap),
SCMP_SYS(openat),
SCMP_SYS(prlimit64),
SCMP_SYS(read),
SCMP_SYS(readlink),
SCMP_SYS(rt_sigaction),
SCMP_SYS(rt_sigprocmask),
SCMP_SYS(set_robust_list),
SCMP_SYS(set_tid_address),
SCMP_SYS(sigaltstack),
SCMP_SYS(stat),
SCMP_SYS(sysinfo),
SCMP_SYS(write)
};
int size_of_whitelist_syscall = sizeof(whitelist_syscall) / sizeof(int);
对seccomp_load(ctx);
execl("/usr/bin/java", "/usr/bin/java", "Test", NULL);
//execl("/usr/bin/python3", "python", "./test.py", NULL);
//execl("./test.out", "./test.out", NULL);
中的每个单词进行排序,并将其与作为关键字相关联。
因此,字谜通过排序后的字母关联,所有字谜都一起出现在列表中。
这具有线性的空间复杂度,因此您不应用尽内存。
答案 1 :(得分:0)
假设您的单词是0123456789
1023456789
1203456789
。如您所见,字符串的长度为10。如果要创建类似以下的字谜:
"\n"
该项目仅使用一次,您将获得10个!可能的字谜。 10!等于3628800。每个字有10位数字,表示10个字节。 10! * 10 = 36288000字节。这意味着 36.288 MB 。在这种情况下,我忽略了"\n"
转义序列。如果我们需要考虑此转义序列,则需要10! * 11个字节,等于 39.9168 MB 。
如果单词的长度变为11,则需要439084800字节(11!* 11 = 439084800)。等于 439.0848 MB 。如果我们需要考虑"\n"
转义序列,这次您将需要 479.0016 MB 。
如果单词的长度变为12,则需要5748019200字节(12!* 12 = 5748019200)。等于 5.7480192 GB 。如果我们需要考虑{{1}}转义序列,这一次您需要 6.2270208 GB 。
因此,进行此类计算时,您需要知道要生成的数据大小是否可以由您的硬件来完成。