我正在尝试构建一个二进制树,它将按字母顺序保存文件中的单词,并计算文件中单词的出现次数。然后我必须能够替换原始文本文件中的单词。现在我只是想设置我的二叉树并在那里获取单词。字符串标记化工作,它将打印每行的单词和标点符号。我还必须将标点符号存储在字符数组中并计算其出现次数。我的插入功能有问题,但我不确定我做错了什么。我收到了分段错误。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
/*
Name: Marcus Lorenzana
*/
//binary tree struct to hold left and right node
//as well as the word and number of occurrences
typedef struct node
{
char* word;
int count;
struct node *left;
struct node *right;
}
node;
node *insert(node *item, char *word);
char* readFile(char* filename);
int main()
{
FILE *fin;
char *word;
fin = fopen("data.txt", "r");
char* filecontents = readFile("data.txt");
//create dictionary node
node *dictionary;
dictionary = NULL;
//read words and punctuation in from the text file
word = strtok (filecontents, " \n");
int i = 0;
while (word != NULL)
{
printf("%s\n",word);
insert(dictionary,word);
printf("%s",dictionary->word);
word = strtok (NULL, " \n");
i++;
}
return 0;
}
//not sure if works
node *insert(node *item, char *word)
{
if(item==NULL)
{
item= (node*) malloc(sizeof(node));
strcpy(item->word, word);
item->left=NULL;
item->right=NULL;
item->count++;
}
else
{
if(strcmp(word, item->word)<0)
{
item->left=insert(item->left, word);
item->count++;
}
else if(strcmp(word, item->word)>0)
{
item->right=insert(item->right, word);
item->count++;
}
else
{
item->count++;
}
}
return item;
}
char* readFile(char* filename)
{
FILE* file = fopen(filename,"r");
if(file == NULL)
{
return NULL;
}
fseek(file, 0, SEEK_END);
long int size = ftell(file);
rewind(file);
char* content = calloc(size + 1, 1);
fread(content,1,size,file);
return content;
}
答案 0 :(得分:0)
insert
功能存在两个问题。
struct node
的双指针,否则如果你计划使用一个指向{的单个指针,它应该return
每个递归调用{1}}。struct node
单词的内存。要查找代码其他部分的问题,请使用malloc
(here)。它是调试内存泄漏或分段错误错误的绝佳工具。
要解决问题1 ,我将展示传递单个指针和valgrind
ing(仍在变异)的示例。您的插入功能(问题2已解决)应如下所示:
return
要解决问题2 ,错误在于创建新节点的代码块。看这里:
node *insert( node *item, char *word ) {
if ( item == NULL ) {
node *new_item = malloc( sizeof( struct node ) );
new_item->word = malloc( sizeof( char ) * ( strlen( word ) + 1 ) ); // Note, this line (p2).
strcpy( new_item->word, word );
new_item->count = 1; // << Note change here.
new_item->left = NULL;
new_item->right = NULL;
return new_item;
} else {
int cmp_result = strcmp( word, item->word );
if ( cmp_result < 0 ) {
item->left = insert( item->left, word );
item->count++;
} else if ( cmp_result > 0 ) {
item->right = insert( item->right, word );
item->count++;
} else {
// Node already exists, do what you see fit here.
}
}
return item;
}
...你不是item = ( node* )malloc( sizeof( node ) );
strcpy( item->word, word ); // << Here, invalid (error).
这个词的内存块。你正在做的是覆盖你的结构中的内存,也可能覆盖你没有分配的其他内存地址(取决于垃圾值何时为0以模拟malloc
终止符)。这是未定义的行为。
解决方案是执行以下操作:
NULL
...注意item = ( node* ) malloc( sizeof( node ) );
item->word = malloc( sizeof( char ) * ( strlen( word ) + 1 ) ); // << Fix.
strcpy( item->word, word ); // << Now, valid.
以确保+ 1
终结符有空间,因为NULL
返回传递给它的字符数组的字符串长度。
<强>注:强>
strlen
的结果也不是一个好主意,但这完全取决于你,因为它不会导致错误(但可能会在错误消息出现时显示错误消息)。 malloc
不是main( void )
也很重要。