无法使我的插入函数在字母二进制字符串树中工作

时间:2013-08-15 03:22:34

标签: c insert binary-tree alphabetical

我正在尝试构建一个二进制树,它将按字母顺序保存文件中的单词,并计算文件中单词的出现次数。然后我必须能够替换原始文本文件中的单词。现在我只是想设置我的二叉树并在那里获取单词。字符串标记化工作,它将打印每行的单词和标点符号。我还必须将标点符号存储在字符数组中并计算其出现次数。我的插入功能有问题,但我不确定我做错了什么。我收到了分段错误。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

/*
Name: Marcus Lorenzana
*/

//binary tree struct to hold left and right node
//as well as the word and number of occurrences
typedef struct node
{
    char* word;
    int count;
    struct node *left;
    struct node *right;
}
node;

node *insert(node *item, char *word);
char* readFile(char* filename);

int main()
{
    FILE *fin;
    char *word;
    fin = fopen("data.txt", "r");


    char* filecontents = readFile("data.txt");

    //create dictionary node
    node *dictionary; 
    dictionary = NULL;

    //read words and punctuation in from the text file
    word = strtok (filecontents, " \n");
    int i = 0;
    while (word != NULL)
    {

        printf("%s\n",word);
        insert(dictionary,word);
        printf("%s",dictionary->word); 
        word = strtok (NULL, " \n");
        i++;
    }




    return 0;
}

//not sure if works
node *insert(node *item, char *word)
{
    if(item==NULL)
    {
        item= (node*) malloc(sizeof(node));
        strcpy(item->word, word);
        item->left=NULL;
        item->right=NULL;
        item->count++;
    }
    else
    {
        if(strcmp(word, item->word)<0)
        {
            item->left=insert(item->left, word); 
            item->count++;
        }
        else if(strcmp(word, item->word)>0)
        {
            item->right=insert(item->right, word);
            item->count++;
        }
        else
        {
            item->count++;
        }
    }
    return item;
}


char* readFile(char* filename)
{
    FILE* file = fopen(filename,"r");
    if(file == NULL)
    {
        return NULL;
    }

    fseek(file, 0, SEEK_END);
    long int size = ftell(file);
    rewind(file);

    char* content = calloc(size + 1, 1);

    fread(content,1,size,file);

    return content;
}

1 个答案:

答案 0 :(得分:0)

insert功能存在两个问题。

  1. 如果你计划改变指针,它应该被传递给struct node的双指针,否则如果你计划使用一个指向{的单个指针,它应该return每个递归调用{1}}。
  2. 创建新节点时,您不是struct node单词的内存。
  3. 要查找代码其他部分的问题,请使用mallochere)。它是调试内存泄漏或分段错误错误的绝佳工具。


    要解决问题1 ,我将展示传递单个指针和valgrind ing(仍在变异)的示例。您的插入功能(问题2已解决)应如下所示:

    return

    要解决问题2 ,错误在于创建新节点的代码块。看这里:

    node *insert( node *item, char *word ) {
      if ( item == NULL ) {
        node *new_item = malloc( sizeof( struct node ) );
    
        new_item->word = malloc( sizeof( char ) * ( strlen( word ) + 1 ) ); // Note, this line (p2).
    
        strcpy( new_item->word, word );
    
        new_item->count = 1; // << Note change here.
        new_item->left = NULL;
        new_item->right = NULL;
    
        return new_item;
      } else {
        int cmp_result = strcmp( word, item->word );
    
        if ( cmp_result < 0 ) {
          item->left = insert( item->left, word );
          item->count++;
        } else if ( cmp_result > 0 ) {
          item->right = insert( item->right, word );
          item->count++;
        } else { 
          // Node already exists, do what you see fit here.
        }
      }
    
      return item;
    }
    

    ...你不是item = ( node* )malloc( sizeof( node ) ); strcpy( item->word, word ); // << Here, invalid (error). 这个词的内存块。你正在做的是覆盖你的结构中的内存,也可能覆盖你没有分配的其他内存地址(取决于垃圾值何时为0以模拟malloc终止符)。这是未定义的行为。

    解决方案是执行以下操作:

    NULL

    ...注意item = ( node* ) malloc( sizeof( node ) ); item->word = malloc( sizeof( char ) * ( strlen( word ) + 1 ) ); // << Fix. strcpy( item->word, word ); // << Now, valid. 以确保+ 1终结符有空间,因为NULL返回传递给它的字符数组的字符串长度。

    <强>注:

    • 转换strlen的结果也不是一个好主意,但这完全取决于你,因为它不会导致错误(但可能会在错误消息出现时显示错误消息)。
    • 除非您打算使用此功能,否则主要功能的空参数类型malloc不是main( void )也很重要。