需要知道如何在c中按空格解析单词。还需要知道我是否正确分配了内存吗?

时间:2019-03-07 03:08:11

标签: c pointers malloc tokenize dynamic-arrays

我正在编写一个用c编写的程序,该程序从文本文件中读取文本,然后从文件中随机选择单词,如果单词大于或等于6,则将单词附加在一起,删除空格,最后打印出新词。 (我在Linux“ <”上使用重定向来读取文件)

Example input: "cheese and crackers"

New word should be: cheesecrackers

代码如下:

int main (void)
{
    int ch;
    char *ptrChFromFile;
    int strSize = 1;
    int i;
    int numberOfWords = 1;

    ptrChFromFile = malloc (sizeof (char));

    if (ptrChFromFile == NULL) {
        puts ("COULDN'T ALLOICATE MEMORY");
        exit (EXIT_FAILURE);
    }

    while ((ch = getchar ()) != EOF) {
        ptrChFromFile =
            realloc (ptrChFromFile, (strSize + 1) * sizeof (char));

        if (ptrChFromFile == NULL) {
            puts ("failed to allocate memory");
            exit (EXIT_FAILURE);
        }

        if (ch == ' ') {
            numberOfWords++;
        }

        ptrChFromFile[strSize] = ch;
        strSize++;
    }

    ptrChFromFile[strSize] = 0;

    char **ptrWords = malloc (sizeof (char *) * strSize);


    for (i = 0; i < strSize; i++) {
        if (ptrChFromFile[i] != ' ') {
            ptrWords[i] = &ptrChFromFile[i];
        }
        else {
            ptrWords[i] = 0;
        }
    }

    free (ptrChFromFile);
    free (ptrWords);
    return 0;
}

我正在努力的事情是:

1)我是否为指针分配了正确的内存大小?

2)如何不使用string.h库中的任何特殊方法(如strtok)按空格分析每个单词。那么如何将这些单词存储在指针* ptrWords中?

所以ptrWords应该看起来像这样:


  

奶酪|和饼干

 0        1      2

然后我要遍历ptrWords并检查指针中每个单词的长度是否大于或等于6。如果它们存储在指针ptrOutputWord中。

所以ptrOutputWord应该看起来像这样:


  

奶酪|饼干

 0        1      

最后,我想将ptrOutputWord中的值打印为一个没有空格的单词。

我试图解释我到底想做什么。谢谢任何能提前帮助的人。

编辑:我更改了代码以仅反映应该读取字符的部分,并在每次读取新字符时将指针的大小重新分配一个,但是没有分配适当的内存量。

1 个答案:

答案 0 :(得分:1)

您遇到了一些问题:

#include <stdio.h>
#include <time.h>

为什么要使用此标题?

#include <stdlib.h>

int main()
{
  char ch, *ptrChFromFile; 
  int strSize;

此变量需要有一个有用的起始值。

  ptrWordsFromFile = (char*)malloc(sizeof(char));

无需投射。

  if(ptrChFromFile == NULL)
  {
     puts("COULDN'T ALLOICATE MEMORY");
     exit(EXIT_FAILURE);
  }

  while((ch = getchar()) != EOF)

getchar返回并返回int,而不是char

  {
    ptrChFromFile  = (char*)realloc(ptrChFromFile, strSize * sizeof(char)+1);

我们需要比以前多一个字符,并为0添加更多空间。 您应该在元素数量上加上+2(而不是+1):(strSize+2) * sizeof(<any type>)

通常,您不应该将realloc的结果直接分配给同一指针。万一失败,您将丢失旧的指针值。再说一次:不需要演员。

    if(ptrChFromFile == NULL)
      {puts("failed to alloicate memory");}

如果失败,则无法继续!如上退出程序

    *ptrChFromFile = ch;

将字符放在扩大缓冲区的开头。您应该在末尾添加。

    strSize++;
  }

现在您的内存中有一堆字符,但字符串没有终止。

  free(ptrChFromFile);
  return 0;
}

修复后,它看起来像这样:

#include <stdio.h>
#include <stdlib.h>

int main(void)
{
  int ch;
  char *ptrChFromFile; 
  int strSize = 0;

  ptrWordsFromFile = malloc(sizeof(char));

  if (ptrChFromFile == NULL)
  {
     puts("COULDN'T ALLOICATE MEMORY");
     exit(EXIT_FAILURE);
  }

  while ((ch = getchar()) != EOF)
  {
    ptrChFromFile = realloc(ptrChFromFile, (strSize+2) * sizeof(char));

    if (ptrChFromFile == NULL)
    {
      puts("failed to allocate memory");
      exit(EXIT_FAILURE);
    }

    ptrChFromFile[strSize] = ch;
    strSize++;
  }
  ptrChFromFile[strSize] = 0;

  // Now add detection and storing of separate words
  // (You might omit storing words that are too short)
  // Select random words and add together.

  free(ptrChFromFile);
  return 0;
}