sscanf和字符串

时间:2009-07-01 00:20:51

标签: c csv scanf

为了Ruby扩展的目的,我在C中解析一些CSV数据。为了从每一行中提取数据,我使用sscanf,如下所示:

  char* line = RSTRING_PTR(arg);
  double price;
  double volume_remaining;
  unsigned int type_id, range, order_id, volume_entered, minimum_volume, duration, station_id, region_id, solar_system_id, jumps;
  char* issued;
  char* bid;
  printf("I got %s\n",line);
  int res = sscanf(line, "%lf,%lf,%u,%u,%u,%u,%u,%s,%s,%u,%u,%u,%u,%u", &price, &volume_remaining, &type_id, &range, &order_id, &volume_entered, &minimum_volume, bid, issued, &duration, &station_id, &region_id, &solar_system_id, &jumps);
  printf("I matched %d values\n", res);
  printf("I have price %f, vol_rem %f, type_id %d, range %d, order_id %d, vol_ent %d, min_vol %d, issued %s, bid %s, duration %d, station_id %d, region_id %d, solar_system_id %d, jumps %d, source %s \n",price, volume_remaining, type_id, range, order_id, volume_entered, minimum_volume, issued, bid, duration, station_id, region_id, solar_system_id, jumps, source); // and hash build follows below

运行它会产生这个:

I got 728499.93,437.0,2032,32767,1132932560,588,1,False,2009-05-24 19:52:08.000,90,60003760,10000002,30000142,0
I matched 7 values
I have price 728499.930000, vol_rem 437.000000, type_id 2032, range 32767, order_id 1132932560, vol_ent 588, min_vol 1, issued (null), bid (null), duration -1210229476, station_id 3001, region_id 3001, solar_system_id 1, jumps -1210299816

请注意空字符串。基本上,似乎sscanf出于某种原因绊倒了这些。我无法弄清楚为什么甚至彻底阅读了文档。有什么想法吗?

4 个答案:

答案 0 :(得分:2)

您的角色指针是单元化的,并指向随机的内存段。你必须为sscanf()分配一个缓冲区来写入,它必须足够大。 (你很幸运,没有段错误。)第二部分是困难的部分 - scanf()可能不适合这里的工作。

答案 1 :(得分:2)

在堆栈上分配内存是一种简单的方法。例如:

char issued[1024] = {0};
char bid[1024] = {0};

顺便说一句,“在堆栈上分配内存”实际上只是意味着获取堆栈指针的当前位置,将其分配给变量名称,然后按变量类型的大小递增堆栈指针。与使用malloc和朋友在堆上分配内存相比,这是一个非常快速的操作。与malloc不同的是,一旦弹出当前堆栈帧(即执行到达当前函数的末尾),就会丢失任何堆栈分配的内存。

答案 2 :(得分:1)

%s匹配非空白字符。你可能想要的是%[^,]255,它将匹配除,而不是%s以外的所有字符。 255是可选的,它指定了您期望该字段的字段宽度。

答案 3 :(得分:0)

我同意Thanatos。作为第一次启动,您需要为已发布和出价分配内存,您可以这样做:

char发出[1024]; char bid [1024];