如何从字符串中删除长空格

时间:2018-05-29 21:53:53

标签: stata

我的数据集中有一个字符串变量,空间很大,我不知道如何删除它。

我已经尝试过了:

replace x = subinstr(x," ", "", .)

然而,什么也没发生。

您可以在下面找到字符串的示例:

  

已使用:先前已使用过的项目。该项目可能有一些迹象       化妆品,但完全是   按预期运作和运作。此项目可能是已使用的楼层模型或商店退货。

我正在尝试将其转换为:

  

已使用:先前已使用过的项目。该物品可能有一些化妆品磨损迹象,但完全可操作并且按预期运行。此项目可能是已使用的楼层模型或商店退货。有关任何不完善的详细信息和说明,请参阅卖家列表。

2 个答案:

答案 0 :(得分:2)

你基本上必须告诉Stata消除长度为两个字符的所有空格。

以下适用于我:

clear
set obs 1

generate string = "Used: An item that has been used previously. The item may have some signs of cosmetic wear, but is fully" ///
+ "                                                                       operational and functions as intended. This item may be a floor model or store return that has been used."
generate new_string = subinstr(string,"  ", "", .)

list

请注意,我将" "更改为" "

答案 1 :(得分:1)

不是计算空格字符数,而只是用stritrim()修剪连续的内部空格字符。所以,

replace x = stritrim(x)

如果您仍遇到问题,可能会在字符串中隐藏其他隐藏字符。在这种情况下,您可能想要使用Nick Cox的charlist