我的数据集中有一个字符串变量,空间很大,我不知道如何删除它。
我已经尝试过了:
replace x = subinstr(x," ", "", .)
然而,什么也没发生。
您可以在下面找到字符串的示例:
已使用:先前已使用过的项目。该项目可能有一些迹象 化妆品,但完全是 按预期运作和运作。此项目可能是已使用的楼层模型或商店退货。
我正在尝试将其转换为:
已使用:先前已使用过的项目。该物品可能有一些化妆品磨损迹象,但完全可操作并且按预期运行。此项目可能是已使用的楼层模型或商店退货。有关任何不完善的详细信息和说明,请参阅卖家列表。
答案 0 :(得分:2)
你基本上必须告诉Stata消除长度为两个字符的所有空格。
以下适用于我:
clear
set obs 1
generate string = "Used: An item that has been used previously. The item may have some signs of cosmetic wear, but is fully" ///
+ " operational and functions as intended. This item may be a floor model or store return that has been used."
generate new_string = subinstr(string," ", "", .)
list
请注意,我将" "
更改为" "
。
答案 1 :(得分:1)
不是计算空格字符数,而只是用stritrim()
修剪连续的内部空格字符。所以,
replace x = stritrim(x)
如果您仍遇到问题,可能会在字符串中隐藏其他隐藏字符。在这种情况下,您可能想要使用Nick Cox的charlist。