我有一张Excel工作表作为Stata的输入。在Excel中,单元格中的点标记缺失值,例如:
Column1 Column2
1 10
2 .
. 13
. 15
3 .
但是,将Excel导入Stata时,上面的两列都被标识为String。
如何在导入期间告诉Stata所有点都应该被识别为缺失值,因此我的数字列保持数字,尽管它们包含一些点/缺失值?
答案 0 :(得分:2)
假设您可能从Excel或csv导入。
<强> Excel中强>
从import excel
指导:
如果列包含至少一个包含非数字文本的单元格,则整个列将作为字符串变量导入。
所以最简单的解决方案是:
destring
变量。您可以通过以下方式destring
一次完整列表:
destring var_1 var_2 var_3, replace
这会将变量覆盖为数字变量和。将被编码为缺失。
导入CSV 如在Excel中,如果有非数字字符,我相信Stata会认为它可能是一个字符串。您可以在导入
时使用numericcols
选项
import delimited, numericcols()
然后,您在numericcols
选项中指定的任何列都被强制为数字和。应该被解释为缺失。
如上所述,同样容易进入destring
。