将xlsx中的点导入为Stata中的缺失值

时间:2017-10-17 18:54:17

标签: import stata xlsx

我有一张Excel工作表作为Stata的输入。在Excel中,单元格中的点标记缺失值,例如:

Column1 Column2
1       10
2       .
.       13
.       15
3       .

但是,将Excel导入Stata时,上面的两列都被标识为String。

如何在导入期间告诉Stata所有点都应该被识别为缺失值,因此我的数字列保持数字,尽管它们包含一些点/缺失值?

1 个答案:

答案 0 :(得分:2)

假设您可能从Excel或csv导入。

<强> Excel中import excel指导: 如果列包含至少一个包含非数字文本的单元格,则整个列将作为字符串变量导入。

所以最简单的解决方案是: destring变量。您可以通过以下方式destring一次完整列表:

destring var_1 var_2 var_3, replace

这会将变量覆盖为数字变量和。将被编码为缺失。

导入CSV 如在Excel中,如果有非数字字符,我相信Stata会认为它可能是一个字符串。您可以在导入

时使用numericcols选项
import delimited, numericcols() 

然后,您在numericcols选项中指定的任何列都被强制为数字和。应该被解释为缺失。

如上所述,同样容易进入destring