Stata:导入用重复变量分隔

时间:2014-03-07 22:53:24

标签: stata

我有一个包含两个相同列的csv文件:

X,X
0,0
1,1
2,2

我想将其导入Stata 13,但它不喜欢导入第二个X(因为名称相同):

. import delimited "filename.csv"
X already defined
Error creating variables
r(109);

是否有一种强制导入的简单方法?

我不想指定要导入的行。实际数据集有100多个变量,重复的变量分布在整个过程中。 同样,我不想手动重命名变量。 如果Stata想要删除或重命名第二个X,我会很好。

作为背景,这个csv文件是由一些草率的SQL代码生成的。重复的变量正是我用于连接的变量。我可以清理SQL代码或预清理(例如Python),但我希望Stata强制导入。

2 个答案:

答案 0 :(得分:2)

尝试insheet

将此示例数据放在.csv文件中:

x,x,y,y
238965,586,127,192864
238965,586,127,192864
1074,198264,5186,2947
1074,198264,5186,2947

导入所有变量,Stata中的结果名称为:

x
v2
y
v4

命令是:

insheet using "~/some/file.csv"

(我在Stata 12.1上,根据Stata 13 [U]手册,insheetimport delimited取代,第21页。)

答案 1 :(得分:1)

import delimited在07oct2013更新中针对此特定问题进行了修补。要更新Stata 13类型...

. update all
命令窗口中的