我有一个包含两个相同列的csv文件:
X,X
0,0
1,1
2,2
我想将其导入Stata 13,但它不喜欢导入第二个X
(因为名称相同):
. import delimited "filename.csv"
X already defined
Error creating variables
r(109);
是否有一种强制导入的简单方法?
我不想指定要导入的行。实际数据集有100多个变量,重复的变量分布在整个过程中。
同样,我不想手动重命名变量。
如果Stata想要删除或重命名第二个X
,我会很好。
作为背景,这个csv文件是由一些草率的SQL代码生成的。重复的变量正是我用于连接的变量。我可以清理SQL代码或预清理(例如Python),但我希望Stata强制导入。
答案 0 :(得分:2)
尝试insheet
。
将此示例数据放在.csv文件中:
x,x,y,y
238965,586,127,192864
238965,586,127,192864
1074,198264,5186,2947
1074,198264,5186,2947
导入所有变量,Stata中的结果名称为:
x
v2
y
v4
命令是:
insheet using "~/some/file.csv"
(我在Stata 12.1上,根据Stata 13 [U]手册,insheet
被import delimited
取代,第21页。)
答案 1 :(得分:1)
import delimited
在07oct2013更新中针对此特定问题进行了修补。要更新Stata 13类型...
. update all
。