在一项提高农业实践视频传播质量的调查中,其中一个变量是在传播过程中讨论了哪些不可转让的做法。例如,播种小麦有四种不可谈判的做法。
我想创建一个返回4,3,2或1的变量,具体取决于讨论的实践。
我首先将所有字符串响应编码为数字:
gen SWI_ST_NNG1=q205_1_1
replace SWI_ST_NNG1="0" if SWI_ST_NNG1=="#NULL!"
replace SWI_ST_NNG1="1" if SWI_ST_NNG1=="Luke warm water should be used for seed treatment"
gen SWI_ST_NNG2=q205_1_2
replace SWI_ST_NNG2="0" if SWI_ST_NNG2=="#NULL!"
replace SWI_ST_NNG2="2" if SWI_ST_NNG2=="Mixture of seed, Jaggery and cow urine should kept for"
gen SWI_ST_NNG3=q205_1_3
replace SWI_ST_NNG3="0" if SWI_ST_NNG3=="#NULL!"
replace SWI_ST_NNG3="3" if SWI_ST_NNG3=="Use of bavistin powder is must for seed treatment"
gen SWI_ST_NNG4=q205_1_4
replace SWI_ST_NNG4="0" if SWI_ST_NNG4=="#NULL!"
replace SWI_ST_NNG4="4" if SWI_ST_NNG4=="Seeds should be kept 12 to 15 hours for germination"
答案 0 :(得分:0)
我们需要一个沙箱来清楚地说明事情,因为你没有提供MCVE。见https://stackoverflow.com/help/mcve
基本上,系列中的变量 j 的值为 j (1到4)或0,我想你想要计数非零。 (我不认为返回1到4会有任何其他意义,因为你如何从一个人编码1和3而从另一个人编写4?)
通过跨变量的循环可以轻松完成计数。
clear
set obs 10
set seed 2803
forval j = 1/4 {
gen SWI_ST_NNG`j' = cond(runiform() < 0.5, `j', 0)
}
list, sep(0)
+-------------------------------------------+
| SWI_ST~1 SWI_ST~2 SWI_ST~3 SWI_ST~4 |
|-------------------------------------------|
1. | 0 0 0 4 |
2. | 1 0 0 0 |
3. | 0 2 0 0 |
4. | 1 2 3 4 |
5. | 1 2 3 4 |
6. | 1 2 3 0 |
7. | 1 2 3 0 |
8. | 0 2 3 4 |
9. | 1 0 3 4 |
10. | 1 2 3 0 |
+-------------------------------------------+
gen count = 0
quietly forval j = 1/4 {
replace count = count + (SWI_ST_NNG`j' > 0)
}
list, sep(0)
+---------------------------------------------------+
| SWI_ST~1 SWI_ST~2 SWI_ST~3 SWI_ST~4 count |
|---------------------------------------------------|
1. | 0 0 0 4 1 |
2. | 1 0 0 0 1 |
3. | 0 2 0 0 1 |
4. | 1 2 3 4 4 |
5. | 1 2 3 4 4 |
6. | 1 2 3 0 3 |
7. | 1 2 3 0 3 |
8. | 0 2 3 4 3 |
9. | 1 0 3 4 3 |
10. | 1 2 3 0 3 |
+---------------------------------------------------+
有关行方向工作的更多信息,请参阅this discussion。
在实践中,有一个方便的捷径:
egen count2 = anycount(SWI*), values(1/4)
但是学习循环方法对于解决更复杂的问题非常有用。
请注意,如果您将编码变量编码为1或0,那么您想要的计数就是行总和,可以使用egen
轻松获得。这样的指标(a.k.a.哑)变量对于大多数统计和数据管理目的来说是更好的编码。