我有数据,包括一些'NA'部分。完整数据集大小为1994年。但我使用'complete.cases'公式,因此control_dataset大小为319 obs。
但是,我开始使用此代码:
zero_2nd <-lm(formula = ViolentCrimesPerPop ~ (population + householdsize +
racePctHisp + agePct12t29 + agePct65up + numbUrban + pctWWage +
pctWFarmSelf + pctWInvInc + pctWSocSec + medFamInc + perCapInc +
AsianPerCap + NumUnderPov + PctPopUnderPov + PctNotHSGrad +
PctBSorMore + PctUnemployed + PctEmploy + PctEmplManu + PctOccupManu +
PctOccupMgmtProf + TotalPctDiv + PctFam2Par + PctKids2Par +
PctYoungKids2Par + PctWorkMomYoungKids + NumImmig + PctImmigRecent +
PctImmigRec8 + PctImmigRec10 + PctRecentImmig + PctRecImmig8 +
PctRecImmig10 + PctSpeakEnglOnly + PctLargHouseFam + PctLargHouseOccup +
PersPerRentOccHous + PctPersDenseHous + PctHousLess3BR +
PctHousOwnOcc + PctWOFullPlumb + OwnOccMedVal + OwnOccHiQuart +
RentLowQ + MedRent + MedRentPctHousInc + MedOwnCostPctInc +
NumStreet + PctForeignBorn + LemasSwFTPerPop + LemasTotReqPerPop +
PolicPerPop + RacialMatchCommPol + PctPolicAsian + OfficAssgnDrugUnits +
PctUsePubTrans + PolicCars)^2, data = zerodata)
我使用摘要(zero_2nd), 残差: 所有319个残差为0:没有剩余自由度!
系数:(1393由于奇点而没有定义) 发生了。
和所有标准。错误,t值,Pr(&gt; | t |)是NA。
为什么会出现这种情况?怎么能解决这个问题呢?
(zerodata = cutted data set(319 obs。))
答案 0 :(得分:0)
这更像是一个统计问题而不是编码问题。从本质上讲,这样的错误意味着你在模型中使用的一个协变量被另一个完美地预测。
您可以从a similar question asked on Cross Validated找到更多详情。