Прогнозирование после модели Бокскокса в Stata


Я пытаюсь сопоставить опцию предсказания после boxcox в Stata 13 с моим кодом, используя шаги, описанные в руководстве Stata (стр. 5).

Ниже приведен пример кода, который я использовал:
sysuse auto,clear
local indepvar weight foreign length  
qui boxcox price `indepvar' ,model(lhsonly)lrtest
qui predict yhat1 
qui predict resid1, residuals


//yhat2 and resid2 computed using the procedure described in Stata manual
set more off
set type double
mat coef=e(b)
local nosvar=colsof(coef)-2

qui gen constant=1
local varname weight foreign length  constant
local coefname weight foreign length  _cons

//step 1: compute residuals first
forvalues k = 1/`nosvar'{
local varname1 : word `k' of `varname'
local coefname1 : word `k' of `coefname'
qui gen xb`varname1'=`varname1'*_b[`coefname1']
}
qui egen xb=rowtotal(xb*)
qui gen resid=(price^(_b[theta:_cons]))-xb

//step 2: compute predicted value

qui gen yhat2=.
local noobs=_N
local theta=_b[theta:_cons]
forvalues j=1/`noobs'{
qui gen temp`j'=.
forvalues i=1/`noobs'{
qui replace temp`j'=((`theta'*(xb[`j']+resid[`i']))+1)^(1/`theta') if _n==`i'
}
qui sum temp`j'
local tempmean`j'=r(mean)
qui replace yhat2=`tempmean`j'' if _n==`j'
drop temp`j' 
}
drop resid
qui gen double resid2=price-yhat2



 sum yhat* resid*

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
       yhat1 |        74    6254.224    2705.175   3428.361   21982.45
       yhat2 |        74    1.000035    8.13e-06   1.000015   1.000054
      resid1 |        74   -88.96723    2094.162  -10485.45   6980.013
      resid2 |        74    6164.257    2949.496       3290      15905
Примечание: yhat1 и resid1 основаны на Stata predict, в то время как yhat2 и resid2 основаны на моем примере кода. Сравнение необходимо для того, чтобы убедиться, что вычисленный мною предельный эффект верен (margins не вычисляет предельный эффект после boxcox).
1 3

1 ответ:

Ваше определение первого остатка неверно, потому что вы пропустили определение y^(\lambda) на странице 3 руководства. См. также раздел методы и формулы в ручном вводе для самогоboxcox .

Переведено на вашу задачу, в строке

 qui gen resid=(price^(_b[theta:_cons]))-xb

Термин

 price^(_b[theta:_cons])

Должно быть:

 (price^(_b[theta:_cons])-1)/_b[theta:_cons]