Как включить состояние N в качестве весовой переменной в SPSS?


Моя структура данных такова:

State           N           Var1            Var2
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65

Var1 и Var2-агрегированные процентные значения на уровне штата. N - число участников в каждом государстве. Я хотел бы провести линейную регрессию между Var1 и Var2 с учетом веса N, как это лучше всего сделать в SPSS?

2 2

2 ответа:

Вы можете использовать WEIGHT BY или использовать подкоманду на REGRESSION - примеры ниже.

DATA LIST FREE / State (A15) N  Var1  Var2 (3F2.0).
BEGIN DATA
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65
END DATA.

WEIGHT BY N.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

*Or using subcommand.
WEIGHT OFF.    
REGRESSION
  /MISSING LISTWISE
  /REGWGT=N
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.
Вы можете сами убедиться, что эти две процедуры дают одинаковые оценки. И что если вы запустите регрессию без взвешивания или с помощью подкоманды REGWGT, это приведет к различным оценкам для этого примера.

Какова причина использования N в качестве веса? Если вы действительно хотите сделать это, поскольку регрессия рассматривает вес как вес репликации, вы должны быть осторожны с вашими степенями свободы.