El arte de programar en R Un leguaje para la estadística - page 192

CAPÍTULO 7. AJUSTE CON MODELOS ESTADÍSTICOS
189
Se debe especificar distribución que se aplica mediante el argumento
family
de la función:
family=binomial
.
En la fórmula y los datos, la variable de respuesta, para el caso de la
distribución binomial, se puede especificar de tres maneras:
1. Como un
vector
. En este caso, el sistema entendería que se trata de
datos binarios y por lo tanto el vector tendría sólo valores 0 y 1.
2. Como una
matriz
de dos columnas. En este caso, se entiende que la
primera columna contiene el número de éxitos para la prueba y la
segunda columna, el número de fracasos.
3. Como un
factor
. En este caso, el primer nivel (o categoría) del factor,
se entiende como fracaso (0), y todos los otros como éxito (1).
La familia binomial, por omisión toma como función de liga la función
logit
, si se quisiera especificar otra de las disponibles, por ejemplo la fun-
ción
probit
, se haría así:
family=binomial(link=probit)
.
Una vez establecido lo anterior, procedemos a resolver el problema en R, de la
siguiente manera:
reprobados
<-
curso
$
Grupo
-
curso
$
Aprobados
aprobados
<-
curso
$
Aprobados
horasCurso
<-
curso
$
Horas
(exito
<-
aprobados
/
(aprobados
+
reprobados))
## [1] 0.1000 0.2000 0.2857 0.4737 0.6000 0.8571 0.9000 1.0000
## [9] 0.9500
# Aquí optamos por especificar la variable de respuesta
# como una matriz de dos columnas:
formula
<-
cbind
(aprobados,reprobados)
~
horasCurso
mm
<-
glm
(formula,
family
=binomial)
summary
(mm)
##
## Call:
## glm(formula = formula, family = binomial)
##
## Deviance Residuals:
## Min
1Q Median
3Q
Max
## -1.240 -0.554 0.343 0.439 1.547
##
## Coefficients:
##
Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.7056
0.7387 -6.37 1.9e-10 ***
## horasCurso 0.1407 0.0201 7.00 2.6e-12 ***
1...,182,183,184,185,186,187,188,189,190,191 193,194,195,196,197,198
Powered by FlippingBook