CAPÍTULO 7. AJUSTE CON MODELOS ESTADÍSTICOS
181
l
l l
l
l
l l
l
l
l
l
l
0 2 4 6 8 10
0
5
10 15
x
y
modelo parabola
modelo recta
Figura 7.4: Dos modelos estadísticos ajustados con un mismo conjunto de datos
por lo menos de manera aproximada. Los residuos son la diferencia entre el
valor observado y el valor obtenido por el modelo. Por otra parte, la variable
aleatoria que se ha observado es continua y puede tomar cualesquiera valores.
En muchos problemas, sin embargo, la variable de respuesta que se desea mo-
delar no obedece a dichas características. Pensemos, por ejemplo, en variables
que pudieran tener una repuesta binaria: “infectado” o “no infectado”, “apro-
bado” o “reprobado”, etc. Por supuesto que este tipo de variables no tienen
una distribución normal.
Antes de entrar en la materia de los modelos lineales generalizados, da-
remos un poco de formalidad a los modelos lineales revisados en la sección
anterior.
En las figuras 7.2 y 7.4 se muestran tanto los datos
experimentales
, en
rojo
,
como las
curvas
resultantes del ajuste, en
azul
. En ambos casos, la curva o línea
azul
representa la media,
µ
, de la variable aleatoria,
Y
, y, por consiguiente, cada
uno de los valores de la variable se podría expresar como sigue:
y
i
=
µ
+
ε
i
=
β
0
+
β
1
x
1
+
. . .
+
β
n
x
n
+
ε
i
(7.6)
donde, en la terminología de los modelos estadísticos, los
ε
i
son conocidos co-
mo los
residuos
del modelo
2
. Si se eliminan éstos de la ecuación anterior, se
tiene que la media es el objeto o variable que está definida por la expresión
lineal, como se muestra:
2
Son precisamente estos residuos los que se presupone, como se dijo anteriormente, obedecen
a una distribución normal de probabilidades.