CAPÍTULO 7. AJUSTE CON MODELOS ESTADÍSTICOS
171
37.8949982178
,
37.9752539821
,
37.5238097329
,
38.8349502588
,
39.5894958061
,
40.4058337918
)
En vez de utilizar un gráfico de barras, como se hizo anteriormente, aquí
se hará un gráfico de puntos, en el rango de valores que nos interesa, con el
siguiente código:
plot
(prcnt,
ylim
=
c
(
34
,
max
(prcnt)),
# <- Rango de valores de interés
# El título:
main
=
"Incremento en Desempleo\nEduc.Media Sup o Superior"
,
xlab
=
"Trimestres a partir de 2011 (x)"
,
ylab
=
"% del total de desempleados (y)"
)
La apariencia visual que arroja el código anterior se puede ver en la Fig.
7.1(a). De ahí se intuye que uno pudiera trazar algún tipo de curva, típicamente
una recta, que
siguiera más o menos el camino trazado o sugerido por los puntos
,
como lo muestran los dos intentos de la Fig. 7.1(b).
Hasta aquí, aunque nuestro procedimiento,
a ojo
, para encontrar alguna lí-
nea que se
ajuste
a los datos, mismo que se ha mostrado en la Fig. 7.1(b), nos da
alguna idea
más o menos regular
de por dónde andaría la línea en cuestión, no
es de ninguna manera preciso. Supóngase, sin embargo, que la tal línea ideal
existiera; entonces, para cada punto de los datos, se podría calcular la diferen-
cia (
residuo
), entre el valor obtenido, en las ordenadas, en dicha línea con la
misma abscisa y el del punto. Este valor se ha etiquetado en la figura para uno
de los puntos con el símbolo
ε
. De hecho, el procedimiento para el cálculo de
dichos residuos, se puede hacer para cualquier línea que se ocurra contra el
conjunto de datos que se tiene. Si se suman los valores cuadrados de dichos re-
siduos, se obtiene un valor asociado a cualquier línea
candidata
a ajustarse a los
datos. La técnica para encontrar de entre todas las líneas candidatas posibles,
la
mejor
u
óptima
, consiste en encontrar aquella cuya suma de residuos cuadra-
dos sea la menor. Esta técnica se conoce con el nombre de regresión lineal por
mínimos cuadrados y se puede estudiar a detalle en Walpole et al. [2012] pp.
394-397 y en Wood [2006] pp. 3-12. Aquí sólo se utilizarán los resultados de la
aplicación de dicho método, que se encuentran ya consignados en el lenguaje.
En general la ecuación de cualquier recta en el espacio del problema mos-
trado en la Fig. 7.1(a), estaría dada por:
y
=
β
0
+
β
1
x
(7.1)
donde,
β
0
es conocida como el
intersecto
o intersección con el eje Y, y
β
1
es la
pendiente o inclinación de la recta. Entonces, el asunto consiste en encontrar
los valores de esos coeficientes,
β
0
y
β
1
, para la línea recta
óptima
, señalada
en el párrafo anterior. En R, esta operación se realiza por medio de la función