11
Tecnología y Ciencias del Agua
, vol. VIII, núm. 4, julio-agosto de 2017, pp. 5-18
Buendía-Espinoza
et al
.,
Identificación de cambios en la ciclogénesis del Atlántico Norte mediante un modelo de mezclas Gaussianas
ISSN 2007-2422
•
en su grupo; valores cercanos a 0 significan que
la observación podría pertenecer a otro grupo;
en valores cercanos a -1, la observación está
pobremente clasificada. En la gráfica hay una
medida resumen denominada ancho promedio
de silueta o coeficiente de silueta, que se inter-
preta de acuerdo con el cuadro 1.
Medida de la distancia entre MMG
De acuerdo con Sfikas, Constantinopoulos,
Likas y Galatsanos (2005), y Fukunaga (1990),
la distancia de Bhattacharyya puede ser utiliza-
da para comparar fdp de modelos de mezclas
Gaussianas y además tiene una expresión en
forma cerrada. Esta distancia se utilizó para me-
dir la distancia entre los grupos de los ciclones
tropicales para los dos intervalos de estudio y
se define como sigue:
B f
,
g
( )
=
1
8
μ
f
μ
g
(
)
T f
g
2
1
μ
f
μ
g
(
)
+
1
2 ln
f
+
g
2
f
g
(7)
donde
µ
f
,
∑
f
y
µ
g
,
∑
g
corresponden a los vecto-
res de medias, y las matrices de varianzas y
covarianzas de los núcleos de las densidades
Gaussianas, respectivamente.
Estadístico de prueba para la comparación de
las fdp del MMG
Se aplicó la técnica paramétrica de remuestreo
para obtener el percentil 95 de la distribución
empírica del estadístico de prueba, que es la dis-
tancia de Bhattacharyya entre los componentes
de los modelos de mezclas Gaussianas, para
verificar si existen diferencias estadísticamente
significativas entre ellos (Engel, 2010).
El método de remuestreo (Efron, 1979; Efron
& Tibshirani, 1993) se usa para encontrar inter-
valos de confianza en situaciones donde es im-
posible obtener de manera analítica la distribu-
ción muestral del estimador (para mayor detalle,
ver DiCiccio & Tibshirani, 1987; Hall, 1988). Esta
técnica se sustenta teóricamente en dos conside-
raciones: 1) la función de distribución verdadera
F
(
x
) se estima mediante la función de distribu-
ción empírica ˆ
F
(
x
) de acuerdo con el teorema
Glivenko-Cantelli, que muestra que ˆ
F
(
x
p
)
F
(
x
)
conforme
n
→
∞ (Bickel & Freedman, 1981); y 2)
de acuerdo con la propiedad de consistencia, la
F
( ˆ ) de una muestra dada puede aproximarse
mediante la distribución muestral del remues-
treo ˆ
F
*
( ˆ
*
) cuando el número de remuestreos
es grande y puede también aproximarse ˆ
F
(
x
) a
F
(
x
). Bajo estos supuestos, Babu y Singh (1983)
demuestran que ˆ
F
*
( ˆ
*
) ˆ
F
( ˆ ), cuando el número
de remuestreos es suficientemente grande.
Procedimiento de remuestreo
1. Se genera una variable aleatoria U
~
Uniforme
(0,1).
2. Si
U
j
j
=
1
K
,
j
+
1
j
=
1
K
+
1
,
donde
π
j
corresponde a la probabilidad del
j
-ésimo
componente del modelo de mezclas,
entonces se generan variables aleatorias
a partir de la distribución del
j
-ésimo
componente. Dicho componente tiene una
distribución normal bivariada, obtenida
mediante el algoritmo EM.
Cuadro 1. Rango del coeficiente en silueta.
Rango del coeficiente de silueta
Interpretación
0.71-1.00
Estructura fuerte
0.51-0.70
Estructura razonable
0.26-0.50
Estructura débil y podría ser artificial
< 0.25
Ninguna estructura sustancial
Fuente: Kaufman y Rousseeuw (2005).