BioMates: Modelo Autorregresivo

Series Temporales
Modelo Autorregresivo

Las observaciones de una serie cronológica están asociadas a los diferentes valores que alcanza una magnitud que varía en el tiempo. Tales valores se guardan en una lista de la forma

(y₁, y₂, ..., y_n).

El ajuste autorregresivo de orden p, AR(p), consiste en suponer que los valores registrados han sido generados por un modelo subyacente de la forma

esto es, la lectura que se obtiene en la etapa i-ésima depende linealmente de las últimas p observaciones, más un error aleatorio representado aquí por e_i. Otras hipótesis adicionales del modelo son:

El proceso es estacionario hasta el segundo orden (significa esto que la esperanza estocástica de las observaciones es constante y que la covarianza entre observaciones depende únicamente de su separación en el tiempo).
Los residuos e_i son normales de media nula y varianza desconocida; estos residuos son, por lo demás, independientes entre sí y de las variables y_i del proceso.

Tal como ha quedado especificado, el modelo AR(p) tiene p+2 parámetros a estimar a partir de los datos observados:

Los p+1 coeficientes autorregresivos
La varianza del residuo, .

El método de estimación adoptado aquí es el de los mínimos cuadrados, que consiste en calcular los parámetros autorregresivos de forma tal que minimicen el error cuadrático

Así, el estimador del vector paramétrico es

siendo

habiéndose indicado la transposición matricial mediante el superíndice T.

El estimador mínimo cuadrático de la varianza , o varianza residual, se calcula mediante

La etapa de validación es la fase en la que se comprueba que el modelo AR(p) explica aceptablemente la serie numérica observada; en ella se debe analizar si las hipótesis del modelo son válidas.

Nos limitamos aquí al chequeo de los residuos estimados

Media nula y varianza constante: la serie de residuos estimados debe comportarse de forma que no experimente tendencias ni alteraciones importantes en su variabilidad a lo largo del tiempo. En la esquina inferior derecha del applet se representa esta serie de residuos, junto con su intervalo de confianza del 95% bajo las hipótesis mencionadas.
Independencia: para contrastar que los residuos son independientes se plantea la hipótesis nula

H₀: "los k primeros coeficientes de correlación son nulos: ".
frente a la alternativa:
H₁: "al menos existe un coeficiente de correlación no nulo: ".

Se calcula para ello el estadístico de Ljung-Box:
el cual se distribuye como una distribución , siendo (r₁, r₂, ..., r_k) las correlaciones correspondientes a los k primeros retardos. El valor k elegido para la realización del test es el entero más próximo a 10 log₁₀(n-p). El contraste se realiza para un nivel de significación del 5%.

Caso

Durante la fase temprana del periodo menstrual de una mujer sana se han registrado, a partir de muestras sanguíneas, durante ocho horas y a intervalos de diez minutos, los niveles de cierta hormona cuyo papel es importante en el proceso reproductivo. Las 48 lecturas realizadas son las siguientes:

2.4 2.4 2.4 2.2 2.1 1.5 2.3 2.3 2.5 2.0 1.9 1.7 2.2 1.8 3.2 3.2

2.7 2.2 2.2 1.9 1.9 1.8 2.7 3.0 2.3 2.0 2.0 2.9 2.9 2.7 2.7 2.3

2.6 2.4 1.8 1.7 1.5 1.4 2.1 3.3 3.5 3.5 3.1 2.6 2.1 3.4 3.0 2.9

Mediante el ajuste de un modelo matemático se quiere caracterizar la serie para establecer las diferencias entre las propiedades de las series tomadas en otras fases del ciclo menstrual.
Para el orden p=1, se obtiene el modelo
y_i = 0.9999 + 0.5860 y_i-1, para todo i= 2, ..., n. La varianza residual asociada es de 0.2016. Del gráfico de los residuos, éstos no parecen experimentar tendencia a lo largo del tiempo, ni que su variabilidad se vea alterada; además, la mayor parte de ellos se mantienen dentro de los márgenes de confianza, lo que nos permite concluir que las hipótesis de normalidad, nulidad de la esperanza y constancia de la variancia (homocedasticidad) son válidas. Por otro lado, según el contraste de Ljung-Box, la hipótesis de independencia de estos residuos puede mantenerse como aceptable al nivel de significación del 5%. A falta de un chequeo más exhaustivo, parece que el modelo estimado se ajusta razonablemente bien a la serie observada de niveles hormonales. Experimentando con órdenes superiores (p= 2, 3, ...), el análisis de los residuos sigue dando resultados razonables, pero mejorando muy levemente la varianza residual, lo que induce a tomar como bueno el modelo autorregresivo AR(1), ya que el aumento de su complejidad no redunda en una mejora sensible del poder predictivo de éste.
(Fuente: Peter J. Diggel (1992) Time Series. A Biostatistical Introduction. Oxford Science Publication.)

Manual de las applets de BioMates Hay problemas en la carga del applet.