Cabecera

Series Temporales
Modelo Autorregresivo

Las observaciones de una serie cronológica están asociadas a los diferentes valores que alcanza una magnitud que varía en el tiempo. Tales valores se guardan en una lista de la forma

(y1, y2, ..., yn).

El ajuste autorregresivo de orden p, AR(p), consiste en suponer que los valores registrados han sido generados por un modelo subyacente de la forma

esto es, la lectura que se obtiene en la etapa i-ésima depende linealmente de las últimas p observaciones, más un error aleatorio representado aquí por ei. Otras hipótesis adicionales del modelo son:
  1. El proceso es estacionario hasta el segundo orden (significa esto que la esperanza estocástica de las observaciones es constante y que la covarianza entre observaciones depende únicamente de su separación en el tiempo).
  2. Los residuos ei son normales de media nula y varianza desconocida; estos residuos son, por lo demás, independientes entre sí y de las variables yi del proceso.

Tal como ha quedado especificado, el modelo AR(p) tiene p+2 parámetros a estimar a partir de los datos observados:

  • Los p+1 coeficientes autorregresivos
  • La varianza del residuo, .

El método de estimación adoptado aquí es el de los mínimos cuadrados, que consiste en calcular los parámetros autorregresivos de forma tal que minimicen el error cuadrático

Así, el estimador del vector paramétrico es

siendo
habiéndose indicado la transposición matricial mediante el superíndice T.

El estimador mínimo cuadrático de la varianza , o varianza residual, se calcula mediante

La etapa de validación es la fase en la que se comprueba que el modelo AR(p) explica aceptablemente la serie numérica observada; en ella se debe analizar si las hipótesis del modelo son válidas.

Nos limitamos aquí al chequeo de los residuos estimados

  • Media nula y varianza constante: la serie de residuos estimados
    debe comportarse de forma que no experimente tendencias ni alteraciones importantes en su variabilidad a lo largo del tiempo. En la esquina inferior derecha del applet se representa esta serie de residuos, junto con su intervalo de confianza del 95% bajo las hipótesis mencionadas.
  • Independencia: para contrastar que los residuos son independientes se plantea la hipótesis nula
    H0: "los k primeros coeficientes de correlación son nulos:
    ".
    frente a la alternativa:
    H1: "al menos existe un coeficiente de correlación no nulo: ".

    Se calcula para ello el estadístico de Ljung-Box:
    el cual se distribuye como una distribución , siendo (r1, r2, ..., rk) las correlaciones correspondientes a los k primeros retardos. El valor k elegido para la realización del test es el entero más próximo a 10 log10(n-p). El contraste se realiza para un nivel de significación del 5%.


Caso

Durante la fase temprana del periodo menstrual de una mujer sana se han registrado, a partir de muestras sanguíneas, durante ocho horas y a intervalos de diez minutos, los niveles de cierta hormona cuyo papel es importante en el proceso reproductivo. Las 48 lecturas realizadas son las siguientes:

2.4 2.4 2.4 2.2 2.1 1.5 2.3 2.3 2.5 2.0 1.9 1.7 2.2 1.8 3.2 3.2
2.7 2.2 2.2 1.9 1.9 1.8 2.7 3.0 2.3 2.0 2.0 2.9 2.9 2.7 2.7 2.3
2.6 2.4 1.8 1.7 1.5 1.4 2.1 3.3 3.5 3.5 3.1 2.6 2.1 3.4 3.0 2.9

Mediante el ajuste de un modelo matemático se quiere caracterizar la serie para establecer las diferencias entre las propiedades de las series tomadas en otras fases del ciclo menstrual.

Para el orden p=1, se obtiene el modelo

yi = 0.9999 + 0.5860 yi-1,
para todo i= 2, ..., n. La varianza residual asociada es de 0.2016. Del gráfico de los residuos, éstos no parecen experimentar tendencia a lo largo del tiempo, ni que su variabilidad se vea alterada; además, la mayor parte de ellos se mantienen dentro de los márgenes de confianza, lo que nos permite concluir que las hipótesis de normalidad, nulidad de la esperanza y constancia de la variancia (homocedasticidad) son válidas. Por otro lado, según el contraste de Ljung-Box, la hipótesis de independencia de estos residuos puede mantenerse como aceptable al nivel de significación del 5%. A falta de un chequeo más exhaustivo, parece que el modelo estimado se ajusta razonablemente bien a la serie observada de niveles hormonales. Experimentando con órdenes superiores (p= 2, 3, ...), el análisis de los residuos sigue dando resultados razonables, pero mejorando muy levemente la varianza residual, lo que induce a tomar como bueno el modelo autorregresivo AR(1), ya que el aumento de su complejidad no redunda en una mejora sensible del poder predictivo de éste.

(Fuente: Peter J. Diggel (1992) Time Series. A Biostatistical Introduction. Oxford Science Publication.)

Manual de las applets de BioMates
Hay problemas en la carga del applet.


© BioMates, 2000-2001