Unidad 4: ANÁLISIS DE COVARIANZA

Supuestos del Modelo

El modelo de covarianza supone que

Existe relación lineal entre la covariable $X$ y la respuesta $Y$, es decir, $\beta\neq0$

Cómo probar que no hay relación lineal entre $X$ y $Y$ o no hay efecto de la covariable?.

La hipótesis que se debe plantear es

MATH

Se debe observar en la tabla de ANOVA el renglón correspondiente a la causa de variación Regresión

Causa de Variación gl. SC CM E(CM)
Regresión $1$ MATH MATH MATH

Y el renglón correspondiente al Error

MATH MATH MATH MATH

Se observa que bajo $H_{0}:\beta=0$ la esperanza del cuadrado medio de la regresión es E(CMMATH) MATH. Luego para probar $H_{0}:\beta=0$ se usa

MATH

Si se rechaza $H_{0}$ implica que el ajuste por covariable no se requiere.

¿Cómo observar gráficamente el cumplimiento de este supuesto?

Haga un gráfico de dispersión entre la variable respuesta y la covariable X sin tener en cuenta los tratamientos y se debe observar que los puntos se ajustan a una línea recta (o curvilinea).

La relación entre $X$ y $Y$ es la misma para cada tratamiento

Es decir, los coeficientes de regresión $\beta_{i}$ para cada tratamiento son iguales.

Cómo se prueba el supuesto de que la relación entre $Y$ y $X$ es la misma para cada tratamiento?

La hipótesis que se debe plantear es

MATH

Es decir que si se realiza un análisis de regresión entre la covariable $X$ y la variable respuesta $Y$ en cada tratamiento, las pendientes deben ser iguales.

La prueba estadística es

MATH

Los grados de libertad del numerador son $t-1$ porque es la resta de los grados de libertad de las dos sumas de cuadrados, MATH

Como esta prueba es considerada preliminar, se puede tomar a $\alpha=0.025$ en vez de escoger $\alpha=0.05,$ según lo recomendado por Bancroft (1964).

Si $H_{0}$ es rechazada se debe investigar los datos más cercanamente, por ejemplo por gráfico o prueba formal para ver si el no paralelismo es quizás debido a un tratamiento. Si esto ocurre se puede eliminar este tratamiento y proceder al análisis de la manera usual con los otros tratamientos. Si esta explicación no es plosible entonces es difícil preescribir que hacer.

En algunos casos el modelo MATH no es demasiado adecuado y entonces se debe usar el modelo MATH. En este caso, sin embargo, las comparaciones de los tratamientos dependen solo de los valores de $X$ para el cual ellos son comparados, lo cual puede ser un poco insatisfactorio y engorroso.

Haga en un mismo plano cartesiano un gráfico de dispersión entre la variable respuesta y la covariable X para cada tratamiento y si obtienen rectas paralelas entonces indica el cumplimiento del supuesto.

Las covariables no son afectadas por los tratamientos.

Cómo se prueba el supuesto de que las covariables no han sido afectadas por los tratamientos?

La hipótesis a ser probada se puede expresar con

MATH es decir $H_{0}:$ La covarianza no afecta a los tratamientos

Para visualizar el problema de que las covariables son afectadas por los tratamientos.se presenta la figura.1.


cov-afect-por-ttos.jpg

Figura 1. Covarianza afectada por los tratamientos

En este caso valores bajos de $y$ son asociados con valores bajos de $x$ para el tratamiento 1 (T$_{1}$) y valores altos de $y$ son asociados con valores altos de $x$ para el tratamieno 2 (T$_{2}$). Suponga que los tratamientos son variedades de papa y nosotros queremos comparar la producción de esas variedades usando como covariable el tamaño de las semillas. Así la variedad 1 tiene semillas pequeñas de papa y la variedad 2 tiene semillas grandes de papa. Si se aplicca el análisis de covarianza se podría querer comparar las variedades al tamaño de semilla de papa $x=\overline{x}$, un valor que no puede ser obtenido por ambas variedades. Por consiguiente, este procedimiento no es válido.

Antes se mencionó que si las covariables fueron observadas antes de aplicar los tratamientos entonces ellas no son afectadas por los tratamientos, pero es posible que se tenga una situación como la de la figura 1 auque se observen las covariables antes de aplicar los tratamientos. Esto se podría deber a las siguientes razones:

$\left( i\right) $. Debido a una ejecución particular del proceso de aleatorización. En este caso se debe rechazar este patrón de aleatorización y repetir el proceso de aleatorización.

$\left( ii\right) $ Debido a la falta de aleatorización. En este caso uno debería exponer los motivos del investigador.

$\left( iii\right) $ El efecto es debido a la casualidad (al azar).

En la práctica, por supuesto, uno puede no distinguir entre $\left( i\right) $ y $\left( ii\right) $. Un método para protegerse uno mismo de esta situación es tomar la variable $X$ como factor de tratamiento y realizar el ANOVA para un DCA. y considerar la prueba

MATH

Si la hipótesis nula es rechazada al $\alpha=0.025$, se debe asumir que la covariable es ``afectada'' por los tratamientos. Esta prueba es importante cuando la covariable es medida después de la aplicación de los tratamientos.

Los residuos provienen de una distribución normal.

Este supuesto asume que las variables error $\varepsilon_{ij}$ se distribuyen normal indepentientes con media cero y varianza constante MATH. Este supuesto se debe probar utilizando los residuales MATH

¿Cómo se obtiene el residual?

se conoce que el modelo es

MATH

Y el modelo ajustado $\widehat{Y}_{ij}$ se obtiene reemplazando en el valor esperado del modelo MATH los parámetros MATH y $\beta_{..}$por sus estimadores MATH y $\widehat{\beta}$ respectivamente

MATH

y asi el residual es dado por

MATH

Después de calculados los $e_{ij}$ se procede a probar por los métodos conocidos los supuestos de:

Si la hipótesis nula es rechazada al $\alpha=0.025$, se debe asumir que la covariable es ``afectada'' por los tratamientos.

$\left( i\right) $ La normalidad

$\left( ii\right) $ La independencia

$\left( iii\right) $ Igualdad de varianza

Es bien conocido que el método de mínimos cuadrados es óptimo solamente si las observaciones son normalmente distribuidas.
¿Qué hacer si las observaciones no son normalmente distribuidas? La respuesta obvia es reemplazar el método de mínimos cuadrados por cualquier método "robusto" como por ejemplo la estimación $M$ (Huber, 1964).

Cómo citar este material

La cita para este recurso está presentada en formato APA. Cópiela para su reutilización

Mendoza, H, Bautista, G. (2002). Diseño Experimental. Universidad Nacional de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2000352/. Licencia: Creative Commons BY-NC-ND.
Universidad Nacional de Colombia
Carrera 30 No 45-03 - Edificio 477
Bogotá D.C. - Colombia

Aviso Legal - Copyright