Unidad 4: ANÁLISIS DE COVARIANZA
Supuestos del Modelo
El modelo de covarianza supone que
Existe relación lineal entre la covariable y
la respuesta
,
es decir,
Cómo probar que no hay relación lineal entre y
o
no hay efecto de la covariable?.
La hipótesis que se debe plantear es
Se debe observar en la tabla de ANOVA el renglón correspondiente a la causa de variación Regresión
Causa de Variación | gl. | SC | CM | E(CM) |
Regresión | ![]() |
![]() |
![]() |
![]() |
Y el renglón correspondiente al Error
![]() |
![]() |
![]() |
![]() |
Se observa que bajo la esperanza del cuadrado medio de la regresión es
E(CM
)
.
Luego para probar
se usa
Si se rechaza implica que el ajuste por covariable no se requiere.
¿Cómo observar gráficamente el cumplimiento de este supuesto?
Haga un gráfico de dispersión entre la variable respuesta y la covariable X sin tener en cuenta los tratamientos y se debe observar que los puntos se ajustan a una línea recta (o curvilinea).
La relación entre y
es
la misma para cada tratamiento
Es decir, los coeficientes de regresión para cada tratamiento son iguales.
Cómo se prueba el supuesto de que la relación entre y
es
la misma para cada tratamiento?
La hipótesis que se debe plantear es
Es decir que si se realiza un análisis de regresión entre la
covariable y la variable respuesta
en cada tratamiento, las pendientes deben ser iguales.
La prueba estadística es
Los grados de libertad del numerador son porque es la resta de los grados de libertad de las dos sumas de cuadrados,
Como esta prueba es considerada preliminar, se puede tomar a en vez de escoger
según lo recomendado por Bancroft (1964).
Si es
rechazada se debe investigar los datos más cercanamente, por ejemplo por
gráfico o prueba formal para ver si el no paralelismo es quizás
debido a un tratamiento. Si esto ocurre se puede eliminar este tratamiento y
proceder al análisis de la manera usual con los otros tratamientos. Si
esta explicación no es plosible entonces es difícil preescribir que
hacer.
En algunos casos el modelo no es demasiado adecuado y entonces se debe usar el modelo
.
En este caso, sin embargo, las comparaciones de los tratamientos dependen solo
de los valores de
para el cual ellos son comparados, lo cual puede ser un poco insatisfactorio y
engorroso.
Haga en un mismo plano cartesiano un gráfico de dispersión entre la variable respuesta y la covariable X para cada tratamiento y si obtienen rectas paralelas entonces indica el cumplimiento del supuesto.
Las covariables no son afectadas por los tratamientos.
Cómo se prueba el supuesto de que las covariables no han sido afectadas por los tratamientos?
La hipótesis a ser probada se puede expresar con
es decir
La covarianza no afecta a los tratamientos
Para visualizar el problema de que las covariables son afectadas por los tratamientos.se presenta la figura.1.
Figura 1. Covarianza afectada por los tratamientos
En este caso valores bajos de son asociados con valores bajos de
para el tratamiento 1
(T
)
y valores altos de
son asociados con valores altos de
para el tratamieno 2
(T
).
Suponga que los tratamientos son variedades de papa y nosotros queremos
comparar la producción de esas variedades usando como covariable el
tamaño de las semillas. Así la variedad 1 tiene semillas
pequeñas de papa y la variedad 2 tiene semillas grandes de papa. Si se
aplicca el análisis de covarianza se podría querer comparar las
variedades al tamaño de semilla de papa
,
un valor que no puede ser obtenido por ambas variedades. Por consiguiente,
este procedimiento no es válido.
Antes se mencionó que si las covariables fueron observadas antes de
aplicar los tratamientos entonces ellas no son afectadas por los tratamientos,
pero es posible que se tenga una situación como la de la figura 1 auque
se observen las covariables antes de aplicar los tratamientos. Esto se
podría deber a las siguientes razones:
.
Debido a una ejecución particular del proceso de aleatorización. En
este caso se debe rechazar este patrón de aleatorización y repetir
el proceso de aleatorización.
Debido a la falta de aleatorización. En este caso uno debería
exponer los motivos del investigador.
El efecto es debido a la casualidad (al azar).
En la práctica, por supuesto, uno puede no distinguir entre y
.
Un método para protegerse uno mismo de esta situación es tomar la
variable
como factor de tratamiento y realizar el ANOVA para un DCA. y considerar la
prueba
Si la hipótesis nula es rechazada al ,
se debe asumir que la covariable es ``afectada'' por los tratamientos. Esta
prueba es importante cuando la covariable es medida después de la
aplicación de los tratamientos.
Los residuos provienen de una distribución normal.
Este supuesto asume que las variables error se distribuyen normal indepentientes con media cero y varianza constante
.
Este supuesto se debe probar utilizando los residuales
¿Cómo se obtiene el residual?
se conoce que el modelo es
Y el modelo ajustado se obtiene reemplazando en el valor esperado del modelo
los parámetros
y
por
sus estimadores
y
respectivamente
y asi el residual es dado por
Después de calculados los se procede a probar por los métodos conocidos los supuestos de:
Si la hipótesis nula es rechazada al ,
se debe asumir que la covariable es ``afectada'' por los tratamientos.
La
normalidad
La independencia
Igualdad de varianza
Es bien conocido que el método de mínimos cuadrados es óptimo
solamente si las observaciones son normalmente distribuidas.
¿Qué hacer si las observaciones no son normalmente distribuidas? La
respuesta obvia es reemplazar el método de mínimos cuadrados por
cualquier método "robusto" como por ejemplo la estimación (Huber, 1964).