jueves, 7 de abril de 2011

aNOVa

 
ANOVA
                                            Análisis  de  varianza

CarolinaS
05/04/2011

     
Es  una sigla estadística que se refiere al análisis  de una varianza Anova( según  terminología inglesa) . Es la unión de varias  técnicas y instrumentos  estadísticos  en el que la varianza forma  parte  esencial para su estudio. 
Fue  introducida  una dentro de este tema  una tabla fundamental para el análisis de ANOVA.   La tabla  F de Fisher,  por  su creador, en 1920 y 1930  porque es cuando se tiene mas de dos niveles. ‘Análisis de varianza para comparar más de dos muestras’ (Montgomery, 2001, Badii & Castillo, 2007).

Es muy util para resolver problemas ya que por medio de esta se compara múltiples poblaciones o columnas de datos   y la estimación  de  los  componentes de variación( medias ) de un proceso.
Se compara  estos valores basándose  en la varianza global o general, a partir de los grupos de datos numéricos a comparar. Análisis  de varianza en general se emplea para relacionar probabilidades en que la conclusión  de  la media de un conjunto  valores  sea  distinta  a la media de otro conjunto de valores.

Condiciones
Para  utilizar ANOVA se debe tomar  en cuenta las tres condiciones: 
       Si es en modelos fijos,todas las poblaciones deben ser de distribuciones  normales, 
       Todas    las  poblaciones  tienen que tener  la misma varianza  δ12 = δ22  = δ..m²
       Que  las muestras se  seleccionen independientemente( aleatoriamente)  para que por lo tanto  haya independencia de errores experimentales.
Análisis de factor de varianza de una vía
       Un tipo de factor de análisis  en cada grupo.   Ejemplo:  capacitación  a  dos conjuntos de personas distintos.  Es un modelo  en el que  se asignan aleatorio los datos  de un  solo factor.  Cuando la variación   es significativa mente alta  en tratamientos significa  que los tratamientos tienen efectos diferentes  en las poblaciones.
Ejemplo ANOVA
Speedo fabrica bicicletas de turismo para verdaderos ciclistas.  El ingeniero jefe de control de calidad decide comparar las velocidades mas altas obtenidas,  utilizando  tres mecanismos de cambios diferentes;  5  ciclistas  experimentados son cronometrados cuando corren con cada uno de los tres mecanismos, los resultados  aparecen aqui. ¿Los datos sugieren una diferencia en las velocidades promedio a un nive l de 1%?



Mecanismo1
Mecanismo 2
Mecanismo 3


Ciclistas  

40                                     51
37


1

2
42
749
38

3
37
53
38

         45
57
41

42
42
40


PROMEDIOS:
41,2
50,4
38,8
 Promedio total   X__   =




SUMA DE CADRADOS  TOTALES

S.CT.
12,01778
56,75111
41,81778

2,15111
30,61778
29,88444

41,81778
90,88444
29,88444

2,35111
183,15111
6,08444

SC.T.            = 
527,41333

Trata mientos :   
               





           4
            5


                               

43,4666667







SCT:   SUMA  DE CUADrADOS TOTALES
SIRVE PARA DETERMINAR LA VARIANZA.   ( X1 – XX_  ) 2    +  ( X2 – XX_  ) 2      +  ( X3 – XX_  ) 2    + …

La variabilidad de  datos es por  naturaleza propia de los valores que analizamos,  pero también es imputable a  niveles o tratamientos si es que afecten de manera desigual  a la variable respuesta. El análisis de la varianza permite considerar instrumentos estadísticos  que separan  la variabilidad debida al azar de la variabilidad  imputable a los tratamientos o niveles.  Estos estadísticos se definen a partir de las variables que configuran las N=n1+n2+...+nk observaciones.



SCE + SCRT=  SCT
SCT =      527.41333

SCTR :   SUMA DE  CUADRADOR DE TRATAMIENTO

  r 1*(  X1_ – XX_  )2     +  r 2 *(  X2_ -  XX_ ) 2 +    r 3 * ( X3_ -  xx_ )2 + ..  .
r  : es   la cantidad  de datos que existen  en cada tratamiento
X1_  media  del  mecanismo de tratamiento 1. 
X2_ “  “ 2.   X3 “ “ 3.

SCTR=  5 (  ( 40,2-43.467)2  + ( 50,4 -  43.46)2  + ( 42  -38,8)2 )
=  409.033


SCE:  SUMA DE CUADRADOS DE ERROR

 (  X11 –X1_)2 + ( X12 – X2_) 2 + ç( X13 -   X3) 2   + 
  SCE =  134.7003

Compruebo con la primera:    S CT = S TR + SCE  para ver si los resultados están bien
SCT =  409.  033  + 134.7003
SCT= 527.4099
CUADRADOS MEDIOS: son la suma de cuadrados  para  los grados de libertad

CMT=     SCT                                       = 527.4133                          =             39. 1952
                   Gl :  n-1                                   15-1

CMTR =    SCTR                                   =  409.033                          =             204.5165
                    Gl :   C-1                                     3-1

CME  =  SCE                                              134. 7003
                Gl :  n-c                                =    15 – 3                             =             11. 225 


F =          CMRT                                            204.5166                         =    17.598
                    CME                                              11. 62145
Razón para  la prueba   de  medias:


F que se  obtiene    al F  crítico,  que se ve en la tabla,    la hipotesis se rechaza.

F  que se obtiene      Fcrítico ,  la hipótesis  se rechaza.
        F crítico = 6,93       F = 17.598

F critico  por tablas



Interpretación :

 No se sugiere aumento de velocidad   promedio, como para profesionales .




 





Bibliografía


       Cuaderno de clase  y aula virtual .


1 comentario: