ANÁLISIS DE ALGORITMOS DE PRUEBAS DE BONDAD DE AJUSTE
En otras palabras lo que se desea es probar la hipótesis que un modelo de probabilidad teórico (normal, exponencial, poissón etc) en particular será un modelo satisfactorio de la población en estudio.
Este ajuste de los datos a un modelo de distribución de probabilidad se puede realizar por medio de las pruebas estadísticas más conocidas como pruebas de bondad de ajuste tales como la chi cuadrado y la de Kolmogor-smirnov.
PRUEBA DE BONDAD DE AJUSTE CHI CUADRADO
El procedimiento de la prueba requiere una muestra aleatoria de tamaño n proveniente de la población cuya distribución de probabilidad es desconocida. Estas n observaciones se pueden distribuir en k intervalos de clases y pueden ser representadas en histogramas.
La prueba se puede utilizar tanto para distribuciones discretas como para distribuciones continuas.
La prueba se puede sintetizar en los siguientes pasos.
1. Se colocan los n datos históricos (muéstrales) en una tabla de frecuencia de la siguiente manera:
Se busca en cuantos intervalos de clases se puede distribuir los datos en estudio lo cual se puede hacer o alternativamente es muy común utilizar las encontrar el número de intervalos se aplica la regla de sturges: m =1+3,3 log n donde n es el número de datos
Luego encontramos el rango el cual es la diferencia entre el mayor valor y el menor valor. R=Xmax-Xmin
Amplitud de cada intervalo está dado por A= Rango/ Número de intervalos
se obtienen las frecuencias observadas en cada intervalos se calcula la media, la varianza y las desviación estándar.
2. Se propone una distribución de probabilidad una distribución de probabilidad de acuerdo con la tabla de frecuencia o con la curva que muestre un histograma o polígono de frecuencia.
3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno de los intervalos (FEi) de la siguiente manera:
Si la variable es continua se halla mediante la integración de la distribución propuesta y luego se multiplica por el número total de datos.
Si la variable es continua se utiliza de modelo matemático de la distribución propuesta y se evalúan todas las categorías y luego se multiplica por el número total de datos.
4. Se calcula el estadístico de prueba
Nota: El estadístico de prueba tiene distribución Chi cuadrado con, m-k-1 grados de libertad, siempre que las frecuencias esperadas sean 5 o más para todas las categorías
5. Si el estimador C es menor o igual al valor correspondiente X2 con m-k-1 grados de libertad (K= números de parámetros estimados de la distribución propuesta estimada por los estadísticos muéstrales) y a un nivel de confiabilidad de 1-α, entonces no se puede rechazar la hipótesis de que los datos siguen la distribución que se propuso.
RECOMENDACIONES IMPORTANTES
Un aspecto que debe notarse es el relacionado con la magnitud de las frecuencias esperadas. Si estas frecuencias son muy pequeñas, entonces el estadístico X2 no reflejará el alejamiento entre lo observado y lo esperado, si no solo la pequeña magnitud de las frecuencias esperadas. La prueba de bondad de ajuste chi cuadrado tal vez nos sea el mejor procedimiento cuando al variable es continua.
EJEMPLO



PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV SMIRNOV
Es aplicable solamente a variables aleatorias continuas
Comparar la gráfica de la distribución empírica acumulada con la correspondiente gráfica de la función de densidad acumulada de la distribución teórica propuesta.
Si hay un acercamiento entre las gráficas existe una probabilidad de que la distribución teórica se ajusta a los datos.
El hecho de que utiliza la distribución de probabilidad acumulada la hace un poco más eficiente que la prueba anterior
La metodología de la prueba es la siguiente:
1. Se colocan los n datos históricos en una tabla de frecuencias con intervalos o utilizando la formula de de Struges: K=1+3.3log n; donde n es el número de datos de la muestra.
a. Encuentre la amplitud del intervalo de clase
b. Para cada intervalo se tendrá la frecuencia observada i (FOi). Se calcula la media y la varianza de los datos
2. Se encuentra la probabilidad observada (POi), dividiendo la frecuencia observada de cada intervalo por el número total de datos.
3. Se calcula la probabilidad acumulada observada de cada intervalo (PAOi) del paso 2
4. Se propone una distribución de probabilidad de acuerdo con la forma de tabla de frecuencia obtenida en 1. O con la gráfica de los datos.
5. Con la función acumulada de la distribución propuesta, se calcula la probabilidad esperada acumulada para cada intervalo (PEAi) mediante la integración de la distribución propuesta.
6. Se calcula la probabilidad acumulada (PAEi) para cada intervalo de clase.
7. Se calcula el valor absoluto entre la diferencia de PAO y PAE para cada intervalo y se selecciona la máxima diferencia, llamándola MD
8. El estimador MD se comporta con un valor límite correspondiente a la (tabla que contiene los valores críticos de kolmogorov-Smirnov). Con n datos y a un nivel de confianza de 1−α . Si el estimador MD es menor o igual al valor límite de la tabla, entonces se acepta ha hipótesis de que la información histórica sigue la distribución propuesta.
EJEMPLO




OPINIÓN
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos disponibles se ajustan a una determinada distribución por lo que se puede entender por bondad de ajuste a la asimilación de los datos observados de una variable a una función matemática previamente establecida y reconocida.
La prueba de Chi Cuadrado se basa en la comparación entre la frecuencia observada en un intervalo de clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la distribución teórica considerada. Es decir, se trata de determinar si las frecuencias observadas en la muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula formulada.
Prueba de kolmogorov smirnov Esta permite establecer si dos muestras se ajustan al mismo modelo probabilístico, es válido para distribuciones continuas y sirve tanto para muestras grandes como para muestras pequeñas.
BIBLIOGRAFIA:
http://www.unamerida.com/archivospdf/337%20Lectura6.1.pdf
http://metabase.uaem.mx/bitstream/handle/123456789/556/3.-_Pruebas_de_bondad_de_ajuste.pdf?sequence=1
https://carlosmarquez.files.wordpress.com/2012/02/prueba-de-bondad-de-ajuste.pdf