Pruebas De Varianza Uniformidad E Independencia
-
Upload
instituto-tecnologico-de-pachuca -
Category
Technology
-
view
31.932 -
download
3
description
Transcript of Pruebas De Varianza Uniformidad E Independencia
2.4.2 Pruebas de Varianza
2.4.3 Pruebas de Uniformidad
2.4.4 Pruebas de Independencia
UNIDAD 2 NUMEROS ALEATORIOS Y
PSEUDOALEATORIOS
Otra propiedad que debe satisfacer el conjunto de ri, es que sus números tengan una varianza de 1/12. la prueba que busca determinar lo anterior es la prueba de varianza, que establece las siguientes hipótesis:
H0: σ2ri=1/12
H1: σ2ri≠1/12
2.4.2 Pruebas de Varianza
La prueba de varianza consiste en determinar la varianza de los n números que contiene ri, mediante la ecuación siguiente:
Después se calculan los limites de aceptación inferior y superior con las ecuaciones siguientes:
𝑉ሺ𝑟ሻ= σ (𝑟𝑖 − 𝑟ҧ)2𝑛𝑖=1𝑛− 1
𝐿𝐼𝑉(𝑟) = 𝑋𝛼/2,𝑛−1212(𝑛− 1) 𝐿𝑆𝑉(𝑟) = 𝑋1𝛼/2,𝑛−1212ሺ𝑛− 1ሻ
Si el valor de V(r) se encuentra entre los límites de aceptación, decimos:
No se puede rechazar que el conjunto ri
tiene una varianza de 1/12, con un nivel de aceptación de 1-α;
De lo contrario, se rechaza que el conjunto ri, tiene una varianza de 1/12.
Ejemplo: realizar la prueba de varianza a los 40 números ri de la siguiente tabla. Considerando que n=40 y α=5%, procedemos a calcular la varianza de los números, y los límites de aceptación correspondientes:
0.0449
0.1733
0.5746
0.049 0.8406
0.8349
0.92 0.2564
0.6015
0.6694
0.3972
0.7025
0.1055
0.1247
0.1977
0.0125
0.63 0.2531
0.8297
0.6483
0.6972
0.9582
0.9085
0.8524
0.5514
0.0316
0.3587
0.7041
0.5915
0.2523
0.2545
0.3044
0.0207
0.1067
0.3587
0.1746
0.3362
0.1589
0.3727
0.4145
𝑉ሺ𝑟ሻ= σ (𝑟𝑖 − 𝑟ҧ)2𝑛𝑖=1𝑛− 1 𝑉ሺ𝑟ሻ= σ (𝑟𝑖 − .43184)240𝑖=1 40− 1
𝑉ሺ𝑟ሻ= 0.087034
𝐿𝐼𝑉(𝑟) = 𝑋𝛼/2,𝑛−1212(𝑛− 1)
𝐿𝑆𝑉(𝑟) = 𝑋1𝛼/2,𝑛−1212ሺ𝑛− 1ሻ
𝐿𝐼𝑉(𝑟) = 𝑋0.05/2,39212(39)
𝐿𝑆𝑉(𝑟) = 𝑋1−0.05/2,39212ሺ39ሻ
𝑳𝑰𝑽(𝒓) = 𝟓𝟖.𝟏𝟐𝟎𝟎𝟓𝟒𝟏𝟒𝟔𝟖 = 𝟎.𝟏𝟐𝟒𝟏𝟖𝟖𝟏𝟓
𝑳𝑺𝑽(𝒓) = 𝟐𝟑.𝟔𝟓𝟒𝟑𝟎𝟎𝟑𝟒𝟔𝟖 = 𝟎.𝟎𝟓𝟎𝟓𝟒𝟑𝟑𝟖
Dado que el valor de la varianza: V(r)=0.087034 está entre los limites de aceptación, podemos decir que no se puede rechazar que el conjunto de 40 números ri tiene una varianza de 1/12= 0.08333.
Una de las propiedades más importantes que debe cumplir un conjunto de números ri es la uniformidad . Para comprobar su acatamiento se han desarrollado pruebas estadísticas tales como las pruebas Chi-cuadrada y de Kolmogorov-Smirnov . En cualquiera de ambos cosas, para probar la uniformidad de los números de un conjunto ri es necesario formular las siguientes hipótesis:
La prueba Chi-cuadrada busca determinar si los números del conjunto ri se distribuyen uniformemente en el intervalo (0,1). Para llevar a cabo esta prueba es necesario dividir el intervalo (0,1), en m subintervalos, en donde es recomendable m=√n. Posteriormente se clasifica cada número pseudo aleatorio del conjunto ri en los m intervalos .
Prueba Chi-cuadrada
A la cantidad de números ri que se clasifican en cada intervalo se le denomina frecuencia observada (Oi), y a la cantidad de números ri que se espera encontrar en cada intervalo se le llama frecuencia esperada (Ei); teóricamente, la ri es igual a n/m. A partir de los valores de Oi y Ei se determina el estadístico mediante la ecuación:
𝑋02 = (𝐸𝑖 − 𝑂𝑖)𝐸𝑖𝑚
𝑖=1
Si el valor del estadístico es menor al valor de tablas de , entonces no se puede rechazar que el conjunto de números ri sigue una distribución uniforme. En caso contrario, se rechaza que ri sigue una distribución uniforme.
𝑋02 𝑋𝛼,𝑚−12
0.347 0.832 0.966 0.472 0.797 0.101 0.696 0.966 0.404 0.603
0.993 0.371 0.729 0.067 0.189 0.977 0.843 0.562 0.549 0.992
0.674 0.628 0.055 0.494 0.494 0.235 0.178 0.775 0.797 0.252
0.426 0.054 0.022 0.742 0.674 0.898 0.641 0.674 0.821 0.19
0.46 0.224 0.99 0.786 0.393 0.461 0.011 0.977 0.246 0.881
0.189 0.753 0.73 0.797 0.292 0.876 0.707 0.562 0.562 0.821
0.112 0.191 0.584 0.347 0.426 0.057 0.819 0.303 0.404 0.64
0.37 0.314 0.731 0.742 0.213 0.472 0.641 0.944 0.28 0.663
0.909 0.764 0.999 0.303 0.718 0.933 0.056 0.415 0.819 0.444
0.178 0.516 0.437 0.393 0.268 0.123 0.945 0.527 0.459 0.652
Ej. Realizar la prueba de chi-cuadrada a los siguientes 100 números de un conjunto ri, con un nivel de confianza del 95%
𝑚 = ξ𝑛 = 10
Intervalo Oi
E i=n/m
( Ei-Oi)²/Ei
[0.00-0.10) 7 10 0.9
[0.10-0.20) 9 10 0.1
[0.20-0.30) 8 10 0.4
[0.30-0.40) 9 10 0.1
[0.40-0.50) 14 10 1.6
[0.50-0.60) 7 10 0.9
[0.60-0.70) 11 10 0.1
[0.70-0.80) 14 10 1.6
[0.80-0.90) 9 10 0.1
[0.90-1.00) 12 10 0.4
6.2
Cálculos para la prueba chi-cuadrada
El estadístico =6.2 es menor al estadístico correspondiente de la chi- cuadrada =16.9. En consecuencia, no se puede rechazar que los números ri siguen una distribución uniforme.
𝑿𝟎𝟐
𝑿𝟎.𝟎𝟓,𝟗𝟐
Propuesta por Kolmogorov-Smirnov, esta es una prueba estadística que también nos sirve para determinar si un conjunto ri cumple la propiedad de uniformidad. Es recomendable aplicarla en conjuntos ri pequeños, por ejemplo n<20. El procedimiento es el siguiente:
2.4.3.2 Prueba de Kolmogorov-Smirnov
1. Ordenar de menor a mayor los números del conjunto ri.
r1≤r2 ≤r3 ≤… ≤rn
2. Determinar los valores de D+, D- y D con las siguientes ecuaciones:
𝑫+ = 𝐦𝐚𝐱𝟏<𝒊<𝒏൜𝒊𝒏− 𝒓𝒊ൠ
D= máx. (D+,D-)3. Determinar el valor critico de acuerdo
con la tabla de valores críticos de Kolmogorov para un grado de confianza α, y según el tamaño de la muestra n.
𝑫− = 𝐦𝐚𝐱𝟏<𝒊<𝒏൜𝒓𝒊 − 𝒊− 𝟏𝒏 ൠ
4. Si el valor D es mayor que el valor critico
Se concluye que los números del conjunto ri no siguen una distribución uniforme; de lo contrario se dice que no se ha detectado diferencia significativa entre la distribución de los números del conjunto ri y la distribución uniforme.
ri= {.97, 0.11, 0.65, 0.26, 0.98, .03, 0.13, 0.89, 0.21, 0.69}
Ej. Realizar una prueba de Kolgomorov-Smirnov, con un nivel de confianza de 90%, al siguiente conjunto ri de 10 números
Para determinar los valores de D+, D- y D es recomendable realizar una tabla como la siguiente:
i 1 2 3 4 5 6 7 8 9 10
i/n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
ri 0.03 0.11 0.13 0.21 0.26 0.65 0.69 0.89 0.97 0.98
i-1/n 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
i/n-ri 0.07 0.09 0.17 0.19 0.24-0.05 0.01
-0.09
-0.07 0.02
ri- (i-1)/n 0.03 0.01
-0.07
-0.09
-0.14 0.15 0.09 0.19 0.17 0.08
n 10
D+ 0.24 D- 0.19 D 0.24
De acuerdo con la tabla de valores para la prueba de Kolmogorov-Smirnov, el valor crítico correspondiente a n=10 es =0.368, que resulta mayor al valor D=.24; por lo tanto, se concluye que los números del conjunto ri, se distribuyen uniformemente.
𝑫𝟎.𝟏𝟎,𝟏𝟎 𝑫𝟎.𝟏𝟎,𝟏𝟎
Las dos propiedades más importantes que deben satisfacer los números de un conjunto ri son uniformidad e independencia. A continuación hablaremos de las pruebas estadísticas que tratan de corroborar si los números en el intervalo (0,1) son independientes o, en otras palabras, si parecen pseudo aleatorios. Para probar la independencia de los números de un conjunto ri primero es preciso formular las siguientes hipótesis:
H0: los números del conjunto ri son
independientesH1: los números del conjunto ri no son
independientes
El procedimiento de esta prueba consiste en determinar una secuencia de números (S) que sólo contiene unos y ceros, de acuerdo con una comparación entre ri y ri-1. La secuencia de unos y ceros se construye de esta manera: se coloca un cero si el número ri es menor que o igual al número ri anterior; en caso de ser mayor que el número ri anterior, se pone un uno. Posteriormente se determina el número de corridas observadas, C0 (una corrida se identifica como la cantidad de unos y ceros consecutivos). Luego se calcula el valor esperado, la varianza del número de corridas y el estadístico Z0, mediante las ecuaciones:
Si el estadístico Z0 es menor que el valor crítico de Z∞/2, se concluye que los números del conjunto ri son independientes y se acepta H0.
Ejemplo Realizar la prueba de corridas arriba y abajo con
un nivel de aceptación de 95% al siguiente conjunto de números ri:
Realizaremos la asignación de unos y ceros por renglón (o fila). Por lo tanto, la secuencia S es:
S = {1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0}
0.34
0.83
0.96
0.47
0.79
0.99
0.37
0.72
0.06
0.18
0.67
0.62
0.05
0.49
0.59
0.42
0.05
0.02
0.74
0.67
0.46
0.22
0.99
0.78
0.39
0.18
0.75
0.73
0.79
0.29
0.11
0.19
0.58
0.34
0.42
0.37
0.31
0.73
0.74
0.21
Obteniéndose un valor de C0 = 24, y ∞ = 5%. A continuación se presentan los cálculos correspondientes al valor esperado y a la varianza del número de corridas:
Como el estadístico Z0 es menor que el valor de tabla de la normal estándar para Z∞/2 Z5%/2 = 1.96, se acepta H0 y se concluye que los números del conjunto ri son independientes. Es decir, de acuerdo a esta prueba, los números son aptos para usarse en simulación.
El procedimiento de esta prueba consiste en determinar una secuencia de unos y ceros, de acuerdo con una comparación entre los números del conjunto ri y 0.5. Posteriormente se determina el número de corridas observadas C0, y los valores de n0 y n1. C0 es el número de corridas en la secuencia, determinado de la misma manera que en la prueba de corridas arriba y abajo; n0 es igual a la cantidad de ceros en la secuencia, y n1 es igual a la cantidad de unos en la secuencia, cumpliéndose que n0 + n1 = n. Luego se calcula el valor esperado, la varianza del número de corridas y el estadístico Z0 con las siguientes ecuaciones:
Si el estadístico Z0 está dentro del intervalo: -Z∞/2 Z0 Z∞/2 se concluye que los números del conjunto ri son independientes. De lo contrario se rechaza que el conjunto de ri es independiente (se rechaza H0).
Ejemplo Realizar la prueba de corridas arriba y abajo, con
un nivel de aceptación de 95%, al siguiente conjunto de números ri:
Construiremos la secuencia de unos y ceros por renglón quedado de la siguiente manera:
S = {1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1}
0.809
0.042
0.432
0.538
0.225
0.88 0.688
0.772
0.036
0.854
0.397
0.268
0.821
0.897
0.07 0.721
0.087
0.35 0.779
0.482
0.136
0.855
0.453
0.197
0.444
0.799
0.809
0.691
0.545
0.857
0.692
0.055
0.348
0.373
0.436
0.29 0.015
0.834
0.599
0.724
0.564
0.709
0.946
0.754
0.677
0.128
0.012
0.498
0.6 0.913
A partir de la secuencia anterior se determina que hay 21 corridas, 23 ceros y 27 unos. Por lo tanto, C0=21, n0=23 y n1=27. A continuación se presentan los cálculos del valor esperado y de la varianza del número de corridas:
Como valor de Z0 cae dentro del intervalo
-1.96 Z0=-1.2484146 1.96 se dice que los números del conjunto ri son independientes con un nivel de confianza de 95% (se acepta H0). De acuerdo con esta prueba, el conjunto de números ri se puede usar en un estudio de simulación.
Esta prueba consiste en visualizar el número ri con cinco decimales (como si fuera una mano del juego de póker, con 5 cartas), y clasificarlo como: todos diferentes (TD), exactamente un par (1P), dos pares (2P), una tercia (T), una tercia y un par (TP), póker (P) y quintilla (Q).
Ejemplos:ri = 0.69651 un par (1P)
ri = 0.13031 dos pares (2P)
ri = 0.98898 una tercia y un par (P)
La prueba póker se puede realizar a números ri con tres, cuatro y cinco decimales. Para ri con tres decimales solo hay tres categorías de clasificación: todos diferentes (TD), un par (1P) y una tercia (T). Cuando se consideran ri con cuatro decimales se cuenta con cinco opciones para clasificar los números: todos diferentes (TD), exactamente un par (1P), dos pares (2P), una tercia (T) y póker (P).
Prueba póker para números con cinco decimales
La prueba póker requiere el estadístico de la distribución Chi-cuadrada X2
∞,6 para números con cinco decimales.
El procedimiento de la prueba consiste en:a) Determinar la categoría de cada número del conjunto ri.
b) Contabilizar los números ri de la misma categoría o clase para obtener la frecuencia observada (0i).
Categoría Probabilidad Ei
Todos diferentes (TD) 0.3024 0.3024nExactamente un par (1P) 0.5040 0.5040nDos pares (2P) 0.1080 0.1080nUna tercia y una par (TP) 0.0090 0.0090nTercia (T) 0.0720 0.0720nPóker (P) 0.0045 0.0045nQuintilla (Q) 0.0001 0.0001n
c) Calcular el estadístico de la prueba X20 con la ecuación
Donde:
Ei = Frecuencia esperada de números ri en cada categoría
m = Cantidad de categorías o clases en las que se clasificaron los números ri
Oi = Frecuencia observada
d) Comparar el estadístico de X20 con X2
∞,m-1
Si X2
0 es menor que X2∞,m-1 se acepta H0, o sea, que los
números del conjunto ri son independientes. En caso contrario la independencia de los números del conjunto ri se rechaza.
Ejemplo: Realizar la prueba póker, con un nivel de aceptación de
95%, a los siguientes 30 números entre cero y uno, con cinco decimales.
Primero clasificamos cada número del conjunto ri, asignándole las claves que se mencionaron antes.
0.06141 0.72484 0.94107 0.56766 0.14411 0.87648
0.81792 0.48999 0.18590 0.06060 0.11223 0.64794
0.52953 0.50502 0.30444 0.70688 0.25357 0.31555
0.04127 0.67347 0.28103 0.99367 0.44598 0.73997
0.27813 0.62182 0.82578 0.85923 0.51483 0.09099
0.06141
1P 0.72484
1P
0.94107
TD 0.56766
T 0.14411
TP 0.87648
1P
0.81792
TD 0.48999
T 0.18590
TD 0.06060
TP 0.11223
2P 0.64794
1P
0.52953
1P 0.50502
2P
0.30444
T 0.70688
1P 0.25357
1P 0.31555
T
0.04127
TD 0.67347
1P
0.28103
TD 0.99367
1P 0.44598
1P 0.73997
2P
0.27813
TD 0.62182
1P
0.82578
1P 0.85923
TD 0.51483
TD 0.09099
TP
Cálculos de la prueba póker
Categorías Oi E1
Todos diferentes (TD) 8 (0.3034)(30) = 9.072
0.12667
Exactamente un par (1P)
12 (0.5040)(30) = 15.12
0.64380
Dos pares (2P) 3 (0.1080)(30) = 3.24
0.01777
Una tercia y una par (TP)
3 (0.0090)(30) = 0.27
27.6033
Tercia (T) 4 (0.0720)(30) = 2.16
1.56740
Póker (P) 0 (0.0045)(30) = 0.135
0.135
Quintilla (Q) 0 (0.0001)(30) = 0.003
0.003
= 30.0969
El estadístico es mayor que el estadístico correspondiente
de la Chi-cuadrada: En consecuencia, se rechaza que los números del conjunto ri son independientes.
PRUEBA DE SERIESConsiste en comparar los números con el
propósito de corroborar la independencia entre números consecutivos. Las hipótesis básicas son:
H₀: los números del conjunto ri son independientes.
H1: los números del conjunto ri no son independientes.
Pasos:Crear una grafica de dispersión entre los
números consecutivos (ri , rr+1).
Dividir la gráfica en m casillas, siendo m el valor entero más cercano a que permita formar de preferencia una matriz cuadrada.
Se determina la frecuencia observada Oi, contabilizando el numero de puntos en la casilla y su correspondiente frecuencia esperada Ei
ξ𝒏
De acuerdo con Ei = (n-1)/m, donde n-1 es el numero de pares ordenados o puntos en la gráfica.
Calcular el error o estadístico de prueba
Si el valor del error es menor que o igual al estadístico de tablas xα,m-1, no podemos rechazar la hipótesis de independencia entre números consecutivos.
Ejemplo:
Realizar la prueba de series a los siguientes 30 números, con un nivel de confianza de 95%.
0.872 0.950 0.343 0.058 0.384
0.219 0.041 0.036 0.213 0.946
0.570 0.842 0.706 0.809 0.300
0.618 0.152 0.462 0.005 0.203
0.291 0.151 0.596 0.443 0.868
0.913 0.511 0.586 0.608 0.879
Generar la gráfica de dispersión con los 29 pares ordenados(x,y) = (ri , rr+1) siguientes:
(r1,r2)= 0.872 0.219(r2,r3)= 0.219 0.570(r3,r4)= 0.570 0.618(r4,r5)= 0.618 0.291(r5,r6)= 0.291 0.913(r6,r7)= 0.913 0.95
…
(r28,r29)= 0.203 0.868(r29,r30)= 0.868 0.879
Se contabiliza el número de puntos en cada casilla Oi y se calcula la frecuencia esperada Ei de acuerdo Ei = 29/9. en la ultima columna se presenta el calculo del estadístico de prueba.
Intervalo i Oi Ei=(n-1)/m = 29/9
1 3 3.22 0.0152 3 3.22 0.0153 5 3.22 0.9844 3 3.22 0.0155 6 3.22 2.4006 1 3.22 1.5317 5 3.22 0.9848 1 3.22 1.5319 2 3.22 0.462
Total 29 29 7.937
El valor de tablas es mayor que el error total de 7.937, por lo cual no podemos rechazar la hipótesis de independencia.
Prueba de huecosConsiste en comparar los números con el
propósito de verificar el tamaño del “hueco” que existe entre ocurrencias sucesivas de un número; las hipótesis son las fundamentales:
H₀: los números del conjunto ri son independientes.
H1: los números del conjunto ri no son independientes.
Pasos:
Definir un intervalo de prueba(α,β), donde (α,β) є (0,1)
Se construye una secuencia de 1 y 0 de esta manera: se asigna un 1 si el ri pertenece al intervalo (α,β), y un 0 si no pertenece.
Ejemplo: si se define un intervalo (α,β)=(0.6,0.7) y se tiene la muestra de 10 números. ri =(0.67,0 .62, 0.05,0.49,0.59,0.42,0.64,0.06,0.74,0.67) S={1,1,0,0,0,0,1,0,0,1}El tamaño del hueco i se define como el
número de ceros existentes entre unos consecutivos. En en ejemplo tenemos h=3
A partir del conjunto anterior se determina la frecuencia Oi, contabilizando el num. de ocurrencias de cada tamaño de hueco y su correspondiente frecuencia esperada Ei, de acuerdo con
Ei = (h)(β-α)(1-(β-α))i
Frecuencias observadas y esperadas en la prueba de huecos.
Tamaño del EI (h)(β-α)(1-(β-α))i
hueco OI
Ei=(3)(0.7-0.6)(1-(0.7-0.6))i Ei
0 1 (3)(0.1)(0.9)^0 0.31 0 (3)(0.1)(0.9)^1 0.272 1 (3)(0.1)(0.9)^2 0.2433 0 (3)(0.1)(0.9)^3 0.21874 1 (3)(0.1)(0.9)^4 0.19683
≥5 0 (3)(0.9)^5 1.77147TOTAL h=3 h=3 h=3
• Después se procede a calcular el error o estadístico de prueba
Ejemplo: Realizar la prueba de huecos a los siguientes 30 números, con un nivel de confianza de 95% para el intervalo (α,β) =(0.8,1.0)
0.872 0.950 0.343 0.058 0.3840.219 0.041 0.036 0.213 0.9460.570 0.842 0.706 0.809 0.3000.618 0.152 0.462 0.005 0.2030.291 0.151 0.596 0.443 0.8680.913 0.511 0.586 0.608 0.879
Tomando los números por renglón se tiene:
S={1,1,0,0,0,0,0,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1} 0 7 1 1 10 0 3
Prueba de huecos
Tamaño del EI (h)(β-α)(1-(β-α))i (Ei - Oi)2
hueco OI
Ei=(7)(1.0-0.8)(1-(1.0-0.8))i Ei
0 2 1.4 0.2571431 2 1.12 0.6914292 0 0.896 0.8960003 1 0.7168 0.1118894 0 0.57344 0.573440
≥5 2 2.29376 0.037622TOTAL h=7 7 2.567522
Ya que el estadístico de prueba = 2.567522 es menor
que el estadístico de tablas , no podemos rechazar la hipótesis de independencia entre los números.