FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2...

15
O, en forma más compacta, Intervalo de confianza para β 1 a 100() %: Β 1 t α / 2 (3.8) Observe un rasgo importante de los intervalos de confianza dados en (3.6) y (3.8): en ambos casos la amplitud del intervalo de confianza es proporcional al error estándar del estimador. Es decir, entre más grande sea el error estándar, más amplio será el intervalo de confianza. Expresado de otra forma, mientras más grande sea el error estándar del estimador, mayor será la incertidumbre de estimar el verdadero valor del parámetro desconocido. Así, el error estándar de un estimador suele describirse como una medida de la precisión del estimador. De vuelta al ejemplo de regresión el salario promedio por hora (Y) y el nivel de escolaridad (X), recuerde que en la tabla 3.2 descubrimos que β 2 = 0.7240; = 0.0700. Como hay 13 observaciones, los grados de libertad (gl) son 11. Si suponemos que α = 5%, es decir, un coeficiente de confianza a 95%, entonces la tabla t muestra que para 11 gl el valor crítico t α / 2 = 2.201. Al sustituir estos valores en (3.5), el estudiante debe verificar que el intervalo de confianza para β 2 a 95% sea el siguiente:

Transcript of FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2...

Page 1: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

O, en forma más compacta,Intervalo de confianza para β1 a 100() %:

Β1 tα / 2 (3.8)Observe un rasgo importante de los intervalos de confianza dados en (3.6) y (3.8): en ambos casos la amplitud del intervalo de confianza es proporcional al error estándar del estimador. Es decir, entre más grande sea el error estándar, más amplio será el intervalo de confianza.

Expresado de otra forma, mientras más grande sea el error estándar del estimador, mayor será la incertidumbre de estimar el verdadero valor del parámetro desconocido. Así, el error estándar de un estimador suele describirse como una medida de la precisión del estimador.De vuelta al ejemplo de regresión el salario promedio por hora (Y) y el nivel de escolaridad (X), recuerde que en la tabla 3.2 descubrimos que β2 = 0.7240; = 0.0700. Como hay 13 observaciones, los grados de libertad (gl) son 11. Si suponemos que α = 5%, es decir, un coeficiente de confianza a 95%, entonces la tabla t muestra que para 11 gl el valor crítico tα / 2 = 2.201. Al sustituir estos valores en (3.5), el estudiante debe verificar que el intervalo de confianza para β2 a 95% sea el siguiente:

Page 2: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

0.5700 ≤ β2 ≤ 0.8780 (3.9)O, con la ecuación (3.6), es:

0.7240 2.201 (0.0700)Es decir,

0.7240 0.1540 (3.10)La interpretación de este intervalo de confianza es: Dado el coeficiente de confianza de 95%, en 95 de cada 100 casos, los intervalos como la ecuación 3.9 contendrán al verdadero valor de β2. Pero, como ya advertimos, no se puede afirmar que la probabilidad de que el intervalo especifico de la ecuación (3.9) contenga al verdadero β2 sea de 95%, porque este intervalo es ahora fijo y no aleatorio; por consiguiente, β2 se encontrará o no dentro de él: la probabilidad de que el intervalo fijo especifico incluya al verdadero de β2 es por consiguiente 1 o 0.

Page 3: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Según la ecuación (3.7) y los datos de la tabla 3.2, el estudiante puede verificar fácilmente que el intervalo de confianza para β1 a 95% en este ejemplo es:-1.8871 ≤ β1 ≤ 1.8583 (3.11)

Una vez más, se debe tener cuidado al interpretar este intervalo de confianza. En 95 de cada 100 casos, los intervalos como la ecuación (3.11) contendrán al verdadero valor de β1; la probabilidad de que este intervalo fijo en particular incluye al verdadero β1 es de 1 o 0.Intervalo de confianza para β1 y β2 simultáneamente.Hay ocasiones en que se necesita construir un intervalo de confianza conjunto para β1 y β2 tal que, para un coeficiente de confianza () de, por ejemplo, 95% tanto β1 como β2 caigan al mismo tiempo dentro de ese intervalo.

4.- Intervalo de confianza para σ2

Como señalamos anteriormente según el supuesto de normalidad, la variable.

X2 = (n - 2) (4.1)

Page 4: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

FIGURA 1Intervalo de confianza a 95% para x2 (11gl).

Den

sida

d

2.5%

2.5%

F(x2 )

x2

3.8157 21.9200X2

0.975

X2

0.025

Page 5: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Sigue la distribución x2 con n – 2 gl. Por tanto, con la distribución x2 se establece el intervalo de confianza para σ2

(4.2)

Donde el valor de x2 en medio de esta doble desigualdad es igual a la planteada en (4.1), y donde y son dos valores de x2 (los valores críticos x2) obtenidos de la tabla ji cuadrad para n – 2 gl de manera que ellos cortan 100(α/2) % de las áreas de las colas de la distribución x2, como se muestra en la figura 1.

Page 6: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Al sustituir x2 de (4.1) en (4.2) y reorganizar los términos, obtenemos.Pr = (4.3)Que da el intervalo de confianza a 100 (1 - α) % para .

Continuamos con el ejemplo de salarios y nivel de escolaridad: se encontró en la tabla 3.2 que para los datos se tiene = 0.8936. Si seleccionamos α de 5%, la tabla ji cuadrada para 11 gl da los siguientes valores críticos = 21.9200 y = 3.8157. Estos valores muestran que la probabilidad de que un valor ji cuadrada sea superior a 21.9200 es 2.5%, y la de 3.8157 es 97.5%. Por consiguiente, el intervalo entre dos valores es el intervalo de confianza para x2 a 95%, como se aprecia en el diagrama de la figura 1. (Observe la característica asimétrica de la distribución ji cuadrada.)Al sustituir los datos del ejemplo en (4.3), el estudiante verificará que el intervalo de confianza para a 95% es el siguiente:

Page 7: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

-0.4484 ≤ ≤ 2.5760 (4.4)La interpretación de este intervalo es la siguiente: Si establecemos límites de confianza a 95% sobre y afirma a priori que entre estos límites caerá el verdadero , acertaremos, a la larga, 95% de las veces.

5.- Prueba de hipótesis: comentarios generales.Tras estudiar el problema de la estimación puntual y por intervalos, ahora consideraremos el tema de las pruebas de hipótesis.El problema de las pruebas de hipótesis estadísticas puede plantearse sencillamente de la siguiente manera: ¿es compatible o no lo es una observación o un hallazgo dados, según algunas hipótesis planteadas? La palabra “compatible” se utiliza aquí en el sentido de que la observación es lo “bastante” cercana al valor hipotético, de forma que no se rechaza la hipótesis planteada.Así, si alguna teoría o experiencia previa lleva a creer que el verdadero coeficiente de la pendiente β2 en el ejemplo salarios y nivel de escolaridad es la unidad, ¿es el β2 = 0.724 obtenido de la muestra de la tabla 3.2 consistente con la hipótesis planteada? De ser así, no se rechaza la hipótesis; de lo contrario, se puede rechazar.

Page 8: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

En el lenguaje de estadística, la hipótesis planteada se conoce como hipótesis nula, y se denota con el símbolo H0. La hipótesis nula suele probarse frente a una hipótesis alternativa (también conocida como hipótesis mantenida) denotada con H1, que puede plantear, por ejemplo, que el verdadero β2 es diferente a la unidad. La hipótesis alternativa puede ser simple o compuesta.

Por ejemplo, H1: β2 = 1.5 es una hipótesis simple, pero H1: β2 ≠ 1.5 es una hipótesis compuesta.La teoría de pruebas de hipótesis se refiere al diseño de reglas o procedimientos que permiten decidir si se rechaza o no la hipótesis nula. Hay dos métodos mutuamente complementarios para diseñar tales reglas: el intervalo de confianza y la prueba de significancia.

Estos dos enfoques plantean que la variable (el estadístico o estimador) en consideración sigue alguna distribución de probabilidad y que la prueba de hipótesis establece afirmaciones sobre el (los) valor (es) del (los) parámetro(s) de tal distribución. Por ejemplo, sabemos que, con el supuesto de normalidad, β2 esta normalmente distribuida con media igual a β2 y varianza dada.

Si formulamos la hipótesis de que β2 = 1, se hace una afirmación sobre uno de los parámetros de la distribución normal, por ejemplo, la media.

Page 9: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

6.- Prueba de hipótesis: método del intervalo de confianza .-Prueba bilateral o de dos

colas.- Para ilustrar el enfoque del método de confianza, una vez más nos referimos al ejemplo de salarios y nivel de escolaridad. Por los resultados de la regresión obtenidos., sabemos que el coeficiente de pendiente es 0.7240. Supongamos que se postula que:

H0: β2 = 0.5H1: β2 ≠ 1.5

Es decir, el verdadero coeficiente de la pendiente es 0.5 según la hipótesis nula, pero menor o mayor que 0.5 según la hipótesis alternativa. La hipótesis nula es una hipótesis simple, mientras que la hipótesis alternativa es compuesta; y, en la práctica, se conoce como hipótesis bilateral.

Page 10: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

FIGURA 2Intervalo de confianza para β2 a 100(1 – α) %.

β2 - t α/2 ee(β2 ) β2 + t α/2 ee(β2 )

Los valores de β2 que se encuentran dentro de este intervalo son posibles en H0 con 100 100(1 – α) % de confianza. Por tanto, no se rechaza H0 si β2 se encuentra en esta región.

Page 11: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Con mucha frecuencia, dicha hipótesis alternativa bilateral refleja el hecho de que no se tiene una expectativa a priori o teórica solida sobre la dirección en la cual debe moverse la hipótesis alternativa respecto de la hipótesis nula.

¿Es el β2 observado compatible con H0? Para responder, consultaremos el intervalo de confianza (5.3.9). Sabemos que, a la larga, los intervalos como (0.5700, 0.8780) contendrán al verdadero β2 con una probabilidad de 95%. En consecuencia, a la larga (es decir, en muestreo repetido), tales intervalos proporcionan un recorrido o limites dentro de los cuales puede encontrarse el verdadero β2 con un coeficiente de confianza de 95%. Así, el intervalo de confianza proporciona un conjunto de hipótesis nulas posibles. Por consiguiente, se el β2 en H0 se encuentra por fuera del intervalo, se puede rechazar. Este intervalo se ilustra esquemáticamente en la figura 2.

Page 12: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Regla de decisión Construya un intervalo de confianza para β2 a 100(1 - α) %. Si el β2 en H0 se encuentra dentro de este intervalo de confianza, no rechace, pero si esta fuera del intervalo, rechace H0.

En estadística, cuando se rechaza la hipótesis nula, se dice que el hallazgo es estadísticamente significativo. Por otra parte, cuando no se hace, se dice que el resultado no es estadísticamente significativo.

Algunos autores utilizan frases como “muy significativo desde un punto de vista estadístico”. Con este término, por lo general se refieren a que, cuando rechazan la hipótesis nula, la probabilidad de cometer un error tipo 1 (por ejemplo, α) es un número pequeño, usualmente 1%. Pero, como demostrará el análisis del valor p, es mejor dejar que el investigador califique el hallazgo estadístico como “significativo”, “moderadamente significativo” o “muy significativo”.

Page 13: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

Prueba unilateral o de una cola.- Algunas veces tenemos una expectativa a priori o teórica solida (o existen expectativas basadas en algún trabajo empírico previo) de que la hipótesis alternativa es unilateral o unidireccional, en lugar de ser bilateral o de dos colas, como acabamos de analizar. Así, para el ejemplo de los salarios y el nivel de escolaridad, se puede postular que.H0: β2 ≤ 0.5 y H1: β2 > 0.5

7.- Pruebas de hipótesis: enfoque de la prueba de significancia.-Prueba de significancia de los coeficientes de regresión: la prueba t.Un enfoque alterno pero complementario al de intervalo de confianza para probar hipótesis estadísticas es el método de la prueba de significancia, desarrollado en forma independiente por R.A. Fisher y conjuntamente por Neyman y Pearson.

En términos generales, una prueba de significancia es un procedimiento que utiliza los resultados muéstrales para verificar la verdad o falsedad de una hipótesis nula

Page 14: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

La idea básica de las pruebas de significancia es la de un estadístico de prueba (un estimador) y su distribución muestral según la hipótesis nula. La decisión de aceptar o rechazar H0 se toma con base en el valor del estadístico de prueba obtenido con los datos disponibles.Como ilustración, recuerde que, según el supuesto de normalidad, la variable

Sigue la distribución t con n – 2 gl. Si el valor del verdadero β2 se especifica con la hipótesis nula, el valor t de (3.2) se calcula fácilmente a partir de la muestra disponible y, por consiguiente, sirve como estadístico de prueba. Y como este estadístico de prueba sigue una distribución t, caben afirmaciones sobre los intervalos de confianza como la siguiente:

Page 15: FIGURA 1 Intervalo de confianza a 95% para x 2 (11gl). Densidad 2.5% F(x 2 ) x2x2 3.815721.9200 X 2 0.975 X 2 0.025.

(7.1)

Donde es el valor de en H0 y son los valores de t (los valores críticos de t) obtenidos de la tabla t para un nivel de significancia () y n – 2 gl

Pr[] = Que da el intervalo en el cual se encontrará con probabilidad 1 - , dado = . En el lenguaje de prueba de hipótesis, el intervalo de confianza a 100(1 - α) % establecido en (7.2) se conoce como la región de aceptación (de la hipótesis nula), y la (s) región (es) que queda (n) fuera del intervalo de confianza se llama (n) región (es) de rechazo (de H0) o región (es) critica (s).Como ya mencionamos, los límites de confianza dados por los puntos extremos del intervalo de confianza se llaman también valores críticos.Veamos de nuevo el ejemplo de los salarios y el nivel de escolaridad. Sabemos que = 0.7240, ee() = 0.0700 y gl = 11. Si suponemos α = 5%, iα/2 = 2.201.Veamos de nuevo el ejemplo de los salarios y el nivel de escolaridad. Sabemos que = 0.7240, ee() = 0.0700 y gl = 11. Si suponemos α = 5%, iα/2 = 2.201.