El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy...

16
no una hipótesis nula depende de α, el nivel de significancia o probabilidad de cometer un error tipo l, o sea, la probabilidad de rechazar la hipótesis cuando es verdadera. Si el error de rechazar la hipótesis nula cuando es verdadera (error tipo l) es costoso en comparación con el error de no rechazar la hipótesis nula cuando es falsa (error tipo ll), será razonable fijar la probabilidad de ocurrencia del primer tipo de error en niveles bajos. Si, por otra parte, el costo de incurrir en el error tipo l es bajo comparado con el costo de cometer el error tipo ll, se justificará que la probabilidad del primer tipo de error sea alta (lo que reduce la probabilidad de incurrir en el segundo tipo de erro). Desde luego, el problema es que pocas veces se conocen los costos de cometer los dos tipos de error. Por tanto, los econometristas tienen por costumbre fijar el valor de α en niveles de 1,5 o 10% como máximo, y escogen un estadístico de prueba que haga que la probabilidad de cometer un error tipo ll sea lo más pequeña posible. Como uno menos la probabilidad de cometer un error tipo ll se conoce como la potencia de la prueba, este procedimiento equivale a maximizar la potencia de la prueba

Transcript of El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy...

Page 1: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Selección del nivel de significancia α.- Del análisis expuesto hasta ahora, debe tenerse claro que rechazar o no una hipótesis nula depende de α, el nivel de significancia o probabilidad de cometer un error tipo l, o sea, la probabilidad de rechazar la hipótesis cuando es verdadera. Si el error de rechazar la hipótesis nula cuando es verdadera (error tipo l) es costoso en comparación con el error de no rechazar la hipótesis nula cuando es falsa (error tipo ll), será razonable fijar la probabilidad de ocurrencia del primer tipo de error en niveles bajos. Si, por otra parte, el costo de incurrir en el error tipo l es bajo comparado con el costo de cometer el error tipo ll, se justificará que la probabilidad del primer tipo de error sea alta (lo que reduce la probabilidad de incurrir en el segundo tipo de erro).

Desde luego, el problema es que pocas veces se conocen los costos de cometer los dos tipos de error. Por tanto, los econometristas tienen por costumbre fijar el valor de α en niveles de 1,5 o 10% como máximo, y escogen un estadístico de prueba que haga que la probabilidad de cometer un error tipo ll sea lo más pequeña posible. Como uno menos la probabilidad de cometer un error tipo ll se conoce como la potencia de la prueba, este procedimiento equivale a maximizar la potencia de la prueba

Page 2: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Nivel exacto de significancia: Valor p.- Como recién mencionamos, el talón de Aquiles del método clásico de la prueba de hipótesis es su arbitrariedad al seleccionar αUna vez obtenido un estadístico de prueba (es decir, el estadístico t) en un ejemplo dado, ¿por qué no tan sólo consultar la tabla estadística adecuada y encontrar la probabilidad real de obtener un valor del estadístico de prueba tan grande o mayor que el obtenido en el ejemplo?

Esta probabilidad se denomina valor p (es decir, valor de probabilidad), también conocida como nivel observado o exacto de significancia, o probabilidad exacta de cometer un error tipo l. Más técnicamente, el valor p se define como nivel de significancia más bajo al cual puede rechazar una hipótesis nula.

Para ilustrar, retomemos el ejemplo de los salarios y el nivel de escolaridad. Con la hipótesis nula de que el verdadero coeficiente del nivel de escolaridad es 0.5, se obtuvo un valor t de 3.2 en la ecuación (5.7.4). ¿Cuál es el valor p de obtener un valor t igual o superior a 3.2?

Page 3: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Como ya mencionamos, si los datos no apoyan la hipótesis nula, el |t| obtenido con tal hipótesis nula será “grande” y, por consiguiente, el valor p de obtener tal |t| será “pequeño”. En otras palabras, para un tamaño de muestra dado, a medida que aumenta |t|, el valor p se reduce y, por consiguiente, se rechaza la hipótesis nula con mayor confianza.¿Cuál es la relación entre el valor p y el nivel de significancia α? Si se adquiere el hábito de fijar α igual al valor p de un estadístico de prueba (es decir, el estadístico t), entonces no hay conflicto entre dos valores. En otros términos, es mejor dejar de fijar α de forma arbitraria en algún nivel y tan solo seleccionar p del estadístico de prueba

Significancia estadística y significancia práctica.- El punto de toda esta exposición es que no se debe confundir la significancia estadística con la significancia práctica o económica. Como afirma Goldberger.Cuando se especifica una hipótesis nula, digamos β1 = 1, lo que se busca es que β1 este cercano a 1, tan cerca que para todos los propósitos prácticos pueda tratarse como si fuera 1. Pero que 1.1 sea “prácticamente lo mismo que” 1.0 es una asunto de economía, no de estadística. El asunto no se resuelve con una prueba de hipótesis, porque el estadístico de prueba [t = ](bj - 1)/σbj mide el coeficiente estimado en unidades de errores estándar, las cuales no tienen significado para medir el parámetro económico βj – 1. Puede ser una buena idea reservar el término “significancia” para el concepto estadístico, y adoptar la palabra “sustancial” para el económico.

Page 4: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados con significancia estadística se reduce mucho, pero los temas de significancia económica adquieren importancia crítica. De hecho, como con muestras grandes se rechazan casi todas las hipótesis nulas, puede haber estudios en los cuales lo único importante sea la magnitud de los valores estimados puntuales.Elección entre los enfoques de intervalos de confianza y pruebas de significancia en las prueba de hipótesis.- En la mayor parte de los análisis económicos aplicados, la hipótesis nula postulada hace las veces de comodín, y el objetivo del trabajo empírico es tumbarlo, es decir, rechazar la hipótesis nula.

Page 5: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Por tanto, en el ejemplo consumo-ingreso, la hipótesis nula de que la PMC β2 = 0 es a todas luces absurda, pero con frecuencia sirve para ejemplificar los resultados empíricos. Parece que a los editores de publicaciones especializadas de renombre no les emociona publicar un trabajo empírico que no rehace la hipótesis nula. De alguna manera, como noticia, es más novedoso el hallazgo de que la PMC sea estadísticamente diferente de cero que el hallazgo de que sea igual a, digamos, 0.7.

Así, J. Bradford De Long y Kevin Lang sostienen que es mejor para los economistasConcentrarse en las magnitudes de los coeficientes e informar sobre los niveles de confianza y no sobre las pruebas de significancia. Si todas, o casi todas, las hipótesis nulas son falsas, no es muy sensato concentrarse en averiguar si una estimación es o no distinguible de su valor predicho con la hipótesis nula. En lugar de esto, deseamos saber que métodos son buenas aproximaciones, para lo cual es necesario conocer los intervalos de los valores de los parámetros excluidos por las estimaciones empíricas.

Page 6: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

9.- Análisis de regresión y análisis de varianza.- En esta sección estudiamos el análisis de regresión desde el punto de vista del análisis de varianza, y nos introduciremos en una forma complementaria de mirar el problema de la inferencia estadística.En anteriores capítulos se elaboro la siguiente identidad.

Es decir, SCT = SCE + SCR, la cual fragmenta la suma de cuadros total (SCT) en dos componentes: la suma de cuadrados explicada (SCE) y la suma de cuadrados de residuos (SCR). El estudio de estos componentes de SCT se conoce como análisis de varianza (ANOVA) desde el punto de vista de la regresión.

Asociados con toda suma de cuadrados están sus gl, es decir, el número de observaciones independientes en las que se basa. La STC tiene n – 1 gl porque se pierde 1 gl en el cálculo de la media muestral. La SCR tiene n – 2 gl. (¿Por qué?) (Nota: Esto sólo es válido para el modelo de regresión con dos variables con presencia del intercepto β1.) SCE tiene 1 gl (de nuevo, esto sólo vale para el caso de dos variables), lo cual se deduce de que SCE = sea una función solo de β2, pues se conoce .

Page 7: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

TABLA 3Tabla ANOVA para el modelo de regresión con dos variables*SC significa suma de cuadrados.t Significa suma de cuadrados promedio, la cual se obtiene al dividir SC entre el número de gl.

Reorganicemos las sumas de cuadrados y sus gl asociados en la tabla 5, que es la forma estándar de la tabla AOV, denominada algunas veces tabla ANOVA. Con la información de la tabal 5, consideramos ahora la siguiente variable:

Fuente de variación SC* gl SCPt

Debido a la regresión (SCE) 1

Debido a los residuos (SCR) n - 2

SCT n - 1

Page 8: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

(9.1)

Si suponemos que las perturbaciones ui están normalmente distribuidas, lo cual se cumple para el MCRLN, y si la nula (H0) es que β2 = 0, puede demostrarse que la variables F de la ecuación (9.1) satisface la distribución F con 1 gl en el numerador y (n -2)gl en el denominador.

¿Qué uso puede hacerse de la razón F anterior? Puede demostrarse que: y (9.2) (9.3)

Page 9: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

(Observe que β2 y σ2 al lado derecho de estas ecuaciones son los verdaderos parámetros.) Por tanto, si β2 es en realidad cero, ambas ecuaciones (9.2) y (9.3) proporcionan estimaciones idénticas del verdadero σ2. En esta situación, la variable explicita X no tiene influencia lineal alguna sobre Y, y toda la variación en Y se explica con las perturbaciones aleatorias ui. Por otra parte, si β2 es diferente de cero, 9.2) y (9.3) serán diferentes y parte de la variación en Y se atribuirá a X. Por consiguiente, la razón F de (9.1) constituye una prueba de la hipótesis nula H0: β2 = 0. Como todas las cantidades que forman parte de esta ecuación se obtiene de la muestra disponible, esta razón F constituye un estadístico de prueba para verificar la hipótesis nula de que el verdadero β2 es igual a cero. Solo debe calcularse la razón F y compararla con el valor crítico F obtenido de las tablas F en el nivel de significancia seleccionado, u obtener el valor p del estadístico F calculado.

TABLA 4Tabla ANOVA para el ejemplo de los salarios y el nivel de escolaridad

Page 10: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Para esclarecer esto, continuamos con el ejemplo ilustración. La tabla ANOVA para este ejemplo se presenta en la tabla 5.4. El valor F calculado es 108.3026. El valor p de este estadístico F correspondiente a 1 y 8 gl no puede obtenerse de la tabla F dada

pero con tablas estadísticas electrónicas se demuestra que el valor p es 0.0000001, una probabilidad en efecto muy pequeña. Si escoge el método del nivel de significancia para la prueba de hipótesis y fija α en 0.01, o en un nivel de 1%, se verá que la F calculada de 108.3026 es obviamente significativa en este nivel. Por tanto, si rechazamos la hipótesis nula de que β2 = 0, la probabilidad de cometer un error tipo l es muy pequeña. Para todo fin práctico, la muestra no puedo prevenir de una población con un valor β2 igual a cero, y se puede concluir con gran confianza que X, la educación, si afecta Y, el salario promedio.

Fuente de variación SC gl SCP

Debido a la regresión (SCE) 95.4255 1 95.4255

Debido a los residuos (SCR) 9.5928 11 0.8811 = 108.3026

SCT 105.1188 12

Page 11: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

establece que el cuadrado del valor t con k gl es un valor F con 1 gl en el numerador y k gl en el denominador. En nuestro ejemplo, si suponemos que H0: β2 = 0, entonces con (3.2) se verifica fácilmente que el valor t estimado es 10.41. Este valor t tiene 11 gl. Según la misma hipótesis nula, el valor F era 108.3026 con 1 y 11gl. De donde (10.3428)2 = valor F, excepto por errores de redondeo.Así, las pruebas t y F proporcionan dos formas alternas, pero complementarias, de probar la hipótesis nula de que β2 = 0. Sé éste es el caso, ¿por qué no solo confiar en la prueba t y no preocuparse por la prueba F y el análisis de varianza que la acompaña? Par el modelo con dos variables, con realidad no es necesario recurrir a la prueba F. Pero cuando consideramos el tema de la regresión múltiple, veremos que la prueba F tiene diversas aplicaciones interesantes que la hacen un método muy útil y eficaz para demostrar hipótesis estadísticas.

10.- Aplicación del análisis de regresión: problema de predicción.- Con base en los datos muéstrales de la tabla 2 obtuvo la siguiente regresión muestral.Yi = -0.0144 + 0.7240X (6.2)Donde Yi es el estimador del verdadero E(Yi) correspondiente a X dada. ¿De qué sirve esta regresión histórica? Para “predecir” o “pronosticar” el salario promedio futuro Y correspondiente a algún nivel dado de escolaridad X. Ahora, hay dos clases de predicciones:

Page 12: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

1.- la predicción del valor de la media condicional de Y correspondiente a un valor escogido X, por ejemplo, X0, que es el punto sobre la línea de regresión poblacional misma.2.- la predicción de un valor individual Y correspondiente a X0. Estas dos predicciones se llaman predicción media y predicción individual.Predicción media

Para ordenar las ideas, suponga que X0 = 20 y deseamos predecir E(Y|X0 = 20). Ahora, puede demostrarse que la regresión histórica (6.2) proporciona la estimación puntual de esta predicción media de la siguiente forma:Y0 = β1 + β2 X0

= -0.0144 + 0.7240(20) (10.1)= 14.4656Donde Y0 = estimador de E(Y|X0). Puede comprobarse que este predictor puntual es el mejor estimador lineal e insesgado (MELI).Como Y0 es un estimador, es probable que éste sea diferente de su verdadero valor. La diferencia entre los dos valores dará alguna idea del error de predicción o pronóstico. Para evaluar este error es necesario encontrara la distribución muestral de Y0.Y0 esta normalmente distribuida con media (β1 + β2 X0) y una varianza dad por la siguiente formula:

Page 13: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

(10.2)Al reemplazar la σ2 desconocida por su estimador ensesgado σ2, vemos que la variable. (10.3)

sigue una distribución t con n – 2 gl. La distribución t sirve por consiguiente para construir intervalos de confianza para el verdadero E(Y|X0) y pruebas de hipótesis acerca de tal valor de la manera usual, a saber,Pr[β1 + β2 X0 - tα/2 ee(Y0)≤ β1 + β2 X0 ≤ β1 + β2 X0 + tα/2 ee(Y0)] = 1 – α (10.4)Donde ee(Y0) se obtiene de (10.2).Para nuestros datos

Page 14: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

= 0.3826ee() = 0.6185

por tanto, el intervalo de confianza a 95% para el verdadero E(Y|X0) = β1 + β2 X0 está dado por 14.4656 – 2.201(.6185) ≤ E(Y0 X = 20) ≤ 14.4656 = 2.20(0.6185)

Page 15: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

FIGURA 6Intervalos (bandas) de confianza para la media de Y y los valores individuales de Y.

00 2 4 6 8 10 12 14 16 18 2220

X

2

4

6

8

10

12

14

16

18

Sala

rio P

rom

edio

Nivel de escolaridadX

Y = - 0.0144 + 0.7240X

14.46

13.10

12.01

15.82

15.82

Intervalo de confianza para Y individual

Intervalo de confianza para la media de Y

Page 16: El punto expresado por Goldberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados.

Es decir,13.1043 ≤ E(Y|X = 20) ≤ 15.8260 (10.5)Así, dado X0 = 100, en muestreo repetido, en 95 de cada 100 intervalos como (10.5) estará el verdadero valor medio; la mejor estimación del verdadero valor medio es, por supuesto, la estimación puntual 75.3645.Si obtenemos intervalos de confianza a 95% como (10.5) por cada valor de X en la tabla 2, se obtiene lo que se conoce como intervalo de confianza o banda de confianza, para la función de regresión poblacional, que se presenta en la figura 6.