Regresión Lineal Simple 2011-0
description
Transcript of Regresión Lineal Simple 2011-0
Regresión Lineal Simple2011-0
Modelo de Regresión Lineal Simple
Variable respuesta o dependiente: Yi
Coeficiente de intersección poblacional: β0
Coeficiente de regresión poblacional: β1
Variable predictora, regresora o independiente: Xi
Error aleatorio no observable: εi
0 1i i iY X
La ecuación de regresión lineal poblacional es:
Método de Mínimos Cuadrados El método de mínimos cuadrados permite
encontrar las estimaciones de β0 y β1 tal que se minimice la suma de cuadrados de los errores:
Las ecuaciones normales son:
220 1 0 1
1 1
,n n
i i ii i
Q Y X
0 11
ˆ ˆ 0n
i ii
Y X
0 11
ˆ ˆ 0n
i i ii
X Y X
Método de Mínimos Cuadrados
Los estimados son:
Por lo tanto, la línea o ecuación de regresión estimada es:
0 1ˆ ˆY X
11 22
1
SPˆSC
n
i ii
n
ii
X Y nXYXYX X nX
0 1ˆ ˆ
i iY X
Error estándar de estimación El residual describe el error de estimación
en el ajuste del modelo en la i-ésima observación.
Una medida general de la diferencia entre cada valor observado y el valor estimado es el error estándar de estimación.
0 1ˆ ˆˆ
i i i i ie Y Y Y X
2
1
2
n
ii
e
eS
n
Análisis de variancia El análisis de variancia es una técnica
estadística que consiste en dividir la suma de cuadrados de la variable dependiente en sus fuentes de variación.
Cuadro de análisis de variancia:Fuentes
de variació
n
Grados de
libertad
Suma de
cuadrados
Cuadrado
medio
F calculad
o
Regresión
1 SCReg SCReg (1)
F0 = (1)/(2)
Error n – 2 SCError
Se2 (2)
Total n – 1 SCTotal
Análisis de variancia
Supuesto:
Hipótesis:
Estadístico de prueba: 0 1, 22
SCRegF ~ ne
FS
Criterio de rechazo:0 1 ,1, 2F nF
0 1
1
H : 0H : 0a
2~ N 0,i
donde: SCTotal SC Y 1SCReg SP XY
Coeficiente de determinación El coeficiente de determinación R2 se define
por:
es decir, mide la proporción de la variación total de la variable dependiente que es explicada por el modelo de regresión (o por la variable independiente).
Si R2 > 0.8 el modelo de regresión es satisfactorio.
2 SC RegR 100%SCTotal
Coeficiente de correlación lineal
El coeficiente de correlación lineal mide el grado de asociación lineal entre dos variables. El coeficiente de correlación muestral, r , puede variar de –1 a 1.
Si r se acerca a –1 existe relación lineal fuerte e inversa entre las variables. Si r se acerca a 1 existe relación lineal fuerte y directa entre las variables. Si r se acerca a 0 no existe relación lineal entre las variables en estudio, pudiendo existir algún otro tipo de relación no lineal.
También se cumple que R2 = ± r2 (el signo depende del tipo de relación).
Ejemplo El gerente de una compañía se está
preparando para una reunión, y le gustaría mostrar al grupo de vendedores la relación entre el número de visitas a clientes y el monto de los pedidos que se reciben. De sus registros se recolectó la siguiente información muestral para el último año. Los datos fueron los siguientes:
X = Número de visitasY = Monto de los pedidos (miles de dólares)
X 5 4 6 7 8 1 3 4 1 3Y 8.7 7.1 13.
715.1
16.7
2.2 4.6 7.5 2.3 6.1
Ejemplo Encuentre el modelo de regresión lineal
estimado e interprete sus coeficientes. Calcule e interprete el coeficiente de
determinación y de correlación. ¿Se puede afirmar que existe relación
lineal significativa entre las variables en estudio? Use un nivel de significación del 5%.