An£Œlisis de Regresi£³n M£›ltiple Especificaci£³n del...

download An£Œlisis de Regresi£³n M£›ltiple Especificaci£³n del modelo Especificaci£³n del modelo de regresi£³n

of 57

  • date post

    15-Mar-2020
  • Category

    Documents

  • view

    2
  • download

    0

Embed Size (px)

Transcript of An£Œlisis de Regresi£³n M£›ltiple Especificaci£³n del...

  • Análisis de Regresión Múltiple

    Dr. Elio Riera

  • Precio de la casa = β0 + β1(Área de la casa) + ε

    Pero en general, una variable dependiente depende de más de

    una variable independiente:

    Precio de la casa puede depender de:

     Área

     Antigüedad

     Número de baños

     Área del garaje

     Etc.

    Se ha visto el tema del análisis de

    regresión simple:

  • y = β0 + β1x1 + ε

    Regresión Lineal Simple

    Regresión Lineal Múltiple

    y = β0 + β1x1 + β2x2 + ……… + βpxp + ε

    Para tratar este tipo de problemas se

    requiere expandir el análisis de regresión:

  • Modelo de Regresión Múltiple

    Vamos a examinar la relación lineal entre una variable

    dependiente (y) y dos o más variables independientes (xi)

    εxβxβxββy kk22110  

    ie kik2i21i10i xbxbxbby 

    Modelo poblacional:

    Y-intercepto Pendientes Error aleatorio

    Valor de y Pendientes estimadas

    Modelo de regresión múltiple muestral:

    y-intercepto

    estimado Error muestral

  • Modelo de Regresión Múltiple

    kk22110 xbxbxbbŷ  

    Valor estimado o

    predecido de ŷ Pendientes estimadas

    Modelo de regresión múltiple estimado:

  • 15-6

    Modelo de Regresión Múltiple

    Modelo de dos variables:

    y

    x1

    x2

    22110 xbxbbŷ 

    Llamado hiperplano de regresión

  • y

    x1

    x2

    22110 xbxbbŷ yi

    yi

    <

    e = (y – y)

    <

    x2i

    x1i La ecuación de mejor ajuste, y, es hallada minimizando la

    suma de cuadrados del error,

    e2

    <

    Observación

    muestral

    Modelo de Regresión Múltiple

    Modelo de dos variables:

    (continuación)

  • Modelo de Regresión Múltiple Poblacional

     Los términos de error (ε) son realizaciones estadísticamente

    independientes de una variable aleatoria para cada nivel de x.

     Para un valor dado de x, pueden existir muchos valores de y, por lo

    tanto muchos valores posibles para e. La distribución de los posibles

    errores del modelo para cualquier nivel de x es normal.

     Las distribuciones de los posibles valores de los errores e tienen igual

    varianza en cada nivel de x.

     Las medias de la variable dependiente y, para todos los valores

    especificados de x, pueden ser conectados con una línea la cual es el

    componente lineal del modelo de regresión poblacional.

    Supuestos:

  • Conceptos Básicos para la Construcción de

    Modelos

     Los modelos son usados para evaluar cambios sin

    implementarlos en el sistema real.

     Los modelos pueden ser usados para predecir

    “outputs” basados en “inputs” específicos.

     El proceso de construcción de modelos consiste de 3

    etapas:

  •  Especificación del modelo

     Especificación del modelo de regresión poblacional.

     Recolección de la data muestral.

     Formulación o construcción del modelo

     Cálculo de los coeficientes de correlación entre las distintas

    variables, dependientes e independientes.

     Ajuste del modelo a la data. Estimación de la ecuación de

    regresión múltiple.

     Diagnóstico del modelo

     Pruebas estadísticas para determinar la bondad de ajuste del

    modelo a la data.

     Verificación de los supuestos de regresión múltiple.

    Etapas

  • Especificación del Modelo

     A veces referido como identificación del modelo

     Es un proceso para establecer la estructura del modelo

     Decidir qué se quiere hacer y seleccionar la variable

    dependiente (y).

     Determinar las potenciales variables independientes (x) para

    el modelo.

     Recolectar los datos muestrales (observaciones) para todas

    las variables. Sugerencia: Tamaño muestral de al menos 4

    veces el número de variables independientes.

  • Construcción del Modelo

     Es el proceso de construir la ecuación para los datos.

     Puede incluir todas o algunas de las variables

    independientes (x).

     El objetivo es explicar la variación en la variable

    dependiente (y) a través de la relación lineal con las

    variables independientes seleccionadas (x).

  • Diagnóstico del Modelo

     Analizar la calidad del modelo (efectuar las pruebas de diagnóstico).

     Evaluar el grado en que los supuestos se satisfacen.

     Si el modelo es inaceptable, iniciar el proceso de construcción del modelo nuevamente.

     Usar el modelo más simple que satisfaga las necesidades.

     El objetivo es ayudar a tomar mejores decisiones.

  • Ejemplo

    Un distribuidor de pies (postres) desea

    evaluar los factores que se cree influyen

    en la demanda

  • Diagramas de Dispersión

  • Ejemplo:Especificación del Modelo

    Un distribuidor de pies (postres) desea evaluar los factores

    que se cree influyen en la demanda

     Variable dependiente: Ventas (unidades / semana)

     Variables independientes: Precio ($) y Publicidad ($100)

    Modelo de Regresión múltiple Poblacional:

    Ventas = β0 + β1(Precio) + β2(Publicidad) + ε

  • Ejemplo: Construcción o Formulación del Modelo

    Modelo de Regresión Múltiple (Muestral):

    Ventasj = b0 + b1(Precioj) + b2(Publicidadj) + errorj

    Modelo de Regresión Múltiple Lineal

    Ventas = b0 + b1(Precio) + b2(Publicidad)

  • Interpretación de los Coeficientes Estimados

     Pendientes (bi)

     Estiman el cambio en el valor promedio de “y” como bi unidades por

    cada unidad de incremento en xi manteniendo las otras variables

    constantes.

     Ejemplo: Si b1 = -20, entonces se espera que las ventas promedio (y)

    se reduzcan en 20 pies por semana por cada $1 en que se incremente el

    precio (x1), manteniendo constante la variable publicidad (x2).

     y-intercepto (b0)

     Estima el valor promedio de y cuando todas las variables xi son

    iguales a cero (suponiendo que el valor cero está dentro de los rangos

    de valores que pueden tomar los xi).

  • Formulación del Modelo

     Los datos que se presentan fueron

    recolectados durante 5 semanas de

    observación y registro.

  • Formulación del Modelo

    Ventas = b0 + b1 (Precio)

    + b2 (Publicidad)

    Semana

    Venta de

    pies

    Precio

    ($)

    Publicidad

    ($100s)

    1 350 5.50 3.3

    2 460 7.50 3.3

    3 350 8.00 3.0

    4 430 8.00 4.5

    5 350 6.80 3.0

    6 380 7.50 4.0

    7 430 4.50 3.0

    8 470 6.40 3.7

    9 450 7.00 3.5

    10 490 5.00 4.0

    11 340 7.20 3.5

    12 300 7.90 3.2

    13 440 5.90 4.0

    14 450 5.00 3.5

    15 300 7.00 2.7

    Modelo de Regresión Múltiple:

  • Matriz de Correlación

     Las correlaciones entre la variable dependiente y las

    variables independientes seleccionadas pueden obtenerse

    usando Excel:

     Datos / Análisis de datos / Coeficiente de correlation

     Puede evaluar la significancia estadística de la correlación

    con una prueba t

  • Matriz de Correlación: Ventas de Pies

     Ventas vs. Precio : r = -0.44327

     Hay una asociación lineal negativa entre las

    ventas y el precio

     Ventas vs. Publicidad : r = 0.55632

     Hay una asociación lineal positiva entre las

    ventas y la publicidad

    Ventas de

    pies Precio Publicidad

    Ventas de pies 1

    Precio -0.44327 1

    Publicidad 0.55632 0.03044 1

  • Estimación de la Ecuación de Regresión Lineal Múltiple

     Programas estadísticos (computadora) son

    generalmente usados para generar estimados

    de los coeficientes y medidas de bondad de

    ajuste de la regresión múltiple

     Excel: Datos / Análisis de datos / Regresión

  •  Excel:

     Datos / Análisis de datos / Regresión

    Estimación de la Ecuación de Regresión Lineal Multiple

    (continuación)

  • Regresión Múltiple: Excel (Resultado)

    licidad)74.131(Pub cio)24.975(Pre - 306.526 Ventas 

  • b1 = -24.975: Las

    ventas decrecerán en

    promedio 24.975 pies

    por semana por cada

    $1 incrementado en el

    precio, manteniendo

    constante la publici-

    dad

    b2 = 74.131: Las

    ventas crecerán en

    promedio 74.131 pies

    por semana por cada