Diagnosis en el modelo de regresión lineal normal

Click here to load reader

  • date post

    11-Feb-2017
  • Category

    Documents

  • view

    222
  • download

    0

Embed Size (px)

Transcript of Diagnosis en el modelo de regresión lineal normal

  • Universidade

    de Vigo

    Diagnosis en el modelo de Diagnosis en el modelo de Diagnosis en el modelo de Diagnosis en el modelo de

    regresin lineal normalregresin lineal normalregresin lineal normalregresin lineal normal

    Log L ( )

    Elementos de diagnosis, interpretacin y anlisis

    Log L (

    Log L ( )

    Log L

    A

    B(0)

    Log L (0

    )

    )

    0

  • Universidade

    de Vigo

    Universidade

    de VigoJustificacin del temaJustificacin del temaJustificacin del temaJustificacin del tema

    Hasta ahora hemos considerado que las principales suposiciones del modelo se verificaban, y en consecuencia, los estimadores MCO eran los ms eficientes.

    Sin embargo, cuando trabajamos con datos reales, no siempre es Sin embargo, cuando trabajamos con datos reales, no siempre es esto cierto, y necesitamos algn instrumento que nos permita ver que suposiciones son vlidas y cuales no.

  • Universidade

    de Vigo

    Universidade

    de VigoFuentes de Fuentes de Fuentes de Fuentes de elaboracinelaboracinelaboracinelaboracin de modelosde modelosde modelosde modelos

    La fundamentacin terica, esto es, de la teoraeconmica o de la empresa.Depende de cada problema concreto

    El anlisis de datos o elementos estadsticos dediagnosis. Comn a muchos problemas

  • Universidade

    de Vigo

    Universidade

    de VigoFallos en el modeloFallos en el modeloFallos en el modeloFallos en el modelo

    Un modelo puede fallar por dos tipos de causas: El modelo est mal especificado, es decir alguna suposicin de partida no se verifica.

    Existen datos que provienen de otra poblacin y contaminan el modelo.

    Cuando el modelo obtenido no se ve afectado por cambios en Cuando el modelo obtenido no se ve afectado por cambios en las suposiciones o los datos se dice que es robusto.

    La diagnosis nos permite determinar el grado de robustez del modelo.

  • Universidade

    de Vigo

    Universidade

    de VigoNecesidad de la diagnosisNecesidad de la diagnosisNecesidad de la diagnosisNecesidad de la diagnosis

    A continuacin se van a exponer de modo grfico cuatro modelos cuyos resultados de la regresin son casi equivalentes aparentemente.

    El coeficiente de determinacin vale en todos los casos 0,985 y los coeficientes estimados son muy similares.los coeficientes estimados son muy similares.

    Variable Name

    Estimated

    Coefficient

    Caso1 X 0.84

    CONSTANT 19.15

    Caso2 X 0.80

    CONSTANT 19.87

    Caso3 X 0.90

    CONSTANT 18.08

    Caso4 X 0.80

    CONSTANT 20.00

  • Universidade

    de Vigo

    Universidade

    de Vigo

    Ejemplo del efecto de la forma de la Ejemplo del efecto de la forma de la Ejemplo del efecto de la forma de la Ejemplo del efecto de la forma de la

    nube de puntosnube de puntosnube de puntosnube de puntos

    1 2

    3

    4

  • Universidade

    de Vigo

    ResiduosResiduosResiduosResiduos

  • Universidade

    de Vigo

    Universidade

    de Vigo

    InterpretacinInterpretacinInterpretacinInterpretacin

    (1) modelo bien especificado

    (2) forma funcional mal especificada: imponemos una relacin lineal que en la realidad no existe

    (3) hay un valor influyente que cambia la direccin (3) hay un valor influyente que cambia la direccin de la recta y que, adems, es atpico

    (4) tenemos un valor de comportamiento influyente, pero no atpico

  • Universidade

    de Vigo

    Universidade

    de Vigo

    Elementos para analizar en un Elementos para analizar en un Elementos para analizar en un Elementos para analizar en un

    modelomodelomodelomodelo

    Eso nos indica que no solo se deben examinar la salida sino tambin diagnosticar el modelo.

    Los elementos que se deben tener en cuenta a la hora de la

    17/12/2007

    Los elementos que se deben tener en cuenta a la hora de la diagnosis son:1 El comportamiento de los datos.2 El efecto de ese comportamiento sobre las suposiciones.

  • Universidade

    de Vigo

    Universidade

    de VigoEl comportamiento de los datosEl comportamiento de los datosEl comportamiento de los datosEl comportamiento de los datos

    Los datos marcan si el modelo con el que se trabaja es vlido o no.

    De modo complementario, el modelo ayuda a ver si los datos son coherentes con el son coherentes con el comportamiento esperado o no, existe por tanto un proceso de retroalimentacin entre datos y modelo, por lo que en la practica hay que buscar un equilibrio entre ambos.

    DatosModelo

  • Universidade

    de Vigo

    Universidade

    de VigoProceso de diagnosis de un modeloProceso de diagnosis de un modeloProceso de diagnosis de un modeloProceso de diagnosis de un modelo

    1. Se empieza con un modelo, se estima y se analiza si existen datos extraos al modelo, suponiendo vlidas todas las suposiciones.

    2. En caso de datos extraos se eliminan esos (o se corrigen) y se revisa el modelo de nuevo.

    3. Si alguna suposicin falla, se corrige y se vuelve a revisar el 3. Si alguna suposicin falla, se corrige y se vuelve a revisar el modelo corregido.

    4. Ese proceso se repite hasta que haya una adecuacin conveniente entre modelo y datos.

    Eso exige analizar los factores que afectan al Eso exige analizar los factores que afectan al

    comportamiento de los datoscomportamiento de los datos

  • Universidade

    de Vigo

    Universidade

    de VigoFactores que afectan a los datosFactores que afectan a los datosFactores que afectan a los datosFactores que afectan a los datos

    A los datos que tengan un comportamiento muy distinto del resto se les conoce como valores atpicos o anmalos. Un valor no es atpico siempre, sino que depende del entorno donde se estudie:

    17/12/2007

    donde se estudie:

    1. El contexto del anlisis

    2. La muestra considerada

    3. La forma funcional del modelo

    4. Las variables incluidas en el modelo

  • Universidade

    de Vigo

    Universidade

    de VigoValores atpicos o anmalosValores atpicos o anmalosValores atpicos o anmalosValores atpicos o anmalos

    *

    Rregresincurvilinea

    Valor atpico bajo la regresin lineal pero no en la curvilinea

    A

    17/12/2007

    X

    Y*

    *

    *

    *

    *

    *

    * *

    *

    Regresin lineal

    A

    B

  • Universidade

    de Vigo

    Universidade

    de VigoElementos de DiagnosisElementos de DiagnosisElementos de DiagnosisElementos de Diagnosis

    Medidas basadas en los residuos

    Grficos

    Estadsticos y test de hiptesisEstadsticos y test de hiptesis

    El orden de anlisis es1. Grficos

    2. Estadsticos y anlisis de los residuos

    3. Test de hiptesis

    Se vieron en la asignatura de

    estadstica y slo los

    comentaremos a medida que

    los utilicemos

  • Universidade

    de Vigo

    Instrumentos grficos que permiten evaluar la

    Grficos para la diagnosisGrficos para la diagnosisGrficos para la diagnosisGrficos para la diagnosis

    Instrumentos grficos que permiten evaluar la calidad del modelo

  • Universidade

    de Vigo

    Universidade

    de VigoRuido BlancoRuido BlancoRuido BlancoRuido Blanco

    Sucesin de variables aleatorias

    ++

    * * * *

    El modelo bien especificado tiene residuos que se comportan El modelo bien especificado tiene residuos que se comportan como un ruido blanco.como un ruido blanco.

    aleatorias independientes: Media cero Varianza constante Simtrica

    0

    -

    ei

    0

    -

    e

    *

    *

    **

    *

    *

    *

    *

    *

    *

    **

    *

    *

    *

    **

    *

    * *

    *

    **

    X

  • Universidade

    de Vigo

    Universidade

    de VigoComportamiento de los residuosComportamiento de los residuosComportamiento de los residuosComportamiento de los residuos

    Las perturbaciones del MRLN deberan comportarse como un ruido blanco, puesto que son independientes e igualmente distribuidas con media 0 y simtricas.

    Los residuos de la regresin son aproximaciones a las perturbaciones y aunque no son independientes ni con varianza constante son bastante cercanos a ese comportamiento, por lo que constante son bastante cercanos a ese comportamiento, por lo que suponemos que bajo todas las suposiciones del modelo deberan comportarse casi como ruido blanco.

    En todos los grficos donde se representen los residuos respecto a alguna variable, estos deben verificar que bajo las suposiciones del MRLN debera ser cercanos a un ruido blanco.

  • Universidade

    de Vigo

    Universidade

    de Vigo

    Grficos de residuosGrficos de residuosGrficos de residuosGrficos de residuos

    Por tanto, los residuos debe verificar: E(e)=0;

    los residuos deben oscilar alrededor del 0, no deben presentar ninguna forma funcional

    Var(e)= constante aproximadamente. Los residuos deben dispersarse de forma homognea, estar comprendidos entre dos bandas

    Independencia: Los residuos no deben presentar relaciones entre ellos, formas graficas encadenadas.

    Normalidad Los residuos deben estar cercanos al 0, simtricos a cada lado y las bandas no muy alejadas

    del 0 (alrededor de dos veces la desviacin estndar).

    Eso significa que cualquier forma en que se aleje de esas caractersticas existe un fallo de alguna suposicin.

    La variable independiente nos dice algo sobre ese fallo.

  • Universidade

    de Vigo

    Grfico resumen de calidad del Grfico resumen de calidad del Grfico resumen de calidad del Grfico resumen de calidad del

    modelomodelomodelomod