Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de...

42
Distribución Normal o gaussiana

Transcript of Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de...

Page 1: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Distribución Normal o gaussiana

Page 2: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad

Page 3: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Una distribución normal de media μ y desviación típica σ se designa por N(μ, σ). Su gráfica es la campana de Gauss:

Page 4: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

DefiniciónSe dice que una variable

aleatoria X se encuentra normalmente distribuida si su función de densidad está dada por

Page 5: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

El 99% de los datos se encuentra entre el promedio y 3 desviaciones estandar

Page 6: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Calculo de probabilidades distribución normal

Page 7: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

EjemploSe sabe que la longitud de las alas

extendidas de un tipo de ave rapaz es una variable aleatoria que sigue una distribución Normal, de media 120 cm. y desviación típica 8 cm.

X → N (120; 8) Calcúlese la probabilidad de que la

longitud de un ave elegida al azar sea:a.- Mayor de 130 cmb.- Menor de 100 cmc.- Esté comprendido entre 110 y 130 cm

Page 8: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Distribución Normal TípicaLa forma anterior de calculo de

probabilidad resulta muy difícil de calcular,

Ante lo cual se realiza un cambio de parámetro y se cambia la variable x por la variable z y se pasa de la distribucón normal general a la distribución normal tipica

Page 9: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Una variable aleatoria continua, X, sigue una distribución normal de parámetros = µ= 0 y σ = 1

Page 10: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Y su función de densidad es:

µ =0 y σ = 1

Page 11: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Por lo tanto debemos realizar el cambio de variable

Page 12: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Calculo de probabilidad distribución normal tipificada

Page 13: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Suponga que x tiene una distribución normal con normal µ =10 y σ = 2

CalcularP(x<13)P(x>9)P(6≤x≤14)

Page 14: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

EjemploSe sabe que la longitud de las alas

extendidas de un tipo de ave rapaz es una variable aleatoria que sigue una distribución Normal, de media 120 cm. y desviación típica 8 cm.

X → N (120; 8) Calcúlese la probabilidad de que la

longitud de un ave elegida al azar sea:a.- Mayor de 130 cmb.- Menor de 100 cmc.- Esté comprendido entre 110 y 130 cm

Page 15: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

MuestreoPoblaciónEs un conjunto finito o infinito de

elementos cuyas características se desean estudiar

Page 16: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

MuestraSubconjunto de la poblaciónMuestreoProcedimiento para obtener una

muestraParámetros

Son ciertos valores numéricos fijos que pueden describir las características de una población (promedio, varianza, proporción)

Page 17: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Inferencia estadísticaEs un tipo de inferencia inductiva

que permite generalizar las conclusiones obtenidas en una muestra de la población a todos los elementos de la población.

La generalización de las conclusiones obtenidas en una muestra a toda la población está sujeta a riesgos por cuanto la muestra se debe seleccionar con un muestreo probabilístico

Page 18: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

El estudio de la inferencia estadística se acostumbra a dividir en 3 partes.

Estimación puntualEstimación por intervaloContraste de hipótesis.

Page 19: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Diseño de muestreoEs el plan que se llevará a cabo

para seleccionar la muestra, de tal manera que exista un conocimiento bien fundado de que la muestra sea representativa

Page 20: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Método de selección de la muestraExisten dos tipos de muestreo: el probabilístico

y el no probabilístico.Con el muestreo probabilístico, todos los

sujetos tienen la misma probabilidad de entrar a formar parte del estudio. La elección se hace al azar.El no probabilístico es aquel en el que no todos los sujetos tienen la misma probabilidad de formar parte de la muestra de estudio.

Los tipos de muestreo probabilísticos más utilizados son: aleatorio simple, aleatorio sistemático, aleatorio estratificado y aleatorio por conglomerados.

Page 21: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Muestreo aleatorio simple: Muestra seleccionada de manera que cada elemento o individuo de la población tenga las mismas posibilidades de que se incluya. Por ejemplo, los números del cartón de los juegos de azar es una muestra aleatoria imple ya que todos los números tienen igual probabilidad de salir.

Page 22: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Muestreo aleatorio sistemático: Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población. El k se calcula dividiendo el total de la población por la muestra necesaria: k = N/n

. Si se tiene una población de 8 000 individuos y el tamaño de la muestra necesario es de 400, se seleccionará uno de cada 20, que será la fracción de muestreo (8 000/400). Para decidir por cuál se ha de comenzar, se selecciona aleatoriamente, o por sorteo, un número del 1 al 20, y a partir de dicho número se va seleccionando a un sujeto de cada 20.

Page 23: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Muestreo aleatorio estratificado: Una población se divide en subgrupos según alguna característica, y se forman los denominados estratos y se selecciona al azar una muestra de cada estrato. La estratificación se suele hacer en función de diferentes variables o características de interés: género, edad, situación laboral, etc.

Por ejemplo, si se desea efectuar una estratificación por género y se sabe que en la población la distribución es de 55 mujeres y 45 hombres, por tanto, si el tamaño de la muestra es de 400, se elegirán aleatoriamente 220 mujeres y 180 hombres.

Page 24: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Definición de intervalo de confianza

Dada una muestra aleatoria simple (X1, X2,…, Xn) de una variable aleatoria X se llama intervalo de confianza para un parámetro θ, con nivel o coeficiente de confianza “1-α”, 0< α < 1, a un intervalo aleatorio (dado que sus extremos dependen de las muestras elegidas)

Page 25: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Nivel de Confianza.Probabilidad de que la estimación

efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro. (1-α)

Page 26: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Estimación de Intervalos de confianza para la mediaCaso 1La muestra es seleccionada de

una población con distribución normal y varianza poblacional conocida

µ є [ x - z1-α/2 *σ/√n , x + z1-α/2

*σ/√n]

Page 27: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Caso 2La muestra es seleccionada de

una población que tiene una distribución cualquiera con media µ y varianza σ2 conocida. En este caso n ≥30

µ є [ x - z1-α/2 *σ/√n , x + z1-α/2

*σ/√n]

Page 28: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Caso 3

La muestra aleatoria es seleccionada de una población distribuida de manera normal pero los parámetros σ,µ (poblacionales) son desconocidos y n≤30

µ є [ x - t1-α/2 (n-1)*s/√n , x +t1-α/2 (n-1) *s/√n]

Page 29: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Datos importantesMuestral Poblacional

Promedio x µ

Desviación estandar

s σ

varianza s² σ²

Page 30: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Como consecuencia de la falta de gas registrada en la ciudad de La Plata, en los meses de invierno, la Empresa Camuzzi - Gas Pampeana decide hacer un estudio para determinar la cantidad gastada en este combustible para calefacción casera en un año en particular. Con tal motivo se selecciona una muestra de n = 64 hogares de la ciudad. La media muestral del

gasto en gas para calefacción resultó de $83,6. Se sabe por experiencia que la desviación estándar de la población es $17,8.

a) Halle un intervalo de confianza del 95% para el gasto promedio anual en este tipo de

combustible en las viviendas de la ciudad de La Plata.

b) Calcule un intervalo de confianza del 99% para ese gasto promedio anual.

Page 31: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

. Se encuentra que la concentración promedio de zinc de una muestra de 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el cereal. Suponga que la desviación estándar de la población es 0.3 y los datos se distribuyen de manera normal.

Page 32: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviación típica de 0.7mg. Suponiendo que la variable X=“contenido de nicotina en un cigarrillo”, sigue una distribución N(µ; σ), obténgase un intervalo de confianza al 99% � del contenido medio de nicotina por cigarrillo en esa marca.

Page 33: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Una empresa fabrica bombillas cuya duración en horas sigue una distribución N(µ; 200).

Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constrúyase un intervalo de confianza al nivel del 95%, 99 % � para la vida media de las bombillas fabricadas por esa fábrica.

Page 34: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Error muestral y tamaño muestralError muestral

E=

Tamaño muestral

N=

Page 35: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

La desviación típica de la altura de los habitantes de un país es de 8 cm y los datos se distribuyen de manera normal . Calcular el tamaño mínimo que ha de tener una muestra de habitantes de dicho país para que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90%

Page 36: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

 La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 95% y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?.

Page 37: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Intervalo de confianza para una proporción

Page 38: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Intervalo de confianza para una proporción

Page 39: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Error muestral

E=

Tamaño Muestral

Page 40: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Se quiere estimar el resultado de un referéndum mediante un sondeo. Para ello se realiza un muestreo aleatorio simple con n=100 personas y se obtienen 35% que votarán a favor y 65% que votarán en contra (suponemos que no hay indecisos para simplificar el problema a una variable dicotómica). Con un nivel de error del 5%, calcule un intervalo de confianza para la verdadera proporción de las elecciones.

Page 41: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Tomada al azar una muestra de 500 personas en cierta comunidad, se encontró que 220 personal leían el periódico habitualmente. Calcula con un nivel de confianza de 90%, 95% y 99% el intervalo en que se encontrará la verdadera proporción de electores

Page 42: Distribución Normal o gaussiana. La distribución normal o Gaussiana es la más importante y la de mayor uso de todas las distribuciones de probabilidad.

Una multinacional está estudiando la posibilidad de instalar un nuevo sistema de producción en sus empresas; antes de hacerlo decide consultar a sus trabajadores. Como no tienen ninguna referencia previa sobre la opinión de sus empleados, supone que tal opinión está dividida en partes igual 50% a favor y 50% en contra. Si desea una fiabilidad del 99% con un error máximo del 4% ¿Cuál debe ser el tamaño mínimo de la muestra?