1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación...

24
Centro Educacional San Carlos de Aragón. Sector: Matemática. Prof.: Ximena Gallegos H. Estadística Contenidos NM – 3 Unidad: Estadística y Probabilidades. Aprendizajes Esperados: * Reconoce diferentes formas de organizar información: tablas y gráficos estadísticos. * Calcula e interpreta medidas de tendencia central. Algunas Observaciones sobre estadística. Diremos que la Estadística es el conjunto de teoremas, herramientas, métodos y técnicas que pueden usarse en: a. Recolección, selección y clasificación de datos. b. Interpretación y análisis de datos. c. Deducción y evaluación de conclusiones y de su confiabilidad con base en datos muestrales. Conceptos Básicos. Población: Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio. La población puede ser finita o infinita. Ejemplo: Alumnos que rinden PSU este año. Muestra: Es un subconjunto de la población, que debe ser representativa y aleatoria. Ej. Alumnos del colegio san Carlos, que rinden PSU este año. Dato: Información obtenida en la observación de los objetos en estudio. Ej. Puntaje obtenido en la PSU. El dato estadístico es cualquier característica que de algún modo es medible ( peso, edad, nota, puntaje, etc.) Entre los datos estadísticos se distinguen: a) Variable Cualitativa: observaciones que se refieren a un atributo, son NO numéricas ej. Color de ojos, sexo, etc. b) Variable Cuantitativa: observaciones de índole numérica: notas, peso etc. Las variables cuantitativas se dividen en Variable continua: es aquella que puede tomar todos los valores de un intervalo. (Ej. Altura de una persona, edad, peso, etc.) y Variable discreta: Es aquella que sólo toma los valores enteros de un intervalo. (Ej. Número de hijos, etc.) Clasificación de datos 1

Transcript of 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación...

Page 1: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Centro Educacional San Carlos de Aragón. Sector: Matemática. Prof.: Ximena Gallegos H.

Estadística Contenidos NM – 3

Unidad: Estadística y Probabilidades.Aprendizajes Esperados:* Reconoce diferentes formas de organizar información: tablas y gráficos estadísticos.* Calcula e interpreta medidas de tendencia central.

Algunas Observaciones sobre estadística.Diremos que la Estadística es el conjunto de teoremas, herramientas, métodos y técnicas que pueden usarse en:a. Recolección, selección y clasificación de datos.b. Interpretación y análisis de datos.c. Deducción y evaluación de conclusiones y de su confiabilidad con base en datos muestrales.

Conceptos Básicos.Población: Es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio. La población puede ser finita o infinita.Ejemplo: Alumnos que rinden PSU este año.

Muestra: Es un subconjunto de la población, que debe ser representativa y aleatoria.Ej. Alumnos del colegio san Carlos, que rinden PSU este año.

Dato: Información obtenida en la observación de los objetos en estudio.Ej. Puntaje obtenido en la PSU.

El dato estadístico es cualquier característica que de algún modo es medible ( peso, edad, nota, puntaje, etc.)

Entre los datos estadísticos se distinguen:a) Variable Cualitativa: observaciones que se refieren a un atributo, son NO numéricas ej. Color de ojos, sexo, etc.

b) Variable Cuantitativa: observaciones de índole numérica: notas, peso etc. Las variables cuantitativas se dividen en Variable continua: es aquella que puede tomar todos los valores de un intervalo. (Ej. Altura de una persona, edad, peso, etc.) y Variable discreta: Es aquella que sólo toma los valores enteros de un intervalo. (Ej. Número de hijos, etc.)

Clasificación de datos

Distribución de frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Elementos de una distribución de frecuencias agrupadas.

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

1

Page 2: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Frecuencia (f) : Es el número de veces que se repite el valor de un dato, o el número de individuos que pertenecen a la misma clase.

Frecuencia relativa ( fr) : Corresponde a la razón entre la frecuencia absoluta y el total de datos, la cual se puede expresar mediante el uso de porcentajes.

Frecuencia porcentual (f %) : Es la frecuencia relativa expresada en porcentaje.

Frecuencia Acumulada (Fi) : Para cada valor (o clase) es la suma de su frecuencia y las de las anteriores. Se puede determinar en forma ascendente y descendente; también en forma porcentual.

Rango: Es el conjunto de todos los valores que puede tomar una variable. (También se denomina: recorrido o campo de variación).

Amplitud de clase : Es la diferencia entre el límite superior e inferior de la clase.

Marca de clase : Es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros o estadígrafos.

Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Los siguientes datos representan el puntaje obtenido por un grupo de 20 alumnos. Tabular en 6 intervalos o clases.

3 10 12 20 12 18 23 21 23 30

24 0 15 13 5 7 17 6 22 18

Clase I Mc Grados

Responde de acuerdo a la tabla.a) ¿Cuántos alumnos obtuvieron:

12 ó más puntos Menos de 18 puntos En promedio 15 puntos

Entre 6 y 17 puntos

b) ¿Qué porcentaje de alumnos obtuvo:18 ó más puntos Menos de 12 puntos Entre 12 y 23 puntos En promedio 21

puntos

2

Page 3: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Solucionario:

Clase I Mc fi F F fr f% Grados1 0 – 6 3 3 3 20 0,15 15% 54º2 6 – 12 9 3 6 17 0,15 15% 54º3 12– 18 15 5 11 14 0,25 25% 90º4 18 – 24 21 7 18 9 0,35 35% 126º5 24 – 30 27 2 20 2 0,10 10% 36º

20 1 100% 360º

Definición de parámetro estadístico

Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.

Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Tipos de parámetros estadísticos

Hay tres tipos parámetros estadísticos: De centralización, De posición y De dispersión.

Medidas de centralización Las medidas de centralización o de tendencia central nos dan una idea acerca del comportamiento de los datos a los que se refieren. Se puede decir que expresan el grado de centralización de los datos que representan.

Las medidas de centralización son : Media Aritmética + Mediana + Moda

Definición de media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre

el número total de datos.

Datos no agrupados Datos agrupados

Ejemplo: Edad de un grupo de 50 personas.

Interpretación. La edad promedio del grupo es 45,6 años

3

Page 4: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Observaciones sobre la media:1. La media se puede hallar sólo para variables cuantitativas.

2. La media es muy sensible a las puntuaciones extremas, en cuyo caso puede ser una medida

de centralización poco representativa de la distribución.

3. La media es independiente de las amplitudes de los intervalos, pero no se puede determinar

si hay un intervalo con amplitud indeterminada.

4. Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número.

5. Si todos los valores de la variable se multiplican por un mismo número la media aritmética

queda multiplicada por dicho número.

Media Ponderada:

Ejemplo: Un alumno que postula a la Universidad tiene los siguientes puntajes.

¿En cuál de las 3 universidades tiene una mejor Media Ponderada?

4

Page 5: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

También se puede determinar así:

Definición de moda: La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Puede ocurrir que la distribución sea:

*Amodal: Ningún dato tiene mayor frecuencia que otro.

*Unimodal: Un solo dato es el que más se repite.

* Bimodal: Dos datos tiene la misma frecuencia (mayor)

* Polimodal: Más de dos datos tienen la misma frecuencia (mayor)

Datos Agrupados:

Ejemplo: Edad de un grupo de 50 personas.

Observaciones respecto de la Moda.1. Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es

la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

2. Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

3. Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. ( Ej. 0, 1, 3, 3, 5, 5, 7, 8; Mo = 4)

5

Page 6: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Mediana : M eLa mediana de un conjunto de datos numéricos ordenados en forma creciente o decreciente, es

el dato que se encuentra al centro de dicha ordenación, o la media aritmética de los datos

centrales (en caso que la muestra tenga un número de datos pares)

Datos NO Agrupados:

Número impar de datos Número par de datos

Datos Agrupados: ;

Ejemplo: Edad de un grupo de 50 personas.

Interpretación: La persona ubicada en el lugar 25, tiene aprox. 48,7 años)

La mediana es independiente de las amplitudes de los intervalos.

6

Page 7: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Gráficos Estadísticos.Diagrama de barras

Un diagrama de barras se utiliza para representar datos cualitativos o datos cuantitativos de tipo

discreto.

Se representan sobre los ejes coordenados: en el eje de abscisas se anotan los valores de la

variable, y sobre el eje de las ordenadas las frecuencias absolutas o relativas o porcentuales o

acumuladas.

Los datos se representan mediante barras de una altura proporcional a la frecuencia.

7

Page 8: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Polígonos de frecuencia

Un polígono de frecuencias se forma uniendo los extremos de las barras (en su punto medio) mediante segmentos.

También se puede realizar trazando solo los puntos que representan las frecuencias y

uniéndolos mediante segmentos.

Polígono de Frecuencias.

Histograma y Polígono de Frecuencias.

8

Page 9: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Gráfico Circular.

Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de cada sector es

proporcional a la frecuencia absoluta correspondiente, es decir,

El diagrama circular se construye con la ayuda de un transportador de ángulos.

Histograma.

Un histograma es una representación gráfica de una variable en forma de barras.

Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.

La superficie de cada barra es proporcional a la frecuencia de los valores representados.

9

Page 10: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Medidas de posiciónLas medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

Las medidas de posición son: Cuartiles, Quintiles, Deciles y Percentiles.

Cuartiles. (Q)

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Cálculo de los cuartiles

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresión

Número impar de datos

2, 5, 3, 6, 7, 4, 9

Número par de datos

2, 5, 3, 4, 6, 7, 1, 9

10

Page 11: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra , en la tabla de las

frecuencias acumuladas.

Ejemplo : Edad de un grupo de 50 personas.

Interpretación: Significa que un 25% de la muestra tiene menos de 40,3 años, mientras que el otro 75% supera los 40,3 años.

Deciles. (D)

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

D5 coincide con la mediana.

Cálculo de los deciles

En primer lugar buscamos la clase donde se encuentra , en la tabla de

las frecuencias acumuladas.

Ejemplo: Edad de un grupo de 50 personas.

Interpretación : Significa que un 70% de la muestra tiene menos de 53,5 años, mientras que el otro 30% supera los 53,5.

11

Page 12: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Percentiles. (P)

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra , en la

tabla de las frecuencias acumuladas.

Ejemplo: Edad de un grupo de 50 personas.

Interpretación : Significa que un 20% de la muestra tiene menos de 35 años, mientras que el otro 80% supera esta edad.

Obs. 10: y coinciden con la mediana.

12

Page 13: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Medidas de dispersiónLas medidas de dispersión nos informan cuán cercanos o lejanos están los datos respecto de

un valor central (media aritmética).

Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.

Desviación Típica.

La desviación típica es la raíz cuadrada de la varianza.

Desviación respecto a la media :

; donde representa el dato o la marca de clase.

Ejemplo: Se otorgará una beca universitaria, al alumno cuyo buen rendimiento se haya

mantenido por mayor tiempo, durante el último año. Para ello se decide considerar sólo 4

asignaturas.

Si sólo uno puede obtener la beca, ¿quién es el elegido?

1ª Observación: a pesar de todos tener el mismo promedio (6,3), las notas de Hugo son las que

se encuentran + cercanas a la media, en tanto las de Luis son más dispersas.

Rango:

13

Page 14: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Obs. 2: Aunque el rango no es una medida significativa, si nos indica cuán dispersos se

encuentran los datos entre los valores extremos.

Por lo anterior, se podría decir que H y P serían los + aptos, por ser sus calificaciones menos

dispersas.

Desviación Media: La desviación representa el mayor o menor alejamiento de un dato con

respecto a la media.

Obs. 3: La suma de las desviaciones de todos los datos con respecto a su media aritmética es

cero.

Obs. 4: Para determinar quién presenta un valor de desviación que indique cuán cercano o

lejano está de la media, es necesario determinar el valor absoluto de la desviación.

…… está a 1,2 puntos alejado de la media

…… está a 1,4 puntos alejado de la media

…… está a 2,6 puntos alejado de la media

Obs.5: Como el valor de la desviación absoluta de L es mayor, entonces las notas de H

representan un mejor rendimiento durante el período indicado.

Por lo tanto se define Desviación Media como la media aritmética de las desviaciones absolutas

respecto a la media.

14

Page 15: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

a) Datos No agrupados:

Ejemplo 1:

Ejemplo 1

Calcular la desviación media de la distribución:

15

Page 16: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias (gráficos), la expresión de la desviación media es:

Donde Xi representa “Marca de Clase”

Ejemplo: Edad de un grupo de 50 personas.

I

20 – 30 25 8 8 20,6 164,8

30 – 40 35 4 12 10,6 42,4 40 – 50 45 15 27 0,6 9

50 - 60 55 23 50 9,4 216,250 41,2 432,4

Usando Fórmula:

16

Page 17: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Varianza.

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.

La varianza se representa por.

a) Datos No agrupados:

Ejemplo.

Para simplificar este cálculo, se suele utilizar una expresión equivalente, determinada por:

Varianza para datos agrupados

Para simplificar este cálculo, se suele utilizar una expresión equivalente, determinada por:

Ejemplo: Edad de un grupo de 50 personas.

I

20 – 30 25 8 8 – 20,6 424,36 3.394,88

30 – 40 35 4 12 – 10,6 112,36 449,44 40 – 50 45 15 27 – 0,6 0,36 5,4

50 - 60 55 23 50 9,4 88,36 2.032,2850 625,44 5.882

;

17

Page 18: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

O también…. Usando Fórmula directamente.

Propiedades de la Varianza.1. La varianza es un índice muy sensible a las puntuaciones extremas.

2. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones

sean iguales.

3. Si a todos los valores de la variable, se les suma un mismo número, la varianza no varía.

4. Si todos los valores de la variable se multiplican por un mismo número, la varianza queda

multiplicada por el cuadrado de dicho número.

5. Si se tienen varias distribuciones con la misma media y se conocen sus respectivas

varianzas, se puede calcular la varianza total, mediante la siguiente fórmula:

Si todas las muestras tienen el mismo tamaño:

Si todas las muestras tienen distinto tamaño:

Observaciones : 1) En los casos en que no se pueda determinar la media, tampoco será posible determinar la

varianza.

2) La varianza no viene expresada en las mismas unidades que los datos, ya que las

desviaciones están al cuadrado.

3) Se puede concluir que la desviación típica es la raíz cuadrada de la varianza y se puede

representar como: , es decir:

Datos No agrupados: Datos Agrupados:

18

Page 19: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Desviación Estándar o Típica.

Esta medida de dispersión expresa el grado de dispersión de los datos respecto a la media. Se

designa con la letra “s” o también con el símbolo y queda determinada por:

Datos No agrupados:

Es decir, La desviación típica es la raíz cuadrada de la varianza.

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Ejemplo 1: Calcular la desviación típica de la distribución:

Obs.7: Mientras menor sea el valor de la desviación estándar, el grupo de observaciones es

más homogéneo, es decir, a menor dispersión mayor homogeneidad y a mayor dispersión

menor homogeneidad.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

19

Page 20: 1 - matecuaticos.files.wordpress.com …  · Web viewMientras menor sea el valor de la desviación estándar, el grupo de observaciones es más homogéneo, es decir, a menor dispersión

Ejemplo: Edad de un grupo de 50 personas.

O también.

Observaciones sobre la desviación típica: La “s” es un índice muy sensible a las puntuaciones extremas. En los casos en que no se puede determinar la media, no es posible hallar “s”. Cuán + pequeña sea la desviación típica, mayor será la concentración de datos alrededor

de la media.

Propiedades de la desviación típica

1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un mismo número la desviación típica no varía.

3 Si todos los valores de la variable se multiplican por un mismo número la desviación típica queda multiplicada por dicho número.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

20