Ayudantia Bioestadistica P2

71
Nombre: Sebastián Elías Zavala Marín Ayudantia Bioestadistica P2

description

Bioestadistica

Transcript of Ayudantia Bioestadistica P2

Nombre: Sebastián Elías Zavala Marín

Ayudantia Bioestadistica P2

Regresion y Correlacion

Regresión, requisitos

Variables Bivariadas

X es variable independiente, Y dependiente (según el estudio)

Variable Y es aleatoria

X es tomada sin error (sesgo)

Subpoblaciones de Y dado X poseen la misma varianza

regresion

Yi= α + ß X

Ῠ = a + bX

a= valor de la ordenada cuando x=0

b = pendiente, es cuanto aumenta o decrementa Y si a

X lo aumento en una unidad

Correlacion

Es una medida del grado de asociacion entre dos variables

cuantitativas, es decir la magnitud con que los puntos se

dispersan de la linea de regresion

Rho es el coficiente de correlacion poblacional y r es para

muestras

Como r calculado es mayor al tabular, se rechaza

Ho, por ende la alzada(Y) NO es independiente del

peso(X), por lo tanto estan asociadas

Series Cronologicas

Conjunto de observaciones de un fenomeno que se describe a

traves del tiempo(periodos)

Permite:

Predecir fenomenos(saber si estamos frente una epidemia o

una curacion masiva de una enfermedad)

Que ocurre si introdusco algun factor a un evento(por ej

aumentar el consumo de leche vs casos de osteoporosis )

Describir un fenomeno(conocer valores esperados y sus

limites de confianza o si este fenomeno expresa una

“tendencia lineal”)

Series Cronologicas

Se pueden clasificar según el cambio de intensidad del

fenomeno descrito siendo:

Tendencia Secular

Fluctuaciones Periodicas: Variaciones Estacionales

Variaciones Ciclicas

Fluctuaciones Accidentales

Tendencia Secular Se caracteriza por analizar un fenomeno a largo plazo, es regular,

es considerado el valor base de un fenomeno y se espera que tengo movimientos mas o menos suaves aunque esto ultimo se puede arreglar.

Se emplean los siguientes métodos para describir una tendencia secular

Linea de tendencia a mano libre o grafica

Linea de tendencia con semipromedios

Linea de tendencia con promedios moviles

Variacion promedio Anual

Ascenso o descenso porcentual

Metodo de los minimos Cuadrados

Tendencia Secular

Generalmente

los datos vienen

tabulados donde

en X se entregan

los años/meses

y en Y se tabulan

las veces que

ocurre el

fenómeno.

Meses N de casos

Enero 2200

Febrero 2250

Marzo 2350

Abril 2500

Mayo 2600

Junio 2750

Julio 2900

Agosto 3000

Septiembre 3200

Octubre 3250

Noob 3300

Diciembre 3400

Linea de tendencia con promedios

moviles(PM) Es un método que

permite suavizar la grafica de la tendencia secular, a su vez permite observar mas nítidamente si la tendencia secular, posee una “tendencia lineal”

Se emplean los promedios móviles, vale decir, se escogen cada 3,5,7 promedios y se coloca el PM frente al termino de al medio

Meses N de

casos

PM

Enero 2200 -----

Febrero 2250 2266

Marzo 2350 2366

Abril 2500 2483

Mayo 2600 2616

Junio 2750 2750

Julio 2900 2883

Agosto 3000 3033

Septiembr

e

3200 3150

Octubre 3250 3250

Noob 3300 3316

Diciembre 3400 ----

Variacion promedio anual/mensual Nos permite saber en una tendencia secular como varia la

intensidad del fenomeno en años/meses, dependiendo lo que se mida

Es requisito que exista una tendencia lineal

(Ultimo año/mes - primer año/mes)/ n periodos

Diciembre = 3400

Enero= 2200

12 meses = 11 periodos Variación promedio Anual/mensual = 109,09 =109 Si estuvieramos viendo casos de mordidas por ej, la interpretacion seria El n° de casos de mordidas entre enero y diciembre ha aumentado en 109 casos mensualmente

Ascenso o Descenso Porcentual

Describe el ascenso o descenso de la intensidad del fenomeno

descrito pero de manera porcentual

((Ultimo año/mes - primer año/mes) *100) / primer año/mes

((3400 – 2200) *100 ) / 2200 = 54,5 %

Implica que entre enero y diciembre han aumentado los casos de

mordeduras en un 54,5%

Variacion Estacional

La variacion existe especificamente en intervalos regulares,

en este caso estaciones(meses), es decir en enero pasa tal

cosa, en diciembre otra cosa, es el mes lo que importa

No se busca una tendencia(que sea lineal por ej), sino que se

busca un valor esperado demarcado con un limite superior e

inferior habituales para un evento

Se emplea el unico método para describir las variaciones

estacionales que es el método de mediana fija y de los

limites de variación habitual

Estadigrafos de tendencia central

Media*

Mediana

Moda

* Es afectada por valores

extremos

método de mediana fija y de los

limites de variación habitual

Se entregan los datos según mes y varios años, se debe tener

como requisito entre 7 – 11 años como minimo

Se elige como mediana el valor que es central

Como limites superior se elige el valor que esta antes del

valor mas mayor

Como limites inferiores se elige el valor que esta antes del

valor mas menor

Permite describir el estado actual, si hay una epidemia o si

hay una curacion milagrosa de un caso (sahh)

método de mediana fija y de los

limites de variación habitual Enero orden

1995 19 7

1996 18 6

1997 9 1

1998 10 2

1999 15 4

2000 17 5

2001 11 3

Asignar un orden a cada dato, luego se busca el del medio(mediana) en este caso como son 7 datos el valor central es el 4, por ende la mediana= 15

Luego los limites seria los inmediatamente bajo los valores extremos es decir la posicion 2 y 6 por ende los limites superior = 18 e inferior = 10

Para enero se espera un valor de 15 con una variacion entre 18 y 10

Para enero 2015 si observo un valor sobre 18 estoy frente un brote o una epidemia

Para enero 2015 si observo un valor por debajo de 10 estoy frente una sanacion o erradicacion masiva de la enfermedad

Prueba de Hipótesis entre dos media

aritméticas

Se basa en comparar dos muestras, y analizar si su diferencias

es por el muestreo en si(aleatoriedad), o por algun

tratamiento aplicado en alguna muestra

Podemos tener: Diferencias entre medias muestrales y

medias poblaciones.

Comparacion entre dos medias: muestras independientes

Comparacion entre dos medias: muestras asociadas

Z o t? El requisito para estas comparaciones es que si

o si deben distribuirse normalmente

Se sabe que si la muestras aumenta 30 o mas

individuos se acerca a Z, CON

σ CONOCIDO

Si la muestra posee menos de 30 individuos, la

muestra se acerca al estadigrafo t, DONDE

EL σ ES DESCONOCIDO. En este caso se

obtiene S de la muestra y con ese S se trabaja

Caracteristicas de t (student) Simetrica

Desde -∞ a + ∞

En relacion a los grados de libertad:

Distribucion de aplana

Varianza aumenta, es mayor que 1

Requiere usar intervalos mayores

Comparación de una media muestral con una

media poblacional (σ DESCONOCIDO)

Se quiere comparar la media de muestra con la media población pero se desconoce σ, Se usa “t”

Hipotesis nula se plantea y se habla asi:

H0 = µ0 = µ

No habría diferencia estadística entre el promedio de la muestra y el de la población

H1 = µ0 ≠ µ

Habría diferencia estadística entre el promedio de la muestra y el de la población

Zona de rechazo se determina con los grados de libertad Gl = n – 1 y un α =0.05 (α viene determinado)

X X^2 Descripcion

48 2304 n = 7

53 2809 Media = 51

52 2704 S = 2,58

48 2304

54 2916

53 2809

49 2401

Σ X = 357 Σ X^2 =18247

Grados de liberta = 7 – 1 = 6, con

α =0.05

µ = 50

nos da un valor de t = 2,447

(tabular)

Si calculamos t con la formula

nos dara un t =1,02

como t calculado es menor al

tabular

No se puede rechazar H0

El promedio de la muestra no

difiere del poblacional

Comparación de una media muestral con una

media poblacional (σ CONOCIDO)

Si σ ES CONOCIDO, se emplea Z.

Tener cuidado si se pide si el valor

de la media difiere o es menor o mayor

Se trabaja con los valores de Z, no con la probabilidad

Si se quiere saber si la media difiere de la media poblacional

el Z tabulado (con alfa = 0,05) es de 1,96

Si se quiere saber si la media es mayor o menos a la media

poblacional el Z tabulado (con alfa = 0,05) es de 1,65

Ejemplo

Si una muestra otorgo una media = 42,5 y se sabe que de la

poblacion µ=43,4 y σ = 5.

A)El valor de la media muestral es estadisticamente

inferior a la media? Con α=5%

B)Que pasa si se quiere saber solo si la media muestral

difiere de la media poblacional?

Calcular Z

Z = -1,4

A)Como Z es 1,4 es menor a 1,65, la media muestral no es

inferior a la poblacional

B) Como Z calculado es menor a 1,96, la media muestral no

difiere de la media poblacional

Prueba de la diferencia entre dos medias

aritméticas: muestras independientes Los supuestos de esta prueba son:

Las mediciones de una muestra son independientes de las de la otra muestra.

Ambas muestras provienen de poblaciones que tienen distribución Normal.

Las varianzas de las poblaciones son iguales

Como son dos muestras los grados de libertad de calculan = (n1 -1)*(n2 -1)

Las hipotesis serian

H0 : µ1 =µ 2 ; no habria diferencias entre los promedios de las muestras, provienen de la misma poblacion

H1 : µ1 ≠ µ 2 ; Habria diferencias entre los promedios de las muestras, provienen de poblaciones distintas

Si se escoge 20 ratas machos homogéneas, las divide

en 2(10 y 10) grupos al azar, asignando un grupo a la

dieta normal (grupo 1) y el otro a la dieta deficiente

(grupo2).

Calculadas las medias aritméticas y varianzas de

ambos grupos se obtiene:

T calculado da 3,08 pero t tabulado es de 2,101 ende

se rechaza Ho, hay diferencias entre muestras

Prueba de la diferencia entre dos medias

aritméticas: muestras asociadas

Dos individuos que comparten una experiencia común que puede ser genética o ambiental. Usando el mismo individuo dos veces , lo que habitualmente se conoce como las pruebas de antes y después.

Las observaciones pareadas resultan de dividir un organismo o unidad de manera que una mitad recibe un tratamiento y la otra mitad el otro tratamiento.

Se determina si la media de una muestra de diferencias entre pares es significativamente distinta de una media hipotética que según la hipótesisnula es igual a cero.

Análisis de Varianza

Modelo I – diferencia entre medias

Modelo II – componentes de varianza

Modelo Anidado o Jerarquico

Fisher

Solo toma valores positivos desde 0 al infinito positivo

Modelo I

Factor de Corrección(FC)

Suma de los Cuadrados Totales

Suma de Cuadrados entre muestras

(SCM)

Suma de Cuadrados del error

Andeva

Zona de rechazo

Los grados de libertad se dan entre tratamientos es decir 3-1

= 2 y entre muestras(error) = 15 -3 = 12, entonces el F

tabulado con alfa = 0,01, es de F = 6,93

F calculado = 4,44

No se puede rechazar Ho

Las medias no difieren significativamente

Modelo II

Modelo Anidado o Jerarquico

Fin ?