Ayudantia Bioestadistica P2
-
Upload
marianela-quintrel -
Category
Documents
-
view
228 -
download
1
description
Transcript of Ayudantia Bioestadistica P2
Regresión, requisitos
Variables Bivariadas
X es variable independiente, Y dependiente (según el estudio)
Variable Y es aleatoria
X es tomada sin error (sesgo)
Subpoblaciones de Y dado X poseen la misma varianza
regresion
Yi= α + ß X
Ῠ = a + bX
a= valor de la ordenada cuando x=0
b = pendiente, es cuanto aumenta o decrementa Y si a
X lo aumento en una unidad
Correlacion
Es una medida del grado de asociacion entre dos variables
cuantitativas, es decir la magnitud con que los puntos se
dispersan de la linea de regresion
Rho es el coficiente de correlacion poblacional y r es para
muestras
Como r calculado es mayor al tabular, se rechaza
Ho, por ende la alzada(Y) NO es independiente del
peso(X), por lo tanto estan asociadas
Series Cronologicas
Conjunto de observaciones de un fenomeno que se describe a
traves del tiempo(periodos)
Permite:
Predecir fenomenos(saber si estamos frente una epidemia o
una curacion masiva de una enfermedad)
Que ocurre si introdusco algun factor a un evento(por ej
aumentar el consumo de leche vs casos de osteoporosis )
Describir un fenomeno(conocer valores esperados y sus
limites de confianza o si este fenomeno expresa una
“tendencia lineal”)
Series Cronologicas
Se pueden clasificar según el cambio de intensidad del
fenomeno descrito siendo:
Tendencia Secular
Fluctuaciones Periodicas: Variaciones Estacionales
Variaciones Ciclicas
Fluctuaciones Accidentales
Tendencia Secular Se caracteriza por analizar un fenomeno a largo plazo, es regular,
es considerado el valor base de un fenomeno y se espera que tengo movimientos mas o menos suaves aunque esto ultimo se puede arreglar.
Se emplean los siguientes métodos para describir una tendencia secular
Linea de tendencia a mano libre o grafica
Linea de tendencia con semipromedios
Linea de tendencia con promedios moviles
Variacion promedio Anual
Ascenso o descenso porcentual
Metodo de los minimos Cuadrados
Tendencia Secular
Generalmente
los datos vienen
tabulados donde
en X se entregan
los años/meses
y en Y se tabulan
las veces que
ocurre el
fenómeno.
Meses N de casos
Enero 2200
Febrero 2250
Marzo 2350
Abril 2500
Mayo 2600
Junio 2750
Julio 2900
Agosto 3000
Septiembre 3200
Octubre 3250
Noob 3300
Diciembre 3400
Linea de tendencia con promedios
moviles(PM) Es un método que
permite suavizar la grafica de la tendencia secular, a su vez permite observar mas nítidamente si la tendencia secular, posee una “tendencia lineal”
Se emplean los promedios móviles, vale decir, se escogen cada 3,5,7 promedios y se coloca el PM frente al termino de al medio
Meses N de
casos
PM
Enero 2200 -----
Febrero 2250 2266
Marzo 2350 2366
Abril 2500 2483
Mayo 2600 2616
Junio 2750 2750
Julio 2900 2883
Agosto 3000 3033
Septiembr
e
3200 3150
Octubre 3250 3250
Noob 3300 3316
Diciembre 3400 ----
Variacion promedio anual/mensual Nos permite saber en una tendencia secular como varia la
intensidad del fenomeno en años/meses, dependiendo lo que se mida
Es requisito que exista una tendencia lineal
(Ultimo año/mes - primer año/mes)/ n periodos
Diciembre = 3400
Enero= 2200
12 meses = 11 periodos Variación promedio Anual/mensual = 109,09 =109 Si estuvieramos viendo casos de mordidas por ej, la interpretacion seria El n° de casos de mordidas entre enero y diciembre ha aumentado en 109 casos mensualmente
Ascenso o Descenso Porcentual
Describe el ascenso o descenso de la intensidad del fenomeno
descrito pero de manera porcentual
((Ultimo año/mes - primer año/mes) *100) / primer año/mes
((3400 – 2200) *100 ) / 2200 = 54,5 %
Implica que entre enero y diciembre han aumentado los casos de
mordeduras en un 54,5%
Variacion Estacional
La variacion existe especificamente en intervalos regulares,
en este caso estaciones(meses), es decir en enero pasa tal
cosa, en diciembre otra cosa, es el mes lo que importa
No se busca una tendencia(que sea lineal por ej), sino que se
busca un valor esperado demarcado con un limite superior e
inferior habituales para un evento
Se emplea el unico método para describir las variaciones
estacionales que es el método de mediana fija y de los
limites de variación habitual
método de mediana fija y de los
limites de variación habitual
Se entregan los datos según mes y varios años, se debe tener
como requisito entre 7 – 11 años como minimo
Se elige como mediana el valor que es central
Como limites superior se elige el valor que esta antes del
valor mas mayor
Como limites inferiores se elige el valor que esta antes del
valor mas menor
Permite describir el estado actual, si hay una epidemia o si
hay una curacion milagrosa de un caso (sahh)
método de mediana fija y de los
limites de variación habitual Enero orden
1995 19 7
1996 18 6
1997 9 1
1998 10 2
1999 15 4
2000 17 5
2001 11 3
Asignar un orden a cada dato, luego se busca el del medio(mediana) en este caso como son 7 datos el valor central es el 4, por ende la mediana= 15
Luego los limites seria los inmediatamente bajo los valores extremos es decir la posicion 2 y 6 por ende los limites superior = 18 e inferior = 10
Para enero se espera un valor de 15 con una variacion entre 18 y 10
Para enero 2015 si observo un valor sobre 18 estoy frente un brote o una epidemia
Para enero 2015 si observo un valor por debajo de 10 estoy frente una sanacion o erradicacion masiva de la enfermedad
Prueba de Hipótesis entre dos media
aritméticas
Se basa en comparar dos muestras, y analizar si su diferencias
es por el muestreo en si(aleatoriedad), o por algun
tratamiento aplicado en alguna muestra
Podemos tener: Diferencias entre medias muestrales y
medias poblaciones.
Comparacion entre dos medias: muestras independientes
Comparacion entre dos medias: muestras asociadas
Z o t? El requisito para estas comparaciones es que si
o si deben distribuirse normalmente
Se sabe que si la muestras aumenta 30 o mas
individuos se acerca a Z, CON
σ CONOCIDO
Si la muestra posee menos de 30 individuos, la
muestra se acerca al estadigrafo t, DONDE
EL σ ES DESCONOCIDO. En este caso se
obtiene S de la muestra y con ese S se trabaja
Caracteristicas de t (student) Simetrica
Desde -∞ a + ∞
En relacion a los grados de libertad:
Distribucion de aplana
Varianza aumenta, es mayor que 1
Requiere usar intervalos mayores
Comparación de una media muestral con una
media poblacional (σ DESCONOCIDO)
Se quiere comparar la media de muestra con la media población pero se desconoce σ, Se usa “t”
Hipotesis nula se plantea y se habla asi:
H0 = µ0 = µ
No habría diferencia estadística entre el promedio de la muestra y el de la población
H1 = µ0 ≠ µ
Habría diferencia estadística entre el promedio de la muestra y el de la población
Zona de rechazo se determina con los grados de libertad Gl = n – 1 y un α =0.05 (α viene determinado)
X X^2 Descripcion
48 2304 n = 7
53 2809 Media = 51
52 2704 S = 2,58
48 2304
54 2916
53 2809
49 2401
Σ X = 357 Σ X^2 =18247
Grados de liberta = 7 – 1 = 6, con
α =0.05
µ = 50
nos da un valor de t = 2,447
(tabular)
Si calculamos t con la formula
nos dara un t =1,02
como t calculado es menor al
tabular
No se puede rechazar H0
El promedio de la muestra no
difiere del poblacional
Comparación de una media muestral con una
media poblacional (σ CONOCIDO)
Si σ ES CONOCIDO, se emplea Z.
Tener cuidado si se pide si el valor
de la media difiere o es menor o mayor
Se trabaja con los valores de Z, no con la probabilidad
Si se quiere saber si la media difiere de la media poblacional
el Z tabulado (con alfa = 0,05) es de 1,96
Si se quiere saber si la media es mayor o menos a la media
poblacional el Z tabulado (con alfa = 0,05) es de 1,65
Ejemplo
Si una muestra otorgo una media = 42,5 y se sabe que de la
poblacion µ=43,4 y σ = 5.
A)El valor de la media muestral es estadisticamente
inferior a la media? Con α=5%
B)Que pasa si se quiere saber solo si la media muestral
difiere de la media poblacional?
Calcular Z
Z = -1,4
A)Como Z es 1,4 es menor a 1,65, la media muestral no es
inferior a la poblacional
B) Como Z calculado es menor a 1,96, la media muestral no
difiere de la media poblacional
Prueba de la diferencia entre dos medias
aritméticas: muestras independientes Los supuestos de esta prueba son:
Las mediciones de una muestra son independientes de las de la otra muestra.
Ambas muestras provienen de poblaciones que tienen distribución Normal.
Las varianzas de las poblaciones son iguales
Como son dos muestras los grados de libertad de calculan = (n1 -1)*(n2 -1)
Las hipotesis serian
H0 : µ1 =µ 2 ; no habria diferencias entre los promedios de las muestras, provienen de la misma poblacion
H1 : µ1 ≠ µ 2 ; Habria diferencias entre los promedios de las muestras, provienen de poblaciones distintas
Si se escoge 20 ratas machos homogéneas, las divide
en 2(10 y 10) grupos al azar, asignando un grupo a la
dieta normal (grupo 1) y el otro a la dieta deficiente
(grupo2).
Calculadas las medias aritméticas y varianzas de
ambos grupos se obtiene:
Prueba de la diferencia entre dos medias
aritméticas: muestras asociadas
Dos individuos que comparten una experiencia común que puede ser genética o ambiental. Usando el mismo individuo dos veces , lo que habitualmente se conoce como las pruebas de antes y después.
Las observaciones pareadas resultan de dividir un organismo o unidad de manera que una mitad recibe un tratamiento y la otra mitad el otro tratamiento.
Se determina si la media de una muestra de diferencias entre pares es significativamente distinta de una media hipotética que según la hipótesisnula es igual a cero.
Análisis de Varianza
Modelo I – diferencia entre medias
Modelo II – componentes de varianza
Modelo Anidado o Jerarquico
Zona de rechazo
Los grados de libertad se dan entre tratamientos es decir 3-1
= 2 y entre muestras(error) = 15 -3 = 12, entonces el F
tabulado con alfa = 0,01, es de F = 6,93
F calculado = 4,44
No se puede rechazar Ho
Las medias no difieren significativamente