Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos … · 2008-10-22 · PP:...

25
PP: gran cantidad de faltantes Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos (ojo con no sesgar la serie!!) 2) Completar con algún método

Transcript of Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos … · 2008-10-22 · PP:...

PP: gran cantidad de faltantes

Mejor solución no siempre es la misma:

1) Trabajar con datos incompletos (ojo con no sesgar la serie!!)

2) Completar con algún método

Definición: Homegeneidad

2 estaciones A y B

Est A Est BA1 b1A2 b2..

..Aj bj

An bnAn+1....

A = Σ AiB = Σ bi en el período coincidente

Qi = bi/Ai

A y B son homogéneas cuando:

σ (Q) < σ (A) y σ (Q) < σ (B)

Primer método de estimación de faltantes

Condición: A y B homogéneasbj: faltante

Est A Est BA1 b1A2 b2..

..Aj bj

An bnAn+1....

A = Σ AiB = Σ bien el período coincidente sin contar ni Aj ni bj

Q = B/A

bj se estima como:

bj = Aj Q

Segundo método de estimación de faltantes

Idea: Establecer si las 2 estaciones están relacionadas a través de una relación linealY cuantificar esa relación

Método de las mínimos cuadradosP2 E1b

y = 3,2052+0,4978*x

4 6 8 10 12 14 16 18 20 22 24 26

x

2

4

6

8

10

12

14

16

18

20

y

x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x

Estacion B = bo +b1 Estación A

Pendienteb1 =(Σxi yi –n xm ym)/(Σxi2 – n xm2)

Ordenada al origen

Estacion B

Estación A

P2 E1by = 3,2052+0,4978*x

4 6 8 10 12 14 16 18 20 22 24 26

x

2

4

6

8

10

12

14

16

18

20

y

x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x

SSE

SSRSST

SST = SSR + SSE

Suma total de los cuadrados

ΣΣ(yi-ym)2

Suma de los cuadrados debida a la regresiónΣ(Ŷ-ym)2

Suma de los cuadrados de errorNo explicado por la recta

Σ (yi-Ŷ)2

Ŷ= b1 x * bo

Cómo sabemos si el ajuste es bueno?????

Coeficiente de determinación: mide la proporción de la variación que esexplicada por la variable independiente del modelo

R2 = SSR/SST = 1 – SSE/SST

Ejemplo:

R2 = 0.91 indica que el modelo lineal entre Y y X explica un 91% de la variabilidad de Y.

TEST DE SIGNIFICANCIA

1) TEST NORMAL. R ~ N(0 ; 1/(N-2)1/2 )

R > 1.96/ (N-2)1/2 SIGNIFICATIVO CON 95% DE CONFIANZA

R > 2.58/ (N-2)1/2 SIGNIFICATIVO CON 99% DE CONFIANZA

2) Test T Ho : R=0T = ( R (n-2) ½) / (1-R2)

Cuándo puede usarse para el caso de relaciones no lineales??

y = c edx

Ln y = ln c + d x lneLn y = ln c + d x

Llamando:Y´ = ln yb = ln c

Y´= b + d x es una relación lineal

También pueden usarse ajustes no lineales

Con Excel:

GraficoDispersionAgregar línea de tendenciaLineal (o cualquier otro ajuste)Mostrar ecuación y R

Con STATISTICA:

StatisticsMultiple regresion

Resultados:R2 porcentaje de varianza explicada por la rectaF = SSR/SSE debe ser lo más grande posible para que el ajuste sea buenoP debe ser menor que el nivel de significancia con el que se quiere trabajarCoeficientes B: ordenada al origen y pendiente y los respectivos test para ver si difieren de cero.

y = 0.0037x + 4.0034R2 = 0.1703

0

1

2

3

4

5

6

7

8

0 50 100 150 200 250 300 350 400 450

Tercer método de estimación de faltantes

Se cuenta sólo con la serie A y falta un dato intermedio.

P2 E1by = 3,2052+0,4978*x

4 6 8 10 12 14 16 18 20 22 24 26

x

2

4

6

8

10

12

14

16

18

20

y

x:y: r2 = 0,3897; r = 0,6243| p = 0,0015; y = 3,20524017 + 0,497816594*x

Estacion A = bo +b1 TiempoEstación A

Tiempo

Solo interpolación!!!Ojo extrapolación!!

Reducción de Promedios a Períodos de igual Longitud

Est A Est BA1 b1A2 b2..

..Aj bj

An bnAn+1..An+k..

Estimar el promedio de B para n+k años:

Período coincidente: hasta año n

A1 = Σ Ai/n promedio primeros n años

B1 = Σ bi/n promedio primeros n años

Q = B / A

A2 = Σ Ai/(n+k) promedio n+k años

Estimo:

B2 = Σ bi/(n+k) = Q A2

VARIABILIDAD MEDIA = Σ ІAi – ĀІ / n

VARIABILIDAD SECUENCIAL = Σ ІAi – Ai-1І / (n-1)

VARIABILIDAD RELATIVA = VARIABILIDAD SECUENCIAL / Ā

Ai precipitación en el tiempo i; serie temporal de n términos

Análisis de variabilidad de la precipitación:

Indice de pluviosidad implica realizar la siguiente transformación:

Pi = pi /Pmedia * 100 porcentaje de la precipitación normal esperada

Pj > 100 pp superiores a las normales

Pj < 100 pp inferiores a las normales

Método de los Quintiles para precipitación mensual

Se necesita tener una muestra de datos ordenada

-------------------------------------------------------------------------------- pp

20% 40% 60% 80% 100%

Quintil1

Percentil 20

Quintil 4

Percentil 80

Quintil 3

Percentil 60

Quintil 2

Percentil 40

Extsubnormal sub normal sobre Ext sobre

Ver: ejemplosparaclase.xls

Pagina PPMENSUAL

Ejercicio 11

Método de los Quintiles para precipitación diaria

N días en total N-k días con pp

Método de los quintiles

OJO!!! Distinguir pp nula de dato faltante

Ver: ejemplosparaclase.xls

Pagina PPDIARIA

Ejercicio 12

AJUSTE POR FUNCIONES DE PROBABILIDAD

Cálculo de probabilidades

Con serie original de datos: HistogramaOjiva

Si la distribución es simétrica: ajuste NORMAL

Si no es simétrica: transformación: LOG NORMAL

Ejercicio 13 y 17

Ejercicio 14 y 15

probabilidad

ojiva

pp

Para variables positivas: precipitación, presión de vapor, evaporación, agua precipitable

Distribución GAMMA : X tiene distribución γ (α ; β) cuando la función de densidad probabilística es:

F (x) = 1 / β α Г(α) x α-1 e -x/β

Donde

Г es la función gamma

Α = (1 + (1+4/3 A)1/2) / 4 A

α= ln (xmedio) – Σ(ln x) / n

β = xmedio /α

α y β > 0

Esperanza de la distribución = α * β

Varianza de la distribución = α * (β)1/2

Planilla de cálculo de distribución gamma: AJUSTEGAMMA.XLS

Calcula ln (pp), parámetros α y β,Probabilidad con la función DISTR.GAMMA (x; α; β; Argumento)Argumento = verdadero probabilidad acumuladaArgumento = falso función de densidad

Si se conocen los parámetros de la distribución, se puede estimar el valor de pp por debajo del cual caen los valores con un determinado nivel de probabilidad:

DIST.GAMMA.INV (probabilidad; α; β)

probabilidad

Función de distribución acumulada

ppx

Ajuste por distribución Normal y Log Normal:

**** Con Excel:

DISTR.NORMAL (x; media; desvío; Argumento)

DISTR.LOG.NORMAL (x; media; desvío)

**** Con STATISTICA:

StatisticDistribution Fitting

Elegir la distribución

Da las frecuencias observadas y las esperadas con el ajuste

Período de retorno: es el tiempo promedio (en años) esperado para la repetición de determinado evento

Un suceso que ocurre m veces en n años tiene probabilidad de ocurrencia:

P = m/n

El intervalo medio entre sucesivas recurrencias será el período de retorno:

T = n/m = 1/P

Ejemplo:

Si existe un 2% de riesgo de que se produzca una tormenta intensa quiere decir que

P(tormenta intensa) =0.2

T = 1/0.2 = 50 años

Esto no quiere decir que la tormenta se produzca regularmente cada 50 años sinoque en un período largo (por ejemplo 500 años), es posible que la tormenta serepita 10 veces!!!!

Probabilidad de excedencia:

Probabilidad de que, dado un determinado período de retorno T, o bien la probabilidad p de determinado evento (p= 1/T), el mismo ocurra al menos una vez en el intervalo de tiempo de n años:

P (T,n) = 1 – (1- 1/T) n

Ejemplo:

cuál es la probabilidad de que una tormenta cuyo período de retorno es 50 años, ocurra al menos 1 vez en los próximos 5 años:

P(50; 5) = 1- (1- 1/50)5 = 0.096 = 9.6%

INTENSIDAD DE UNA TORMENTA

Es la cantidad de lluvia caída en un intervalo de tiempo dado

Para analizar la evolución de una tormenta se toman intervalos cada vez más

pequeños y se compara la intensidad.Intensidad (mm/h)

tiempo

hietograma

Pico de intensidad en un intervalo de tiempo:

Máximo cambio de precipitación en ese intervalo durante toda la tormenta

Ejemplo:

Tiempo (min) pp(mm)

5 110 715 1520 625 330 2

Total de pp caída en la tormenta:1+7+15+6+3+2 = 34 mm

Tiempo de duración de la tormenta:30 minutos

Pico de intensidad para 5 min:El máximo es que entre 10 y 15 min llovieron 15 mm:15mm/5min = 180 mm/h

Pico de intensidad en 10 minutos:Tiempo(min) 10 20 30Pp (mm) 8 21 521mm/10min = 126 mm/h

Intensidad media de la tormenta:Pptotal/tiempo total = 34 mm/30min = 68 mm/h