Αναφορές
Συγκριτική Ανάλυση Μοντέλων Θνησιμότητας για τον
Ελληνικό Πληθυσμό
Απόστολος Μποζίκας
e-mail: [email protected]Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης
Πανεπιστήμιο Πειραιώς
Νάουσα, 4-7 Μαΐου 2016
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Το Πρόβλημα
I Κατά τις τελευταίες δεκαετίες το προσδόκιμο ζωής κατά τη γέννηση
αυξήθηκε σημαντικά σε παγκόσμιο επίπεδο (εξέλιξη ιατρικής,
συνθήκες διαβίωσης)
I Στην Ελλάδα, τα τελευταία 50 χρόνια αυξήθηκε (1961-2010):
για τους άνδρες από 70.2 σε 78 έτη
για τις γυναίκες από 73.8 σε 83.3 έτη
I Αυτό έχει ως συνέπεια την αύξηση των ηλικιωμένων με άμεσες
συνέπειες στους φορείς ασφάλισης
I Ανάγκη για τη χρήση του καταλληλότερου μοντέλου πρόβλεψης
για τα δεδομένα θνησιμότητας του ελληνικού πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Το Πρόβλημα
I Κατά τις τελευταίες δεκαετίες το προσδόκιμο ζωής κατά τη γέννηση
αυξήθηκε σημαντικά σε παγκόσμιο επίπεδο (εξέλιξη ιατρικής,
συνθήκες διαβίωσης)
I Στην Ελλάδα, τα τελευταία 50 χρόνια αυξήθηκε (1961-2010):
για τους άνδρες από 70.2 σε 78 έτη
για τις γυναίκες από 73.8 σε 83.3 έτη
I Αυτό έχει ως συνέπεια την αύξηση των ηλικιωμένων με άμεσες
συνέπειες στους φορείς ασφάλισης
I Ανάγκη για τη χρήση του καταλληλότερου μοντέλου πρόβλεψης
για τα δεδομένα θνησιμότητας του ελληνικού πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Το Πρόβλημα
I Κατά τις τελευταίες δεκαετίες το προσδόκιμο ζωής κατά τη γέννηση
αυξήθηκε σημαντικά σε παγκόσμιο επίπεδο (εξέλιξη ιατρικής,
συνθήκες διαβίωσης)
I Στην Ελλάδα, τα τελευταία 50 χρόνια αυξήθηκε (1961-2010):
για τους άνδρες από 70.2 σε 78 έτη
για τις γυναίκες από 73.8 σε 83.3 έτη
I Αυτό έχει ως συνέπεια την αύξηση των ηλικιωμένων με άμεσες
συνέπειες στους φορείς ασφάλισης
I Ανάγκη για τη χρήση του καταλληλότερου μοντέλου πρόβλεψης
για τα δεδομένα θνησιμότητας του ελληνικού πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Το Πρόβλημα
I Κατά τις τελευταίες δεκαετίες το προσδόκιμο ζωής κατά τη γέννηση
αυξήθηκε σημαντικά σε παγκόσμιο επίπεδο (εξέλιξη ιατρικής,
συνθήκες διαβίωσης)
I Στην Ελλάδα, τα τελευταία 50 χρόνια αυξήθηκε (1961-2010):
για τους άνδρες από 70.2 σε 78 έτη
για τις γυναίκες από 73.8 σε 83.3 έτη
I Αυτό έχει ως συνέπεια την αύξηση των ηλικιωμένων με άμεσες
συνέπειες στους φορείς ασφάλισης
I Ανάγκη για τη χρήση του καταλληλότερου μοντέλου πρόβλεψης
για τα δεδομένα θνησιμότητας του ελληνικού πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Το Πρόβλημα
I Κατά τις τελευταίες δεκαετίες το προσδόκιμο ζωής κατά τη γέννηση
αυξήθηκε σημαντικά σε παγκόσμιο επίπεδο (εξέλιξη ιατρικής,
συνθήκες διαβίωσης)
I Στην Ελλάδα, τα τελευταία 50 χρόνια αυξήθηκε (1961-2010):
για τους άνδρες από 70.2 σε 78 έτη
για τις γυναίκες από 73.8 σε 83.3 έτη
I Αυτό έχει ως συνέπεια την αύξηση των ηλικιωμένων με άμεσες
συνέπειες στους φορείς ασφάλισης
I Ανάγκη για τη χρήση του καταλληλότερου μοντέλου πρόβλεψης
για τα δεδομένα θνησιμότητας του ελληνικού πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Σκοπός
I Εξέταση 3 μοντέλων πρόβλεψης θνησιμότητας:
1 ως προς την εφαρμογή τους στα ελληνικά δεδομένα
2 ως προς την αποτελεσματικότητα των προβλέψεων που παράγουν
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Σκοπός
I Εξέταση 3 μοντέλων πρόβλεψης θνησιμότητας:
1 ως προς την εφαρμογή τους στα ελληνικά δεδομένα
2 ως προς την αποτελεσματικότητα των προβλέψεων που παράγουν
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Σκοπός
I Εξέταση 3 μοντέλων πρόβλεψης θνησιμότητας:
1 ως προς την εφαρμογή τους στα ελληνικά δεδομένα
2 ως προς την αποτελεσματικότητα των προβλέψεων που παράγουν
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δομή
1 Περιγραφή Μοντέλων
2 Προσαρμογή στα Δεδομένα
΄Ελεγχος Καλής Προσαρμογής
3 Προβλέψεις
Αξιολόγηση Προβλέψεων
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δομή
1 Περιγραφή Μοντέλων
2 Προσαρμογή στα Δεδομένα
΄Ελεγχος Καλής Προσαρμογής
3 Προβλέψεις
Αξιολόγηση Προβλέψεων
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δομή
1 Περιγραφή Μοντέλων
2 Προσαρμογή στα Δεδομένα
΄Ελεγχος Καλής Προσαρμογής
3 Προβλέψεις
Αξιολόγηση Προβλέψεων
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δομή
1 Περιγραφή Μοντέλων
2 Προσαρμογή στα Δεδομένα
΄Ελεγχος Καλής Προσαρμογής
3 Προβλέψεις
Αξιολόγηση Προβλέψεων
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δομή
1 Περιγραφή Μοντέλων
2 Προσαρμογή στα Δεδομένα
΄Ελεγχος Καλής Προσαρμογής
3 Προβλέψεις
Αξιολόγηση Προβλέψεων
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δεδομένα και Συμβολισμοί
I Δεδομένα
πηγή: Human Mortality Database (2015)ηλικίες x : 60-94έτη t: 1981-2010εξαίρεση γενεών t − x (≤ 5 παρατηρήσεις): 1887-1891 και 1946-1950
I Συμβολισμοί
τ.μ. αριθμός θανάτων: Dx,t
κεντρική έκθεση στον κίνδυνο: Ex,t
(αρχική) έκθεση στον κίνδυνο: E 0x,t ≈ Ex,t + 1/2
ένταση θνησιμότητας: µx,t = dx,t/Ex,t (θεωρούμε≡ mx,t)
πιθανότητα θανάτου: qx,t = dx,t/E0x,t
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Δεδομένα και Συμβολισμοί
I Δεδομένα
πηγή: Human Mortality Database (2015)ηλικίες x : 60-94έτη t: 1981-2010εξαίρεση γενεών t − x (≤ 5 παρατηρήσεις): 1887-1891 και 1946-1950
I Συμβολισμοί
τ.μ. αριθμός θανάτων: Dx,t
κεντρική έκθεση στον κίνδυνο: Ex,t
(αρχική) έκθεση στον κίνδυνο: E 0x,t ≈ Ex,t + 1/2
ένταση θνησιμότητας: µx,t = dx,t/Ex,t (θεωρούμε≡ mx,t)
πιθανότητα θανάτου: qx,t = dx,t/E0x,t
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Περιγραφή Μοντέλων
I Lee and Carter (1992): logµx ,t = αx + β(1)x κ
(1)t (M1)
I Renshaw and Haberman (2006): logµx ,t = αx + β(1)x κ
(1)t + γt−x (M2)
I Cairns et al. (2006): logit qx ,t = κ(1)t + (x − x)κ
(2)t (M3)
όπου, logit qx,t = logqx,t
1− qx,t
I Συμβολισμοί:
αx : παράμετρος ηλικίας που εκφράζει τη μέση θνησιμότητα στην
ηλικία x
κ(i)t : παράμετρος χρόνου που εκφράζει το γενικό επίπεδο
θνησιμότητας στο έτος t
β(1)x : παράμετρος ηλικίας που εκφράζει την απόκλιση από τη μέση
θνησιμότητα, καθώς το γενικό επίπεδο θνησιμότητας αλλάζει
γt−x : παράμετρος χρόνου που εκφράζει την επίδραση της
ημερομηνίας γέννησης t − x στο υπό μελέτη μοντέλο
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Περιγραφή Μοντέλων
I Lee and Carter (1992): logµx ,t = αx + β(1)x κ
(1)t (M1)
I Renshaw and Haberman (2006): logµx ,t = αx + β(1)x κ
(1)t + γt−x (M2)
I Cairns et al. (2006): logit qx ,t = κ(1)t + (x − x)κ
(2)t (M3)
όπου, logit qx,t = logqx,t
1− qx,t
I Συμβολισμοί:
αx : παράμετρος ηλικίας που εκφράζει τη μέση θνησιμότητα στην
ηλικία x
κ(i)t : παράμετρος χρόνου που εκφράζει το γενικό επίπεδο
θνησιμότητας στο έτος t
β(1)x : παράμετρος ηλικίας που εκφράζει την απόκλιση από τη μέση
θνησιμότητα, καθώς το γενικό επίπεδο θνησιμότητας αλλάζει
γt−x : παράμετρος χρόνου που εκφράζει την επίδραση της
ημερομηνίας γέννησης t − x στο υπό μελέτη μοντέλο
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Περιγραφή Μοντέλων
I Lee and Carter (1992): logµx ,t = αx + β(1)x κ
(1)t (M1)
I Renshaw and Haberman (2006): logµx ,t = αx + β(1)x κ
(1)t + γt−x (M2)
I Cairns et al. (2006): logit qx ,t = κ(1)t + (x − x)κ
(2)t (M3)
όπου, logit qx,t = logqx,t
1− qx,t
I Συμβολισμοί:
αx : παράμετρος ηλικίας που εκφράζει τη μέση θνησιμότητα στην
ηλικία x
κ(i)t : παράμετρος χρόνου που εκφράζει το γενικό επίπεδο
θνησιμότητας στο έτος t
β(1)x : παράμετρος ηλικίας που εκφράζει την απόκλιση από τη μέση
θνησιμότητα, καθώς το γενικό επίπεδο θνησιμότητας αλλάζει
γt−x : παράμετρος χρόνου που εκφράζει την επίδραση της
ημερομηνίας γέννησης t − x στο υπό μελέτη μοντέλο
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Περιγραφή Μοντέλων
I Lee and Carter (1992): logµx ,t = αx + β(1)x κ
(1)t (M1)
I Renshaw and Haberman (2006): logµx ,t = αx + β(1)x κ
(1)t + γt−x (M2)
I Cairns et al. (2006): logit qx ,t = κ(1)t + (x − x)κ
(2)t (M3)
όπου, logit qx,t = logqx,t
1− qx,t
I Συμβολισμοί:
αx : παράμετρος ηλικίας που εκφράζει τη μέση θνησιμότητα στην
ηλικία x
κ(i)t : παράμετρος χρόνου που εκφράζει το γενικό επίπεδο
θνησιμότητας στο έτος t
β(1)x : παράμετρος ηλικίας που εκφράζει την απόκλιση από τη μέση
θνησιμότητα, καθώς το γενικό επίπεδο θνησιμότητας αλλάζει
γt−x : παράμετρος χρόνου που εκφράζει την επίδραση της
ημερομηνίας γέννησης t − x στο υπό μελέτη μοντέλο
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα
I Χρήση της γλώσσας στατιστικού προγραμματισμού R
I Μέθοδος μέγιστης πιθανοφάνειας
I Για τα μοντέλα M1 και M2 θεωρούμε ότι:
τ.μ. Dx ,t ∼ Poisson(Ex ,t µx ,t)
I Για το μοντέλο M3:
τ.μ. Dx ,t ∼ Binomial(E 0x ,t , qx ,t)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα - M1
60 65 70 75 80 85 90 95
−4.5
−3.5
−2.5
−1.5
αx vs. x
age
60 65 70 75 80 85 90 95
0.00
0.01
0.02
0.03
0.04
βx(1)
vs. x
age
1980 1990 2000 2010
−8−6
−4−2
02
4
κt(1)
vs. t
year
60 65 70 75 80 85 90 95
−5−4
−3−2
αx vs. x
age
60 65 70 75 80 85 90 95
0.01
0.02
0.03
0.04
βx(1)
vs. x
age
1980 1990 2000 2010
−10
−50
5
κt(1)
vs. t
year
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα - M2
60 65 70 75 80 85 90 95
−4.5
−3.5
−2.5
−1.5
αx vs. x
age
60 65 70 75 80 85 90 95
0.015
0.025
0.035
βx(1) vs. x
age
1980 1990 2000 2010
−6−4
−20
24
κt(1)
vs. t
year
1890 1910 1930 1950−0
.20−0
.100.0
00.1
0
γt−x vs. t−x
cohort
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα - M2
60 65 70 75 80 85 90 95
−4.5
−3.5
−2.5
αx vs. x
age
60 65 70 75 80 85 90 95
0.020
0.030
0.040
βx(1) vs. x
age
1980 1990 2000 2010
−50
5
κt(1)
vs. t
year
1890 1910 1930 1950−1
.0−0
.50.0
0.5
γt−x vs. t−x
cohort
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προσαρμογή στα Δεδομένα - M3
1980 1985 1990 1995 2000 2005 2010
−3.0
−2.9
−2.8
−2.7
κt(1)
vs. t
year
1980 1985 1990 1995 2000 2005 2010
0.096
0.100
0.104
0.108
κt(2)
vs. t
year
1980 1985 1990 1995 2000 2005 2010
−3.5
−3.4
−3.3
−3.2
−3.1
−3.0
κt(1)
vs. t
year
1980 1985 1990 1995 2000 2005 2010
0.120
0.125
0.130
0.135
0.140
κt(2)
vs. t
year
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
΄Ελεγχος Καλής Προσαρμογής
1 Συμπεριφορά Καταλοίπων
2 Κριτήρια Πληροφορίας
3 Λόγος Πιθανοφάνειας
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Συμπεριφορά Καταλοίπων
I Μέτρηση αποκλίσεων μεταξύ των παρατηρούμενων και
προσαρμοσμένων τιμών
I Εξαρτάται από την επιλογή της κατανομής των θανάτων για το κάθε
μοντέλο
I ΄Ελλειψη τυχαιότητας στις αποκλίσεις των καταλοίπων
→ ανεπάρκεια του μοντέλου να συλλάβει ειδικά αποτελέσματαηλικίας, χρόνου και ημερομηνίας γέννησης του υπό εξέταση πληθυσμού
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Συμπεριφορά Καταλοίπων - M1
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010
−3−2
−10
12
3calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010
−3−2
−10
12
3
calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
I ΄Ελλειψη παραμέτρου ημερομηνίας γέννησης → δεξιά διαγράμματα
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Συμπεριφορά Καταλοίπων - M2
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010
−3−2
−10
12
3calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010
−3−2
−10
12
3
calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Συμπεριφορά Καταλοίπων - M3
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010−3
−2−1
01
23
calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
60 65 70 75 80 85 90 95
−3−2
−10
12
3
age
resid
uals
1980 1990 2000 2010
−3−2
−10
12
3
calendar year
resid
uals
1890 1910 1930 1950
−3−2
−10
12
3
year of birth
resid
uals
I ΄Ελλειψη παραμέτρου ηλικίας → αριστερά διαγράμματα (ειδικά στις γυναίκες)I ΄Ελλειψη παραμέτρου ημερομηνίας γέννησης → δεξιά διαγράμματα
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Κριτήρια Πληροφορίας
I AIC = 2k − 2 log L, όπου k ο αριθμός των ελεύθερων παραμέτρων
I AIC (c) = AIC +2k(k + 1)
n − k − 1, όπου n ο αριθμός των παρατηρήσεων
I BIC = (log n)k − 2 log L
Ανδρες
Μοντέλο
Μέγιστη
Πιθανοφάνεια
Αριθμός
Παραμέτρων AIC(c) BIC
M1 -5,472.27 98 11,162(2) 11,623(3)
M2 -5,080.40 151 10,516(1) 11,207(1)
M3 -5,573.81 60 11,275(3) 11,563(2)
Γυναίκες
M1 -6,234.97 98 12,687(2) 13,149(2)
M2 -5,171.16 151 10,697(1) 11,388(1)
M3 -7,923.67 60 15,975(3) 16,263(3)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Κριτήρια Πληροφορίας
I AIC = 2k − 2 log L, όπου k ο αριθμός των ελεύθερων παραμέτρων
I AIC (c) = AIC +2k(k + 1)
n − k − 1, όπου n ο αριθμός των παρατηρήσεων
I BIC = (log n)k − 2 log L
Ανδρες
Μοντέλο
Μέγιστη
Πιθανοφάνεια
Αριθμός
Παραμέτρων AIC(c) BIC
M1 -5,472.27 98 11,162(2) 11,623(3)
M2 -5,080.40 151 10,516(1) 11,207(1)
M3 -5,573.81 60 11,275(3) 11,563(2)
Γυναίκες
M1 -6,234.97 98 12,687(2) 13,149(2)
M2 -5,171.16 151 10,697(1) 11,388(1)
M3 -7,923.67 60 15,975(3) 16,263(3)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Κριτήρια Πληροφορίας
I AIC = 2k − 2 log L, όπου k ο αριθμός των ελεύθερων παραμέτρων
I AIC (c) = AIC +2k(k + 1)
n − k − 1, όπου n ο αριθμός των παρατηρήσεων
I BIC = (log n)k − 2 log L
Ανδρες
Μοντέλο
Μέγιστη
Πιθανοφάνεια
Αριθμός
Παραμέτρων AIC(c) BIC
M1 -5,472.27 98 11,162(2) 11,623(3)
M2 -5,080.40 151 10,516(1) 11,207(1)
M3 -5,573.81 60 11,275(3) 11,563(2)
Γυναίκες
M1 -6,234.97 98 12,687(2) 13,149(2)
M2 -5,171.16 151 10,697(1) 11,388(1)
M3 -7,923.67 60 15,975(3) 16,263(3)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Κριτήρια Πληροφορίας
I AIC = 2k − 2 log L, όπου k ο αριθμός των ελεύθερων παραμέτρων
I AIC (c) = AIC +2k(k + 1)
n − k − 1, όπου n ο αριθμός των παρατηρήσεων
I BIC = (log n)k − 2 log L
Ανδρες
Μοντέλο
Μέγιστη
Πιθανοφάνεια
Αριθμός
Παραμέτρων AIC(c) BIC
M1 -5,472.27 98 11,162(2) 11,623(3)
M2 -5,080.40 151 10,516(1) 11,207(1)
M3 -5,573.81 60 11,275(3) 11,563(2)
Γυναίκες
M1 -6,234.97 98 12,687(2) 13,149(2)
M2 -5,171.16 151 10,697(1) 11,388(1)
M3 -7,923.67 60 15,975(3) 16,263(3)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Λόγος Πιθανοφάνειας
I Το M1 αποτελεί ειδική περίπτωση του M2 (M1 ⊆ M2)
I H0 : το ειδικότερο μοντέλο M1 είναι καλύτερο από το M2
H1 : το γενικότερο μοντέλο M2 είναι καλύτερο
I ψLR = 2 logL2
L1(≈ χ2
(n2−n1),α)
Η μηδενική υπόθεση απορρίπτεται όταν: ψLR > χ2(n2−n1),α
Ανδρες
H0 : Ειδικό
Μοντέλο
H1 : Γενικό
Μοντέλο
Στατιστική Ελέγχου
Λόγου Πιθανοφάνειας
Βαθμοί
Ελευθερίας p-Value
M1 M2 783.74 53 < 0.0001
Γυναίκες
M1 M2 2,127.6 53 < 0.0001
Στατιστική Ελέγχου Λόγου Πιθανοφάνειας (LR) για το ζευγάρι M1 - M2
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Λόγος Πιθανοφάνειας
I Το M1 αποτελεί ειδική περίπτωση του M2 (M1 ⊆ M2)
I H0 : το ειδικότερο μοντέλο M1 είναι καλύτερο από το M2
H1 : το γενικότερο μοντέλο M2 είναι καλύτερο
I ψLR = 2 logL2
L1(≈ χ2
(n2−n1),α)
Η μηδενική υπόθεση απορρίπτεται όταν: ψLR > χ2(n2−n1),α
Ανδρες
H0 : Ειδικό
Μοντέλο
H1 : Γενικό
Μοντέλο
Στατιστική Ελέγχου
Λόγου Πιθανοφάνειας
Βαθμοί
Ελευθερίας p-Value
M1 M2 783.74 53 < 0.0001
Γυναίκες
M1 M2 2,127.6 53 < 0.0001
Στατιστική Ελέγχου Λόγου Πιθανοφάνειας (LR) για το ζευγάρι M1 - M2
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Λόγος Πιθανοφάνειας
I Το M1 αποτελεί ειδική περίπτωση του M2 (M1 ⊆ M2)
I H0 : το ειδικότερο μοντέλο M1 είναι καλύτερο από το M2
H1 : το γενικότερο μοντέλο M2 είναι καλύτερο
I ψLR = 2 logL2
L1(≈ χ2
(n2−n1),α)
Η μηδενική υπόθεση απορρίπτεται όταν: ψLR > χ2(n2−n1),α
Ανδρες
H0 : Ειδικό
Μοντέλο
H1 : Γενικό
Μοντέλο
Στατιστική Ελέγχου
Λόγου Πιθανοφάνειας
Βαθμοί
Ελευθερίας p-Value
M1 M2 783.74 53 < 0.0001
Γυναίκες
M1 M2 2,127.6 53 < 0.0001
Στατιστική Ελέγχου Λόγου Πιθανοφάνειας (LR) για το ζευγάρι M1 - M2
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
I Υπολογισμός μελλοντικών τιμών της εκτιμήτριας ηx ,tn+s (2011-2030):
ηx ,tn+s = αx +N∑i=1
β(i)x κ
(i)tn+s + γtn+s−x
όπου ηx ,tn+s = log µx ,tn+s ή logit qx ,tn+s
I Παράμετρος κ(i)tn+s (μοντέλα M1-M3)
Τυχαίος περίπατος με μετατόπιση (random walk with a drift)
I Παράμετρος γtn+s−x (μοντέλο M2)
Ανδρες: ARIMA (0,1,1) με μετατόπιση
Γυναίκες: ARIMA (2,1,0) με μετατόπιση
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
I Υπολογισμός μελλοντικών τιμών της εκτιμήτριας ηx ,tn+s (2011-2030):
ηx ,tn+s = αx +N∑i=1
β(i)x κ
(i)tn+s + γtn+s−x
όπου ηx ,tn+s = log µx ,tn+s ή logit qx ,tn+s
I Παράμετρος κ(i)tn+s (μοντέλα M1-M3)
Τυχαίος περίπατος με μετατόπιση (random walk with a drift)
I Παράμετρος γtn+s−x (μοντέλο M2)
Ανδρες: ARIMA (0,1,1) με μετατόπιση
Γυναίκες: ARIMA (2,1,0) με μετατόπιση
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
I Υπολογισμός μελλοντικών τιμών της εκτιμήτριας ηx ,tn+s (2011-2030):
ηx ,tn+s = αx +N∑i=1
β(i)x κ
(i)tn+s + γtn+s−x
όπου ηx ,tn+s = log µx ,tn+s ή logit qx ,tn+s
I Παράμετρος κ(i)tn+s (μοντέλα M1-M3)
Τυχαίος περίπατος με μετατόπιση (random walk with a drift)
I Παράμετρος γtn+s−x (μοντέλο M2)
Ανδρες: ARIMA (0,1,1) με μετατόπιση
Γυναίκες: ARIMA (2,1,0) με μετατόπιση
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
I Υπολογισμός μελλοντικών τιμών της εκτιμήτριας ηx ,tn+s (2011-2030):
ηx ,tn+s = αx +N∑i=1
β(i)x κ
(i)tn+s + γtn+s−x
όπου ηx ,tn+s = log µx ,tn+s ή logit qx ,tn+s
I Παράμετρος κ(i)tn+s (μοντέλα M1-M3)
Τυχαίος περίπατος με μετατόπιση (random walk with a drift)
I Παράμετρος γtn+s−x (μοντέλο M2)
Ανδρες: ARIMA (0,1,1) με μετατόπιση
Γυναίκες: ARIMA (2,1,0) με μετατόπιση
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
0.20
Year
Forc
e of
mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M1 (LC)
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
0.20
Year
Forc
e of
mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M2 (RH)
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
0.20
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M3 (CBD)
1980 1990 2000 2010 2020 20300.
010.
020.
050.
100.
20Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M6 (Cohort CBD)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Προβλέψεις
1980 1990 2000 2010 2020 2030
0.00
20.
005
0.02
00.
050
0.20
0
Year
Forc
e of
mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M1 (LC)
1980 1990 2000 2010 2020 2030
0.00
20.
005
0.02
00.
050
0.20
0
Year
Forc
e of
mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M2 (RH)
1980 1990 2000 2010 2020 2030
0.00
20.
005
0.02
00.
050
0.20
0
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M3 (CBD)
1980 1990 2000 2010 2020 20300.
002
0.00
50.
020
0.05
00.
200
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M6 (Cohort CBD)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Ακρίβεια Προβλέψεων
I Χρήση μέτρων σφάλματος MAE, RMSE, MAPE για τα έτη 2011-2013
Ανδρες
Error M1 M2 M3
MAE 0.006 0.004 0.006
RMSE 0.011 0.007 0.010
MAPE 9.139 5.455 10.180
Γυναίκες
MAE 0.004 0.003 0.005
RMSE 0.007 0.006 0.009
MAPE 8.845 5.213 12.113
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
I Λάβαμε υπόψιν μόνο το σφάλμα των προβλέψεων
I Αγνοήσαμε την αβεβαιότητα που προκύπτει κατά την εκτίμηση των
παραμέτρων (parameter risk)
I Εφαρμογή μεθόδου bootstrap
I Εμφανής αβεβαιότητα στις προβλέψεις
M2: Ανδρες 85 ετών
M3: Γυναίκες 65 ετών
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
I Λάβαμε υπόψιν μόνο το σφάλμα των προβλέψεων
I Αγνοήσαμε την αβεβαιότητα που προκύπτει κατά την εκτίμηση των
παραμέτρων (parameter risk)
I Εφαρμογή μεθόδου bootstrap
I Εμφανής αβεβαιότητα στις προβλέψεις
M2: Ανδρες 85 ετών
M3: Γυναίκες 65 ετών
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
I Λάβαμε υπόψιν μόνο το σφάλμα των προβλέψεων
I Αγνοήσαμε την αβεβαιότητα που προκύπτει κατά την εκτίμηση των
παραμέτρων (parameter risk)
I Εφαρμογή μεθόδου bootstrap
I Εμφανής αβεβαιότητα στις προβλέψεις
M2: Ανδρες 85 ετών
M3: Γυναίκες 65 ετών
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
I Λάβαμε υπόψιν μόνο το σφάλμα των προβλέψεων
I Αγνοήσαμε την αβεβαιότητα που προκύπτει κατά την εκτίμηση των
παραμέτρων (parameter risk)
I Εφαρμογή μεθόδου bootstrap
I Εμφανής αβεβαιότητα στις προβλέψεις
M2: Ανδρες 85 ετών
M3: Γυναίκες 65 ετών
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
Year
For
ce o
f mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M1 (LC)
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
Year
For
ce o
f mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M2 (RH)
1980 1990 2000 2010 2020 2030
0.01
0.02
0.05
0.10
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M3 (CBD)
1980 1990 2000 2010 2020 20300.
010.
020.
050.
10Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M6 (Cohort CBD)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Αξιολόγηση Προβλέψεων
1980 1990 2000 2010 2020 2030
0.00
20.
005
0.02
00.
050
Year
For
ce o
f mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M1 (LC)
1980 1990 2000 2010 2020 2030
0.00
50.
020
0.05
0
Year
For
ce o
f mor
talit
y (lo
g sc
ale)
x = 65
x = 75
x = 85
M2 (RH)
1980 1990 2000 2010 2020 2030
0.00
20.
005
0.02
00.
050
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M3 (CBD)
1980 1990 2000 2010 2020 20300.
005
0.02
00.
050
Year
Prob
abilit
y of
dea
th (l
ogit
scal
e)
x = 65
x = 75
x = 85
M6 (Cohort CBD)
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Αναφορές
Ενδεικτική Βιβλιογραφία
Cairns, A. J. G., Blake, D., and Dowd, K. (2006). A two-factor model forstochastic mortality with parameter uncertainty: Theory and calibration.Journal of Risk and Insurance, 73(4):687–718.
Human Mortality Database (2015). University of California, Berkeley (USA),and Max Planck Institute for Demographic Research (Germany). Availableat www.mortality.org.
Lee, L. R. and Carter, R. D. (1992). Modeling and Forecasting US Mortality.American Statistical Association, 87(419):659–671.
Renshaw, A. and Haberman, S. (2006). A cohort-based extension to theLee-Carter model for mortality reduction factors. Insurance: Mathematicsand Economics, 38(3):556–570.
Α. Μποζίκας, Υ.Δ. Πανεπιστημίου Πειραιώς
Top Related