Download - Curs Tabela de Decizie

Transcript
Page 1: Curs Tabela de Decizie

CURSUL 9. Decizii în condiţii de incertitudine . Concepte, criterii, axiome.

1.Tabele de decizieCele mai multe probleme de decizie pot fi reprezentate sub forma unor

tabele de decizie. Presupunem că exista un număr finit de stări posibile ale naturii, pe care în continuare le vom nota θ1, θ2,……,θn si un număr finit de acţiuni / variante : A1, A2, …..,A m. Decidentul poate alege numai o singură acţiune din cele posibile. Vom nota cu xij, consecinţa luării deciziei Ai atunci când θj este starea reală a naturii.

Tabelul 2.1 Forma generala a unei tabele de decizie

Stări ale naturii

θ1 θ1 ……. θn

Acţiuni

A1 x11 x12 x1n

A2 x21 x22 …… x2n

. . . …… .

. . . …… .

Am xm1 xm2 …… xmn

Variabilele xij pot lua valori numerice, ca în cazul problemelor de decizie monetare, sau pot fi şi de natură calitativă.

Presupunem că decidentul poate măsura valoarea consecinţelor xij prin intermediul unei funcţii cu valori reale v(.), astfel că v(xij)>v(xkl) dacă şi numai dacă decidentul preferă consecinţa xij consecinţei xkl. Vom nota în continuare vij = v(xij) iar noua tabela de decizie devine:

Tabelul 2.2 Tabela de decizie, cu valorile asociateStări ale naturii

θ1 θ2 ……. θn

Acţiuni

A1 v11 v12 v1n

A2 v21 v22 …… v2n

. . . …… .

. . . …… .Am vm1 vm2 …… vmn

Problemele de decizie au fost clasificate în funcţie de informaţiile avute de decident asupra stărilor naturii. Avem astfel:

consecinţe

consecinţe

Page 2: Curs Tabela de Decizie

Decizii în condiţii de certitudine in care decidentul cunoaşte starea reală a naturii, înainte să facă o alegere.

Deoarece vi1 cresc odată cu creşterea valorii fiecărei consecinţe pentru decident, decizia optimala este desigur, aceea de a alege acţiunea cu cea mai mare valoare numerica vi1.Astfel, problemele decizionale în condiţii de certitudine sunt foarte directe, relevând o singură chestiune : cum se măsoară vi1

pentru că acestea să reprezinte corect preferinţele factorului decizional?

Tabelul 2.3 - Decizia în condiţii de certitudine (siguranţă).

Valori Stare

θ1

Acţiuni

A1 v11

A2 v21

. .

. .Am

vm1

Decizii în condiţii de risc. Deşi decidentul nu cunoaşte cu siguranţă starea reală a naturii, el poate cuantifica incertitudinea printr-o distribuţie de probabilităţi: (P(θ1), P(θ2), ..., P(θn)); dacă vij sunt măsurate printr-o metodă corectă şi dacă decidentul acţionează sub o anumită raţionalitate, el va trebui să

aleagă varianta Ai care să maximizeze suma . Această sumă

reprezintă utilitatea aşteptată a lui Ai . Vom folosi deci, în discuţia problemelor în condiţii de risc uij în loc de vij.

Decizii în condiţii de incertitudine ,sau strictă nesiguranţă- situaţiea în care decidentul nu poate spune nimic sigur despre starea reală a naturii

2. Criterii de decizie în condiţii de incertitudine

C1. Criteriul maximin (Criteriul lui Wald)

Pentru acţiunea Ai notăm cea mai puţin bună consecinţă ce poate avea loc pentru decident astfel:

care se numeşte nivel de siguranţă al decidentului pentru varianta Ai. Cu alte cuvinte, acesta reprezintă câştigul minim garantat decidentului dacă ar alege varianta Ai. Un decident prudent va alege în final varianta Ak căreia ii corespunde cea mai mare valoare din mulţimea valorilor de siguranţă:

Din punct de vedere psihologic, criteriul lui Wald este un criteriu prudent, pesimist

cons

ecin

ţe

Page 3: Curs Tabela de Decizie

C2. Criteriul optimist al lui Hurwicz (Criteriul maximax)

Intr-o manieră asemănătoare cu varianta pesimistă a lui Wald, se poate dezvolta un criteriu optimist, considerând cel mai bun rezultat în cadrul fiecărei variante decizionale. Vom defini nivelul optimist oi, al fiecărei variante astfel:

.

Astfel, oi reprezintă valoarea celei mai bune consecinţe în cadrul variantei de decizie Ai. Mai departe, se recomandă alegerea variantei Ak corespunzătoare rezultatului ok, cel mai bun dintre nivelurile optimiste.

Acest criteriu, deşi oferă alegerea unei variante de maxim, preferate, este rar utilizat în practică de către decidenţi.

Hurwicz a propus un criteriu de compromis între cele două prezentate până acum. Conform criteriului mixt pesimist – optimist un decident trebuie să-şi stabilească decizia între un nivel prudent şi unul optimist, combinând aceste mărimi. Pentru fiecare variantă în parte se va determina o combinaţie

convexă , cu . reprezintă indexul de pesimism –

optimism al decidentului , este o valoare specifică fiecărui individ în parte şi este aplicabil oricărei probleme de decizie cu care se confruntă. Hurwicz a propus următoarea regulă de decizie:

Aplicarea unei astfel de reguli necesită pentru fiecare decident, cunoaşterea indexului .

O posibilitate de estimare a acestui coeficient, dată de Raiffa este următoarea:se oferă decidentului posibilitatea de a alege între două variante A1

şi A2 care, în două stări ale naturii θ1 şi θ2, conduc la următoarele consecinţe monetare:

θ1 θ2 si oi αsi+(1-α)oi

A1 1 0 0 1 1-A2 v v v v v

cu .

Decidentul este întrebat care este suma de bani care ar trebui să apară în matricea consecinţelor astfel încât el să fie indiferent la alegerea între A1 şi A2. La această sumă, cele două variante sunt echivalente, deci:

, şi .

C3. Criteriul pierderilor de oportunitate minimax (Criteriul lui Savage)

Page 4: Curs Tabela de Decizie

Savage a arătat necesitatea de a compara valorile consecinţelor acţiunilor sub o aceeaşi stare a naturii. Asemănător costului de oportunitate, Savage a introdus conceptul de regret monetar sau pierdere de oportunitate a valorii asociate unei consecinţe, notat cu rij.

Criteriul lui SAVAGE presupune următoarele etape:- se construieşte matricea regretelor monetare:

- pentru fiecare alternativă Ai se determină un index ρi care reprezintă cea mai mare pierdere de oportunitate:

- alegerea Ak reprezintă pierderea minimă dintre cele mai mari pierderi de oportunitate.

C.4 Criteriul raţiunii insuficiente( Criteriul lui Laplace)

Laplace a relevat că a nu şti nimic despre starea reală a naturii este echivalent cu a considera că toate stările sunt echiprobabile. El a propus ca varianta aleasă să fie cea căreia ii corespunde valoarea medie maximă:

Cele patru criterii prezentate sunt distincte, ele sugerând comportamente diferite ale decidenţilor în raport cu o problemă decizională. Rezultatele furnizate de aceste criterii coincid numai întâmplător.

Considerăm în continuare următorul exemplu ( dat de Milnor ).

Tabelul 2.4 - Exemplul lui Milnor

Acţiuni

Stări ale naturii

Wald Hurwicz Hurvicz* Laplace Savage

θ1 θ2 θ3 θ4 si oi

A1 2 2 0 1 0 2 5/4 2

A2 1 1 1 1 1 1 1 1 3

A3 0 4 0 0 0 4 1 2

A4 1 3 0 0 0 3 1 1

În mod evident, criteriul lui Wald ar duce la varianta A2 iar Hurwicz la A3. Criteriul

pesimist – optimist are două soluţii posibile. Pentru deci

Page 5: Curs Tabela de Decizie

varianta aleasă este A3, iar pentru se va alege varianta A2. cu ajutorul

tabelei regretelor (tabelul 2.5), observăm că soluţia oferită de Savage este varianta A4.

Tabelul 2.5 Tabela regretelor în exemplul lui Milnor

θ1 θ2 θ3 θ4 ρk

A1 0 2 1 0 2

A2 1 3 0 0 3

A3 2 0 1 1 2

A4 1 1 1 1 1

Fiecare regulă de decizie clasifică acţiunile de la cea mai bună pană la cea mai puţin bună, fără a putea spune însă, dacă o acţiune este bună sau nu pentru decident. ALTE REGULI DE DECIZIE

Criteriul medie – variaţie

Fiecare variantă este evaluată prin valoarea medie:

Ai (media)

şi variaţie: care reprezintă ecartul maxim al valorilor pentru

fiecare variantă.

Regula 1. Aα Aβ dacă

şi D(Vα)<D(Vβ)

SAU

şi

Soluţia optimă corespunde variantei (acţiunii) cu cea mai mare medie şi variaţie

minimă

Page 6: Curs Tabela de Decizie

Regula 2.

dacă

iar soluţia optimă corespunde raportului

Regula 3. dacă

(prag ales de decident), sau soluţia optimă e dată de:

3. Axiomele de consistenţă ale regulilor decizionale Pentru ca o regulă de decizie să fie consistentă in incertitudine, ea trebuie

să respecte următorul sistem axiomatic (Luce si Raiffa) :Axioma 1: Criteriul decizional trebuie sa ofere o clasificare completă

a tuturor acţiunilor.Cu alte cuvinte, regula de decizie trebuie ca, implicit sau explicit, să

ataşeze un index numeric fiecărei acţiuni, care să permită sortarea acestora crescător sau descrescător. În general vom considera că o regulă ataşează alternativei Ai indexul Vi şi că varianta cu cel mai mare index va fi preferată celorlalte.

Observaţie: cele patru reguli de decizie , satisfac această regulă:

Criteriul maximin al lui Wald:

Criteriul pesimist – optimist al lui Hurwicz:

Criteriul minimax al lui Savage:

Criteriul raţiunii insuficiente al lui Laplace:

Axioma 2: Independenţa alegerii de etichetarea problemeiAceastă axiomă exprimă cerinţa naturală ca alegerea decidentului să nu

fie influenţată de ordinea în care sunt listate alternativele şi stările naturii.

Page 7: Curs Tabela de Decizie

Considerăm matricea decizională de dimensiuni mxn, descrisă de

acţiunile, stările şi consecinţele: .

Fie o a doua matrice decizională . Elementele acestei

matrice sunt obţinute din prima prin permutarea atât a liniilor cât şi a coloanelor. Rândul i devine π(i) iar coloana j devine τ(j).

Regula decizională va trebui să asocieze acţiunilor din cele două tabele decizionale valorile V respectiv V’ astfel încât oricare ar fi atunci

.

Axioma 3: Independenţa alegerii de scala valorilor

Fie o tabelă de decizie de dimensiuni m x n cu stările θ j, acţiunile Ai şi valorile vij date .

Fie o a doua tabelă de dimensiuni m x n cu aceleaşi stări θ j şi acţiuni Ai

dar cu valorile v’ij diferite, construită din prima tabelă prin schimbarea scalei de măsurare a valorilor.

v’ij = αvij + β, pentru α > 0 şi α, β fixate.Atunci o regulă decizională ar trebui să asocieze valorile V şi respectiv V’

acţiunilor din cele două tabele astfel încât oricare ar fi ,

OBSERVATIE.Dacă o acţiune duce la o consecinţă strict mai bună decât alta, oricare ar fi starea naturii, atunci prima acţiune trebuie preferată celei de-a doua. Să considerăm acum exemplul din tabelul de mai jos:

θ1 θ2 θ3 θ4 θ5

A1 8 9 4 7 2

A2 3 1 3 6 -9

Este evident, în acest caz, că A1 este preferat lui A2, deoarece orice s-ar întâmpla, ea duce la o consecinţă mai bună. Vom spune că A1 domină puternic pe A2 şi că se impune următorul principiu, al “dominării nete”.

Axioma 4: Axioma dominării nete.

Page 8: Curs Tabela de Decizie

Daca Ai şi Ak sunt două variante astfel încât oricare ar fi

atunci regula de decizie va trebui să asocieze celor două alternative

valorile Vi şi Vk astfel încât Vi > Vk.O astfel de axiomă este utilă deoarece ea permite eliminarea dintr-o

matrice a tuturor variantelor dominate, fără a fi afectată decizia optima.

Axioma 5: Axioma independenţei alegerii în raport cu alternativele irelevante.

Fie o tabelă de decizie de dimensiuni m x n cu: stările θj, acţiunile Ai şi valorile vij date .Fie o a doua tabelă construită din prima tabelă prin simpla adăugare a unei noi acţiuni. Astfel a doua tabelă are (m+1) linii, n coloane şi v’ ij = vij,

.v’(m+1),j poate lua orice valoare numerică . Atunci

regula decizională va trebui să ducă la aceeaşi clasificare a primelor m acţiuni în ambele tabele, indiferent de varianta Am+1 luată în considerare.

OBSERVATIE. Să considerăm următoarele două tabele decizionale:

θ1 θ2

A1 6 4A2 3 8

θ1 θ2

A1 16 4A2 13 8

Diferenţa între cele două tabele o reprezintă doar constanta 10 care a fost adăugată la ambele elemente din prima coloană în trecerea de la prima tabelă la a doua. Ne aşteptăm ca o regulă decizională să determine aceeaşi acţiune optimă pentru ambele tabele.

Axioma 6: Axioma independenţei adăugării unei constante intr-o coloană a matricei decizionale.

Fie o tabelă de decizie de dimensiuni m x n cu stările θ j, acţiunile Ai şi valorile vij date .

Fie o a doua tabelă de dimensiuni m x n cu aceleaşi stări θ j şi acţiuni Ai

dar cu valorile v’ij diferite, construită din prima tabelă prin adăugarea unei constante c la fiecare element din coloana l:

Atunci o regulă decizională ar trebui să asocieze valorile V respectiv V’ acţiunilor din cele două tabele astfel încât

Page 9: Curs Tabela de Decizie

Următoarele două axiome încearcă să explice exact ce înţelegem prin circumstanţe de strictă nesiguranţă.

OBSERVATIE. Dacă factorul decizional nu ştie absolut nimic despre starea reală atunci este normal să presupunem că va fi indiferent între cele două acţiuni din tabela de mai jos.

θ1 θ2 θ3

A1 6 0 3

A2 0 6 3Setul de consecinţe posibile al lui A1 este identic în termenii valorii cu cel

al lui A2, acţiunile având acelaşi nivel de nesiguranţă. Singura caracteristică ce le diferenţiază este faptul că acţiunile au consecinţe egale ca valoare, sub stări diferite ale naturii. Atunci, este posibil ca decidentul să aibă o preferinţă raţională asupra unei acţiuni, dacă nu poate spune absolut nimic despre starea reală?

Axioma 7: Independenţa alegerii în raport cu permutarea elementelor de pe liniile matricei decizionale

Presupunem că într-o tabelă m x n există două acţiuni Ai şi Ak, şi o permutare a stărilor {1, 2, ..., n} astfel încât,

vij =viτ(j)

Atunci o regulă decizională ar trebui să asocieze valorile V acţiunilor astfel încât

Vi =Vk.

OBSERVATIE. Sa considerăm următoarele două probleme decizionale:

Tabelul 2.6 – Ilustrarea Axiomei 8

(a) (b)

θ1 θ2

A1 9 4

A2 2 6

θ'1 θ'2 θ'3 θ'4 θ'5

A1 9 4 4 4 4

A2 2 6 6 6 6

Având în vedere că starea reală este incertă, există vreo diferenţă între aceste probleme? Dacă stările θ’2, θ’3, θ’4 şi θ’5 sunt reunite şi identificate cu o

Page 10: Curs Tabela de Decizie

singură stare θ’’2, atunci Tabela 2.6(b) devine identică cu Tabela 2.6(a); iar o situaţie de strictă nesiguranţă nu va lua în considerare nici un argument care ar sugerea că θ2 din tabela 2.6(a) este diferit în vreun fel de θ’’2 din tabela rezultată. Intr-adevăr, θ’’2 este o stare mai probabilă decât oricare dintre stările care o compun, θ’2, θ’3, θ’4 sau θ’5; dar asta nu spune nimic despre posibilităţile relative de apariţie ale stărilor θ’’2 şi θ’1. Astfel, acţiunea preferată din Tabela 2.6(a) ar trebui să coincidă cu acţiunea preferată de decident din tabela 2.6(b). Se adopta deci, următoarea axiomă:

Axioma 8: Independenţa alegerii în raport cu duplicarea coloanelor matricei decizionale

Fie o tabelă de decizie de dimensiuni mxn cu stările θ j, acţiunile Ai şi valorile vij date .

Fie o a doua tabelă de dimensiuni m x (n+1) cu stările θ’ j, acţiunile Ai şi valorile v’ij construită din prima tabelă prin duplicarea coloanei n.

'il ilv v , pentru

Atunci o regulă decizională ar trebui să asocieze valorile V respectiv V’ acţiunilor din cele două tabele astfel încât

Vi >Vk dacă şi numai dacă V’i > V’k

Combinarea acestei axiome cu axioma “independenţei la etichetare” (Axioma 2) înseamnă că se aplică şi situaţiilor în care orice coloană este duplicată.

4. Analiza criteriilor versus axiomeAm stabilit opt principii de consistenţă a alegerii ca axiome. Prima

întrebare evidentă este care din criteriile lui Wald, Hurwicz, Savage sau Laplace

Page 11: Curs Tabela de Decizie

satisface aceste axiome. Răspunsul, dat de teorema de mai jos, este că nici unul nu o face.

Teorema 1(Milnor): Criteriile decizionale ale lui Wald, Hurwicz, Savage şi Laplace sunt compatibile cu Axiomele 1 –8 după cum se indică în tabelul 2.7:

Wald Hurwicz Savage Laplace

Axioma 1 √ √ √ √ Clasificarea completă

Axioma 2 √ √ √ √ Independenţa etichetării

Axioma 3 √ √ √ √ Independenţa scalei valorilor

Axioma 4 √ √ √ √ Dominarea netă

Axioma 5 √ √ x √Independenţa alternativelor irelevante

Axioma 6 x x √ √Independenţa adăugării unei constante într-o coloană

Axioma 7 √ √ x √Independenţa permutării liniilor

Axioma 8 √ √ √ xIndependenţa duplicării coloanelor

Tabelul 2.7 Compatibilitatea criteriilor şi axiomelor. √ indica faptul că axioma este satisfăcută; x indică faptul că nu este satisfăcută .

Demonstraţie.VEZI DEM. IN CARTE-SUBIECT DE EXAMEN.

Vom demonstra că majoritatea notaţiilor √ sunt corecte şi vom da contra-exemple pentru a justifica toate marcările cu x.

Axioma 1 este evident satisfăcută de toate criteriile, din moment ce fiecare asociază un index numeric fiecărei acţiuni şi ordinea acestor indecşi ne dă o clasificare completă.

Pentru a arăta că criteriul minimax al lui Wald satisface Axioma 2, observăm în primul rând, că minimul valorilor dintr-un şir de numere este independent de ordinea lor. Astfel dacă vom permuta ordinea stărilor nu vom afecta nivelul de siguranţă al nici uneia din acţiuni. Prin permutarea liniilor se vor permuta în mod corespunzător nivelurile de siguranţă.

Pentru a arăta că criteriul Laplace satisface Axioma 3, procedăm astfel: Fie v’ij = αvij + β, cu α >0. Atunci, vom presupune ca:

Page 12: Curs Tabela de Decizie

Pentru a demonstra ca Axioma 4- dominarea neta- este satisfăcută de Criteriul maximin al lui Wald, procedăm după cum urmează:

Presupunem că:vij> vkj, pentru toate stările θj. (2.1)

Atunci:

.

Să arătăm că indexul optimism-pesimism al lui Hurwicz satisface Axioma 5:

pentru orice acţiune Ai max din , este

independent de o altă acţiune. Astfel, adăugarea de acţiuni tabelei de decizie nu poate afecta clasificarea acţiunilor A1, A2 ,…, Am.

Pentru a arăta că Axioma 6 este respectată de criteriul de rezultat mediu al lui Laplace:

Atunci:

Pentru a demonstra că criteriul de regret minimax a lui Savage satisface Axioma 8, presupunem că duplicăm coloana n. Obţinem:

Page 13: Curs Tabela de Decizie

Deoarece r’ij = rij pentru 1 i m şi 1 j n, ρ’i = ρi pentru toate acţiunile Ai. Astfel clasificarea acţiunilor rămâne neschimbată.

Pentru a demonstra că regula maximin a lui Savage nu respectă Axioma 5, dăm următorul contraexemplu. Să considerăm tabela de decizie 2.8, înainte şi după adăugarea acţiunii A3:

Tabelul 2.8 Contraexemplul pentru a demonstra că regula lui Savage, nu respectă Axiomele 5 şi 7

θ1 θ2 θ3

A1 6 0 3

A2 0 3 6

A3 2 9 4

Este uşor de verificat, înainte de adăugarea lui A3 că ρ1 = 3 < 6 = ρ2 dar, dar după adăugarea lui A3, ρ1 = 9 > 6 = ρ2.

Contraexemplul pentru a arăta că rezultatul maximin al lui Wald şi indexul optimism-pesimism al lui Hurwicz nu satisfac Axioma 6. Considerăm drept exemplu Tabelul 2.9 (a) şi (b) folosit pentru argumentarea Axiomei în secţiunea precedentă.

Tabelul 2.9 Contraexemplu pentru a arata ca regulile lui Wald şi Hurwicz nu satisfac Axioma 6

(a)

 θ1 θ2 si oi

A1 6 4 4 6 22/4A2 3 8 3 8 27/4

(b)

 θ1 θ2 si oi

A1 16 4 4 16 52/4A2 13 8 8 13 47/4

Evident clasificările date de cele două criterii diferă în cele două tabele. Am ales să folosim α = ¼ , suficient pentru a furniza un contraexemplu dar se poate verifica pentru orice altă valoare în intervalele 0 α 3/7 şi 2/3 α 1 că ordinea variantelor se inversează între cele două tabele.

Page 14: Curs Tabela de Decizie

Contraexemplul pentru a arăta că regretul maximin a lui Savage nu satisface Axioma 2.4.7: observăm, în tabelul 2.8 că variantele A1 şi A2 au consecinţe identice; linia 2 este o permutare a liniei 1. Totuşi A1 şi A2 nu sunt clasificate în mod egal nici înainte nici după adăugarea lui A3.

Contraexemplu pentru a arăta că regula de rezultat mediu a lui Laplace nu satisface Axioma 2.4.8: comparăm clasificarea lui A1 şi A2 în tabelele 2.6.(a) şi 2.6.(b). În termeni stricţi acesta nu este un contraexemplu la Axioma 2.4.8.

Aşadar, cele patru criterii nu satisfac simultan toate axiomele. Într-adevăr, putem arăta mai mult decât atât: şi anume, nici un criteriu nu poate satisface toate axiomele. Pentru a demonstra aceasta vom arăta că orice criteriu care satisface Axiomele 2.4.1 – 2.4.7. este ,de fapt, criteriul de rezultat mediu al lui Laplace şi din moment ce acest criteriu nu satisface axioma 2.4.8. rezultă că nici un criteriu decizional nu poate satisface toate cele opt axiome.

Teorema 2. Presupunem că un criteriu de decizie satisface Axiomele 1, 4, 5, 6 şi 7. Atunci criteriul asociază un index numeric V i fiecărei acţiuni Ai, astfel încât:

Cu alte cuvinte,1. Clasificarea completă 4. Dominarea puternică 5. Independenţa alternativelor irelevante 6. Independenţa adăugării unei constante într-o coloană 7. Independenţa permutării liniilor

criteriul lui Laplace

Demonstraţie. În primul rând se observă că Axioma 1. este folosită odată cu

presupunerea că, regula decizională asociază un index numeric Vi fiecărei acţiuni Ai. În al doilea rând putem presupune că vij 0 pentru orice i,j deoarece având dată orice tabelă de decizie o putem transforma într-o tabelă echivalentă cu intrări nenegative doar prin extragerea minimului de pe fiecare coloană (Axioma 6.).

Demonstraţia continuă prin luarea unei tabele de decizie şi transformarea ei printr-o secvenţă de tabele echivalente până când se obţine o tabelă în care alegerea între două acţiuni este evidentă.Construcţia este ilustrată în tabelul 2.10.

Considerăm mai întâi în tabela de decizie două acţiuni Ai şi Ak astfel încât

Page 15: Curs Tabela de Decizie

(2.2)

Vom arăta că aceasta implică Vi =Vk. Este indicat să introducem o nouă notaţie, astfel Ai şi Ak devin A0

i şi A0k .În

mod corespunzător vom redenumi şi vij respectiv vkj.Tabelul 2.10 . Secvenţa de construcţie în care două acţiuni cu rezultat mediu egal sunt transformate în două acţiuni echivalente cu liniile în întregime 0.

  θ1 θ2 θ3 Observaţii

a0i 8 6 10

(8+6+10)/3 =8=(12+3+9)/3a0k 12 3 9

a1i 6 8 10 Pasul 1: permutăm rândurile în

ordine crescătoarea1k 3 9 12

a2i 3 0 0 Pasul2: extragem min { v1

ij ,v1kj } din

coloana ja2k 0 1 2

a3i 0 0 3 Pasul 1: permutăm rândurile în

ordine crescătoarea3I 0 1 2

a4i 0 0 1 Pasul 2: extragem min { v3

ij ,v3kj }

din coloana ja4k 0 1 0

a5i 0 0 1 Pasul 1: permutăm rândurile în

ordine crescătoarea5k 0 0 1

a6i 0 0 0 Pasul 2: extragem min { v5

ij ,v5kj }

din coloana ja6k 0 0 0

Fie l=1.

Pasul 1. Adăugăm la tabelă o acţiune Ali construită prin permutarea { }

în ordine crescătoare. Similar adăugăm o acţiune Alk construită prin permutarea

lui { } în ordine crescătoare. Conform axiomei 2.4.5. adăugarea acestor

acţiuni nu afectează ordinea lui şi Conform Axiomei 7, şi

. Astfel:

Page 16: Curs Tabela de Decizie

(2.3.)

Pasul 2 Construim o nouă tabelă de decizie după cum urmează .Pentru

j=1,2....,n extragem minimul între { , } din coloana j rezultând acţiunile şi

. Conform Axiomei 6:

(2.4.)

Fie l=l+2Se repetă paşii 1 şi 2 până se obţine o linie de zerouri. Din moment ce

(2.2) era adevărată iniţial şi din moment ce acelaşi total a fost extras de pe fiecare linie, rezultă că cele două linii vor conţine simultan numai zerouri. Fie Av

i

şi Avk cele două acţiuni cu liniile formate numai din zerouri, atunci conform

Axiomei 7, .Astfel, efectuând (2.3) şi (2.4) la fiecare pas rezultă:

De remarcat că cel puţin un zero este creat în pasul 2 şi datorită reordonării în pasul 1, un zero odată creat nu se mai pierde. Astfel numărul de paşi necesar pentru a crea 2 linii de zerouri este finit, iar deducţia noastră de mai sus este validă.

Apoi considerăm două acţiuni astfel încât :

Adăugăm o acţiune Al la tabelă, unde

pentru j= 1,2 …

Exemplul numeric este prezentat în Tabelul 2.11.

Tabelul 2.11 Exemplificarea demonstraţiei teoremei 2.2. când acţiunile au rezultate medii diferite

θ1 θ2 θ3 rezultat mediu

Ai 13 4 10 9

Ak 8 6 10 8

Al 12 3 9 8

Page 17: Curs Tabela de Decizie

Evident rezultă că :

Aşadar, conform celor de mai sus Vl = Vk dar potrivit Axiomei 4 Vl > Vk; şi în plus, conform Axiomei 5 introducerea lui A l nu poate afecta clasificarea lui A i şi Ak, avem deci Vi > Vk.

Avem astfel:

.

5. Probleme propuse1. Considerăm tabela de decizie :

θ1 θ2 θ3 θ4

A1 0 10 5 5

A2 9 0 1 0

A3 3 1 1 10

A4 5 2 0 5Decidentul preferă acţiunea A4 tuturor celorlalte acţiuni. Alegerea sa este

compatibilă cu: (i) Rezultatul maximin al lui Wald(ii) Indexul optimism – pesimist al lui Hurwicz(iii) Regretul minimax al lui Savage, sau(iv) Principiul raţiunii insuficiente al lui Laplace ? Considerăm tabela de decizie :

θ1 θ2 θ3 θ4

A1 x 3 4 6

A2 2 2 2 4

A3 3 2 1 9

A4 6 6 1 3x este număr real . Aflaţi ce decizie va fi luată , în funcţie de x, atunci când se aplică:

a) Criteriul lui Waldb) Criteriul lui Hurwicz (pentru α=1/2)

Page 18: Curs Tabela de Decizie

c) Criteriul lui Laplaced) Criteriul lui SavageGăsiţi intervalul de variaţie a lui x pentru care toate cele patru criterii duc

la aceeaşi alegere. 3. Presupunem că printr-un miracol al călătoriei în timp, Laplace şi Savage se întâlnesc pentru a discuta problema de alegere în condiţii de incertitudine. Fiecare îl convinge pe celălalt de argumentele sale, şi de comun acord propun întrebuinţarea regretului mediu drept criteriu:

alege Ak astfel încât

Arătaţi că acesta nu va duce la nici o schimbare în luarea deciziei în sens Laplace, adică o acţiune care maximizează rezultatul mediu şi minimizează regretul mediu şi invers. Daţi totuşi un exemplu în care să arătaţi că prin luarea deciziei de tip Savage apar schimbări, adică o acţiune care minimizează regretul mediu nu poate minimiza regretul maxim.4. Un decident nu este impresionat de criteriile propuse de Wald, Hurwicz, Savage şi Laplace şi sugerează “criteriul sumă de indexuri”. Înlocuieşte fiecare v ij

cu πij, unde πij este indexul lui vij în { v1j , v2j , …, vmj} adică πij = 1 dacă vij este cea mai mare valoare în coloana j = 2 dacă vij este cea de-a doua valoare în coloana j . . = m dacă vij este cea mai mică valoare în coloana j

Ignoraţi problema în caz de egalitate. După aceasta, el afirmă că Ak ar trebui considerat mai bun ca Al dacă şi

numai dacă:

Arătaţi că acest criteriu nu satisface Axiomele 2.4.5 şi 2.4.8 .

5. Euclid, un întreprinzător din Atena, este nerăbdător să înceapă o nouă afacere. Are trei posibilităţi şi succesul fiecărei acţiuni va depinde de gusturile consumatorilor din Atena. Analizând problema sa decizională, Euclid a clasificat condiţiile de piaţă în trei stări posibile şi a preconizat profitul pentru fiecare dintre cele trei întreprinderi după cum urmează:

Stări viitoare ale pieţei

    θ1 θ2 θ3

Acţ

iun

ile

A1 0 10 5

A2 9 0 1

A3 3 1 1

Page 19: Curs Tabela de Decizie

Pentru determina starea viitoare a pieţei, Euclid poate consulta contra cost Oracolul din Delphi, care îi va spune cu siguranţă ce stări vor urma. Calculaţi suma maximă pe care el este gata să o plătească oracolului pentru aceste informaţii sub fiecare dintre criteriile :

(a) Rezultatul maximin al lui Wald(b) Indexul optimism – pesimist al lui Hurwicz cu α=2/3(c) Regretul minimax al lui Savage, sau(d) Principiul raţiunii insuficiente a lui Laplace ?

Indicaţie: Introduceţi o a patra acţiune în tabel care să reprezinte ce ar face unchiul Euclid dacă ar şti starea reală.

6. Lui Savage i se oferă ocazia să cumpere la un preţ c cunoştinţele despre starea reală. Arătaţi că, indiferent de tabela de decizie, opţiunea cumpărării informaţiei şi apoi alegerea celor mai bune acţiuni conform ei are regret constant, egal cu c.

7. Considerăm luarea deciziilor cu risc în care probabilităţile , j= 1,2, …, n,

sunt asociate stărilor. Considerăm regula de utilitate care alege Ak, pentru a maximiza

Arătaţi că această regulă satisface Axiomele 2.4.1 şi 2.4.6.

8. De ce tabelele 2.6 (a) şi (b) nu oferă un exemplu care să arate, că regula rezultatului mediu al lui Laplace nu satisface neapărat Axioma 2.4.8? Daţi un contraexemplu la obiect. 9. Consideraţi următoarea axiomă cu dominare slabă. Presupunem că într-o tabelă de decizie există două acţiuni Ai şi Ak astfel încât vij vkj pentru toate stările θj cu inegalitate strictă ce durează cel puţin o stare. Atunci o regulă decizională ar trebui să asocieze o valoare V pentru acţiune astfel încât

Vi > Vk

Credeţi că este o proprietate rezonabilă pe care să o cerem unei reguli de decizie? Motivaţi. Care din criteriile Wald, Hurwicz, Laplace şi Savage o are?