BI019 Bioinformatika Osnove teorije...

24
BI019 Bioinformatika Osnove teorije informacij A Blejec 3. oktober 2012

Transcript of BI019 Bioinformatika Osnove teorije...

Page 1: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

BI019 BioinformatikaOsnove teorije informacij

A Blejec

3. oktober 2012

Page 2: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Kaj je informacija

Racunalnik je stroj za predelavo informacij

GIGO

Page 3: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistemi dogodkv in izidi

Gremo v kino ali na zur?

Izberemo eno od sestih jedi.

”Josko je nas najbol’s prjatu” ali katera srecka bo zadela?

Page 4: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistemi z enakomoznimi stanji in negotovost

ω =

(o11

)

α =

(a1 a2

1/2 1/2

)

β =

(b1 b2 · · · b6

1/6 1/6 · · · 1/6

)

γ =

(c1 c2 c3 · · · c100,000

0.00001 0.00001 0.00001 · · · 0.00001

)

Page 5: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistemi z enakomoznimi stanji in negotovost

ω =

(o11

)

α =

(a1 a2

1/2 1/2

)

β =

(b1 b2 · · · b6

1/6 1/6 · · · 1/6

)

γ =

(c1 c2 c3 · · · c100,000

0.00001 0.00001 0.00001 · · · 0.00001

)

Page 6: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistemi z enakomoznimi stanji in negotovost

ω =

(o11

)

α =

(a1 a2

1/2 1/2

)

β =

(b1 b2 · · · b6

1/6 1/6 · · · 1/6

)

γ =

(c1 c2 c3 · · · c100,000

0.00001 0.00001 0.00001 · · · 0.00001

)

Page 7: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistemi z enakomoznimi stanji in negotovost

ω =

(o11

)

α =

(a1 a2

1/2 1/2

)

β =

(b1 b2 · · · b6

1/6 1/6 · · · 1/6

)

γ =

(c1 c2 c3 · · · c100,000

0.00001 0.00001 0.00001 · · · 0.00001

)

Page 8: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Merjenje negotovosti

Mera negotovosti

Sistem αn z n enakomoznimi stanji naj ima negotovostH(αn) = H(n)

Page 9: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Pravila za racunanje negotovosti

1 Sistem z enim stanjem je gotov, H(1) = 0

2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji

n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)

H(2) > H(1) = 0

3 Kaksno negotovost ima sestavljen sistem

δn×m = αn ⊗ βm

H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Page 10: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Pravila za racunanje negotovosti

1 Sistem z enim stanjem je gotov, H(1) = 0

2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji

n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)

H(2) > H(1) = 0

3 Kaksno negotovost ima sestavljen sistem

δn×m = αn ⊗ βm

H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Page 11: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Pravila za racunanje negotovosti

1 Sistem z enim stanjem je gotov, H(1) = 0

2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji

n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)

H(2) > H(1) = 0

3 Kaksno negotovost ima sestavljen sistem

δn×m = αn ⊗ βm

H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Page 12: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Pravila za racunanje negotovosti

1 Sistem z enim stanjem je gotov, H(1) = 0

2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji

n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)

H(2) > H(1) = 0

3 Kaksno negotovost ima sestavljen sistem

δn×m = αn ⊗ βm

H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Page 13: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Funkcija za racunanje negotovosti

Logaritem

H(n) = C loga n

Dvojiski logaritem

H(n) = log2 n

H(2) = 1

Page 14: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Funkcija za racunanje negotovosti

Logaritem

H(n) = C loga n

Dvojiski logaritem

H(n) = log2 n

H(2) = 1

Page 15: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Funkcija za racunanje negotovosti

Logaritem

H(n) = C loga n

Dvojiski logaritem

H(n) = log2 n

H(2) = 1

Page 16: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

bit, nit in dit

2 log22 = 1 bite loge2 = 0.6931 nit

10 log102 = 0.301 dit

Page 17: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Enakomozna stanja: p = 1/n

αn =

(a1 a2 · · · anp p · · · p

)

H(n) = log2n= −log2(1/n) = −log2p= −n · (1/n)log2(1/n)= −

∑(1/n)log2(1/n)

= −∑

p · log2p

Page 18: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Neenakomozna stanja

αn =

(a1 a2 · · · anp1 p2 · · · pn

)

H(n) = −∑

p · log2p

nadomestimo z

Shannon-Wienerjeva formula

H(n) = −n∑

i=1

pi · log2pi

Shanon-Wiener (Weaver?) indeks diverzitete

Page 19: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Sistem z dvemi stanji> p <- seq(0.0001,0.9999,0.01)> x <- cbind(p,1-p)> H <- function(x) -sum(x*log(x,2))> par(mar=c(4,4,1,0))> plot(p,apply(x,1,H),ylab="H(p,1-p)")

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

p

H(p

,1−

p)

Page 20: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

bit ... 4 biti: 24 = 16 stanj

●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●

1111

1110

1101

1100

1011

1010

1001

1000

0111

0110

0101

0100

0011

0010

0001

0000

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

0

8 4 2 1

8 4 2 1

Page 21: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

byte, ... 8 bitov: 28 = 256 stanj

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●





128 64 32 16 8 4 2 1

128 64 32 16 8 4 2 1

Page 22: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Stevilo bitov (H) in stevilo stanj (n)

bit stanj

1 22 43 84 165 326 647 1288 2569 512

10 102411 204812 409613 819214 1638415 3276816 65536

H = log2n

n = 2H

Page 23: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Kodna tabela ASCII

Page 24: BI019 Bioinformatika Osnove teorije informacijablejec.nib.si/Bioinformatika/TeorijaInformacijS.pdf · 3 Kak sno negotovost ima sestavljen sistem n m = n m H( n m) = H(n m) = H(n)

Nukleotidna zaporedja

Znaki: A T C G

1 Koliko bitov informacije nosi en nukleotid?

2 Zakaj aminokisline kodirjo tripleti?