BI019 Bioinformatika Osnove teorije...
Embed Size (px)
Transcript of BI019 Bioinformatika Osnove teorije...

BI019 BioinformatikaOsnove teorije informacij
A Blejec
3. oktober 2012

Kaj je informacija
Racunalnik je stroj za predelavo informacij
GIGO

Sistemi dogodkv in izidi
Gremo v kino ali na zur?
Izberemo eno od sestih jedi.
”Josko je nas najbol’s prjatu” ali katera srecka bo zadela?

Sistemi z enakomoznimi stanji in negotovost
ω =
(o11
)
α =
(a1 a2
1/2 1/2
)
β =
(b1 b2 · · · b6
1/6 1/6 · · · 1/6
)
γ =
(c1 c2 c3 · · · c100,000
0.00001 0.00001 0.00001 · · · 0.00001
)

Sistemi z enakomoznimi stanji in negotovost
ω =
(o11
)
α =
(a1 a2
1/2 1/2
)
β =
(b1 b2 · · · b6
1/6 1/6 · · · 1/6
)
γ =
(c1 c2 c3 · · · c100,000
0.00001 0.00001 0.00001 · · · 0.00001
)

Sistemi z enakomoznimi stanji in negotovost
ω =
(o11
)
α =
(a1 a2
1/2 1/2
)
β =
(b1 b2 · · · b6
1/6 1/6 · · · 1/6
)
γ =
(c1 c2 c3 · · · c100,000
0.00001 0.00001 0.00001 · · · 0.00001
)

Sistemi z enakomoznimi stanji in negotovost
ω =
(o11
)
α =
(a1 a2
1/2 1/2
)
β =
(b1 b2 · · · b6
1/6 1/6 · · · 1/6
)
γ =
(c1 c2 c3 · · · c100,000
0.00001 0.00001 0.00001 · · · 0.00001
)

Merjenje negotovosti
Mera negotovosti
Sistem αn z n enakomoznimi stanji naj ima negotovostH(αn) = H(n)

Pravila za racunanje negotovosti
1 Sistem z enim stanjem je gotov, H(1) = 0
2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji
n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)
H(2) > H(1) = 0
3 Kaksno negotovost ima sestavljen sistem
δn×m = αn ⊗ βm
H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Pravila za racunanje negotovosti
1 Sistem z enim stanjem je gotov, H(1) = 0
2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji
n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)
H(2) > H(1) = 0
3 Kaksno negotovost ima sestavljen sistem
δn×m = αn ⊗ βm
H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Pravila za racunanje negotovosti
1 Sistem z enim stanjem je gotov, H(1) = 0
2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji
n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)
H(2) > H(1) = 0
3 Kaksno negotovost ima sestavljen sistem
δn×m = αn ⊗ βm
H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Pravila za racunanje negotovosti
1 Sistem z enim stanjem je gotov, H(1) = 0
2 Sistem z vec stanji ima vecjo negotovost kot sistem z manjstanji
n > m⇔ H(αn) > H(αm)⇔ H(n) > H(m)
H(2) > H(1) = 0
3 Kaksno negotovost ima sestavljen sistem
δn×m = αn ⊗ βm
H(αn ⊗ βm) = H(n ×m) = H(n) + H(m)

Funkcija za racunanje negotovosti
Logaritem
H(n) = C loga n
Dvojiski logaritem
H(n) = log2 n
H(2) = 1

Funkcija za racunanje negotovosti
Logaritem
H(n) = C loga n
Dvojiski logaritem
H(n) = log2 n
H(2) = 1

Funkcija za racunanje negotovosti
Logaritem
H(n) = C loga n
Dvojiski logaritem
H(n) = log2 n
H(2) = 1

bit, nit in dit
2 log22 = 1 bite loge2 = 0.6931 nit
10 log102 = 0.301 dit

Enakomozna stanja: p = 1/n
αn =
(a1 a2 · · · anp p · · · p
)
H(n) = log2n= −log2(1/n) = −log2p= −n · (1/n)log2(1/n)= −
∑(1/n)log2(1/n)
= −∑
p · log2p

Neenakomozna stanja
αn =
(a1 a2 · · · anp1 p2 · · · pn
)
H(n) = −∑
p · log2p
nadomestimo z
Shannon-Wienerjeva formula
H(n) = −n∑
i=1
pi · log2pi
Shanon-Wiener (Weaver?) indeks diverzitete

Sistem z dvemi stanji> p <- seq(0.0001,0.9999,0.01)> x <- cbind(p,1-p)> H <- function(x) -sum(x*log(x,2))> par(mar=c(4,4,1,0))> plot(p,apply(x,1,H),ylab="H(p,1-p)")
●
●
●
●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●
●
●
●
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
p
H(p
,1−
p)

bit ... 4 biti: 24 = 16 stanj
●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●
1111
1110
1101
1100
1011
1010
1001
1000
0111
0110
0101
0100
0011
0010
0001
0000
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
8 4 2 1
8 4 2 1

byte, ... 8 bitov: 28 = 256 stanj
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●


128 64 32 16 8 4 2 1
128 64 32 16 8 4 2 1

Stevilo bitov (H) in stevilo stanj (n)
bit stanj
1 22 43 84 165 326 647 1288 2569 512
10 102411 204812 409613 819214 1638415 3276816 65536
H = log2n
n = 2H

Kodna tabela ASCII

Nukleotidna zaporedja
Znaki: A T C G
1 Koliko bitov informacije nosi en nukleotid?
2 Zakaj aminokisline kodirjo tripleti?