Estatística: Modelos Discretos

13
Cap´ ıtulo 3 Modelos Discretos 3.1 Vari´ aveis Aleat´orias Discretas 3.1.1 Vari´ avelAleat´oria Considere um experimento com espa¸ co amostral Ω. Uma fun¸ c˜ao definida no espa¸ co Ω ´ e uma vari´ avel aleat´ oria. Em outras palavras, imagine que s Ω seja um evento simples (um resultado em um expermento aleat´ orio), uma vari´ avel aleat´ oria X ´ e uma fun¸ ao que atribui um valor X (s) a este evento simples. Os valores que X assume podem ser tanto discretos quanto cont´ ınuos, implicando em vari´ aveis, respectivamente discretas ou cont´ ınuas. Neste cap´ ıtulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi- mento no qual arremessamos uma moeda dez vezes. O espa¸ co amostral Ω deste experimento consiste em 2 10 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ ıvel vari´ avel aleat´ oria seria o n´ umero de caras N H assim se s = HHHHTHTTTT , ent˜ ao N H (s) = 5. Note que a fun¸ ao N H toma apenas valores discretos (por exemplo, 0, 1, 2, ...). 3.1.2 Fun¸ ao discreta de probabilidade Lembremos que um modelo probabil´ ıstico ´ e determinado pela terna Ω, F ,P , onde Ω ´ e espa¸ co amostral que representa o conjunto de poss´ ıveis resultados para um experimento aleat´ orio, F ´ ea σalgebra que representa todos os poss´ ıveis eventos compostos e P ´ e a medida de probabilidade que atribui um valor entre 0 e 1 para cada evento, representado a chance de ocorrˆ encia deste particular evento. A defini¸ ao da medida de probabilidade sobre o espa¸ co amostral e, por conseq¨ encia, sobre todos os eventos compostos (por que?) 1 permite que 1 Revise a defini¸ ao a σalgebra. D´ a para ver que todos eventos compostos s˜ ao combina¸ oes de pontos do espa¸ co amostral. Se vocˆ e souber o valor das probabilidades para todos eventos simples, vocˆ e tamb´ em saber´ a, pela simples aplica¸ ao das propriedades da probabildiade, seu 27

Transcript of Estatística: Modelos Discretos

Capıtulo 3

Modelos Discretos

3.1 Variaveis Aleatorias Discretas

3.1.1 Variavel Aleatoria

Considere um experimento com espaco amostral Ω. Uma funcao definida noespaco Ω e uma variavel aleatoria. Em outras palavras, imagine que s ∈ Ω sejaum evento simples (um resultado em um expermento aleatorio), uma variavelaleatoria X e uma funcao que atribui um valor X(s) a este evento simples. Osvalores que X assume podem ser tanto discretos quanto contınuos, implicandoem variaveis, respectivamente discretas ou contınuas. Neste capıtulo apenas nospreocuparemos com o caso discreto.

Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi-mento no qual arremessamos uma moeda dez vezes. O espaco amostral Ω desteexperimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH,HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma possıvelvariavel aleatoria seria o numero de caras NH assim se s = HHHHTHTTTT ,entao NH(s) = 5. Note que a funcao NH toma apenas valores discretos (porexemplo, 0, 1, 2, ...).

3.1.2 Funcao discreta de probabilidade

Lembremos que um modelo probabilıstico e determinado pela terna 〈Ω,F , P 〉,onde Ω e espaco amostral que representa o conjunto de possıveis resultados paraum experimento aleatorio, F e a σ-algebra que representa todos os possıveiseventos compostos e P e a medida de probabilidade que atribui um valor entre0 e 1 para cada evento, representado a chance de ocorrencia deste particularevento. A definicao da medida de probabilidade sobre o espaco amostral e,por consequencia, sobre todos os eventos compostos (por que?)1 permite que

1Revise a definicao a σ-algebra. Da para ver que todos eventos compostos sao combinacoesde pontos do espaco amostral. Se voce souber o valor das probabilidades para todos eventossimples, voce tambem sabera, pela simples aplicacao das propriedades da probabildiade, seu

27

28 CAPITULO 3. MODELOS DISCRETOS

calculemos a funcao discreta de probabilidade para qualquer variavel aleatoriaX .

Assim P (X = x) = P (s : X(s) = x). Em palavras, a probabilidade davariavel aleatoria X possuir valor x e a probabilidade do evento composto de-scrito por s : X(s) = x, ou seja, e a probabilidade dos pontos do espacoamostral s nos quais a funcao X(s), que define a variavel aleatoria, tem valorx. Para economizar sımbolos utilizaremos tambem P (x) significando a mesmacoisa (note que estamos reservando letras maıusculas para representar variaveisaleatorias).

Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex-emplo do experimento de arremesso de moeda dez vezes. Qual e a funcao deprobabilidade para o numero de Caras em uma execucao do experimento? Oseventos de interesse sao, porntanto, da forma s : NH(s) = n. Supondo queutilizamos uma moeda honesta e que os arremessos sao independentes, temosque cada ponto do espaco amostral tem probabildidade de 1/210. Podemosusar analise combinatoria para contarmos quantos pontos do espaco amostralcorrespondem a cada evento de interesse. Dado n, temos que escolher, naoimportando a ordem, n entre dez posicoes na sequencia de arremessos para in-serirmos Caras. Isso equivale a combinacoes de 10 elementos n a n, ou seja2:

P (n) =

(

10n

)

1

210

para n = 0, 1, 2, 3, 4....

3.1.3 Distribuicoes de Probabilidade

A rigor, uma distribuicao de probabilidades e uma funcao crescente definidacomo F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremoso mesmo termo para se referir tambem a funcao discreta de probabilidade.Quando falarmos de variaveis aleatorias contınuas ficara mais clara a necessidadeda nocao de distribuicao de probabilidade.

Os modelos probabilısticos discretos sao comumente definidos em termos dedistribuicoes de probabilidade (aqui ja estamos nos referindo as funcoes discre-tas de probabilidade), nas proximas secoes introduziremos varios deles e suasaplicacoes.

3.2 Modelo Uniforme

Suponha que desejamos descrever o simples experimento de lancamento de umdado honesto. A variavel aleatoria de interesse e simplesmente o resultado doarremesso que chamaremos de X . Qual a distribuicao de probabilidade apropri-ada para descrever este experiemnto? O espaco amostral e Ω = 1, 2, 3, 4, 5, 6,

valor para qualquer evento composto.2Se nao lembra analise combinatoria, recomendo fortemente, Iezzi, G. Matematica Ele-

mentar, Vol. 5 - Combinatoria.

3.3. MODELO GEOMETRICO 29

−5 0 50

0.01

0.02

0.03

0.04

0.05

x

P(x

)

Figura 3.1: Funcao de probabilidade uniforme discreta.

como o dado e honesto temos que P (x) = 1/6, ou seja, a funcao de probabili-dade independe do particular resultado. Este tipo de distribuicao e denominadadistribuicao uniforme discreta.

Distribuicao Uniforme Discreta.

P (xj) =1

n, (3.1)

onde xj e nao nulo em x1, x2, ..., xn.

Exemplo.Numero de Caras em Unico Arremesso de uma Moeda Honesta.Neste experimento o espaco amostral e Ω = H, T . A variavel aleatoria quedescreve o numero de Caras em um unico arremesso e NH(H) = 1 e NH(T ) = 0.Como a moeda e honesta a distribuicao de probabilidades e P (xj) = 1/2 comxj nao nulo em 0, 1.

3.3 Modelo Geometrico

Digamos que voce seja responsavel pelos planos de manutencao de dos novosavioes da Embraer com sistema de aterrisagem totalmente automatico. Vocefez alguns testes de laboratorio e concluiu que com o tempo a probabilidadede falha do sistema tende a p. Se assumirmos que o aviao voara uma vez pordia, qual seria a distribuicao do intervalo de tempo transcorrido ate a primeirafalha? A cada utilizacao ha duas possibilidades que chamaremos de 1 (funciona-mento normal) e 0 (falha). Em princıpio, nosso experimento somente precisaser repetido ate que a primeira falha aconteca, assim o espaco amostral con-tem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas sequenciaspela posicao da primeira falha, assim Ω = 1, 2, 3, 4, .... Note que este espaco

30 CAPITULO 3. MODELOS DISCRETOS

100 200 300 400 5000

0.002

0.004

0.006

0.008

0.01

n

P(n

)

Figura 3.2: Funcao de probabilidade geometrica com p = 0, 01.

amostral tem infinitos pontos, visto que ha a possibilidade, infinitamente im-provavel, de que uma falha nunca ocorra. Probabilidades podem ser atribuıdasa cada sequencia da seguinte forma: a cada utilizacao do sistema a probabili-dade de uma falha e p e a de funcionamento e 1 − p, assim, a probabilidade aser atribuıda ao ponto do espaco amostral n e P (n) = (1− p)n−1p (por que?)3,que e chamada distribuicao geometrica.

Distribuicao geometrica.

P (n) = (1 − p)n−1p, (3.2)

onde n = 1, 2, 3, ....

3.4 Modelo Binomial

Suponha agora que queremos avaliar a probabilidade de em n lancamentos deuma moeda obtermos, nao importando a ordem, k Caras. O espaco amostrale composto por todas as sequencias possıveis de comprimento n (por exemplo,se n = 4, Ω = HHHH, HTHT, TTHH, .... Suponhamos que a probabilidadede obtermos uma Cara em um lancamento seja q (a moeda nao precisa neces-sariamente ser honesta). Considerado os lancamentos independentes, podemosatribuir probabilidades para cada ponto do espaco amostral apenas contando onumero de Caras e Coroas. Procedendo dessa forma encontramos: qk(1−q)n−k.Como a ordem nao importa temos que utilizar analise combinatoria para con-

3P (n) significa a probabilidade da primeira falha ocorrer na n-esima utilizacao, ou seja,primeiro ocorrem n − 1 funcionamentos normais ate que a sequencia e encerrada com umafalha.

3.4. MODELO BINOMIAL 31

0 5 10 15 200

0.05

0.1

0.15

0.2

0.25

n

P(n

)

Figura 3.3: Distribuicao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20.Note a simetria e a posicao da media em p × n.

tarmos o numero de sequencias equivalentes (com o mesmo numero de Caras,so que em outra ordem). No final obtemos:

Distribuicao Binomial.

P (k|n, p) =

(

nk

)

qk(1 − q)n−k (3.3)

para k = 0, 1, 2, 3, 4....Qualquer evento independente cujo resultado possa ser classificado de apenas

duas maneiras (erro ou acerto, sucesso ou falha, etc...) e denominado tentativade Bernoulli. A distribuicao do numero k de ocorrencias de uma das duasmaneiras com probabilidade q em uma sequencia de n tentativas de Bernoulli eBinomial P (k|n, p).

Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadoresestao utilizando energia eletrica de forma intermitente. Estamos interessados emestimar a demanda total esperada. Como uma primeira aproximacao imagineque a qualquer momento cada trabalhador tem exatamente a mesma probabili-dade p de requerer uma unidade de potencia. Se considerarmos que os trabal-hadores atuam de forma independente teremos que a probabilidade de k delesdemandarem energia simultaneamente sera binomial P (k|n, p). Se, em media,um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5.Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si-multaneamente sera P (7|10; 0, 2)+P (8|10; 0, 2)+P (9|10; 0, 2)+P (10|10; 0, 2) =0, 000864. Em outras palavras, se a potencia fornecida for suficiente para co-brir 6 trabalhadores simultaneamenente, havera sobrecarga com probabilidade0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas.

Exemplo. Teste de Eficacia de Medicamentos. A taxa normal de infeccao

32 CAPITULO 3. MODELOS DISCRETOS

0 5 10 15 200

0.05

0.1

0.15

0.2

0.25

0.3

0.35

n

P(n

)

Figura 3.4: Distribuicao Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1.Note a assimetria do caso q = 0, 1.

de determinada doenca e de 25%. Para testar um novo medicamento, o admin-istramos a n indivıduos. Como poderıamos avaliar o resultado do experimento?Se o medicamento for totalmente inutil a probabilidade de exatamente k in-divıduos permanecerem livres de infeccao sera P (k|n; 0, 75). Por exemplo, parak = n = 10, a probabilidade e de 5, 6%. Para k = n = 12, a probabilidade ede 3, 2%. Assim, isso nao seja uma demonstracao conclusiva, se de 10 ou 12 in-divıduos nenhum contrair a infeccao isso poderia ser visto como uma indicacaode que o medicamento fez efeito.

3.5 Modelo Poisson

Tomemos novamente a distribuicao binomial. Imaginemos que estamos interes-sados em um fenomeno que acontece raramente com probabilidade q = λ/n,onde λ e o numero de ocorrencias em um numero muito grande n → ∞de repeticoes. Reexaminemos a expressao para a distribuicao binomial nesteregime:

limn→∞

P (k|n, q = λ/n) = limn→∞

(

nk

)(

λ

n

)k (

1 −λ

n

)n−k

= limn→∞

n!

(n − k)!k!

(

λ

n

)k (

1 −λ

n

)n−k

= limn→∞

n

n

n − 1

n...

n − k + 1

n

λk

k!

(

1 −λ

n

)n(

1 −λ

n

)

−k

=λk

k!e−λ

3.5. MODELO POISSON 33

0 5 10 15 200

0.05

0.1

0.15

0.2

k

P(k

|λ)

Figura 3.5: Distribuicao de Poisson com λ = 5 (tracejado) e λ = 10.

Distribuicao de Poisson.

P (k|λ) =λk

k!e−λ. (3.4)

Exemplo.Aniversarios. Qual e achance que em um grupo de 500 pessoas 2facam aniversario no dia 7 de setembro. Se as 500 pessoas forem escolhidas aoacaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili-dade q = 1/365. Pela definicao λ = nq = 500/365 = 1, 3699... A probabilidadeque k pessoas facam aniversario exatamente no dia 7 de Setembro (ou em qual-quer dia escolhido) e P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24.

Exemplo.Centenarios. Ao nascer qualquer pessoa tem uma pequena chancede chegar aos 100 anos. Em uma comunidade grande o numero de nascimentosem um ano e grande. Devido a guerras, doencas, etc... as duracoes das vidasde uma mesma geracao nao sao independentes. No entanto, podemos compararn nascimentos a n tentativas de Bernoulli com a vida apos os 100 anos comosucesso. Assim a probabilidade de k pessoas chegarem a 100 anos e P (k|λ), comλ dependendo do tamanho da populacao e das condicoes de saude.

3.5.1 Distribuicao de Poisson no tempo

Considere agora uma sequencia de eventos aleatorios ocorrendo no tempo, taiscomo desintegracao radioativa ou acessos a um web server. Suponha que ospontos sejam distribuidos em uma linha do tempo e que estejamos preocupadoscom sua distribuicao (numero de pontos em um intervalo de tempo definido).Suponha adicionalmente que:

1. As condicoes do experimento permanecem constantes com o tempo;

34 CAPITULO 3. MODELOS DISCRETOS

2. Intervalos de tempo que nao se intersectam sao estatisticamente indepen-dentes;

Quando estudarmos variaveis aleatorias no contınuo poderemos tratar este casodiretamente, por hora utilizaremos a ideia de limite. Comecamos por dividiruma unidade de tempo em um numero grande de intervalos n cada um comduracao 1/n. Cada intervalo ou esta vazio (falha) ou contem no mınimo umponto (sucesso). A probabilidade de sucesso pn e a mesma para qualquer umdos intervalos. A distribuicao de probabilidade de k sucessos em n intervalos e,portanto, binomial P (k|n, pn). Note que o numero de sucessos nao e o mesmoque o numero de pontos em um dado intervalo, visto que um sucesso poderepresentar mais de um ponto em um intervalo. Suponhamos entao adicional-mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalode tempo seja desprezıvel conforme n → ∞. Se fixarmos o numero medio desucessos por unidade de tempo como λ = npn teremos que a probabilidade de ksucessos em uma unidade de tempo tera distribuicao de Poisson P (k|λ). Nestacategoria se encaixam: numero de carros passando por um pedagio por unidadede tempo; numero de erros de digitacao em uma pagina; numero de chamadasem um callcenter por unidade de tempo; etc...

3.6 Modelo Hipergeometrico

Suponha que em uma caixa ha n bolas, n1 vermelhas e n2 = n − n1 pretas.Retiramos da caixa r elementos sem reposicao. Qual e a probabilidade de queexatamente k deles sejam bolas vermelhas? O numero total de maneiras de

escolhermos r elementos dentre n e

(

nr

)

. Notemos que o grupo escolhido

tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser

escolhidas de

(

n1

k

)

formas. As r − k bolas pretas podem ser escolhidas de(

n − n1

r − k

)

formas. Para cada escolha de bolas vermelhas pode-se escolher

uma das formas equivalentes de escolha das bolas pretas, assim multiplicamosas quantidades. Finalmente obtemos:

Distribuicao Hipergeometrica:

P (k|n, n1, r) =

(

n1

k

)(

n − n1

r − k

)

(

nr

) . (3.5)

com k = 0, 1, ..., min(r, n1).Exemplo. Controle de Qualidade. Uma fabrica produz pecas que sao em-

baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa fabrica,o controle de qualidade de uma empresa procede da seguinte forma. Sorteia umacaixa do lote e, em seguida, sorteia cinco pecas, sem reposicao, dessa mesma

3.7. MODELO BINOMIAL NEGATIVO 35

0 2 4 6 8 100

0.05

0.1

0.15

0.2

0.25

0.3

0.35

k

P(k

|n,n

1,r)

Figura 3.6: Distribuicao Hipergeometrica com n = 30, n1 = 10 e r = 10.

caixa. Se constatar no maximo duas defeituosas (k ≤ 2), aceita o lote fornecidopela fabrica. Se a caixa sorteada tivesse 4 pecas defeituosas, qual seria a prob-abilidade de rejeitar o lote? A caixa pode ter pecas boas (bolas pretas) oudefeituosas (bolas vermelhas). O numero total de pecas e n = 25, vamos sortearr = 5 e queremos saber a probabilidade do numero de defeituosas n1 = 4 sendoque obtivemos k ≤ 2 pecas defeituosas em nosso sorteio. Assim calculamos :

P (k ≤ 2|n, n1, r) =

(

40

)(

215

)

(

255

) +

(

41

)(

214

)

(

255

) +

(

42

)(

213

)

(

255

) = 0, 984.

Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 pecasdefeituosas em 25 na caixa sorteada sera de 0, 016 (1, 6%).

3.7 Modelo Binomial Negativo

Considere uma sequencia de n tentativas de Bernoulli. Quantas tentativas saonecessarias para conseguirmos r sucessos? A probabilidade de que r sucessosocorram apos r + k tentativas e identica a probabilidade de que k fracassosantecedam o r-esimo sucesso. Assim teremos uma sequencia com r + k − 1tentativas com k fracassos posicionados arbitrariamente seguida por um sucesso.A distribuicao de probabilidade do evento “k fracassos antes do r-esimo acerto”ea distribuicao binomial negativa denotada:

Distribuicao Binomial Negativa.

P (k|r, p) =

(

r + k − 1k

)

pr(1 − p)k. (3.6)

36 CAPITULO 3. MODELOS DISCRETOS

0 10 20 30 40 500

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

Numero de fosforos no outro bolso (r)

u r

Figura 3.7: Caixa de Fosforos de Banach. Distribuicao de fosforos na caixa queainda nao esta vazia. Cada caixa no comeco tem exatos 50 fosforos. Quandoaquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia ha exatos rfosforos na outra caixa. Note que o mais provavel e que haja poucos fosforostambem na outra caixa. A probabilidade de haver ate 15 fosforos no outro bolsoe de 92% (como calculo isso?)

para k = 0, 1, 2, 3, 4....Exemplo. Caixa de Fosforos de Banach. Um matematico sempre carrega

consigo uma caixa de fosforos em seu bolso direito e uma em seu bolso esquerdo.Quando ele quer um fosforo, ele escolhe um bolso ao acaso. A sequencia de bol-sos e, portanto, uma sequencia de tentativas de Bernoulli com p = 1/2. Suponhaque cada caixa inicialmente contenha N fosforos e considere o momento no qualnosso matematico descobre que uma das caixas esta vazia. Neste mesmo mo-mento a outra caixa contem 0, 1, 2, ..., N fosforos com probabilidade ur. Qual eessa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo.O bolso esquerdo estara vazio no momento em que o bolso direito contiver ex-atamente r fosforos se, e somente se, exatametne N − r falhas (bolso direito)precederem o sucesso de numero N + 1. A probabilidade disso acontecer seraP (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim:

ur = 2P (N − r|N + 1, 1/2) =

(

2N − rN

)

2−2N+r.

3.8 Modelo Multinomial

A distribuicao binomial pode ser generalizada para o caso de n tentativas inde-pendentes onde cada tentativa pode resultar em r diferentes resultados. Cadaresultado Ei ocorre com probabilidade pi. Assim p1 + p2 + ... + pr = 1. A

3.9. DISTRIBUICAO DE ZIPF 37

100

101

102

103

104

105

106

107

108

100

101

102

103

104

105

106

107

108

Subroutines ordered by use frequency (n)

Num

ber

of u

ses

Linux reuse dataSunOS reuse dataMac OS X reuse data

Figura 3.8: Distribuicao de Zipf para reutilizacao de codigo nos sistemas Linux,MacOS e SunOS (referencias versus ranking). Esta figura foi extraıda de Veld-huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com-plexit and Zipf’s Law, cs.SE/0508023.

probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes eassim por diante e:

Distribuicao Multinomial.

P (k1, k2, ..., kr|p1, p2, ..., pr) =n!

k1!k2!...kr!pk1

1 pk2

2 ...pkr

r . (3.7)

com k1 + k2 + ... + kr = n.Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual e a probabil-

idade de obtermos cada face 2 vezes? Aqui E1,...E6 representam as seis facesdos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelomultinomial teremos (12!)(2)−6(6)−12 = 0, 0034.

3.9 Distribuicao de Zipf

A distribuicao de Zipf e definida como:Distribuicao de Zipf.

P (k|s, N) =k−s

∑N

n=1n−s

. (3.8)

A distribuicao de Zipf (tambem conhecida como lei de potencia) aparece noslugares mais variados: nas palavras em uma lıngua, nas sequencias de DNA,

38 CAPITULO 3. MODELOS DISCRETOS

na intensidade de terremotos, na popularidade de links na internet, na dis-tribuicao de renda dos 3% mais ricos, no numero de amigos no Orkut, nomesnuma populacao, populacao de cidades, tempo transcorrido nas trocas de car-tas (ou emails), utilizacao de palavras chave em um site de busca, tamanho deextincoes em massa de especies, tamanho de grandes flutuacoes de precos nabolsa, citacoes de artigos cientıficos, etc...

A caracterıstica mais evidente da distribuicao de Zipf e o fato de nao haverum valor tıpico (isso mesmo, a media nao existe !). Assim quando observamosum modelo usual temos uma variacao mas ha um tamanho tıpico (por exemplo,nao vemos ninguem com 10 metros de altura, todo mundo mede algo em tornode 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida peladistribuicao de Zipf, verıamos eventualmente (seriam raros, mas verıamos) pes-soas com 10 m, ou 100 m, ou mesmo 1 km de altura! E claro que a altura daspessoas nao e um bom exemplo. Mas o numero de amigos no Orkut certamentesegue um modelo de Zipf (verifique).

3.10 Exercıcios

1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para doislancamentos independentes dessa moeda, estude o comportamento davariavel numero de Caras e faca um grafico de sua funcao de distribuicao.

2. Uma variavel aleatoria X tem a seguinte funcao de distribuicao:

F (x) =

0 se x < 10;0, 2 se 10 ≤ x < 12;0, 5 se 12 ≤ x < 13;0, 9 se 13 ≤ x < 25;1 se x ≥ 25.

Determine: (a) A funcao de probabilidade de X ; (b) P (X ≤ 12); (c)P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18).

3. Um usuario de transporte coletivo chega pontualmente as 8 horas parapegar o seu onibus. Devido ao transito caotico, a demora pode ser qualquertmpo entre 1 e 20 minutos (assuma que a unidade mınima relevante parao tempo e 1 minuto). Pergunta-se: (a) Qual e a probabilidade de demorarmais de 10 minutos? (b) Qual e a probabilidade de demorar pelo menos 5minutos nao mais que 10 minutos? (c) Qual e a probabilidade da demoranao chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado evai pegar o mesmo onibus (que ainda nao passou), qual e a probabilidadedo amigo atrasado esperar ate 3 minutos?

4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, parauma famılia com tres filhos, calcule a probabilidade de que: (a) Exata-mente dois sejam do sexo masculino. (b) Pelo menos um deles seja dosexo masculino. (c) Todos sejam do sexo feminino.

3.11. REFERENCIAS 39

5. No estudo de desempenho de uma central de computacao, o acesso a CPUe descrito por um modelo de Poisson com 4 requisicoes a cada segundo.Essas requisicoes podem ser de varias naturezas tais como: imprimir umarquivo, efetuar um calculo ou enviar uma mensagem pela internet, entreoutras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual e aprobabilidade de haver mais de 2 acessos A CPU? E do numero de acessosultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tambemescolhido ao acaso, qual e a probabilidade de haver 50 acessos?

6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out-ros 16 perfeitos de um certo livro didatico. Quatro amigas vao a essalivraria para comprar seus livros escolares. (a) Calcule a probabilidade de3 levarem livros defeituosos. (b) Qual e a probabilidade de, apos a visitadessas meninas,restarem o mesmo numero de defeituosso na livraria? Ede nao restar nenhum?

7. Uma vacina contra a gripe e eficiente em 70% dos casos. Sorteamos, aoacaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:(a) Pelo menos 18 imunizados. (b) No maximo 4 imunizados. (c) Naomais do que 3 nao imunizados.

8. Uma linha de producao esta sendo analisada para efeito de controle daqualidade das pecas produzidas. Tendo em vista o alto padrao requerido, aproducao e interrompida para regulagem toda vez que uma peca defeituosae observada . Se 0,01 e a probabilidade da peca ser defeituosa, estude ocomportamento da variavel Q, quantidade de pecas boas produzidas antesda primeira defeituosa.

3.11 Referencias

Se quiser fazer mais exercıcios procure por (todos os exercıcios do texto foramextraıdos de la):

• Magalhaes M.N., de Lima A.C.P., Nocoes de Probabilidade e Estatıstica,Edusp,2004.

Exemplos foram extraıdos de:

• Feller, W. An introduction to Probability Theory and Its Applications,Volume I, John Wiley & Sons, 1950.

• DeGroot, M., Probability and Statistics, Addison-Wesley, 1975.

Livros de divulgacao cientıfica relacionados a lei de Zipf:

• Bak, P., How Nature Works, Oxford University Press, 1996.

• Buchanan, M., Ubiquity, Crown Publishers, 2001.