Probabilidade aula ufrj

download Probabilidade aula ufrj

of 41

Transcript of Probabilidade aula ufrj

Probabilidade1-Espao amostral

O conjunto de todos os possveis resultados de um experimento o espao amostral . Onde n() o nmero de elementos do conjunto , ou o nmero de resultados possveis. = {w1, w2,, w3, .....wn} w = so os pontos amostrais. O espao amostral referente a um lanamento de um dado : = {1, 2, 3, 4, 5, 6} O espao amostral referente a um lanamento de uma moeda : = {cara, coroa} 2- Eventos Chama-se de evento qualquer subconjunto do espao amostral de um experimento aleatrio, ou seja, qualquer resultado do espao amostral. n(E) o nmero de resultados associados ao evento E. Exemplo: No lanamento de uma moeda ={cara, coroa}. Um evento de interesse E pode ser obter cara no lanamento de uma moeda e n(E)=1. possvel encontrar a probabilidade P(E) de qualquer subconjunto E de (do espao amostral). A probabilidade de E, anotada por P(E), l-se p de E, definida como sendo: P(E) = m / n. Isto , a probabilidade do evento A o quociente entre o nmero m de casos favorveis e o nmero n de casos possveis. Probabilidade de um evento: Seja E um evento. A probabilidade deste evento ocorrer dada por P(E), que um nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1. A probabilidade de um evento medida por valores entre 0 e 1.Logo, 0 P(E) 1. mais provvel que um evento ocorra se sua probabilidade estiver prxima a 1. A probabilidade do evento certo de ocorrer 1 e a probabilidade do evento impossvel zero. P(EVENTO CERTO) =1, ou seja, P() =1 P(EVENTO IMPOSSVEL)= 0 , ou seja, para o conjunto vazio - P() = 0A soma entendida a todos os pontos amostrais wi que pertencem a E.

Se E for qualquer evento de ento: P(E) = P(wi) i

Ex. Uma moeda jogada 2 vezes. Se c indica cara e r coroa ento O espao amostral : = { w1, w2,, w3, w4} onde w1 = (c,c) ; w2 = (c,r); w3 = (r,c); w4 = (r,r) Cada ponto wi = tem a probabilidade de ocorrer. Se as faces so iguais nos 2 lanamentos tem-se: P(E)= P (w1, w4) = +1/4 = 1

H trs maneiras diferentes de calcular ou estimar probabilidades: 1) o mtodo clssico, envolve a determinao da probabilidade de qualquer evento a priori (antes de ocorrer). Est associada a jogos de azar ou s chances de um jogo. Definio: P(E) = Nmero de maneiras que o evento pode ocorrer Nmero total de resultados possveis Ex. Qual a probabilidade de se retirar um s de um baralho. P(s) = Nmero de maneiras que o evento pode ocorrer = 4/52 Nmero total de resultados possveis 2) o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade, baseadas num certo grau de crena. Ex; A probabilidade que uma mulher brasileira v ao espao num foguete, um exemplo. Como no h dados do passado devemos avaliar as nossas opinies e crenas para obter uma estimativa subjetiva. 3) o mtodo emprico ou freqncia relativa, que observa a freqncia com que algum evento ocorreu no passado e estima a probabilidade dele novamente ocorrer, fundamentada nos dados histricos. Definio: P(E) = Nmero de vezes que o evento ocorreu Nmero total de observaes Exemplo: No ltimo ms ocorreu 50 nascimentos no hospital do bairro em que mora. Trinta e dois bebs recm nascidos eram meninas. A probabilidade de que um prximo nascimento (ou qualquer nascimento escolhido aleatoriamente) seja menina ? Definio: P(meninas) = Nmero de meninas nascidas no ltimo ms Nmero total de nascimentos no ltimo ms 3- Clculo das probabilidades Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes dos eventos. Pode ser necessrio determinar a probabilidade de ambos os eventos acontecerem P(A e B), a interseo, ou a probabilidade de um deles, A ou B, ou seja, P(A ou B), ou a unio. A interseo de A e B o conjunto de todos os elementos que esto em ambos os conjuntos A e B. O diagrama de Venn uma ferramenta til para representar a relao entre dois conjuntos. = 32/50

(A B) = A interseo B2

Para A B ocorrer, ambos A e B devem ocorrer. Os eventos A e B so chamados associados. A unio de A e B, ou seja, A U B consiste dos elementos que esto em A ou B ou em ambos. Unio de A e B o conjunto de todos os elementos que esto em A ou em B. A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os eventos e denotada por P(AB).

A

B

P(A ou B) = P(A) + P(B) P(A e B) Dois eventos so ditos mutuamente exclusivos (excludentes) se a ocorrncia de um evento probe a ocorrncia do outro. Ex. A ocorrncia de cara e coroa em um nico lanamento de moeda. Se cara ocorre, coroa no pode ocorrer. Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a probabilidade de ambos nula e o termo P(A e B) ser zero. Ento, A B = e P (A B) = 0 Se A e B so mutuamente excludentes -------- P(A ou B) = P(A) + P(B)

A

B

Eventos Complementar So aqueles que se um no ocorrer o outro deve ocorrer certamente. EX. Se o evento A sair a face par no lanamento de um dado (2, 4 ou 6), o complementar sair a face mpar ( 1, 3 ou 5). O complementar escrito como ou AC. claro que eventos complementares formam uma coleo completa porque se A no ocorre, precisa ocorrer. Ento tem-se: P(A) + P () = 1 e P(A) = 1- p() -A= 3

A

Eis as seguintes operaes com conjuntos: a) (A B)C = AC U BC b) (A U B)C = AC BC c) (A ) = e A = A d) C = ; C = e) A AC= f) A U AC = g) A U = A ; A U = h) A (B U C) = (A B) U (A C) Exemplo: Em um experimento aleatrio os eventos A e B associados tais que: P(A) = 1/2 e a P(B)= 1/3 e P(A B) = 1/4 .Calcule: a) P(AC) = 1 P(A) = 1 1/2 = 1/2 b) P(A U B) = P(A) + P(B) - P(A B) = 1/2 + 1/3 1/4 = 7/12 c) P(AC BC) = P [(A U B)C] = 1- P (A U B) = 1 7/12 = 5/12 d) P(AC U BC) = P [(A B)C] = 1- P (A B) = 1 1/4 = e) P(AC B) = a probabilidade que ocorra em B, mas no ocorra em A. Podemos escrever: B= (A B) U (AC B) P(B) = P(A B) + P(AC B) Decorre: P(AC B) = P(B) - P(A B) = 1/3 1/4 = 1/12 Ou: P(AC B) = P(B - A) = P(B) - P(A B) = 1/12 f) P(AC U B) = P(AC) + P(B) - P(AC B) = 1/2 + 1/3 1/12 = .. Probabilidade Condicional - Regra da multiplicao Freqentemente queremos determinar a probabilidade de um evento sabendo-se, ou sobre a condio, de que outro evento ocorreu. Isso chamada probabilidade condicional e denominada de P(A|B) lido com a probabilidade de A dado B. A probabilidade condicional a probabilidade de que o evento A ocorra dado, ou sob a condio de que o evento B j tenha ocorrido. Assim, para dois eventos quaisquer A e B sendo P(B) > 0 definimos a probabilidade condicional de A e B, como sendo: P(A|B) = P(A B) P(B) = P (A) . P(B|A) P(B)

Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e B ocorrerem P(AB) dada por:

A

B

4

Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B so independentes, e P(B|A)=P(B) ou P(A) = P (A|B). Se A e B so independentes ---------- P(A B)=P(A) . P(B) probabilidade de eventos independentes. Se os eventos so dependentes, ento por definio precisaremos considerar o primeiro evento para determinar a probabilidade do segundo; isto , a probabilidade do evento B depende da condio de A j ter ocorrido. Logo, o princpio da probabilidade condicional de v ser usado. A probabilidade conjunta dos eventos A e B : P(A B) = P(A) . P(B|A) Onde P(B|A) a probabilidade de B ocorrer dado que A j tenha ocorrido. RESUMO; 1- A regra da multiplicao usada para calcular a probabilidade de A e B, P (A B), e a regra da adio usada para calcular a probabilidade de A ou B, P (A U B). 2 - Regras de probabilidade P(A ou B), Para eventos no mutuamente excludentes: P(A ou B ou ambos) = P(A) + P(B) P(A e B) Para eventos mutuamente excludentes: P(A ou B) = P(A) + P(B) P(A e B), para eventos independentes: P(A e B) = P(A) . P(B) Para eventos dependentes P(A e B) = P(B).P(A/B) ou P(A).P(B/A) Teorema de Bayes Definio: Seja um espao amostral e A1 , A2 , ..., Ak , eventos. Diz-se que A1 , A2 , ..., Ak formam uma partio de se: Ai , onde i= 1, 2, ..., k k

U=i

Ai AJ = ij

5

Diagrama representativo do Teorema de Bayes

A1 A2

B

A4

A3

A5

AK

A1 , A2 , A3 , ...........Ak , onde formam uma partio de . Seja B um evento qualquer de , onde: B = (B A1 ) U (B A2 ) U ...U (B AK) k P(B) = P(AJ) J=1

. P(B/AJ)

onde j= 1,2,3,....k

(eq. 1)

P(B Ai) = P(Ai) . P(B/Ai)Como:

onde i = 1, 2, ..., k

(eq. 2)

P(Ai/B) = P(B Ai) / P(B)

(EQ.3)

substituindo as equaes (1) e (2) na equao (3) temos: k

P(Ai/B) = [P(Ai) . P(B/Ai)] / P(AJ) . P(B/AJ)J=1 Exemplo:

onde j= 1,2,3...k

Suponha que uma pea escolhida aleatoriamente, onde existem duas mquinas com as mesmas caractersticas. A probabilidade de ser produzida pela mquina A P(A) = 0,60 e de ser da mquina B P(B)= 0,40. A qualidade dos produtos de no terem defeitos que vem da mquina A a probabilidade condicional P(DC/A) = 0,98, logo a probabilidade de ter uma pea com defeito P(D/A)=0,02. As probabilidades condicionais para B revelam que a probabilidade de no ser defeituosa dado que a pea veio da mquina B P(DC/B)=0,96, logo a probabilidade de ser defeituosa dado que veio de B P(D/B)= 0,04.6

Diagrama de rvore: O primeiro ramo indica qual mquina produziu a pea. O segundo ramo indica qualidade da pea e nos diz se veio da mquina A pode ser defeituosa ou no. Probabilidade que uma pea veio de A no defeituosa P(A DC) = P (A) . P(DC/A)= 0,60 . 0,98 = 0,588 P(DC/A)= 0,98 Unidade no defeituosa A MQUINA A P(A)=0,60 . P(A D) = P (A) . P(D/A)= 0,60 . 0,002 = 0,0012 P(D/A) = 0,02 Unidade defeituosa de A P(B DC) = P (B) . P(DC/B)= 0,40 . 0,96 = 0,384 C P(D /B)= 0,96 Unidade no defeituosa B

MQUINA B P(B)=0,40

P(D/B)= 0,04 Unidade defeituosa B

P(B D) = P (B) . P(D/B)= 0,40 . 0,04 = 0,016

Assim, existem 4 resultados possveis para o experimento de selecionar uma unidade da produo. Suponha que se tenha uma pea seja defeituosa e ns queremos saber a probabilidade desta vir da mquina A? (AGORA SE TEM VRIAS PEAS DEFEITUOSAS TANTO DA MQ. A QUANTO DA MQ. B E QUE SE QUER DETERMINAR DE QUE MQ. VEIO) Agora queremos determinar a P(A/D)? Regra da probabilidade condicional:

P(A/D) = P(A D) / P(D) = P(A) . P(D/A) P(D)

EQ 1

Contudo P(D) no foi obtido. aqui que entra o teorema de Bayes. H duas maneiras de uma pea ser defeituosa. Ela pode vir da mquina A e ser defeituosa ou ser da mquina B e ser defeituosa. Usando a regra da adio: P(D)= P(A D) + P(B D) = P(A) . P(D/A) + P(B) . P(D/B) EQ 2Se substituirmos a EQ 2 na EQ 1 teremos o resultado. Pelo teorema de Bayes tem-se:

P(A/D) = P(A D) / P(A D) + P(B D) =

7

P(A) . P(D/A) P(A) . P(D/A) + P(B) . P(D/B)

Podemos encontrar P(A/D) = 0,0012 / (0,012+0,016) = 0,429 Enquanto a P(A) = 0,60 , P(A/D) = 0,429. Note que a P(A/D) < P(A), pois a mquina A produz uma porcentagem menor de defeitos do que a mquina B.

Tcnicas de Contagem Se dois subconjuntos so considerados diferentes devido a diferenas na ordem, eles so vistos como permutaes. Se dois subconjuntos so vistos como idnticos e constituem o mesmo subconjunto porque ambos possuem os mesmos elementos, independente da ordem, eles so chamados combinaes. Dado um conjunto com n elementos, o no. de permutaes, cada uma de tamanho r determinado por:

No de permutaes de n Elementos tomados r por vez: nPr = n! (n-r)! n!= n fatorial....por definio: 4! = 4x3x2x1- 24 e 0!= 1

O no. de combinaes de n elementos tomados r por vez : O nmero de combinaes de n elementos tomados r por vez: CN,n = N! n! (N-n)!

Ou pode ser representado por: N n = N! n! (N-n)!

Exemplo: De 4 empreendimentos uma pessoa tem capital para investir em apenas 2 requerendo o mesmo capital. Sabe-se que 2 empreendimentos vo falhar e 2 sero bem sucedidos. Se selecionar 2 empreendimentos ao a caso qual a probabilidade da pessoa selecionar pelo menos um empreendimento bem sucedido? O experimento envolve uma soluo ao acaso de 2 de 4 empreendimentos e cada possvel par de empreendimentos representada um ponto amostral. Onde S1 e S2 so empreendimentos bem sucedidos e F1 e F2 empreendimentos mal sucedidos. Quantas situaes podem ser feitas? N= 4 e n=28

N n

= N! n! (N-n)!

4 2 = 4! 2! 2! = 4321 =6 (2 1) x (2 1)

As combinaes possveis so: (S1, S2) (S1,F1) (S1,F2) (S2,F1) (S2,F2) (F1,F2) Selecionar um empreendimento bem sucedido inclui todos os pontos menos (F1,F2) P(SELECIONAR PELOS MENOS UM EMPREENDIMENTO) = P(S1, S2)+ P(S1,F1)+P(S1,F2)+ P(S2,F1)+P(S2,F2) P(SELECIONAR PELOS MENOS UM EMPREENDIMENTO) = 1/6+ 1/6+1/6+1/6+1/6+1/6= 5/6 Exemplo: Suponha que num lote com 20 peas existem 5 defeituosas. Se escolhermos 4 peas do lote ao acaso, ou seja, uma amostra de 4 elementos, de modo que a ordem dos elementos seja irrelevantes. Qual a probabilidade de se escolher duas peas defeituosas? P(DUAS PEAS DEFEITUOSAS) = Nmero de todos os subconjuntos com 2 peas (m) Nmero total de possibilidades (n) Peas c/ Peas s/ Defeitos defeitos m= 5 2 x 15 2 no. de maneiras que podemos escolher 2 peas c/ defeitos e 2 s/ defeitos.

n=

20 4

no. de pontos do espao amostral.

P(DUAS PEAS DEFEITUOSAS) =

C5,2 . X C15,2 C20,4

=

5! 2! (3)!

X

15! 2! (13)!

= 70/323 = 0,217

20! 4! (16)!

9

DISTRIBUIO DA PROBABILIDADE Varivel aleatria: pode ser discreta ou contnua. Discreta: pode assumir certos valores, usualmente nos. Inteiros e resultam basicamente de contagens. Ex. o no. de caras no lanamento de uma moeda. Contnua: resulta de uma medida e pode assumir qualquer valor dentro de um dado intervalo. Ex. O peso de um garrafo de gua mineral, que pode assumir qualquer valor entre 10 e 25 quilos. Distribuio da probabilidade: uma lista de todos os resultados possveis de um experimento e tambm das probabilidades associadas a cada um dos resultados. Ex: Aps lanar uma moeda 3 vezes determinar a probabilidade de: obter nenhuma cara; obter uma cara; obter duas caras e obter 3 caras? Distribuio discreta de probabilidade para o lanamento das moedas RESULTADOS (CARAS) PROBABILDIADE 0 1/8 1 3/8 2 3/8 3 1/8 TOTAL1 1 Onde pode ser representado por: c= cara e r= coroa = {(r,r,r); (c,r,r); (c,c,r); (c,c,c); (r,c,r); (r,r,c); (c,r,c); (r,c,c)} A distribuio de probabilidades para lanamentos da moeda

4/8 3/8 2/8 1/8

0

1

2

3

xi

A probabilidade de uma varivel aleatria X assuma um valor especfico xi denotada por P(X = xi). Assim, a probabilidade de que no lanamento de 3 moedas o resultado seja duas caras P(X = 2) = 3/8. Note que ; 0 P(X= xi) 1 e P(X= xi) =1

10

Mdia e Varincia da Destruio discreta A mdia de uma distribuio de probabilidades chamada de esperana matemtica de X, E(X). encontrada multiplicando-se cada resultado possvel pela sua respectiva probabilidade e somando essas quantidades. Mdia ou esperana de uma distribuio de probabilidade discreta = E(X) = [ (xi) P(xi)] Distribuio discreta de probabilidade para o lanamento das moedas RESULTADOS (XI) PROBABILDIADE P(xi) (xi) P(xi) 1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6 TOTAL1 1 3,5 = = E(X) (xi )2 .P(xi) (1-3,5)2 1/6 = 1.042 (2-3,5)2 1/6 = 0.375 (3-3,5)2 1/6 = 0.042 (4-3,5)2 1/6 = 0.042 (5-3,5)2 1/6 = 0.375 (6-3,5)2 1/6 = 1.042 2,92 = 2

Isso quer dizer que se lanarmos um dado podemos obter o resultado 3,5? No, isso quer dizer que se lanarmos vrias vezes um dado (teoricamente um no. infinito de vezes) a mdia dos resultados ser 3,5. A varincia de uma distribuio discreta : 2 = [xi )2 .P(xi)] o desvio padro : = 2 = 2,92= 1,71 o desvio padro mede a disperso dos resultados ao redor da mdia. Distribuio Binomial A distribuio binomial tem 4 propriedades: 1-existem dois resultados possveis (sucesso ou fracasso) 2-a probabilidade de um sucesso, , permanece constante de uma tentativa para a prxima, assim como a probabilidade de um fracasso 1- 3-a probabilidade de um sucesso em uma tentativa totalmente independente de qualquer outra tentativa 4-o experimento pode ser repetido muitas vezes. Ex. o lanamento de uma moeda pode ser considerado um exemplo de uma distribuio binomial. Distribuio Binomial P(X=x) = n ! x! (n-x)! ou n x x (1- )n-x x (1- )n-x

11

Onde, n = no. de ensaios; = probabilidade de sucesso em qualquer dos ensaios, (1)= a probabilidade de um fracasso em qualquer dos ensaios; P(X) = a probabilidade de x sucessos em n ensaios. Uma gerente de crdito da American Express descobriu que 10% () dos usurios dos cartes da companhia no pagam o total de suas dvidas em um ms. Ela quer determinar a probabilidade que de 20 contas (n) aleatoriamente selecionadas, 5 delas (x) no sejam pagas. Isso pode ser escrito como P(X=5 | n= 20, = 0,10) e l-se a probabilidade de 5 sucessos em 20 tentativas com probabilidade de sucesso em qualquer tentativa de 10%. Com n= 20, X=5 e = 0,10 tem-se: P(X= 5) = 20 ! 5! (20-5)! (0,1)5 (1- 0,1)20-5 = 20 . 19. 18 . 17 . 16 . 15! 5. 4.3.2.1 . 15! x(0,1)5 (1- 0,1)20-5

= (15504) (0,00001) (0,2058911) = 0,0319 Assim a probabilidade de uma conta qualquer no ser totalmente paga = 0,10, ento existe 3,19 % de chance de que exatamente 5 das 20 contas escolhidas aleatoriamente tenham essa caracterstica. Usando a tabela posso Tb achar b(x; n, ) = b(5; 20;0,10). Primeiro entro com n = 20 depois com x= 5 e vou at = 0,10 e acho o valor da probabilidade de 0,0319. A tabela binomial inclui valores de abaixo de 0,5. Suponha que 70% dos moradores de SP tenham internet na sua casa. Qual a probabilidade que de 10 moradores selecionados aleatoriamente 6 estejam conectados? Como > 0,5 no se pode usar a Tabela sem fazer alguns ajustes. Se a probabilidade de sucesso de um morador conectado na internet P(S) = 0,70 e de no estar P(S) = 0,30. Se 6 dos 10 moradores so usurios da Internet, ento 4 no so. Assim, 6 sucesso de = 0,70 o mesmo que 4 fracassos de =0,30. Ento pode-se escrever que P(X=6 | n= 10, = 0,70) = P(X=4 | n= 10, = 0,30) e da tabela se tem o valor aproximado de 0,2001. Mdia e varincia da Distribuio Binomial Mdia determinada por: E(X) = = n . Varincia da Distribuio Binomial: 2 = n . (1- )12

Do exemplo anterior tem-se: n=10 E(X) = (10) (0,70) = 7 . Das 10 pessoas escolhidas aleatoriamente, espera-se que 7 estejam conectadas internet. A varincia 2 = (10) (0,70) (0,30) = 2,1.

Distribuio Binomial AcumuladaVamos ver como aplicado na prtica. De acordo com o jornal americano 40% dos formandos do ensino mdio, nos EUA trabalham durante o vero para ganhar dinheiro para pagar as mensalidades do semestre na faculdade. Se 7 formados foram selecionados qual a probabilidade de que 3 ou menos estudantes trabalham? A probabilidade do evento A (0 a 3 trabalham) P(A) = P (X 3) EVENTO A 0 1 2 3 4 5 6 7 ESTUDANTES FORMADOS ( = 0,40)

PODEMOS ENCONTRAR O RESULTADO PELA SOMA DE : P(X= 0) + P(X= 1) + P(X= 2) + P(X= 3) = 0,0280+ 0,1306+ 0,2613+ 0,2903= 0,7102 Estas somas podem ser obtidas diretamente da tabela Binomial Acumulada P(X 3 | n = 7, = 0,40) = 0,7102. Distribuio Hipergeomtrica A distribuio binomial s apropriada se a probabilidade de sucesso de um evento permanece constante em cada tentativa, e isso ocorre se a amostra feita com reposio ou com uma populao infinita (ou muito grande). Caso a populao seja pequena e a amostragem for feita sem reposio, a probabilidade de um sucesso varia, a distribuio hipergeomtrica ser usada. P(x) = r x N n Onde N = o tamanho da amostra r = o no. de elementos na populao identificados como sucesso n = o tamanho da amostra; x = o no. de elementos de na amostra identificados como sucesso Assuma que um estbulo tem N= 10 cavalos e r = 4 deles tm uma doena contagiosa. Qual a probabilidade de selecionar uma amostra de n= 3 em que x= 2 sejam cavalos doentes? P(x) = r x N n13

N-r n-x

N-r n-x

P (X =2) =

4 2 10 3

10-4 3-2

Obs: N n = N! n! (N-n)!

6x6 = 0,30 120 H 30 % de probabilidade de selecionar 3 cavalos, dos quais 2 esto doentes. Mdia e varincia E(X) = n . r N 2 = n

P (X =2) =

r N

.

N -n N-1

Distribuio de PoissonA distribuio de Poisson uma varivel discreta, que utilizada para medir a freqncia relativa de um evento durante um perodo ou determinado espao. usada para calcular: o no. de fregueses que entram por hora numa loja; no. de acidentes por ms; no. de ligaes defeituosas feita pela empresa de Luz; no. mquinas que esto quebradas esperando o conserto..... Para aplicar a distribuio de Poisson temos que assumir: 1- A probabilidade da ocorrncia de um evento constante para qualquer intervalo de tempo ou espao; 2- a ocorrncia de um evento em qualquer intervalo, independente da ocorrncia em qualquer outro intervalo; P (X ) = x e - x! onde: x = o no. de ocorrncias do evento; = o no. mdio de ocorrncias por unidade de tempo ou espao; e = 2,71828 a base do sistema natural de logaritmos

14

Exemplo: Suponha que estejamos interessados na probabilidade de que exatamente cinco fregueses cheguem na loja na prxima hora (ou qualquer hora). Uma observao das ltimas 80 horas mostra que 800 fregueses entraram na loja. Assim, = 800/80 = 10 Fregueses por hora P (X ) = x e - x! P (X = 5) = (10)5 2,71828 -10 = 0,0378 5! Pode-se usar a tabela para achar esse valor, como segue: b(x; ) ou b(x=5; = 10) Procure no topo da tabela = 10 e desa nessa coluna at encontrar x = 5. Ento vai encontrar o valor 0,0378, isto , 3,78 % de chance de que exatamente cinco fregueses entrem na loja na prxima hora. Mdia e varincia E(X) = 2 =

Distribuio exponencialA distribuio exponencial uma distribuio contnua. Ela mede o tempo entre duas ocorrncias, ou seja, estima o espao de tempo entre duas chegadas. A probabilidade de que o espao de tempo seja menos ou igual a uma certa quantidade x : P (X x) =1- e - t Onde : t= o espao de tempo; e= base dos sistema natural de logaritmos, 2,71828 = a taxa media de ocorrncia A distribuio de uma varivel aleatria exponencial mostrada na figura abaixo. A declividade contnua da curva mostra que quanto maior o espao de tempo x, menor a probabilidade. Distribuio exponencial

minutos15

A probabilidade de que 30 minutos seja o tempo entre duas ocorrncias excede a probabilidade de que o espao de tempo seja 40 minutos: P (X 30) > P (X 40 ). Isso ocorre porque 30 minutos deve sempre vir antes que 40 minutos. Assuma no problema anterior que a taxa mdia de chegada = 1,5 por hora e queremos saber a probabilidade de que no mais do que duas horas seja o espao de tempo entre chegadas. Ento: P (X 2) =1- e - t = 1- e (1,5) (2) = 1 - e 3 = e 3 = 1 / e3

= 0,0498

P (X 2) =1- 0,0498 = 0,9502 Pela tabela: Escolha x = 0 e ignore o sinal negativo de . Com o valor de 3 para o expoente e x= 0 da tabela de distribuio de Poisson obtm o valor de 0,0498 ( que o valor de e -3). H 95,02 % de chances de que um segundo fregus entre no perodo de duas horas a partir da entrada do primeiro, se a mdia de chegada for de 1,5 por hora. Distribuio Uniforme As variveis aleatrias contnuas (V.A.C) possuem uma distribuio uniforme de probabilidade se a distribuio em que todos os resultados possveis so iguais. Ex. O lanamento de um dado, onde os seis resultados possveis tm 1/6 de probabilidade de ocorrncia. Suponha que uma V.A.C. x possa assumir valores apenas em um intervalo c x d. Ento a funo freqncia uniforme tem um formato retangular conforme abaixo. Distribuio uniforme f(x) 1/ (d-c) Freqncia relativa

c a b d x Observamos que nem todos os valos possveis de x constituem de todos os pontos no intervalo entre o ponto c e o ponto d. A altura de f(x) constante no intervalo e igual a 1/(d-c). Por isso a rea total sob f(x) dada por: rea total do retngulo = base vezes altura = (d-c) . 1/ (d-c) = 1 A funo densidade de probabilidade : f(x) = 1/ (d-c) cxd16

A funo de distribuio da probabilidade : P ( a x b) = (b-a ) / (d c) ca 0,05 N, 2 > 0,05 X 4 2 > 0,2 Logo, o fcp necessrio e o erro padro torna-se: p = ( )( )

=

(

)(

)

= 0,289

O gerente desta loja que saber qual a probabilidade de obter um valor de p que se situe no intervalo de 0,05 da proporo populacional de clientes que disseram que viram o anuncio, ou seja, qual a probabilidade de obter uma amostra com uma proporo amostral p que se situe entre 0,45 (0,5-0,05) a 0,55(0,5+0,05)? np 5 e n (1- p) 5 para este caso no se aproxima da normal. Somente neste caso para efeito didtico, vamos supor uma distribuio normal de com mdia igual a 0,50 e desvio padro da proporo p = 0,289 Para = 0,45 tem-se : Z= ( 0,45 -0,50)/0,289 = - 0,1730 cuja rea = 0,0675 Para = 0,55 tem-se : Z= ( 0,55 -0,50)/0,289 = 0,1730 cuja rea = 0,0675 Deste modo, a probabilidade de selecionar uma amostra que fornea uma proporo amostral dentro de 0,05 da proporo populacional 0,0675 + 0,0675 = 0,135.

30

Exemplo: A Bells obtm componentes para os seus telefones celulares em lotes de 200 de uma firma em Manaus. Um componente tem uma taxa de defeito de 10 %. As normas recentes estabelecidas pela Bells, para os prximos carregamentos so: a) Se houver mais de 12 % de defeituosos, implicar em constatar um novo fornecedor. b) Se houver de 10 a 12% de defeituosos, implicar em considerar um novo fornecedor. c) Se houver de 5 a 10 % de defeituosos, implicar em continuar com fornecedor. Qual deciso mais provvel que a Bells poder tomar? Obs: O tamanho da populao N no fornecido, e razovel que a Bells compre muitos componentes e a amostra de tamanho n = 200 menor que 0,05 N, logo o fcp desnecessrio. O erro padro : p = Logo, p = ( )( ) ( )( )

= 0,021 P (p > 0,12) 0,4913 0,3289 0,087 0,1711 0,05 0,1 0,12

a)

Z= Z=

= 0,95 CORRESPONDE A UAM REA DE 0,3289

P (p > 0,12) = 0,500 0,3289 = 0,1711 ...Significa que tm 17,11 % a probabilidade de vir com + de 12 % de peas defeituosas.

b)

P (0,10 p 0,12)

Z= Z=

= 0,95 CORRESPONDE A UAM REA DE 0,3289. Significa que tm 32,89 %

a probabilidade de vir entre 10 % a 12 % peas defeituosas.

c)

P (0,005 p 0,10)

Z= Z=

= - 2,38 CORRESPONDE A UAM REA DE 0,4913. Significa que tem 49,13

% a probabilidade de vir entre 5 % a 10 % peas defeituosas. Como o item c forneceu a maior probabilidade, a Bell permanecer com o mesmo fornecedor.

31

Tipos de amostragem (para leitura complementar)Existem vrios procedimentos amostrais apropriados e, portanto apenas alguns sero abordados. a) Amostragem Aleatria Simples o mtodo bsico de amostragem aleatria, pela sua facilidade de selecionar amostras, analisar dados e reduzir erros de amostragem, mas ele no pode ser aplicado sempre, e no sempre o mais apropriado. O mtodo se fundamenta no princpio de que todos os membros de uma populao tm a mesma probabilidade de serem includos na amostra. Fases do mtodo: a) listagem da populao; b) determinao do tamanho da amostra; c) uso de nmeros aleatrios (tabela ou algoritmos computacionais). Existem frmulas e tabelas para estabelecer o tamanho das amostras e as estimativas, de acordo com: tamanho da populao; o nvel de conabilidade desejvel; o ndice de preciso escolhido; o grau de disperso; a taxa de ocorrncia. b)Amostragem Sistemtica Aqui os membros da populao que participam da amostra so determinados a partir de intervalos xos, e no h a utilizao de tabelas de nmeros aleatrios. Por exemplo, numa populao de 100 peas, para obtermos 10 amostras sistemticas podemos retirar as peas de nmero 10, 20, 30, e assim por diante, at completarmos 10 amostras sistematicamente colhidas. Para encontrarmos os pontos onde faremos as coletas sistemticas das amostras, podemos seguir os seguintes passos (conforme exemplo): Dene-se o tamanho da populao: N= 1600. Dene-se o tamanho da amostragem total: n= 100

= 1600/100 = 16Faz-se ento: Sorteia-se um nmero de 1 a 16, que ser o primeiro nmero da amostra, logo as prximas amostras sero retiradas de 16 em 16. As vantagens so: 1. Facilidade de determinao dos elementos da amostra; 2. No precisa usar nmeros aleatrios; 3. Mais rapidez para grandes populaes. As desvantagens so: 1. Cuidados com o fator posio na lista dos componentes da populao; 2. Cuidado com fenmenos sazonais. c) Amostragem Estratificada Consiste em dividir a populao em subgrupos mais homogneos (estratos) e retirar amostras aleatrias simples dos subgrupos. Por exemplo: Deseja-se estudar a aceitao de determinados mtodos de controle de natalidade em uma determinada cidade. Soluo: Aspectos relevantes nesta aceitao: regio do pas e situao socioeconmica; Uma identicao sugerida: regio do pas; norte, nordeste, centro-oeste, sudeste e sul. Uma identicao sugerida - a classe social: alta, mdia e baixa. Estratos que poderiam ser formados:32

Norte de classe alta; Norte de classe mdia; Norte de classe baixa; Nordeste de classe alta; Nordeste de classe mdia; Nordeste de classe baixa; Centro-oeste de classe alta; Cetro-oeste de classe mdia; Centro-oeste de classe baixa Suldeste de classe alta; Suldeste de classe mdia; Suldeste de classe baixa; Sul de classe alta; Sul de classe mdia; Sul de classe baixa Retiramos amostras aleatrias simples de cada estrato, usando o processo j sugerido (listagem, nmeros aleatrios); Juntar numa s amostra a m termos uma amostra de toda a populao; A idia bsica que: um grupo homogneo requer amostra menor que um grupo heterogneo. As amostras estraticadas so divididas em trs tipos: 1. Uniforme: Na amostragem estraticada uniforme sorteia-se igual nmero de elementos de cada estrato. 2. Proporcional: Na amostra estraticada proporcional, o nmero de elementos em cada estrato proporcional ao nmero de elementos existentes no estrato. 3. tima: Na amostra estraticada tima, quando se toma em cada estrato um nmero de elementos proporcional ao nmero de elementos do estrato e tambm variao da varivel de interesse no estrato, medida pelo seu desvio padro. A tcnica de estraticar bastante til, quando a populao apresenta muita diversidade nos seus valores individuais, datas, etc; assim estabelecem-se estratos de modo que a varincia do valor do item seja o menor possvel dentro de cada estrato. d) Amostragem por Conglomerados um mtodo muito utilizado por motivos de ordem prtica e econmica, onde divide-se uma populao em pequenos grupos e sorteia-se um nmero suciente desses pequenos grupos (conglomerados), cujos elementos constituiro a amostra. Neste mtodo, existem pelo menos dois nveis de amostragem que so empregados: Nvel 1 Unidade de Amostragem; Nvel 2 Elementos Amostrados (dentro de cada conglomerado). Exemplo: Deseja-se entrevistar uma amostra representativa de pessoas que vivem numa grande rea da cidade. Extrair uma amostra aleatria simples, ou sistemtica ou estraticada de pessoas espalhadas numa grande rea implicaria em muitas viagens, alto custo e muito tempo. Soluo: Tomar, por exemplo, quarteires da cidade como unidade primria de amostragem ou conglomerado. a) Listar os quarteires b) Sortear uma amostra aleatria simples de quarteires (nmeros aleatrios); c) Entrevista-se as residncias dos quarteires selecionados. Alguns aspectos da representatividade de uma amostra probabilstica: 1. A amostra no deve ter preconceito ou tendncia; 2. Cada item da populao deve ter uma chance conhecida de ser selecionado; 3. Seu tamanho deve ser grande o bastante de modo a minimizar o risco da amostra atpica.

33

Estimando com Intervalos de ConfianaAs populaes so muito grandes para serem estudadas, e consequentemente requer que amostras sejam selecionadas. H dois tipos de estimativas usadas: estimativa pontual e estimativa intervalar. Estimativa pontual: usa uma estatstica para estimar o parmetro com um nico valor ou ponto. Ex: O gerente de uma loja pode escolher uma amostra de n=500 fregueses e encontrar a mdia de gastos de = R$ 37,00. Esse valor serve como uma estima pontual para a mdia da populao. Estimador intervalar: determina a amplitude dentro da qual um parmetro desconhecido pode estar. Ex. O gerente pode decidir que a mdia da populao fique entre R$ 35,00 e R$ 38,00. Cada intervalo geralmente acompanhado de uma declarao de confiana desse intervalo. Por isso chamado de intervalo de confiana. Intervalo de confiana: fornece uma amplitude dentro da qual o parmetro pode ser encontrado e o grau de confiana com que o intervalo pode conter o parmetro. Existem trs graus usuais de confiana associados aos intervalos de confiana, que so: 99, 95 e 90 %. Esses trs graus de confiana so chamados de coeficientes de confiana e so simplesmente convencionais. Se quisermos podemos calcular um intervalo de confiana de 82%. Obs: Por causa do erro amostral provavelmente a mdia no ser igual mdia populao . Como a distribuio amostral mostra como os valores de esto distribudos nas proximidades da mdia populacional , a distribuio amostral de fornece informaes sobre as possveis diferenas entre e . Usando a tabela de reas da distribuio normal padro, pode-se afirmar que 95% dos valores de qualquer varivel aleatria normalmente distribuda est dentro de +/- 1,96 desvio padro da mdia. Desse modo, quando a distribuio amostral de est normalmente distribuda, 95 % dos valores de devem estar dentro de +/- 1,96 da mdia . Um intervalo de confiana tem um limite inferior de confiana (LIC) e um limite superior de confiana (LSC). Esses limites so uma quantidade somada em relao a , logo tem-se que saber a mdia da amostra. De qualquer populao pode-se pegar vrias amostras de um determinado tamanho com cada uma com a sua respectiva mdia (uma Distribuio Amostral). Exemplo: Se pegarmos seis amostras com as suas respectivas mdias pode-se construir os intervalos de confiana com dois erros padres acima e abaixo dessa mdia. Assim, se tem a certeza que 95,5% de certeza que o intervalo construdo possui a mdia desconhecida da populao. Observa-se no grfico que apenas a 3 e 5 esto afastados da mdia populao, cujo intervalo de +/- 2 erros padres no inclui a mdia da populao.

34

Concluso: Se a mdia da populao tem 95,5% (95,5%/2 = 0,4775) de chance de estar no intervalo de dois erros padres de todas as mdias amostrais, ento, dada qualquer amostra pode-se ter 95,5% de certeza que o intervalo de 2 erros padres ao redor da mdia dessa amostra contm a mdia desconhecida da populao. Se desejarmos uma estimativa intervalar para a mdia da populao com uma grande amostra (n 30) pode-se construir um intervalo mais convencional de 95 % em vez de 95,5%, logo quantos erros padres devemos colocar acima e abaixo da mdia amostral? Como a tabela Z contm valores apenas para a rea acima ou abaixo da mdia, devemos dividir ento 95% por dois, que resulta em 0,4750. O Z-valor correspondente a uma rea de 0,4750 Z= 1,96. O intervalo -1,96 da mdia amostral e +1,96 para cima. Intervalo de confiana de 95% para a mdia da populao

para baixo

0,95

0,4750 0,4750 =? -1,96

s

+1,96

Intervalo de confiana para mdia da populao Amostra grande O intervalo de confiana para quando conhecido dado por: I. C. para = +/- Z

35

Exemplo: Considere um empreendedor imobilirio que pretende construir um grande shopping. Ele pode estimar a renda mdia familiar anual na rea como um indicador das vendas futuras. Uma amostra de n= 100 famlias resultou em = R$ 35.500,00. Assuma que o desvio padro seja = R$ 7200,00. Dado que estimado como: I. C. para = 35.500 +/- (1,96) =

um intervalo de 95 %

= R$ 34.088.80 R$ 36.911,20 O intervalo de confiana pode ser interpretado de duas maneiras: A primeira e a mais usada declara que o empreendedor tem 95% de certeza que a verdadeira e desconhecida mdia da populao est entre R$ 34.088.80 e R$ 36.911,20. Embora o verdadeiro valor para a mdia da populao permanea desconhecido, este tem 95 % de certeza que ela se encontra entre esses dois valores. A segunda interpretao reconhece que vrios intervalos de confiana podem ser construdos, ou seja, outra amostra produzir uma mdia amostral diferente por causa do erro amostral. Com um diferente o intervalo ter outro limite superior e inferior. Assim, que se todos os NCn intervalos de confiana forem construdos, 95% deles iro conter a desconhecida mdia da populao. Isso significa que 5% dos intervalos estariam errados, ou seja, eles no conteriam a mdia da populao. Esses 5 % calculados como 1 coeficiente de confiana chamado de Alfa Valor e represente a probabilidade de erro. Alfa Valor a probabilidade de erro ou a probabilidade de que um dado intervalo no contenha a mdia desconhecida da populao. Intervalo de Confiana quando desconhecido Se desconhecido ento deve ser substitudo pelo desvio padro da amostra, conforme abaixo: Intervalo de confiana para quando desconhecido dado por: I. C. para = +/- Z Onde

=

Exemplo: Um contador acabou de completar o imposto de renda de seus clientes e ele quer estimar a quantidade mdia que eles devem Receita Federal. Dos 50 clientes que ele escolheu para sua amostra, a quantidade mdia devida R$ 652,68. Como o desvio padro para todos os seus clientes desconhecido, este deve estimar com o desvio padro da amostra de s = R$ 217,43. Se um grau de confiana de 99% desejado, o valor de Z-valor apropriado 0,99/2 = 0,4950. Da tabela Z para uma rea de 0,4950 revela Z = 2,58. Usando a equao acima tem-se:36

I. C. para = +/- Z

= 652,68 +/- 2,58

= 573,35 732,01O contador pode estar 99% certo de que a quantidade mdia devida por seus clientes algum valor entre R$ 573,35 e R$ 732,01. O que aconteceria com esse intervalo se o contado aceitasse um intervalo de confiana de 95? = 652,68 +/- 1,96

= 592,41 712,96O resultado bom ou ruim em comparao ao anterior? O intervalo de confiana de 95 % mais estreito e d maior preciso. Logo, quanto menor o intervalo, mais significativo. Porm, o contador tem apenas 95 % de certeza de que o intervalo realmente contm . Embora o intervalo seja mais preciso (estreito) a probabilidade de que ele contenha caiu de 99% para 95%. Assim, o contador abriu mo da confiana pela preciso. Controlando o tamanho da amostra Existem dois modos de construir um intervalo mais preciso: 1- diminuindo o grau de confiana e 2- aumentando o tamanho da amostra. 1- Diminuindo o grau de confiana Um aumento de preciso pode ser ganho aceitando um grau de confiana menor. Para o exemplo anterior o intervalo de confiana de 99 % variava de R$ 573,00 a R$ 732,00, enquanto o intervalo de confiana de 95$ era menor variando de R$ 592,00 a R$ 712,00. Existe uma perda envolvida nesse aumento de preciso, ou seja, o grau de confiabilidade de 95% resulta em 5% de probabilidade de erro em vez do 1% de erro associado ao intervalo de confiana de 99%. 2- Aumentando do tamanho da amostra O modo de encurtar o intervalo sem perda de confiana aumentando o tamanho da amostra, pois se diminui o erro padro = . No exemplo acima se a amostra aumentada para 80, o intervalo de 99% exibe um grau de preciso similar ao do intervalo mais curto de 95% sem perder a confiabilidade. Como n = 80, o intervalo de 99% tem-se: I. C. para = +/- Z = 652,68 +/- 2,58

= 589,96 715,39Essa vantagem no ganha sem pagar um preo, ou seja, amostra maior significa maior tempo e mais dinheiro para coletar.37

Intervalos de Confiana para propores da Populao Geralmente as decises dependem de parmetros binrios, ou seja duas categorias de respostas. Ex. uma empresas que saber qual a proporo de seus consumidores pagam com carto de crdito e quantos pagam em dinheiro. Para que a proporo amostral seja normal quando n e n(1-) for maior que 5. Ento a distribuio amostral ter mdia igual a proporo da populao. = E(p) = O erro padro da Distribuio da Proporo da Amostra ser dado por: p = ( )( )

O parmetro que se deseja estimar , e usa-se a proporo amostral p como um estimador para que pode ser escrito como: sp = ( )( )

O intervalo de confiana : I. C. para = p +/- Z

Exemplo: O gerente de uma estao de televiso deve determinar qual a porcentagem de moradias da cidade que tem mais de um aparelho de televiso. Uma amostra aleatria de 500 casas revelou que 275 delas tm dois ou mais aparelhos. Qual o intervalo de confiana de 90% para a proporo de casas com dois ou mais aparelhos? Temos p = 275/500 = 0,55 sp = ( )( )

=

(

)(

)

= 0,022

A tabela da distribuio normal fornece para um intervalo de confiana de 90 % para um valor de Z de 1,65. I. C. para = p +/- Z

= 0,55 +/- (1,65) (0,022) = 0,55 +/- 0,036 0,514 0,586 O gerente pode ter 90 % de certeza que entre 51,4 % a 58,6 % das casas da cidade tm mais de um aparelho de TV em casa. Intervalo de confiana para mdia da populao com amostra pequena Distribuio t Quando a amostra for pequena (n menor que 30 elementos) deve ser usada uma distribuio que no a normal chamada de distribuio t de Student (distribuio t). A distribuio t 38

usada: 1- amostra pequena; 2) desconhecido; e 3 a populao normalmente distribuda ou quase. Caractersticas da distribuio t: tem zero como mdia (igual a distribuio Z); simtrica em relao mdia, e sua amplitude varia de - a + . A varincia da distribuio t maior do que 1, e portanto mais achatada e dispersa que a distribuio Z (varincia da distr. Z 2 = 1). Varincia para distribuio t Uma famlia de distribuio t:Z ou t com n 30

2 =

t com n = 15 ( 20 g.l.)

t com n = 10 (10 g.l.)

A varincia depende dos graus de liberdade (g. l.) definidos como o nmero de observaes menos o nmero de restries impostas a essas observaes, onde a restrio algum valor que essas observaes devem gerar. A estatstica t calculada: t= onde : desvio padro da amostra , a mdia da populao, e media da amostra. Onde

=

A eq. acima pode ser representada como um intervalo de confiana para : Intervalo de confiana para a Mdia da Populao Amostra pequena: I. C. para = +/- t

= +/- t

O valor de t pode ser encontrado na tabela. Exemplo: Uma construtora foi acusada de inflacionar os custos em seus comprovantes de um contrato com o Governo. O contrato declara que um certo tipo de trabalho deve custar em mdia R $ 11.500,00. Na poca apenas 12 diretores de agencias governamentais foram chamados para prestar depoimento sobre o caso dos comprovantes. Se atravs das39

testemunhas chegou-se mdia de R$ 1275,00 com desvio padro de R$ 235,00, um intervalo de confiana de 95 % prova a inocncia da construtora? Suponha que os valores dos comprovantes so normalmente distribudos. Para um intervalo de confiana de 95 % e com g.l. (graus de liberdade) 12 1 = 11 (n-1), resulta pela Tabela um valor de t de 2,201. Assim: I. C. para = +/- t = . 1275 +/- (2,201) = 1275 +/- 149,31 R$ 1.125,69 1.424,31 Resp. O tribunal pode ter 95 % de certeza de que a mdia dos valores dos comprovantes est entre R$ 1125,00 e R$ 1424,00. O intervalo contm o valor contratado reafirmando a defesa da empresa. Note que o valor t para um intervalo de 95 % 2,201 (dado g.l. = 11) enquanto uma amostra maior usaria um valor Z de 1,96, logo o intervalo baseado num t valor mais largo. Determinando o tamanho da amostra O tamanho da amostra tem um importante papel na determinao da probabilidade de erros, bem como da preciso da estimativa. Depois de escolher o grau de confiabilidade dois fatores influenciam na escolha do tamanho da amostra: 1- a varincia da populao 2 (estar fora do controle do pesquisador) e 2- o tamanho do erro tolerado que os pesquisadores esto dispostos a aceitar ( possvel limitar o tamanho do erro). a) Tamanho da amostra para A distribuio normal de Z pode ser expressa como:

=

Z=

=

Isso pode ser reescrito como:

n=

(

)

Tamanho da amostra p/ intervalos da mdia da populao

Onde a diferena entre a mdia da amostra e a mdia da populao o erro (

) .

40

Exemplo: A indstria de disco deseja construir um intervalo de 95% para o tamanho mdio da pea. Uma amostra piloto ( n 30) revela um desvio padro de 6 cm. Qual deve ser o tamanho da amostra? Usa-se um intervalo de 95% utiliza um valor Z de 1,96 (erro de 2 desvios padro).

n= n=

( ( )

)

= 34,5 = 35 peas

A indstria deve selecionar uma amostra de 35 peas. Para essa amostra um intervalo de 95 % pode ser construdo para o dimetro mdio. LO intervalo poderia ter um erro menor que 2 cm. a) Tamanho da amostra para Vimos que: Z=

Onde o erro padro : p = ( )( )

Podemos reescrever uma expresso para o tamanho da amostra como:

n=

( )( ( )

)

Tamanho da amostra p/ intervalos da proporo da populao

Onde a diferena entre a proporo da amostra e a proporo da populao o erro (

) .Como o parmetro desconhecido que desejamos estimar, ento tem dois modos de tratar. 1- Pegar uma amostra piloto para obter um valor de , ou 2- se pode simplesmente considerar = 0,5 para fins de determinar o tamanho da amostra , o que mais seguro. O n ser maximizado se = 0,5, pois ento o numerador da eq acima fica (1 ) = 0,25, pois qualquer valor diferente de 0,5 resultar um valor menor que 0,25. Exemplo:Um candidato est concorrendo para governador e quer uma estimativa com 1 ponto percentual de erro para a proporo das pessoas que iro votar nele. Ele tambm que um intervalo de confiana de 95%. Qual deve ser o tamanho da amostra?

n=

= 9.604 votantes ( ) ( ) Uma amostra de 9604 votos permitir o candidato estime com 1 ponto percentual de erro com intervalo de confiana de 95 %.41

( )(

)

=

(

)(

)