Post on 02-Nov-2020
ufjf.br/tiago_magalh
aes
Universidade Federal de Juiz de Fora
Instituto de Ciências Exatas
Departamento de Estatística
ESTATÍSTICAECONÔMICA
Tiago M.
MAGALHÃEStiago.magalhaes@ice.ufjf.br
12
0/3
Fraternidade Igualdade Liberdade
Aθηνα
ufjf.br/tiago_magalh
aes
ii
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Prefácio
Esta apostila foi criada para auxiliar os alunos das disciplinas EST012 - Estatística Econô-
mica I e EST022 - Estatística Econômica II, oferecida pelo Departamento de Estatística do
Instituto de Ciências Exatas da Universidade Federal de Juiz de Fora. Ela foi criada a partir
das minhas notas de aulas dos cursos mencionados anteriormente e também do curso: Uma
introdução à análise exploratória de dados e métodos estatístico, que é oferecido nos cursos
de verão do Instituto de Matemática e Estatística da Universidade de São Paulo. Porém, o
embrião deste material orginou-se da notas de aula de Introdução à Estatística ministrada pelo
professor Vicente de Paula na Universidade Federal do Ceará, a quem deixo os meus agradeci-
mentos. Por m, entre em contato comigo, caso tenha sugestões a fazer ou tenha encontrado
erros.
Juiz de Fora, 03 de março de 2020
Tiago M. Magalhães
∴
iii
ufjf.br/tiago_magalh
aes
iv
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Sumário
Lista de Figuras ix
Lista de Tabelas xi
1 Conceitos iniciais 1
1.1 Operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Multiplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.1 Elemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.2 Pertinência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.3 Conjuntos especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.4 Operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Combinações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Fatorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.2 Coeciente binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Medidas resumo 7
2.1 Denições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.2 Tipos de variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Séries estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Tipos de séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
v
ufjf.br/tiago_magalh
aes
SUMÁRIO vi
2.3 Distribuição de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Medidas resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4.1 Medidas de posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Medidas de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Métodos grácos 21
3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Grácos para uma variável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.1 Grácos para variáveis qualitativas . . . . . . . . . . . . . . . . . . . . . 22
3.2.2 Grácos para variáveis quantitativas . . . . . . . . . . . . . . . . . . . . 23
3.3 Grácos para duas ou mais variáveis . . . . . . . . . . . . . . . . . . . . . . . . 25
3.3.1 Grácos para duas variáveis quantitativas . . . . . . . . . . . . . . . . . 25
3.3.2 Grácos para variáveis qualitativas e quantitativas . . . . . . . . . . . . . 27
3.4 Considerações nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4 Introdução à probabilidade 31
4.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2.1 Probabilidade em espaços amostrais equiprováveis . . . . . . . . . . . . . 34
4.3 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.4.1 Sensibilidade e especicidade . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.5 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5 Variável aleatória 47
5.1 Variável aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.1.1 Variável aleatória discreta . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.2 Variável aleatória contínua . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
SUMÁRIO vii
5.2 Distribuição de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3 Função distribuição acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Esperança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.5 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6 Distribuições 57
6.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2 Distribuição de binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6.3 Distribuição geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.4 Distribuição binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
6.5 Distribuição hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.6 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.7 Distribuição uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.8 Distribuição exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.9 Distribuição normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.9.1 Importância da normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.9.2 Distribuição normal padrão . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.9.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.10 Aproximação da binomial pela normal . . . . . . . . . . . . . . . . . . . . . . . 74
Referências Bibliográcas 77
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
SUMÁRIO viii
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Lista de Figuras
2.1 Terminal Butantã, São Paulo/SP (Créditos: Google imagens). . . . . . . . . . . 11
3.1 Localização de Minas Gerais no Brasil (Créditos: Wikipédia). . . . . . . . . . . 21
3.2 Grácos de barras para a região de origem. . . . . . . . . . . . . . . . . . . . . . 23
3.3 Grácos para a região de origem. . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Grácos para as alturas (cm) dos alunos. . . . . . . . . . . . . . . . . . . . . . . 25
3.5 Gráco de dispersão da velocidade (mph) de um carro e a distância (pés) até
parar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.6 Grácos de séries temporais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.7 Taxa de mortalidade, Virginia, 1940. . . . . . . . . . . . . . . . . . . . . . . . . 28
3.8 Dotplot da taxa de mortalidade na Virgina em 1940. . . . . . . . . . . . . . . . 29
3.9 Número de insetos exterminados por inseticida. . . . . . . . . . . . . . . . . . . 30
4.1 Representação de Ω. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Árvore de possibilidades para o Paradoxo de Monty Hall. . . . . . . . . . . . . . 38
4.3 Sensibilidade do exame do Exemplo. . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1 Distribuição de probabilidades para VA X descrita na Tabela 5.2. . . . . . . . . 50
5.2 P(a ≤ X ≤ b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.1 Distribuição de probabilidades de uma VA Bernoulli. . . . . . . . . . . . . . . . 58
6.2 Distribuição de probabilidades de uma VA binomial. . . . . . . . . . . . . . . . . 60
6.3 Distribuição de probabilidades de uma VA geométrica. . . . . . . . . . . . . . . 62
6.4 Distribuição de probabilidades de uma VA binomial negativa. . . . . . . . . . . 64
ix
ufjf.br/tiago_magalh
aes
LISTA DE FIGURAS x
6.5 Distribuição de probabilidades de uma VA hipergeométrica (10, 3, n). . . . . . . 65
6.6 Distribuição de probabilidades de uma VA Poisson. . . . . . . . . . . . . . . . . 66
6.7 VA uniforme(a, b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.8 VA uniforme para diferentes intervalos (a, b). . . . . . . . . . . . . . . . . . . . . 68
6.9 VA exponencial para diferentes valores de λ. . . . . . . . . . . . . . . . . . . . . 69
6.10 VA normal para diferentes valores de µ e σ2. . . . . . . . . . . . . . . . . . . . . 71
6.11 FDP de uma VA normal em função de µ e σ2. . . . . . . . . . . . . . . . . . . . 72
6.12 VA normal padrão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.13 Distribuição de probabilidades de uma bin(10, 1/2) e a FDP de uma normal(5, 2, 5). 75
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Lista de Tabelas
2.1 Procedimento de construção de uma distribuição de frequências. . . . . . . . . . 10
2.2 Notas de 50 alunos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Dados dos funcionários. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Visitantes dos sítios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.5 Tempo de realização das tarefas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.6 Salários em reais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.7 Idades dos entrevistados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1 Participantes por região. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Altura (cm) dos alunos do IME-USP . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Estatísticas descritivas para altura (cm) dos alunos do IME-USP . . . . . . . . . 25
3.4 Taxa de mortes por 1000 habitantes na Virginia em 1940. . . . . . . . . . . . . . 28
3.5 Quantidade de insetos exterminados. . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1 Todos os possíveis resultados, escolhendo inicialmente a Porta 1. . . . . . . . . 38
4.2 Distribuição dos pacientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Motivos para voltar a trabalhar. . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.4 Cargo na nova atividade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 Atributos dos funcionários. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.1 Conjuntos Ω e Y associados ao experimento ε e a VA Y , respectivamente. . . . . 48
5.2 Distribuição de probabilidades de X. . . . . . . . . . . . . . . . . . . . . . . . . 49
6.1 Distribuição de probabilidades da VA X para n = 4 e p = 0,2 e 0,7. . . . . . . . 60
xi
ufjf.br/tiago_magalh
aes
LISTA DE TABELAS xii
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 1
Conceitos iniciais
1.1 Operações
1.1.1 Soma
Sejam a, b e c, três números quaisquer, a soma tem as seguintes propriedades:
• Comutativa: a+ b = b+ a;
• Associativa: (a+ b) + c = a+ (b+ c);
• Identidade: a+ 0 = a.
Somatórios. Sejam a1, a2, . . . , an, n números quaisquer. Então,
n∑i=1
ai = a1 + a2 + · · ·+ an.
1.1.2 Multiplicação
Sejam a, b e c, três números quaisquer, a multiplicação tem as seguintes propriedades:
• Comutativa: a× b = b× a;
• Associativa: (a× b)× c = a× (b× c);
• Identidade: a× 1 = a.
1
ufjf.br/tiago_magalh
aes
1.2. CONJUNTOS 2
Produtórios. Sejam a1, a2, . . . , an, n números quaisquer. Então,
n∏i=1
ai = a1 × a2 × · · · × an.
Frações. Sejam a e b, dois números quaisquer. Uma fração é a seguinte representação:
a
b,
que pode ser interpretada com a divisão (operação inversa da multiplicação) de a por b.
1.2 Conjuntos
Na matemática, um conjunto é uma coleção de elementos.
Exemplos.
• O conjunto dos números naturais: 0, 1, 2, 3, ...;
• O conjunto de todos os alunos de uma sala de aula;
• O conjuto de músicos na banda The Bealtes.
Por convenção, todo conjunto é representado por uma letra do alfabeto em maiúsculo: A,B,C, . . . , Z.
1.2.1 Elemento
Elemento de um conjunto é qualquer coisa que pertença a um determinado conjunto.
Exemplos.
• a é um elemento do conjunto das vogais, a ∈ a, e, i, o, u;
• John Lennon é um elemento do conjunto musical The Beatles.
1.2.2 Pertinência
Pertinência é a característica associada a um elemento ao qual faz parte de um conjunto.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
1.3. COMBINAÇÕES 3
Exemplos.
• a pertence ao conjunto das vogais;
• John Lennon pertence ao conjunto musical The Beatles.
1.2.3 Conjuntos especiais
• Conjunto unitário: é o conjunto composto por apenas um elemento.
• Conjunto vazio (∅): é o conjunto com zero elementos.
• Conjunto universo: é o conjunto com todos os elementos.
• Conjunto iguais: dois conjuntos A e B são ditos iguais se todo elemento de A é também
elemento de B e vice-versa.
1.2.4 Operações
Sejam A e B são dois conjuntos não vazios e U o conjunto Universo.
• União (A ∪B): são os elementos que pertencem a A ou pertencem a B.
• Interseção (A ∩B): são os elementos que pertencem simultaneamente a A e B.
• Diferença (A−B): são os elementos que pertencem a A e não pertencem a B.
• Complementar (Ac): são os elementos que pertence a U e não pertencem a A.
1.3 Combinações
1.3.1 Fatorial
Seja n um número natural, denimos como fatorial de n, denotado por n!, o número:
n! = n× (n− 1)× (n− 2)× · · · × 3× 2× 1.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
1.3. COMBINAÇÕES 4
Exemplos.
1! = 1
2! = 2× 1 = 2
3! = 3× 2× 1 = 6
Por convenção, 0! = 1.
Exemplo. O professor José irá tirar dúvidas de três alunos: Alberto, Hellinton e Sylvio. De
quantas maneiras os alunos poderão ser atendidos de forma individual e por ordem de chegada?
Existem 6 possibilidades de atendimento:
Maneira 1: Alberto, Hellinton, Sylvio;Maneira 2: Alberto, Sylvio, Hellinton;Maneira 3: Hellinton, Alberto, Sylvio;Maneira 4: Hellinton, Sylvio, Alberto;Maneira 5: Sylvio, Alberto, Hellinton;Maneira 6: Sylvio, Hellinton, Alberto.
De maneira mais simples, ao invés de termos que listar todas maneiras, basta notarmos que
6 = 3! = número de alunos!
1.3.2 Coeciente binomial
Sejam n e k dois números naturais, denimos como coeciente binomial a seguinte expressão:
(n
k
)=
n!
k!(n− k)!.
Aplicação. Sorteios em que a ordem dos sorteados não é importante.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
1.4. EXERCÍCIOS 5
Exemplo. Quantas são as possíveis combinações de números em um sorteio da mega-sena?
Resposta:
(60
6
)= 50.063.860.
Exemplo. O professor José irá sortear um trabalho para ser resolvido por um dos seus quatro
alunos: Alberto, Christian, Hellinton e Sylvio. De quantas maneiras isso é possível? Resposta:
(4
1
)= 4.
O professor percebeu que o trabalho precisa resolvido por dois alunos ao mesmo tempo. De
quantas maneiras isso é possível? Resposta:
(4
2
)= 6.
1.4 Exercícios
1. Seja D o conjunto das faces de um dado, isto é, D = 1, 2, 3, 4, 5, 6.
(a) Quem é o conjunto dos números pares, P?
(b) Quem é o conjunto dos números ímpares, I?
(c) Quem é o conjunto interseção entre P e I, P ∩ I?
(d) Quem é o conjunto D − I?
(e) Se T é o conjunto das faces maiores que 3. Quem é o conjunto T?
(f) Se U é o conjunto das faces menores ou iguais a 1. Quem é o conjunto U?
(g) Quem é o conjunto da união entre T e U , T ∪ U?
2. Em um avião há 122 passageiros dos quais 96 são brasileiros, 64 são homens, 47 fumantes,
51 homens brasileiros, 25 homens fumantes, 36 brasileiros fumantes e 20 homens brasileiros
fumantes. Determine entres os passageiros quantos deles eram:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
1.4. EXERCÍCIOS 6
(a) Mulheres brasileiras não fumantes;
(b) Homens fumantes não brasileiros;
(c) Mulheres fumantes;
(d) Mulheres fumantes não brasileiras;
(e) Homens brasileiros não fumantes.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 2
Medidas resumo
2.1 Denições
2.1.1 Estatística
É o ramo da matemática aplicada que cuida da coleta, análise e interpretação dos dados
(Fisher).
População. É um conjunto de indivíduos ou objetos que possuem pelo menos uma caracte-
rística em comum.
Amostra. É um subconjunto da população.
Estatística descritiva. Tem com o intuito de apresentar as observações de maneira resu-
mida, através de tabelas, grácos e/ou medidas.
Inferência estatística. Tira resultados e conclusões de uma amostra (signicativa da popu-
lação) e estende a população.
2.1.2 Tipos de variáveis
Quantitativas. É o resultado de contagem (variável discreta) ou mensuração (variável con-
tínua).
7
ufjf.br/tiago_magalh
aes
2.2. SÉRIES ESTATÍSTICAS 8
Qualitativas. Quando se refere a qualidade ou atributo de um indivíduo. Se não houver
ordem em suas realizações, é dita qualitativa nominal, caso contrário, qualitativa ordinal.
2.2 Séries estatísticas
É toda e qualquer seleção de dados organizados em uma tabela, que responda a três ques-
tionamentos básicos:
1. O quê? Se refere ao fenômeno estudado.
2. Quando? Se refere ao período de tempo no qual se estudou o fenômeno.
3. Onde? Se refere a região geográca onde foi estudado o fenômeno.
2.2.1 Tipos de séries
Temporal. É aquela em que o único fator variável é o tempo, permanecendo constantes o
fenômeno estudado e a região geográca.
Observações:
• Fonte primária: o pesquisador é responsável pela coleta de informações.
• Fonte secundária: quando as informações são retiradas de estatísticas já existentes.
Geográca. É aquela em que o único fator variável é a região geográca, permanecendo
constantes o fenômeno estudado e o tempo.
Especicativa. É aquela em que varia somente o fenômeno estudado.
Mista. Composição de duas ou mais séries.
2.3 Distribuição de frequências
Exemplo. Foi perguntado a 27 alunos do curso de Estatística Economica I quantos dias
eles estudaram na semana anterior. As respostas foram:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.3. DISTRIBUIÇÃO DE FREQUÊNCIAS 9
0 3 3 0 2 4 1 1 23 2 2 2 4 3 5 1 54 1 5 3 2 5 4 0 0
O que podemos observar/comentar?
Distribuição de frequências. Uma maneira de se dispor um conjunto de dados para se ter
uma ideia global sobre eles, ou seja, de sua distribuição. Para os dados anteriores:
Dias Freq. obs.0 41 42 63 54 45 4
Observação. Em algumas situações, é conveniente adicionar informações extras a distribui-
ção de frequências, como a frequência acumulada, relativa ou relativa em porcentagem. Para
os dados anteriores:
Dias f fR fR(%) fac0 4 4/27 400/27 41 4 4/27 400/27 82 6 6/27 600/27 143 5 5/27 500/27 194 4 4/27 400/27 235 4 4/27 400/27 27
Em que:
• f é a frequência observada;
• fR é a frequência relativa;
• fR(%) é a frequência relativa percentual;
• fac é a frequência relativa acumulada;
se n é o total de observações, temos que f1 +f2 + · · ·+fn = n, fRi= fi/n, fRi
(%) = 100×fi/n,
faci = f1 + f2 + · · ·+ fi, i = 1, 2, . . . , l e l é o número de observações distintas.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.4. MEDIDAS RESUMO 10
Construção de uma distribuição de frequências. Em situações com muitas observações
ou para o caso de variáveis quantitativas contínuas, o procedimento para a construção de uma
distribuição de frequências é o seguinte, denir:
1. Rol: a organização dos dados em ordem crescente;
2. Amplitude total (AT ): Valor máximo (max) − valor mínimo (min);
3. Número de classes (c): c ≈ 1 + 3, 22 logn10 (fórmula de Sturges);
4. Amplitude de classes (h): h ≈ AT/c.
E construir a distribuição de frequências como mostra a Tabela 2.1.
Tabela 2.1: Procedimento de construção de uma distribuição de frequências.
Classe Freq. obs.1: min (inclusive) |- min +h f12: min +h (inclusive) |- min +2h f2...
......
c: min +(c− 1)h (inclusive) |- min +ch fc
2.4 Medidas resumo
Exemplo. Marcio é aluno da disciplina de Estatística Avançada I, com prova marcada para
as 8h, sem a possibilidade de entrada após este horário. As 7h44, ele chega no Terminal Butantã
(ver Figura 2.1) e, neste exato momento, os dois ônibus das linhas que lhe serve, 8012 e 8022,
estão prestes a partir.
Desesperado, ele pergunta para o scal quanto tempo cada um deles leva até chegar ao
Departamento de Estatística. O scal responde: nestas mesmas condições, eu observei, em
minutos:
8012 13 15 12 10 19 17 10 14 15 158022 16 16 15 16 16 14 15 15 14 15
Qual o ônibus Marcio deveria pegar?
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.4. MEDIDAS RESUMO 11
Figura 2.1: Terminal Butantã, São Paulo/SP (Créditos: Google imagens).
2.4.1 Medidas de posição
Média (X). É o ponto de equilíbrio de um conjunto de observações. Dado um conjunto
de observações X1, X2, . . . , Xn, dene-se média aritmética como o quociente entre a soma das
observações e o número de termos do conjunto.
X =X1 +X2 + · · ·+Xn
n=
∑ni=1Xi
n.
Propriedades da média:
1. Se somarmos uma constante a todos os elementos do conjunto, a nova média cará somada
desta constante.
2. Se multiplicarmos todos os elementos de um conjunto por uma constante, a nova média
cará multiplicada por esta constante.
3. A soma dos desvios tomados em relação a média é nula.
Isto é,
1.(X1 + c) + (X2 + c) + · · ·+ (Xn + c)
n= X + c;
2.(X1 × c) + (X2 × c) + · · ·+ (Xn × c)
n= X × c;
3. (X1 − X) + (X2 − X) + · · ·+ (Xn − X) = 0.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.4. MEDIDAS RESUMO 12
Mediana (Md). É o valor que divide exatamente no meio um conjunto de dados, isto é,
o número de observações a sua direita é o mesmo a sua esquerda. Seja X1, X2, . . . , Xn um
conjunto de dados não ordenados com n observações e X(1), X(2), . . . , X(n) o conjunto de dados
anterior ordenado, então
• Se n é ímpar, a mediana é o valor da observação que está na posição n+12
do conjunto de
dados ordenados,
Md = X(n+12
).
Então,
X(1), X(2), . . . , X(n−12
), Md , X(n+32
), X(n+52
), . . . , X(n)
50%←− 50%−→.
• Se n é par, a mediana é a média dos valores das observações que estão nas posições n2e
n2
+ 1 do conjunto de dados ordenados,
Md =X(n
2) +X(n
2+1)
2.
Então,
X(1), X(2), . . . , X(n2−1), Md , X(n
2+2), X(n
2+3), . . . , X(n)
50%←− 50%−→.
Moda (Mo). É o valor mais frequente de um conjunto de observações.
Relações entre X, Md e Mo.
• Se X > Md > Mo, a distribuição dos dados é assimétrica à direita.
• Se X < Md < Mo, a distribuição dos dados é assimétrica à esquerda.
• Se X = Md = Mo, a distribuição dos dados é simétrica.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.4. MEDIDAS RESUMO 13
Quartis. Os quartis Q1 a Q3 dividem o conjunto de observações em quatro partes, da seguinte
maneira:
• Q1: deixa 25% dos elementos abaixo dele e 75% acima.
• Q2: deixa 50% dos elementos abaixo dele e 50% acima.
• Q3: deixa 75% dos elementos abaixo dele e 25% acima.
SeX1, X2, . . . , Xn é um conjunto de dados não ordenados com n observações eX(1), X(2), . . . , X(n)
o conjunto de dados anterior ordenado, supondo n par, então
X(1), . . . , X(n−54
), Q1, X(n+74
), . . . , X(n−12
), Q2, X(n+32
), . . . , X( 3n−54
), Q3, X( 3n+74
), . . . , X(n)
25%←− 25%−→50%←− 50%−→
.
Entre as possibilidades de calcular os quartis, sugerimos a seguinte:
• Q2: é a mediana de todas as observações (Md);
• Q1: é a mediana das observações que são menores que Md;
• Q3: é a mediana das observações que são maiores que Md.
Intervalo interquartil (IIQ). É a diferença Q3 − Q1, utilizada para avaliar o grau de
espalhamento dos dados.
Exemplo (continuação). Com o conhecimento de medidas de posição, o scal obteve:
Linha Min Q1 Md X Moda Q3 Max
8012 10 12,3 14,5 14,0 15 15 19
8022 14 15,0 15,0 15,2 15 e 16 16 16
Agora, qual o ônibus Marcio deveria pegar?
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 14
2.4.2 Medidas de dispersão
Variância (S2). Mede o grau de dispersão dos valores em torno da média. Quanto menor a
variância, maior a homogeneidade. É calculada da seguinte forma
S2 =
∑ni=1(Xi − X)2
n− 1=
∑ni=1X
2i − nX2
n− 1.
Propriedades da variância. Sejam X um conjunto de dados e c uma constante, então:
1. Var(c) = 0;
2. Var(X ± c) = Var(X);
3. Var(cX) = c2Var(X);
Desvio padrão (S). É a raiz quadrada da variância, isto é, S =√S2
Coeciente de variação (CV ). É o quociente entre o desvio padrão e a média, em porcen-
tagem,
CV =S
X× 100.
Exemplo (continuação). Com o conhecimento de medidas de dispersão, o scal obteve:
Linha Min Q1 Md X Moda Q3 Max S CV
8012 10 12,3 14,5 14,0 15 15 19 2,9 20,5
8022 14 15,0 15,0 15,2 15 e 16 16 16 0,8 5,2
Finalmente, qual o ônibus Marcio deveria pegar?
2.5 Exercícios
1. Classique as seguintes variáveis:
(a) Número de alunos em uma sala;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 15
(b) Número de erros por páginas em um livro;
(c) Temperatura;
(d) Peso;
(e) Sexo;
(f) Região de procedência;
(g) Classicação do vestibular;
(h) Patente militar.
2. Classique as seguintes séries estatísticas:
(a) Produção de arroz em Minas Gerais no período de 2001 a 2003;
(b) Casos de febre amarela em Belo Horizonte, Juiz de Fora e Uberlândia no ano de
2017;
(c) Casos de febre amarela e sarampo em Juiz de Fora em 2017;
(d) Produção de milho, arroz e feijão, nos estados de Minas Gerais, Rio de Janeiro e São
Paulo no ano de 2017;
(e) Produção de milho, arroz e feijão, nos estados de Minas Gerais, Rio de Janeiro e São
Paulo no período de 2000 a 2002.
3. Complete os dados que faltam:
X f fac fR1 4 0,082 43 164 75 5 286 387 458
4. Na Tabela 2.2 estão dadas as notas de 50 alunos. Construa a distribuição de frequências.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 16
Tabela 2.2: Notas de 50 alunos.
60 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 53 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
5. Provar as propriedades da média.
6. Provar as propriedades da variância.
7. Considere uma empresa com três funcionários que ganham 2, 4, 6 salários mínimo.
(a) Se dermos uma abono de um salário mínimo a todos os funcionários, o que acontecerá
com a média e com a variância?
(b) Se dermos um aumento de 35% a todos os funcionários, qual será a nova média
salarial e a variância?
8. Um questionário foi aplicado aos dez funcionários do setor de contabilidade de uma em-
presa, fornecendo os dados da Tabela 2.3.
Tabela 2.3: Dados dos funcionários.
Funcionário Escolaridade Idade Salário (R$) Anos na empresa
1 Superior 34 1600,00 5
2 Superior 43 1950,00 8
3 Médio 31 1360,00 6
4 Médio 37 1370,00 8
5 Médio 24 1250,00 3
6 Médio 25 1000,00 2
7 Médio 27 1100,00 5
8 Fundamental 22 550,00 2
9 Fundamental 21 850,00 3
10 Fundamental 26 850,00 3
(a) Classique cada uma das variáveis. (Note que Funcionário não é variável mas um
identicador).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 17
(b) Calcule a média e a mediana dos salários para os 10 funcionários.
(c) Divida os funcionários em três grupos segundo a escolaridade: Fundamental (F),
Médio (M) e Completo (C). Calcule a média e a mediana para salário. Compare-as
com os valores obtidos em (b). Comente.
(d) Calcule a mediana do tempo de empresa dos funcionários. Considerando o valor
obtido, construa dois grupos: funcionários recentes (R), com número de anos na em-
presa menor ou igual à mediana, e funcionários antigos (A), com tempo de empresa
superior à mediana. Calcule média e desvio padrão de salário para cada grupo.
(e) Calcule o desvio padrão e o coeciente de variação de salário para os grupos em (d).
Qual é mais homogêneo?
9. O Instituto de Matemática e Estatística da Universidade de São Paulo disponibiliza para
seus alunos de pós-graduação um domínio de internet. Um funcionário da Seção de
Informática (SI) retira uma amostra de tamanho 4 de domínios existentes e verica o
número de visitas entre os anos de 2013 a 2017. A Tabela 2.4 apresenta os resultados
dessa amostragem.
(a) Qual é a variável de interesse?
(b) Classique cada uma das variáveis. (Note que Observação não é uma variável mas
um identicador).
(c) Calcule a média, a mediana e o desvio padrão do número de visitas para cada um
dos domínios. Qual é o website mais popular? Justique.
(d) O funcionário da SI fez uma investigação e descobriu que a página www.ime.usp.br/∼diegog
não existia em 2013. Exclua a Observação 1 e refaça o item (c).
10. Um pesquisador desenvolveu um teste para avaliar a capacidade de crianças com idade
entre 7 e 12 em realizar certa tarefa. Quinze crianças foram submetidas ao teste, e o
tempo para realização foi anotado. Os resultados estão na Tabela 2.5:
(a) Calcule o tempo médio de realização do teste para o conjunto de 15 crianças.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 18
Tabela 2.4: Visitantes dos sítios.
Observação Domínio Ano Visitas
1 www.ime.usp.br/∼diegog 2013 0
2 www.ime.usp.br/∼diegog 2014 32
3 www.ime.usp.br/∼diegog 2015 28
4 www.ime.usp.br/∼diegog 2016 47
5 www.ime.usp.br/∼diegog 2017 42
6 www.ime.usp.br/∼manuelg 2013 39
7 www.ime.usp.br/∼manuelg 2014 32
8 www.ime.usp.br/∼manuelg 2015 39
9 www.ime.usp.br/∼manuelg 2016 35
10 www.ime.usp.br/∼manuelg 2017 35
11 www.ime.usp.br/∼montoril 2013 11
12 www.ime.usp.br/∼montoril 2014 12
13 www.ime.usp.br/∼montoril 2015 10
14 www.ime.usp.br/∼montoril 2016 7
15 www.ime.usp.br/∼montoril 2017 17
16 www.ime.usp.br/∼rfarias 2013 42
17 www.ime.usp.br/∼rfarias 2014 33
18 www.ime.usp.br/∼rfarias 2015 41
19 www.ime.usp.br/∼rfarias 2016 31
20 www.ime.usp.br/∼rfarias 2017 33
Tabela 2.5: Tempo de realização das tarefas.
Criança 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Tempo (min) 11 4 7 17 8 16 23 10 8 6 24 8 9 5 11
(b) O pesquisador decide que as crianças cujo tempo de realização do teste for superior
à média mais 1,5 vezes o desvio padrão serão submetidas a procedimentos didáticos
especiais. Alguma criança precisará receber o programa especial? Comente.
(c) Qual é o intervalo inter-quartil para esse conjunto de dados?
11. Um empresa de seguros exige dos seus clientes as seguintes informações: Cargo na úl-
tima empresa em que trabalhou; Escolaridade; Estado Civil; Idade; IMC; Número de
lhos; Signo; Tempo de habilitação. Classique as variáveis solicitadas em: Quantitativa
contínua; Quantitativa discreta; Qualitativa ordinal; Qualitativa nominal.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 19
12. Na Tabela 2.6, apresentamos a distribuição de frequências (incompleta) dos salários se-
manais (em R$) de n funcionários amostrados de uma certa empresa.
Tabela 2.6: Salários em reais.
Xi fi faci fri100 197 0,513200 91300 349400 20500 10 379600 383700 383800
(a) Qual é a variável de interesse? Classique-a.
(b) Complete a tabela. Qual foi tamanho da amostra?
(c) Calcule a média, a mediana e a moda.
(d) Calcule a variância, o desvio padrão e o coeciente de variação.
13. Estudando-se o consumo diário de leite (C) em uma certa região, vericou-se que 20%
das famílias consomem até 1 litro (C < 1), 50% das famílias consomem entre 1 e 2 litros
(1 ≤ C < 2), 20% das famílias consomem entre 2 e 3 litros (2 ≤ C < 3) e o restante entre
3 e 4 litros (3 ≤ C < 4).
(a) Qual a variável em estudo? Classique-a.
(b) Escreva as informações em forma de tabela de frequências.
(c) Calcule a mediana.
(d) Qual o valor do 1o quartil?
14. Um pesquisador da rádio 103,9 Tempo FM aborda 30 transeuntes ao acaso e pergunta-
lhes as idades, obtendo as seguintes respostas:
(a) Qual é a variável que está sendo estudada? Classique-a
(b) Resuma as informações obtidas na forma de uma distribuição de frequências (log3010 =
1, 48).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
2.5. EXERCÍCIOS 20
Tabela 2.7: Idades dos entrevistados.
35; 26; 39; 25; 39; 22;
42; 40; 39; 22; 21; 40;
16; 32; 39; 21; 28; 39;
18; 37; 23; 14; 27; 44;
30; 32; 21; 15; 26; 43.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 3
Métodos grácos
3.1 Motivação
O Estado de Minas Gerais é uma das 27 unidades federativas do Brasil, sendo o quarto
estado com a maior área territorial e localizado na Região Sudeste do país. Limita-se ao sul e
sudoeste com São Paulo, a oeste com o Mato Grosso do Sul, a noroeste com Goiás e Distrito
Federal, a norte e nordeste com a Bahia, a leste com o Espírito Santo e a sudeste com o Rio de
Janeiro. Toda essa descrição poderia ter melhor compreendida ou mesmo ser resumida com a
Figura 3.1.
Figura 3.1: Localização de Minas Gerais no Brasil (Créditos: Wikipédia).
21
ufjf.br/tiago_magalh
aes
3.2. GRÁFICOS PARA UMA VARIÁVEL 22
De maneira simples, um gráco tem dois objetivos:
1. Resumir um conjunto de dados de forma mais agradável;
2. Auxiliar ou ser uma alternativa na transmissão de uma informação.
Observação: Os grácos que serão apresentados neste capítulo foram construídos com o pacote
ggplot2 (Wickham 2009) do software estatístico R (R Core Team 2017).
3.2 Grácos para uma variável
Os grácos desta seção são indicados para as situações em que há apenas uma variável de
interesse no conjunto de dados.
3.2.1 Grácos para variáveis qualitativas
Uma variável é considerada qualitativa quando ela é uma característica ou um atributo.
Gráco de barras. Para cada categoria possível da variável qualitativa de interesse, é dese-
nhado um retângulo na vertical (horizontal) e a altura (comprimento) de retângulo é proporci-
onal a frequência absoluta ou relativa da categoria.
Gráco de setores. Um círculo é dividido em tantos setores quantas forem as categorias da
variável qualitativa de interesse. A área de cada setor é proporcional à frequência relativa da
categoria:
100% (Total) 360o
% da categoria Xo
Este gráco é interessante quando estamos interessados em comparar a proporção de cada
categoria com o valor total. É uma alternativa ao gráco de barras utilizando a frequência
relativa.
Gráco de waes. Também é conhecido como gráco de setores quadrado. Dentro um
quadrado, pequenos quadradinhos são pintados proporcionalmente ao número de observações
dentro cada categoria da variável de interesse.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.2. GRÁFICOS PARA UMA VARIÁVEL 23
0
10
20
30
Centro−Oeste Nordeste Norte Sudeste SulRegião
Par
ticip
ante
s
(a) Frequência absoluta.
0
25
50
75
100
Centro−Oeste Nordeste Norte Sudeste SulRegião
Par
ticip
ante
s (%
)(b) Frequência relativa.
Figura 3.2: Grácos de barras para a região de origem.
Exemplo. Em um congresso de Estatística em São Tomé das Letras (MG), foram sorteados
100 participantes e lhes foi perguntado a região de origem. O resultado desta pesquisa está
apresentado na Tabela 3.1. As Figuras 3.2 e 3.3 apresentam os grácos de barras e setores para
este conjunto de dados. Por estas guras, percebemos uma grande participação de sudestinos,
seguidos pelo dos nordestinos.
Tabela 3.1: Participantes por região.
Região Centro-Oeste Nordeste Norte Sudeste Sul
Participantes 7 33 20 37 3
3.2.2 Grácos para variáveis quantitativas
Uma variável é considerada quantitativa quando ela é o resultado de uma contagem ou uma
mensuração.
Histograma. É a representação gráca de uma distribuição de frequências. Desenhamos
um retângulo para cada intervalo de classe, com base igual a amplitude da classe e altura
proporcional a frequência da classe.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.2. GRÁFICOS PARA UMA VARIÁVEL 24
25
50
75
0/100
Regiao Centro−Oeste Nordeste Norte Sudeste Sul
(a) Gráco de setores.
Centro−Oeste Nordeste Norte Sudeste Sul
(b) Gráco de waes.
Figura 3.3: Grácos para a região de origem.
Boxplot. É a representação gráca dos dados através de um retângulo, construído com os
quartis dados. O boxplot fornece informações como assimetria e a existência de valores atípicos.
Exemplo. 30 alunos do curso de Estatística do IME-USP são sorteados e verica-se a altura,
com a distribuição de frequência e as medias de posição apresentadas nas Tabelas 3.2 e 3.3,
respectivamente. A Figura 3.4a apresenta o histograma das alturas dos alunos, enquanto, a
Figura 3.4b apresenta o boxplot das alturas. De maneira geral, pela Figura 3.4, podemos ver
que a distribuição das alturas é assimétrica à direita, isto é, existe uma concentração de alunos
com alturas menores que a média 183,8 cm.
Tabela 3.2: Altura (cm) dos alunos do IME-USP
I.C. Freq. obs.
176 ` 178 1
178 ` 180 4
180 ` 182 6
182 ` 184 6
184 ` 186 6
186 ` 188 1
188 ` 190 3
190 ` 192 3
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 25
Tabela 3.3: Estatísticas descritivas para altura (cm) dos alunos do IME-USP
Min Q1 Md X Q3 Max
177,1 180,6 183,4 183,8 185,3 191,0
0
2
4
6
180 185 190Altura (cm)
Fre
quên
cia
(a) Histograma.
Max(Min, Q1 − 1.5IIQ) Min(Max, Q1 + 1.5IIQ)
MdQ1 Q3
180 184 188Altura (cm)
(b) Boxplot.
Figura 3.4: Grácos para as alturas (cm) dos alunos.
3.3 Grácos para duas ou mais variáveis
Na prática, um conjunto de dados tem mais do que uma variável de interesse. Nesta seção,
apresentaremos grácos que combinam duas ou mais varáveis de interesse em uma mesma
gura.
3.3.1 Grácos para duas variáveis quantitativas
Gráco de dispersão. Para uma mesma unidade amostral, o par de variáveis quantitativas
é plotado em um plano cartesiano. Pode ser usado com a nalidade de vericar uma possível
relação entre essas duas variáveis.
Gráco de série temporal. Semelhante ao gráco de dispersão, a diferença é que uma das
variáveis é o tempo e os pontos costumam estar conectados para ajudar na identicação de
uma tendência temporal.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 26
Exemplo. Em um conjunto de dados de 1920, foi vericado a velocidade (milhas por hora) de
carros no momento da freagem e a distância (em pés) percorrida entre o momento da freagem
até a parada total (Ezekiel 1930). A Figura 3.5 apresentam o diagrama de dispersão para estes
dados. Por esta gura, parece haver uma relação entre a velocidade e a distância percorrida
até parar, no caso, quanto maior a velocidade, maior é a distância percorrida entre o momento
da freagem e a parada total.
Exemplo. Conjunto de dados com a série de chuvas (mm) na cidade de Fortaleza (CE) entre
os anos de 1849 e 1997 (Morettin e Toloi 2004). A Figura 3.6a apresenta gracamente os indíce
ao longo desses anos.
Exemplo. O preço diário das ações da Petrobrás (Petróleo Brasileiro S.A., PETR4) e do Itaú
Unibanco (ITUB4) entre os dias 19 de março de 2019 a 17 de março de 2020. Por se tratarem de
séries avaliada na mesma escala, elas podem ser plotada em um mesmo gráco, como mostra a
Figura 3.6b. A gura mostra que as ações tiveram uma forte queda nos últimos dias observados,
além disso, ITUB4 se manteve mais valorizado em relação à PETR4.
0
25
50
75
100
125
5 10 15 20 25Velocidade (mph)
Dis
tânc
ia (
pés)
Figura 3.5: Gráco de dispersão da velocidade (mph) de um carro e a distância (pés) até parar.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 27
1000
2000
1850 1900 1950 2000Ano
Chu
va (
mm
)
(a) Chuva em Fortaleza.
10
20
30
2019−03−19 2019−07−17Ano
Pre
ço (
R$)
ITUB4
PETR4
(b) Preço das ações ITUB4 e PETR4.
Figura 3.6: Grácos de séries temporais.
3.3.2 Grácos para variáveis qualitativas e quantitativas
De maneira simples, se o conjunto de dados tiver mais do que uma variável de interesse e uma
dela sendo uma variável qualitativa, o procedimento é separar o banco de dados por categoria
da variável qualitativa e aplicar os grácos vistos anteriormente, de forma apropriada.
Gráco de barras e histograma. Para cada categoria da variável qualitativa, é construído
um gráco de barras se a segunda variável for qualitativa ou um histograma se for quantitativa.
Dotplot. Uma alternativa ao gráco de barras, em que as caixas são substituídas por pontos.
Exemplo. Os dados da Tabela 3.4 são referentes a taxa de mortes por 1000 habitantes na
Virginia em 1940 (Molyneaux et al. 1947), divididos pelo sexo e a região habitada. Pelas Figuras
3.7 e 3.8, podemos ver que houve uma taxa de mortalidade na faixa etária dos 70 a 74 e que,
de maneira, geral o sexo masculino tem uma taxa de mortalidade maior em comparação com o
sexo feminino.
Boxplot e dotplot. Para cada categoria da variável qualitativa, é construído um boxplot se
o interesse for apresentar as medidas de posição ou um dotplot se for o número de observações.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.4. CONSIDERAÇÕES FINAIS 28
Tabela 3.4: Taxa de mortes por 1000 habitantes na Virginia em 1940.
Taxa de mortes
I.C. Masc. rural Fem. rural Masc. urbano Fem. urbano
50-54 11,7 8,7 15,4 8,4
55-59 18,1 11,7 24,3 13,6
60-64 26,9 20,3 37,0 19,3
65-69 41,0 30,9 54,6 35,1
70-74 66,0 54,3 71,1 50,0
0
50
100
150
200
Rural Male Rural Female Urban Male Urban FemaleRegião
Taxa
de
mor
talid
ade
IC 50−54 55−59 60−64 65−69 70−74
(a) Gráco de barras.
0
20
40
60
Rural Male Rural Female Urban Male Urban FemaleRegião
Taxa
de
mor
talid
ade
IC 50−54 55−59 60−64 65−69 70−74
(b) Histograma.
Figura 3.7: Taxa de mortalidade, Virginia, 1940.
Exemplo. A Tabela 3.5 mostra o resultado de um teste com 6 inseticidas, em que eles fo-
ram avaliados pela quantidade de insetos exterminados, cada inseticida foi testado 12 vezes
(Beall 1942). Pela Figura 3.9, o inseticida F foi o que apresentou o maior número de insetos
exterminados, porém apresentou também uma maior variabilidade.
3.4 Considerações nais
Um gráco:
1. é uma forma alternativa de apresentação das informações;
2. deve ser utilizado de acordo com a variável de interesse;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.5. EXERCÍCIOS 29
20
40
60
Rural Male Rural Female Urban Male Urban FemaleRegião
Taxa
de
mor
talid
ade
IC 50−54 55−59 60−64 65−69 70−74
Figura 3.8: Dotplot da taxa de mortalidade na Virgina em 1940.
Tabela 3.5: Quantidade de insetos exterminados.
No de insetos exterminados
Inseticida 1 2 3 4 5 6 7 8 9 10 11 12
A 10 7 20 14 14 12 10 23 17 20 14 13
B 11 17 21 11 16 14 17 27 19 21 7 13
C 0 1 7 2 3 1 2 1 3 0 1 4
D 3 5 12 6 4 3 5 5 5 5 2 4
E 3 5 3 5 3 6 1 1 3 2 6 4
F 11 9 15 22 15 16 13 10 26 26 24 13
3. deve ser o mais claro possível;
4. deve respeitar as escalas;
5. deve ter as unidades de medidas apresentadas.
3.5 Exercícios
1. Construir os grácos pertinentes aos dados da Tabela 2.2.
2. Construir grácos:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
3.5. EXERCÍCIOS 30
0
10
20
A B C D E FInseticida
Inse
tos
mor
tos
(a) Boxplot.
0
10
20
A B C D E FInseticida
Inse
tos
mor
tos
(b) Dotplot.
Figura 3.9: Número de insetos exterminados por inseticida.
(a) para os dados da Tabela 2.3;
(b) Levando em considerações os itens (c) e (d).
3. Construir os grácos pertinentes aos dados da Tabela 2.4.
4. Construir os grácos aplicáveis aos dados da Tabel 2.5.
5. Para os dados da Tabela 2.7
(a) contruir o boxplot das idades;
(b) Levando em consideração o item (b), fazer o histograma.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 4
Introdução à probabilidade
Probabilidade é a quanticação de um incerteza. Neste capítulo, apresentamos formas
de calcular as probabilidades a partir do conhecimento do mecanismo gerador, chamado de
experimento.
4.1 Experimento
Um experimento é um teste ou um conjunto de testes com a nalidade de vericar uma
hipótese. Eles podem ser divididos em:
• Determinístico: Conhecemos o resultado atencipadamente, isto é, a priori.
• Probabilístico: Conhecemos o resultado somente após a realização, isto é, a posteriori.
Exemplos.
1. Lançamento de uma moeda duas vezes;
2. Intenções de votos para um determinado candidato;
3. Tempo de vida de uma nova lâmpada;
4. Satisfação dos cliente de um determinado produto.
Espaço amostral (Ω). São todos os resultados possíveis de um experimento probabilístico.
31
ufjf.br/tiago_magalh
aes
4.1. EXPERIMENTO 32
Exemplos. Os respectivos espaços amostrais dos exemplos anteriores são:
1. Ω = (cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa);
2. Ω = [0, 100];
3. Ω = (0,∞);
4. Ω = Insatisfeito, pouco satisfeito, satisfeito, muito satisfeito.
Evento (E). É um subconjunto do espaço amostral.
Exemplos. Para os exemplos anteriores, temos os possíveis eventos:
1. E: mais caras do que coroas;
2. E: o candidato a presidente ganhar no primeiro turno;
3. E: tempo de vida maior que 34 anos;
4. E: 80% dos entrevistados se declararem, no mínimo, satisfeitos.
Eventos mutuamente exclusivos. Dois eventos A e B são ditos mutuamente exclusivos
quando a interseção entre eles é igual ao conjunto vazio (A ∩B = ∅).
Exemplos.
1. Em um lançamento de um dado, sejam P : a face é par e I: a face é ímpar. Note que:
P ∩ I = ∅.
2. Em uma seleção de pessoas, sejam J : a pessoa selecionada ter nascido em Juiz de Fora e
U : a pessoa selecionada ter nascido em Uberlândia. Note que: J ∩ U = ∅.
Eventos especiais. Existem dois eventos que se destacam entres todos os eventos possíveis
de um experimento, são eles
• O evento impossível: ∅.
• O evento certo: Ω.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.2. PROBABILIDADE 33
Exemplo. Em um lançamento de um dado convencional, sejam:
• E1: a face ser um número par e ímpar. E1 = ∅.
• E2: a face é um número entre 1 e 6. E2 = 1, 2, 3, 4, 5, 6 = Ω.
Conjunto das partes. Seja um conjunto A, o conjunto das partes, P(A), é o conjunto com
todos os possíveis subconjuntos de A.
Exemplo. Se A = 1, 3, 5, então
P(A) = ∅, 1, 3, 5, 1, 3, 1, 5, 3, 5, 1, 3, 5 = Ω.
4.2 Probabilidade
A Probabilidade é uma quanticação da incerteza. É um peso dado para cada resultado
de um experimento. A probabilidade foi construída a partir de três denições, chamadas de
Axiomas da Probabildade, são elas
1. 0 ≤ P(E) ≤ 1;
2. P(Ω) = 1;
3. Dados dois eventos A e B mutuamente exclusivos, então:
P(A ∪B) = P(A) + P(B).
A partir dos Axiomas da Probabildade, quatro propriedades ou teoremas podem ser obser-
vados e demonstrados:
1. Se ∅ é o conjunto vazio, então P(∅) = 0;
2. Se Ac é o complemento do evento A, então P(Ac) = 1− P(A);
3. Se A ⊂ B, então P(A) ≤ P(B);
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.3. PROBABILIDADE CONDICIONAL 34
4. Sejam A e B dois eventos quaisquer, então
P(A ∪B) = P(A) + P(B)− P(A ∩B).
4.2.1 Probabilidade em espaços amostrais equiprováveis
Um espaço amostral é equiprovável se todos os seus elementos têm a mesma probalidade de
ocorrer. Neste tipo de espaço amostral, o cálculo de uma probabilidade é bem simples. Seja
um evento E associado a um espaço amostral Ω, podemos calcular a probabilidade do evento
E ocorrer da seguinte maneira
P(E) =número de casos favoráveis à E
número de casos possíveis=n(E)
n(Ω).
4.3 Probabilidade condicional
Sejam A e B dois eventos de um mesmo espaço amostral, a probabilidade da ocorrência de
um deles sabendo-se que o outro ocorreu é denida como
P(A|B) =P(A ∩B)
P(B), (4.1)
note que P(B) 6= 0, pois B já ocorreu. Se o espaço amostral for equiprovável, temos que:
P(A ∩B) =n(A ∩B)
n(Ω)e P(B) =
n(B)
n(Ω).
Logo,
P(A|B) =n(A ∩B)
n(B).
Teorema da multiplicação. A ocorrência simultânea de dois eventos A e B do mesmo
espaço amostral é igual ao produto da probabilidade de um deles pela probabilidade condicional
do outro, isto é, na equação (4.1), passamos o denominador da fração no lado direito para o
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.4. TEOREMA DE BAYES 35
lado esquerdo multiplicando, temos que:
P(A ∩B) = P(B)P(A|B). (4.2)
4.4 Teorema de Bayes
Sejam A1, A2, . . . , An, eventos mutuamente exclusivos, tais que
A1 ∪ A2 ∪ · · · ∪ An = Ω,
como mostra a Figura 4.1a, com todas as probabilidades P(Ai), i = 1, . . . , n, conhecidas. E
seja B um evento qualquer de Ω, tal que todas as probabilidades condicionais P(B|Ai) são
conhecidas.
A1 A2 A3
A4 A5 A6
A7 A8 A9
(a) Mutuamente exclusivos.
A1 A2 A3
A4 A5 A6
A7 A8 A9
B
(b) M.E. mas com um evento em comum.
Figura 4.1: Representação de Ω.
Note que
B = (A1 ∩B) ∪ (A2 ∩B) ∪ · · · ∪ (An ∩B),
com (Ai ∩ B) e (Aj ∩ B) mutuamente exclusivos, para i 6= j, como descreve a Figura 4.1b.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.4. TEOREMA DE BAYES 36
Dessa forma, podemos escrever a probabilidade do evento B como
P(B) = P(A1 ∩B) + P(A2 ∩B) + · · ·+ P(An ∩B) (4.3)
= P(A1)P(B|A1) + P(A2)P(B|A2) + · · ·+ P(An)P(B|An),
a equação (4.3) é denominada de Teorema da probabilidade total.
Então, por (4.1) e (4.3), temos, para todo evento Ai, que
P(Ai|B) =P(Ai ∩B)
P(B)=P(Ai)P(B|Ai)
P(B)(4.4)
=P(Ai)P(B|Ai)
P(A1)P(B|A1) + P(A2)P(B|A2) + · · ·+ P(An)P(B|An),
esta probabilidade condicional P(Ai|B), em (4.4), é conhecida como Regra ou Teorema de
Bayes.
Exemplo (o Paradoxo de Monty Hall). Em seu programa de televisão, o apresentador
Monty Hall apresentava três portas aos concorrentes. Atrás de uma delas estava um um carro,
enquanto nas outras duas, um bode cada. O jogo se desenvolvia em três etapas:
1a etapa, o concorrente escolhia uma das três portas;
2a etapa, Monty Hall abria uma das outras duas portas que o concorrente não havia esco-
lhido e que continha um dos bodes;
3a etapa, o apresentador perguntava aos concorrentes se eles permaneceriam com a porta
que escolhida no início do jogo ou se eles pretendiam mudar para a outra porta que ainda
estava fechada.
Após a decisão dos participantes, cumprindo-se as 3 etapas, a porta escolhida era então aberta.
Sabendo que o carro está atrás de uma das duas portas restantes, qual deveria ser a decisão ser
tomada pelo concorrente, car com a porta escolhida inicialmente ou mudar de porta? Qual
dos itens abaixo representa a probabilidade dos concorrentes ganharem o carro?
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.4. TEOREMA DE BAYES 37
(a) 1/3. (b) 1/2. (c) 2/3.
Se o jogo não precisasse das 2a e 3a etapas, é fácil observar que a probabilidade de ganhar o
carro seria 1/3, mas não é isso que acontece. Por simplicidade, admita que, em um determinado
jogo, o partcipante escolheu a Porta 1, o apresentador abriu a Porta 3 e os eventos
• S: o participante ganhar o carro trocando a porta escolhida, i.e., escolher a Porta 2, na
3a etapa;
• Sc: o participante ganhar o carro mantendo a porta escolhida, i.e., manter a Porta 1, na
3a etapa;
• P : o apresentador abrir a Porta 3 na 2a etapa.
Então, pelas probabilidades dadas na Tabela 4.1, pelo Teorema de Bayes, podemos vericar
que
P(S|P ) =P(S ∩ P )
P(P )=
P(P |S)P(S)
P(P |S)P(S) + P(P |Sc)P(Sc)
=1× (1/3)
1× (1/3) + (1/2)× (1/3)=
(1/3)
(1/3) + (1/6)=
(1/3)
(3/6)=
2
3.
Logo, se o participante trocar de porta, suas chances de vitória dobram em relação ao início
do jogo. Se o concorrente optar pela manutenção da porta, suas chances se mantém. A Figura
4.2, apresenta a solução desse problema através de uma árvore de possibilidades. Por m, é
importante ressaltar que, a suposição inicial do participante escolhendo a Porta 1 e localização
do carro e dos bodes não interferem no valor 2/3. Esta solução foi apresentada em duas cartas,
Selvin (1975b) e Selvin (1975a).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.4. TEOREMA DE BAYES 38
Tabela 4.1: Todos os possíveis resultados, escolhendo inicialmente a Porta 1.
Localização Porta Probabilidade Decisão
do carro aberta Total Ficar Trocar
Porta 21/6 Carro Bode
Porta 1 (1/2)
(1/3) Porta 31/6 Carro Bode
(1/2)
Porta 2 Porta 31/3 Bode Carro
(1/3) (1)
Porta 3 Porta 21/3 Bode Carro
(1/3) (1)
Etapa 1
Carro Bode Bode
Manter Trocar Manter Trocar Manter Trocar
Carro Bode BodeBode Carro Carro
Figura 4.2: Árvore de possibilidades para o Paradoxo de Monty Hall.
4.4.1 Sensibilidade e especicidade
Seja um exame A, a Sensibilidade e a Especicidade são medidas que avaliam a capacidade
de discriminação do exame A. A Sensibilidade é a proporção de pacientes doentes que apresen-
tam resultado positivo no exame A. E a Especicidade é a proporção de pacientes sadios que
apresentam resultado negativo no exame A. A sensibilidade e a especicidade do exame A são
determinadas usando como referência um Padrão-Ouro.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.4. TEOREMA DE BAYES 39
Tabela 4.2: Distribuição dos pacientes.
Resultado Doente pelo Padrão-OuroTotal
do exame A Sim Não
Positivo Positivo verdadeiro Falso positivo Positivos
Negativo Falso negativo Negativo verdadeiro Negativos
Total Doentes Não doentes Total de examinados
Então, temos que
Sensibilidade =Positivos verdadeiros
Doentese Especicidade =
Negativos verdadeirosNão doentes
.
Exemplo. Apenas uma em cada dez pessoas de uma população tem tuberculose. Das pessoas
que tem tuberculose, 80% reagem positivamente ao teste Y , enquanto apenas 30% das que não
tem tuberculose reagem positivamente. Uma pessoa da população é selecionada ao acaso e
o teste Y é aplicado. Qual a probabilidade de que essa pessoa tenha tuberculose, se reagiu
positivamente ao teste?
Solução. Sejam os eventos:
• T : Uma pessoa ter tuberculose;
• T c: Uma pessoa não ter tuberculose;
• P : o Teste Y dar positivo para tuberculose.
Pelo enunciado, temos que: P(T ) = 0, 1, P(T c) = 0, 9, P(Y |T ) = 0, 8 e P(Y |T c) = 0, 3. Então
P(T |Y ) =P(T ∩ Y )
P(Y )=
P(T ∩ Y )
P(Y ∩ T ) + P(Y ∩ T c)=
P(Y |T )× P(T )
P(Y |T )× P(T ) + P(Y |T c)× P(T c)
=0, 8× 0, 1
0, 8× 0, 1 + 0, 3× 0, 9=
0, 08
0, 08 + 0, 27=
8
35.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.5. INDEPENDÊNCIA 40
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00Probabilidade de verdadeiro positivo
Sen
sibi
lidad
e
(a) Verdadeiro positivo.
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00Probabilidade de falso positivo
Sen
sibi
lidad
e(b) Falso positivo.
Figura 4.3: Sensibilidade do exame do Exemplo.
4.5 Independência
Dois eventos A e B são ditos independentes quando a probabilidade da interseção entre eles
é igual ao produto de suas respectivas probabilidades, isto é, (4.2) pode ser escrito como
P(A ∩B) = P(A)× P(B),
a ocorrência de um evento não altera a probabilidade de ocorrência de um outro evento. De
(4.1):
P(A|B) =P(A ∩B)
P(B)=P(A)× P(B)
P(B)= P(A).
4.6 Exercícios
1. Demonstre os quatro teoremas da Probabilidade.
2. Em um lançamento de um dado convencional, sejam os seguintes eventos: E1: face par;
E2: face que não seja 1 ou 4 e E3: face maior ou igual a 3. Calcule:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 41
(a) P(E1); (b) P(E1 ∩ E2); (c) P(Ec3).
3. Se P(A) = 1/2, P(B) = 1/3 e P(A ∩B) = 1/4. Determine:
(a) P(A ∪B)
(b) P(Ac ∪Bc)
(c) P(Ac ∩B)
(d) P(Ac ∪B)
4. Seja ε: Lançamento de dois dados, e sejam A = (x, y); x+ y = 8; B = (x, y); x = y;
C = (x, y); x+ y = 10; D = (x, y); x > y e E = (x, y); x = 2y. Determine
(a) P(A)
(b) P(B)
(c) P(C)
(d) P(D)
(e) P(A|B)
(f) P(C|D)
(g) P(D|E)
(h) P(A|C)
(i) P(C|E)
(j) P(C|A)
(k) P(A|D)
(l) P(B|C)
(m) P(A|E)
(n) P(B|E)
(o) P[A|(B ∩ C)]
(p) P[(A ∩B)|(C ∩D)]
5. Três cavalos A, B e C estão em uma corrida. A tem 2 vezes mais probabilidade de ganhar
que B e B tem 2 vezes mais probabilidade de ganhar que C. Assumindo que empates são
impossíveis, quais são as probabilidades de vitórias de cada um dos cavalos?
6. Considere um lote com 20 peças das quais 6 contém defeitos. Retiramos 2 peças uma
após a outra, sem reposição. Qual a probabilidade das duas peças serem perfeitas?
7. Uma urna contém X bolas brancas e V bolas vermelhas, uma segunda urna contém Z
bolas brancas e Y bolas vermelhas. Sem se vericar a cor, uma bola é escolhida ao acaso
da urna 1 e posta na urna 2. Em seguida, uma bola é escolhida ao acaso da urna 2. Qual
a probabilidade que esta bola seja branca?
8. A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido 3/5.
Calcular a probabilidade de:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 42
(a) Apenas o homem estar vivo; (b) Pelo menos um estar vivo.
9. A probabilidade de fechamento de cada relé no circuito fechado é dada por θ, θ é um valor
entre 0 e 1. Se todos os relés funcionam de forma independente, qual será a probabilidade
que haja corrente entre os terminais?
2
1
4
3
10. Em novembro de 1994, a Intel anunciou que uma falha sutil em seu chip Pentium poderia
afetar 1 em 9 problemas de divisão. Suponha que um computador realize 20 divisões no
decorrer da execução de um programa e que os erros sejam independentes. Responda:
(a) Qual é a probabilidade de nenhum erro ocorrer?
(b) Qual é a probabilidade de ocorrer pelo menos um erro?
11. Na turma de Estatística Avançada II existem apenas dois alunos matriculados: Leandro
e Márcio. Em um determinado dia, o professor da disciplina propõe um exercício que
Leandro tem probabilidade 7/9 de resolver e Márcio 5/7, independentemente um do outro.
Calcule a probabilidade de:
(a) apenas Márcio conseguir resolver o exercício;
(b) os dois alunos conseguirem resolver o exercício;
(c) o exercício ser resolvido;
(d) que dois alunos não consigam resolver o exercício.
12. Numa cidade do interior do país existem três companhias de telefonia celular: A, B e
C. Constatou-se que entre 1500 famílias, 1100 têm telefone celular, sendo que 470 só
têm celular da companhia A; 230 só têm celular da companhia B; 140 só têm celular da
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 43
companhia C; 57 só têm celulares das companhias A e B; 73 só têm celulares das companhias
A e C; 85 só têm celulares das companhias B e C e 45 têm celulares das três companhias.
(a) Qual é a probabilidade de que uma família escolhida ao acaso tenha pelo menos dois
celulares?
(b) Qual é a probabilidade de que uma família escolhida ao acaso tenha exatamente dois
celulares?
13. Um terço dos executivos que se aposentam retornam ao trabalho após 1,5 anos de aposen-
tadoria. De acordo com a Russel Reynolds Association, a distribuição de probabilidades
para a razão para o retorno está na apresentada na Tabela 4.3 e para o caminho utilizado
na Tabela 4.4.
Tabela 4.3: Motivos para voltar a trabalhar.
Razão para Satisfação com Evitar Contribuir com
o retorno o trabalho o tédio a sociedade
Probabilidade 0,53 0,29 0,18
Tabela 4.4: Cargo na nova atividade.
Caminho NovaAutônomo Consultor
Iniciou umaa
utilizado companhia nova rma
Probabilidade 0,38 0,32 0,23 0,07
Assumindo que razões para o retorno e caminho utilizado sejam independentes:
(a) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,
volte para evitar o tédio e o faça como consultor?
(b) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,
volte para evitar o tédio ou volte como consultor?
(c) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,
volte para evitar o tédio dado que o faça como consultor?
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 44
14. Dados estatísticos mostram que, em uma determinada área de concurso, 75% dos candi-
datos aprovados estudam muito e 90% dos que estudam muito são aprovados. Sabe-se
ainda que, 3% dos candidatos inscritos são aprovados.
(a) Qual a probabilidade de que um candidato inscrito estude muito para o concurso?
(b) Qual a probabilidade de um candidato ser aprovado no concurso dado que não estu-
dou muito?
(c) Qual a probabilidade de um candidato estudar muito dado que não foi aprovado no
concurso?
15. A empresa M & B tem 15.800 empregados classicados quanto ao setor onde trabalha,
idade e sexo, de acordo com a Tabela 4.5:
Tabela 4.5: Atributos dos funcionários.
Setor SexoIdade
< 25 anos 25 a 40 anos > 40 anos
AdministrativoMasculino 1100 2300 2000
Feminino 900 2200 1800
TécnicoMasculino 600 1400 1400
Feminino 200 1100 800
Determine a probabilidade de escolhermos, ao acaso,
(a) Um empregado com 40 anos de idade ou menos;
(b) Um empregado do sexo feminino com pelo menos 25 anos;
(c) Dentre os funcionários do setor técnico, um que tenha 40 anos de idade ou menos;
(d) Um empregado do setor administrativo, sabendo-se que é do sexo masculino.
16. No Brasil, a probabilidade de que um indivíduo, aleatoriamente sorteado, goste de fu-
tebol é 1/4, enquanto que a probabilidade dele gostar de novela é 1/2. Determine a
probabilidade de que goste de futebol e não de novela, nos seguintes casos:
(a) Se gostar de futebol e novela são eventos disjuntos;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 45
(b) Se gostar de futebol e novela são eventos independentes;
(c) Se todos que gostam de futebol gostam de novela;
(d) Se a probabilidade de gostar de futebol e de novela é 1/16;
(e) Se dentre os que não gostam de novela, a probabilidade de não gostar de futebol é
1/4.
17. Em uma pesquisa feita pelo Instituto de Pesquisa do Norte (IPEN), em 2012, vericou-se
que em Manaus-AM, 10,7% dos homens e 7,4% das mulheres torcem para o Palmeiras.
Sabe-se que em 2012, 51,2% dos manauaras eram do sexo feminino.
(a) Qual a probabilidade de um habitante de Manaus selecionado ao acaso ser palmei-
rense?
(b) Se um habitante de Manaus, selecionado ao acaso, arma que é palmeirense, qual a
probabilidade do manauara ser do sexo feminino?
18. Numa pesquisa sobre os hábitos de fumar de uma população, constatou-se que 75% dos
homens entrevistados fumam, 47% das mulheres fumam e 60% dos entrevistados eram ho-
mens. Para uma pessoa aleatoriamente sorteada dessa população, calcule a probabilidade
de:
(a) Fumar;
(b) Não fumar, sabendo-se que é homem;
(c) Ser uma mulher, sabendo-se que não fuma.
19. Em um certo colégio, 4% dos alunos e 1% das alunas tem mais que 160cm de altura.
Além disso, 60% dos estudantes são do sexo feminino. Se um estudante é selecionado
aleatoriamente e tem mais de 160cm, qual a probabilidade deste estudante ser do sexo
feminino?
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
4.6. EXERCÍCIOS 46
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 5
Variável aleatória
5.1 Variável aleatória
Sejam um experimento ε e Ω o seu respectivo espaço amostral, isto é, todos valores possíveis
de ε. Denimos como variável aleatória (VA) qualquer função que associe cada elemento de Ω
a um número real.
Exemplos.
1. Sejam ε: o lançamento de duas moedas honestas, e X a variável aleatória que conta o
número de faces caras voltadas para cima após o lançamento. Denindo c para face
cara e c para face coroa, temos que
Ω = (cc), (cc), (cc), (cc)
↓ X
X = 0, 1, 2 (⊂ R)
2. Sejam ε: o lançamento de um dado honesto, e Y a variável aleatória que eleva ao quadrado
e subtrai 7 o valor da face voltada para cima. Como mostra a Tabela 5.1, todos os valores
possíveis do experimentos são as faces 1 a 6 e todos os valores possíveis de Y são os valores
-6, -3, 2, 9, 18, 29.
47
ufjf.br/tiago_magalh
aes
5.1. VARIÁVEL ALEATÓRIA 48
Tabela 5.1: Conjuntos Ω e Y associados ao experimento ε e a VA Y , respectivamente.
Ω
Y -6 -3 2 9 18 29
Suporte. É o conjunto com todos os valores possíveis de uma variável aleatória. A notação
costuma ser uma versão estilizada da letra (maiúscula) que representa a VA. Por exemplo, X
é o suporte da VA X.
Exemplos (continuação). Para os experimentos e VA descritos anteriormente, temos que
1. Todos os valores possíveis para X são X = 0, 1, 2;
2. Todos os valores possíveis para Y são Y = −6,−3, 2, 9, 18, 29.
5.1.1 Variável aleatória discreta
Uma VA é discreta (VAD) se todos os seus possíveis valores são contáveis, enumeráveis.
Exemplos.
1. X: O número de eleitores do partido dos Democratas na cidade de Smallville. X =
0, 1, . . . ,M, em que M é o número de eleitores em Smallville.
2. Y : A quantidade de pacotes do álbum da copa do mundo comprados até encontrar a
gurinha do Neymar. Y = 1, 2, . . ..
3. Z: O número de erros tipográcos na página 2 da apostila do professor Girafales. Z =
0, 1, . . ..
5.1.2 Variável aleatória contínua
Uma VA é contínua (VAC) se for denida como uma medição de uma quantidade.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.2. DISTRIBUIÇÃO DE PROBABILIDADES 49
Exemplos.
1. X: A proporção de eleitores do partido dos Democratas na cidade de Smallville. X =
[0, 1].
2. Y : O tempo entre o início da greve dos caminhoneiros e o governo iniciar as negociações.
Y = [0,∞).
3. Z: O resultado nanceiro ao investir em ações da Petrobras.
Z = (−∞,∞).
5.2 Distribuição de probabilidades
Descrevem a aleatoriedade inerente a um determinado evento de interesse, respeitando al-
gumas suposições, isto é, quanticam todos os possíveis valores de uma variável aleatória.
Exemplo. A distribuição de probabilidades para a variável aleatória X: número de caras em
um lançamento de duas moedas, é dada por
Tabela 5.2: Distribuição de probabilidades de X.
X 0 1 2
P(X) 1/4 2/4 1/4
Função de probabilidades. SejaX uma variável aleatória discreta, isto é, X = x1, x2, . . . , xn ⊂
R. Denimos como função (ou distribuição) de probabilidades,
p(x) = P(X = x),
a função que determina a probabilidade X assumir um valor particular x, ∀x ∈ R.
Adicionalmente, p(x) respeita as seguintes condições:
1. 0 ≤ p(x) ≤ 1, para x ∈ X ;
2. p(x) = 0, para x /∈ X ;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.2. DISTRIBUIÇÃO DE PROBABILIDADES 50
3.∞∑
x=−∞
p(x) =∑x∈X
p(x) = 1.
Em palavras, a probabilidade de uma VAD assumir um valor que não pertence ao seu
suporte é zero. E esta probabilidade está entre zero e um se o valor de interesse está dentro
do suporte dela. E a soma de todas das probabilidades de cada possível valor, pertecente ao
suporte, é igual a um.
Exemplo. A VA descrita na Tabela 5.2, que também pode ser representada pela Figura 5.1.
0.0
0.1
0.2
0.3
0.4
0.5
0.0 0.5 1.0 1.5 2.0Variável aleatória X
Pro
babi
lidad
es
Figura 5.1: Distribuição de probabilidades para VA X descrita na Tabela 5.2.
Função densidade de probabilidades. Chamamos uma função não negativa f(x) de função
densidade de probabilidade (FDP) de uma V.A.X quando, para qualquer conjuntoA de número
reais:
P(X ∈ A) =
∫Af(x)dx, ∀x ∈ (−∞,∞).
E f(x) tem as seguintes propriedades:
1. f(x) ≥ 0, para x ∈ X ;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.2. DISTRIBUIÇÃO DE PROBABILIDADES 51
2. f(x) = 0, para x /∈ X ;
3.∫ ∞−∞
f(x)dx =
∫Xf(x)dx = 1.
Em palavras, a probabilidade de X pertencer a um conjunto A é calculada integrando a
FDP no conjunto A. Por exemplo,
PX ∈ (a, b) = P(a ≤ X ≤ b) =
∫ b
a
f(x)dx.
a bVariável aleatória contínua
Fun
ção
dens
idad
e de
pro
babi
lidad
es
Figura 5.2: P(a ≤ X ≤ b).
Note que, se a = b,
P(a ≤ X ≤ a) = P(X = a) =
∫ a
a
f(x)dx = 0.
Dessa maneira,
P(X ≤ a) = P(X < a) =
∫ a
−∞f(x)dx.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.3. FUNÇÃO DISTRIBUIÇÃO ACUMULADA 52
5.3 Função distribuição acumulada
Uma função distribuição acumulada (FDA) F (x) de uma variável aleatória X, é uma função
que calcula a probabilidade de X ser menor ou igual a um valor especíco x, isto é,
F (x) = P(X ≤ x).
Uma f.d.a. F (x) tem as seguintes propriedades:
• F é não decrescente, isto é, se a < b, então F (a) < F (b);
• limx→∞
F (x) = 1;
• limx→−∞
F (x) = 0.
Caso discreto.
F (x) =x∑
t=−∞
P(X = t).
Caso contínuo.
F (x) =
∫ x
−∞f(t)dt.
Além disso,
d
dxF (x) = f(x).
5.4 Esperança
Esperança ou valor esperado de uma VAX é a média ponderada de todos os valores possíveis
que X assume. A ponderação para o valor x é a probabilidade de X = x.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.5. VARIÂNCIA 53
Caso discreto.
E(X) =∑x∈X
xP(X = x).
Caso contínuo.
E(X) =
∫Xxf(x)dx.
X 0 1 2
P(X) 1/4 2/4 1/4
Exemplo (continuação). calculamos a esperança de X da seguinte forma:
E(X) =∑x∈X
xP(X = x) =2∑
x=0
xP(X = x)
= 0× 1
4+ 1× 2
4+ 2× 1
4
= 0 +2
4+
2
4=
4
4= 1.
Propriedades da esperança. Sejam X e Y duas variáveis aleatórias e c uma constante,
temos que:
1. E(c) = c;
2. E(X ± c) = E(X)± c;
3. E(cX) = cE(X);
4. E(X ± Y ) = E(X)± E(Y ).
5.5 Variância
A variância de uma VA X é a média ponderada da distância entre a média de X e cada
um dos valores possíveis que X assume. Assim como na esperança, a ponderação para cada
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.6. EXERCÍCIOS 54
distância é a probabilidade de X = x. Isto é, a variância mede a dispersão da V.A. X em torno
da sua média.
Var(X) = E([X − E(X)]2
)= E(X2)− [E(X)]2.
X 0 1 2
P(X) 1/4 2/4 1/4
Exemplo (continuação). calculamos a esperança de X2 da seguinte forma:
E(X2) =∑x∈X
x2P(X = x) =2∑
x=0
x2P(X = x)
= 02 × 1
4+ 12 × 2
4+ 22 × 1
4
= 0 +2
4+
4
4=
6
4=
3
2.
Pela denição de variância:
Var(X) = E(X2)− [E(X)]2 =3
2− [1]2 =
3
2− 1 =
1
2.
Propriedades da variância. Sejam X e Y duas variáveis aleatórias independentes e c uma
constante, temos que:
1. Var(c) = 0;
2. Var(X ± c) = Var(X);
3. Var(cX) = c2Var(X);
4. Var(X ± Y ) = Var(X) + Var(Y ).
5.6 Exercícios
1. Considere uma urna em que temos 4 bolas brancas e 6 bolas pretas. Vamos retirar, ao
acaso, 3 bolas, uma após a outra e sem reposição. Seja X: o número de bolas brancas.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.6. EXERCÍCIOS 55
Construa a distribuição de probabilidades da VA X.
2. Em uma classe, há 6 homens e 3 mulheres. Sorteados 3 alunos, ao acaso e sem reposição,
dena X: o número de homens sorteados.
(a) Escrever o suporte da VA X.
(b) Construa a distribuição de probabilidades da VA X.
(c) Calcular a esperança de X.
(d) Calcular a moda de X.
(e) Calcular o desvio padrão de X.
(f) Calcular a esperança de Y = 2X − 1.
(g) Calcular a variância de Z = 3X − 2.
(h) Refazer os itens anteriores para o caso com reposição.
(i) Refazer os itens anteriores para o caso em que há 6 homens e 2 mulheres.
(j) Refazer os itens anteriores para o caso em que há 20 homens e 20 mulheres.
3. O jogo consiste em se atirar um dado, se der faces 2 ou 5, a pessoa ganha R$ 50 por ponto
obtido; se der faces 1 ou 6, a pessoa ganha R$ 100 por ponto obtido; se der faces 3 ou 4,
a pessoa paga R$ 150 por ponto obtido. Responda: o jogo é honesto? Calcule o desvio
padrão da distribuição.
4. Seja X a diferença entre o número de caras e coroas obtidas após o lançamento de uma
moeda 3 vezes.
(a) Escreva os valores possíveis da VA X.
(b) Construa a distribuição de probabilidades da VA X.
(c) Calcular a esperança de X.
(d) Calcular a variância de X.
(e) Refazer os itens anteriores para o caso com n lançamentos.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
5.6. EXERCÍCIOS 56
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Capítulo 6
Distribuições
Algumas variáveis aleatórias se destacam por serem facilmente encontradas na natureza ou
por terem uma grande aplicabilidade. Neste capítulo apresentaremos as principais VA, junta-
mente com os experimentos que as descrevem, as distribuições de probabilidades, as esperanças
e as variâncias.
6.1 Distribuição de Bernoulli
Experimento de Bernoulli. Um experimento com apenas dois resultados possíveis: su-
cesso ou fracasso, em que P(sucesso) = p e P(fracasso) = 1−p, p é um valor entre zero e um,
não necessariamente conhecido.
Exemplos:
1. Lançamento de uma moeda e o interesse ser a face cara;
2. Lançamento de um dado e o interesse ser por faces pares;
3. O tempo de vida de uma lâmpada ser maior que 8 anos;
4. O corpo de um paciente não rejeitar um novo orgão transplantado.
VA de Bernoulli. Seja a variável aleatória X: a ocorrência de sucesso em um experimento
de Bernoulli, com probabilidade de sucesso p. Então, a VA X tem distribuição de Bernoulli
57
ufjf.br/tiago_magalh
aes
6.1. DISTRIBUIÇÃO DE BERNOULLI 58
com probabilidade p e com distribuição de probabilidades dada por
X 0 1
P(X) 1− p p
p = 0.2
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00x
p(x)
(a) Probabilidade de sucesso igual a 0,2.
p = 0.7
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00x
p(x)
(b) Probabilidade de sucesso igual a 0,7.
Figura 6.1: Distribuição de probabilidades de uma VA Bernoulli.
A função de probabilidades de uma Bernoulli é dada por:
P(X = x) = px(1− p)1−x,
em que p ∈ (0, 1) e x ∈ 0, 1. Note que,
P(sucesso) = P(X = 1) = p1(1− p)1−1 = p,
P(fracasso) = P(X = 0) = p0(1− p)1−0 = 1− p.
A esperança e a variância são, respectivamente:
E(X) = p e Var(X) = p(1− p).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.2. DISTRIBUIÇÃO DE BINOMIAL 59
6.2 Distribuição de binomial
Experimento binomial. Um experimento binomial tem 3 características:
1. uma realização com n repetições independentes;
2. cada repetição admite apenas dois resultados: sucesso ou fracasso;
3. a probabilidade de sucesso não se altera em cada repetição.
Observação. Um experimento binomial é a soma dos resultados de n experimentos inde-
pendentes de Bernoulli. O valor de n é conhecido, mas a probabilidade de sucesso p não é
necessariamente conhecida.
VA binomial. Seja X: o número de sucessos em um experimento binomial, com n repetições
e probabilidade de sucesso p. Então, a VA X tem distribuição binomial, com parâmetros n e
p, de forma alternativa,
X ∼ binomial(n, p) ou X ∼ bin(n, p).
A função de probabilidades de uma VA X ∼ binomial(n, p) é dada por:
P(X = x) =
(n
x
)px(1− p)n−x,
em que p ∈ (0, 1) e x ∈ 0, 1, . . . , n. A esperança e variância de X são dadas, respectivamente,
por
E(X) = np e Var(X) = np(1− p).
Exemplo. Seja X uma VA binomial com 4 repetições e probabilidade de sucesso igual a
1. p = 0, 2;
2. p = 0, 7.
As distribuições de probabilidades são
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.3. DISTRIBUIÇÃO GEOMÉTRICA 60
Tabela 6.1: Distribuição de probabilidades da VA X para n = 4 e p = 0,2 e 0,7.
p X 0 1 2 3 4
0,2P(X)
256/625 256/625 96/625 16/625 1/625
0,7 81/10000 189/2500 367/1387 1029/2500 2401/10000
0.00
0.25
0.50
0.75
1.00
0 1 2 3 4x
p(x)
(a) n = 4 e p = 0, 2.
0.00
0.25
0.50
0.75
1.00
0 1 2 3 4x
p(x)
(b) n = 4 e p = 0, 7.
Figura 6.2: Distribuição de probabilidades de uma VA binomial.
6.3 Distribuição geométrica
Experimento geométrico. Um experimento geométrico tem 3 características:
1. a realização de indenidas repetições independentes até a ocorrência do resultado dese-
jado;
2. cada repetição admite apenas dois resultados: sucesso ou fracasso;
3. a probabilidade de sucesso não se altera em cada repetição.
A probabilidade de sucesso não se altera, porém ela pode ser desconhecida.
VA geométrica. Seja X: o número de fracassos até a ocorrência do primeiro sucesso em
um experimento geométrico, com probabilidade de sucesso p. Então, a VA X tem distribuição
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.3. DISTRIBUIÇÃO GEOMÉTRICA 61
geométrica, com probabilidade p, de forma alternativa,
X ∼ geométrica(p) ou X ∼ geom(p).
Exemplo. Comprar pacotes do álbum da Copa do Mundo de 2018 até encontrar a primeira
gurinha do Gabriel Jesus (GJ). Seja X: o número de pacotes comprados sem a gurinha do
GJ até o pacote premiado. Então, se encontramos:
• no primeiro pacote comprado, tivemos 0 fracassos (X = 0),
• no segundo pacote, tivemos 1 fracasso (X = 1),
• no terceiro, tivemos 2 fracassos (X = 2),
• ...
A função de probabilidades de uma VA X ∼ geométrica(p) é dada da seguinte forma:
P(X = x) = p(1− p)x,
em que p ∈ (0, 1) e x ∈ 0, 1, 2, . . .. Com esperança e variância dadas, respectivamente, por,
E(X) =1− pp
e Var(X) =1− pp2
.
VA geométrica (forma alternativa). Seja Y : o número de repetições até a ocorrência do
primeiro sucesso em um experimento geométrico, com probabilidade de sucesso p. Então, a VA
Y tem distribuição geométrica, com probabilidade p. Além disso, temos que Y = X + 1. Com
função de probabilidades dada por
P(Y = y) = p(1− p)y−1,
em que p ∈ (0, 1) e y ∈ 1, 2, . . .. E,
E(Y ) =1
pe Var(Y ) =
1− pp2
.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.4. DISTRIBUIÇÃO BINOMIAL NEGATIVA 62
Exemplo (continuação). Comprar pacotes do álbum da Copa do Mundo de 2018 até en-
contrar a primeira gurinha do Gabriel Jesus. Seja Y : o número total de pacotes comprados
até o pacote premiado. Então, se encontramos:
• no primeiro pacote comprado, tivemos 1 repetição (Y = 1),
• no segundo pacote, tivemos 2 repetições (Y = 2),
• no terceiro, tivemos 3 repetições (Y = 3),
• ...
0.00
0.25
0.50
0.75
1.00
0 3 6 9x
p(x)
(a) p = 0, 2.
0.00
0.25
0.50
0.75
1.00
0 3 6 9x
p(x)
(b) p = 0, 7.
Figura 6.3: Distribuição de probabilidades de uma VA geométrica.
6.4 Distribuição binomial negativa
Experimento binomial negativo. Um experimento binomial negativo tem 3 caracterís-
ticas:
1. a realização de indenidas repetições independentes até a ocorrência de r resultados
desejados;
2. cada repetição admite apenas dois resultados: sucesso ou fracasso;
3. a probabilidade de sucesso não se altera em cada repetição.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.4. DISTRIBUIÇÃO BINOMIAL NEGATIVA 63
Observação. Um experimento binomial negativo é a soma dos resultados de r experimen-
tos independentes geométrico. A quantidade r é conhecida e a probabilidade p poderá ser
desconhecida, mas sempre será assumida igual em cada repetição do experimento.
VA binomial negativa. Seja X: o número de fracassos até a ocorrência do r-ésimo sucesso
em um experimento binomial negativo, com probabilidade de sucesso p. Então, a VA X tem
distribuição binomial negativa, com r sucessos e probabilidade p, de forma alternativa,
X ∼ binomial negativa(r, p) ou X ∼ bn(r, p).
A função de probabilidades de uma VA X ∼ binomial negativa(r, p) é dada da seguinte
forma:
P(X = x) =
(r + x− 1
x
)pr(1− p)x,
em que p ∈ (0, 1) e x ∈ 0, 1, 2, . . .. E,
E(X) =r(1− p)
pe Var(X) =
1− pp2
.
VA binomial negativa (forma alternativa). Seja Y : o número de repetições até a ocor-
rência do r-ésimo sucesso em um experimento binomial negativa, com probabilidade de sucesso
p. Então, a VA Y tem distribuição binomial negativa, com r sucessos e probabilidade p. Além
disso, temos que Y = X + r. Com função de probabilidades dada por
P(Y = y) =
(y − 1
r − 1
)pr(1− p)y−r,
em que p ∈ (0, 1) e y ∈ r, r + 1, . . .. E,
E(Y ) =r
pe Var(Y ) =
r(1− p)p2
.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.5. DISTRIBUIÇÃO HIPERGEOMÉTRICA 64
0.00
0.25
0.50
0.75
1.00
0 3 6 9x
p(x)
(a) r = 3 e p = 0, 2.
0.00
0.25
0.50
0.75
1.00
0 3 6 9x
p(x)
(b) r = 3 e p = 0, 7.
Figura 6.4: Distribuição de probabilidades de uma VA binomial negativa.
6.5 Distribuição hipergeométrica
Experimento hipergeométrico. Um experimento hipergeométrico tem 3 características:
1. Uma amostra sem reposição de tamanho n será retirada de uma população com N
elementos;
2. cada elemento é classicado como sucesso ou fracasso;
3. existem K sucessos e N −K fracassos na população.
VA hipergeométrica. Seja X: o número de sucessos em uma amostra de tamanho n, reti-
rada de uma população de tamanho N . Então, a VA X tem distribuição hipergeométrica, com
K sucessos, em uma população de tamanho N e amostra de tamanho n, de forma alternativa,
X ∼ hipergeométrica(N,K, n) ou X ∼ hg(N,K, n).
A função de probabilidades de uma VA X ∼ hipergeométrica(N,K, n) é dada da seguinte
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.6. DISTRIBUIÇÃO DE POISSON 65
forma:
P(X = x) =
(K
x
)(N −Kn− x
)(N
n
) ,
em que N ∈ 0, 1, 2, . . ., K ∈ 0, 1, 2, . . . , N, n ∈ 0, 1, 2, . . . , N e x ∈ max(0, n + K −
N), . . . ,min(n,K). E,
E(Y ) = nK
Ne Var(Y ) = n
K
N
(N −K)
N
N − nN − 1
.
0.00
0.25
0.50
0.75
1.00
0 1 2 3x
p(x)
(a) n = 2.
0.00
0.25
0.50
0.75
1.00
0 1 2 3x
p(x)
(b) n = 7.
Figura 6.5: Distribuição de probabilidades de uma VA hipergeométrica (10, 3, n).
6.6 Distribuição de Poisson
Distribuição de Poisson. Chamamos de um experimento de Poisson, experimentos que
contam o número de sucessos em um intervalo contínuo ou região especicada.
Exemplos:
1. número de chamadas telefônicas em uma central no período de 1 hora;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.7. DISTRIBUIÇÃO UNIFORME 66
2. número de navios que chegam no porto de Santos no período de uma semana;
3. número de defeitos observados em uma parede de 3× 3m.
A distribuição de probabilidades de uma Poisson é dada por:
P(X = x) = e−λλx
x!,
em que λ ∈ (0,∞) e x ∈ 0, 1, . . .. Temos que,
E(X) = Var(X) = λ.
0.0
0.1
0.2
0.3
0.4
0.5
0 5 10 15x
p(x)
(a) λ = 2.
0.0
0.1
0.2
0.3
0.4
0.5
0 5 10 15x
p(x)
(b) λ = 7.
Figura 6.6: Distribuição de probabilidades de uma VA Poisson.
6.7 Distribuição uniforme
Uma VA X é uniforme no intervalo (a, b) se a probabilidade de um evento ocorrer, dentro
do intervalo (a, b), é proporcional ao comprimento do intervalo no qual o evento está contido.
A VA X pode ser denotada como
X ∼ uniforme(a, b) ou X ∼ U(a, b).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.8. DISTRIBUIÇÃO EXPONENCIAL 67
Se X ∼ U(a, b), sua função densidade de probabilidade é dada por
f(x) =1
b− a,
em que x ∈ (a, b), a ∈ R, b ∈ R e a < b. E sua função distribuição acumulada é dada por
F (x) = P(X ≤ x) =x− ab− a
,
em que x ∈ (a, b), a ∈ R, b ∈ R e a < b. Nas Figuras 6.7 e 6.8, apresentamos, respectivamente,
a FDP e a FDA de forma geral e para valores especícos de a e b.
1
b − a
a bx
f(x)
(a) FDP.
0.00
0.25
0.50
0.75
1.00
a bx
F(x
)
(b) FDA.
Figura 6.7: VA uniforme(a, b).
Temos também que, se X ∼ U(a, b), então
E(X) =a+ b
2e Var(X) =
(b− a)2
12.
6.8 Distribuição exponencial
Seja um evento P , que ocorre de forma independente e com taxa de ocorrência λ, constante.
A VA X que mede o tempo entre duas ocorrências de P é chamada exponencial, com taxa λ.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.8. DISTRIBUIÇÃO EXPONENCIAL 68
0.00
0.25
0.50
0.75
1.00
0 1 2 3 4 5x
f(x)
U(2, 3) U(1, 3) U(1, 4)
(a) FDP.
0.00
0.25
0.50
0.75
1.00
0 1 2 3 4 5x
F(x
)
U(2, 3) U(1, 3) U(1, 4)
(b) FDA.
Figura 6.8: VA uniforme para diferentes intervalos (a, b).
A VA X pode ser denotada por
X ∼ exponencial(λ) ou X ∼ exp(λ).
Se X ∼ exp(λ), sua FDP é dada por
f(x) = λe−λx,
em que x ∈ (0,∞) e λ > 0. E sua FDA é dada por
F (x) = P(X ≤ x) = 1− e−λx,
em que x ∈ (0,∞) e λ > 0. Na Figura 6.9, apresentamos a FDP e a FDA para valores
especícos de λ.
Se X ∼ exp(λ), então
E(X) =1
λe Var(X) =
1
λ2.
Comentários.
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.8. DISTRIBUIÇÃO EXPONENCIAL 69
0.0
0.5
1.0
1.5
2.0
0 1 2 3x
f(x)
Exp(0,5) Exp(1,0) Exp(2,0)
(a) FDP.
0.00
0.25
0.50
0.75
1.00
0.0 2.5 5.0 7.5 10.0x
F(x
)
Exp(0,5) Exp(1,0) Exp(2,0)
(b) FDA.
Figura 6.9: VA exponencial para diferentes valores de λ.
• É a versão contínua da distribuição geométrica;
• Tem a propriedade da perda de memória, isto é,
P(X > x+ t|X > t) = P(X > x), ∀x, t ≥ 0.
Suponha que um evento P ocorreu há t minutos, a propriedade quer dizer que, a probabilidade
de um novo evento P precisar de mais x minutos para acontecer novamente, em um total
de x + t entre as duas ocorrências, sabendo que já se passaram t minutos é simplesmente a
probabilidade de um novo evento P precisar de mais x para acontecer. Então, o conhecimento
de quando o último evento ocorreu é irrelevante.
Forma alternativa. A FDP e FDA de uma VA exponencial pode ser escrita em função de
sua média. Seja µ = E(X) = 1/λ, a FDP da VA X ∼ exp(µ), ca denida como
f(x) =1
µe−(1/µ)x,
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.9. DISTRIBUIÇÃO NORMAL 70
em que x ∈ (0,∞) e µ > 0. E sua FDA,
F (x) = P(X ≤ x) = 1− e−(1/µ)x,
Se X ∼ exp(µ), então
E(X) = µ e Var(X) = µ2.
Reescrever a função densidade de probabilidade de uma variável aleatória exponencial em
função da média é bastante útil no contexto de Modelos de Regressão, onde há a suposição de
que o comportamento de um fenômeno, no caso, caracterizado por uma VA exponencial, pode
ser descrito por outras condições, variáveis.
6.9 Distribuição normal
Uma variável aleatória X tem distribuição normal com parâmetros µ e σ2, denotada por
X ∼ N(µ, σ2) ou X ∼ normal(µ, σ2), se sua função densidade de probabilidade é dada por
f(x) =1
σ√
2πexp
−1
2
(x− µσ
)2, (6.1)
em que x ∈ R, µ ∈ R e σ2 > 0. Na Figura 6.10, apresentamos a FDP e a FDA de uma VA
normal para valores especícos de µ e σ2.
Nota. A distribuição normal tem origem nos trabalhos de Gauss (1809), sobre erros de ob-
servações astronômicas, por isso também ela é conhecida como distribuição gaussiana.
Propriedades:
1. f(x) é simétrica em relação à µ, isto é, f(x+ µ) = f(µ− x);
2. f(x) tem valor máximo quando x = µ e este valor é 1/σ√
2π;
3. f(x)→ 0 quando x→ ±∞;
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.9. DISTRIBUIÇÃO NORMAL 71
0.00
0.05
0.10
0.15
−10 0 10 20 30x
f(x)
N(10, 5) N(5, 5) N(10, 1)
(a) FDP.
0.00
0.25
0.50
0.75
1.00
−10 0 10 20x
F(x
)
N(10, 5) N(5, 5) N(10, 1)
(b) FDA.
Figura 6.10: VA normal para diferentes valores de µ e σ2.
4. f(x) tem dois pontos de inexão: µ− σ e µ+ σ.
Se X ∼ N(µ, σ2), então
E(X) = µ e Var(X) = σ2,
isto é, os parâmetros que caracterizam um VA normal são a média e a variância. Eles também
servem para quanticar a massa de probabilidade abaixo da curva normal. Por exemplo, entre
µ − 3σ e µ + 3σ, a área sob a curva normal é 0,997. A Figura 6.11 apresenta mais algumas
relações entre esses parâmetros.
6.9.1 Importância da normal
Importância prática. Inúmeros fenômenos encontrados no mundo real podem ser descritos
como uma distribuição normal. Menções à distribuição normal podem ser encontradas até
mesmo na Cultura Pop, como na série de TV The Simpsons e no livroO parque dos dinossauros
(Crichton 2009).
Importância teórica. A distribuição normal é uma distribuição limite, isto é, sob algumas
condições, outras variáveis aleatórias podem ser aproximadas pela VA normal. Este resultado
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.9. DISTRIBUIÇÃO NORMAL 72
0.0015
0.02350.135
0.34 0.34
0.1350.0235
0.0015
1
2πσ2
− ∞ µ − 3σ µ − 2σ µ − σ µ µ + σ µ + 2σ µ + 3σ + ∞x
f(x)
Figura 6.11: FDP de uma VA normal em função de µ e σ2.
é conhecido por Teorema Central do Limite.
Exemplos de aplicação da variável aleatória normal na área da saúde podem serem encon-
trados em Magalhães e Diniz (2020).
6.9.2 Distribuição normal padrão
Se X tem distribuição normal com parâmetros µ e σ2, e denimos uma nova variável, Z,
da seguinte forma,
Z =X − µσ
,
então Z tem distribuição normal de parâmetros 0 e 1, sua FDP. é dada por
f(z) =1√2π
exp
−z
2
2
,
em que z ∈ R, ou seja, a FDP de Z é a mesma de X, apresentada em (6.1), substituindo µ por
0 e σ2 por 1.
Propriedades:
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.9. DISTRIBUIÇÃO NORMAL 73
1
2π
−2 0 2x
f(x)
(a) FDP.
0.00
0.25
0.50
0.75
1.00
−2 −1 0 1 2x
F(x
)(b) FDA.
Figura 6.12: VA normal padrão.
1. f(z) é simétrica em relação ao 0, isto é, f(z) = f(−z);
2. f(z) tem valor máximo quando z = 0 e este valor é 1/√
2π;
3. f(z)→ 0 quando z → ±∞;
4. f(z) tem dois pontos de inexão: −1 e 1.
Se Z ∼ N(0, 1), então
E(Z) = 0 e Var(Z) = 1.
6.9.3 Resultados
Se X1, X2, . . . , Xn são variáveis aleatórias independentes, e cada uma delas tem distribuição
N(µ, σ2), então
X =X1 +X2 + · · ·+Xn
n∼ N(µ, σ2/n)
isto é, a média de variáveis aleatórias normais também tem distribuição normal. Podemos
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 74
também padronizar a VA X, dessa forma,
Z =X − µσ/√n∼ N(0, 1).
6.10 Aproximação da binomial pela normal
Se X tem distribuição binomial com n repetições e probabilidade de sucesso p e, adicional-
mente,
np ≥ 5 e p ≤ 1/2,
a VA X pode ser considerada também, aproximadamente, como uma VA normal com média
np e variância np(1− p).
Exemplo. Uma VA X ∼ bin(10, 1/2). Como n × p = 10 × 1/2 = 5(≥ 5) e p ≤ 1/2, temos
que X tem, aproximadamente, uma distribuição normal de média µ = n× p = 10× 1/2 = 5 e
variância σ2 = n× p× (1− p) = 10× 1/2× 1/2 = 2, 5. A Figura 6.13 apresenta a distribuição
de probabilidades de uma binomial(10, 1/2) e a função densidade de probabilidade de uma
normal(5, 2, 5).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 75
0.00
0.05
0.10
0.15
0.20
0.25
0.0 2.5 5.0 7.5 10.0x
p(x)
Bin(10, 0.5) N(5, 2.5)
Figura 6.13: Distribuição de probabilidades de uma bin(10, 1/2) e a FDP de uma normal(5, 2, 5).
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 76
Estatística Econômica Magalhães, T. M.
ufjf.br/tiago_magalh
aes
Referências Bibliográcas
Beall, G. (1942), `The transformation of data from entomological eld experiments', Journal of
Economic Behavior & Organization 29, 243262.
Crichton, M. (2009), O parque dos dinossauros, L&PM, Porto Alegre.
Ezekiel, M. (1930), Methods of Correlation Analysis, Wiley, New York.
Gauss, C. F. (1809), Theoria motus corporum coelestium in sectionibus conicis solem ambien-
tium, s.n., Hamburgi.
Magalhães, T. M. e Diniz, M. A. (2020), Normalidade dos dados: suposições, transformações e
valores atípicos, in A. Lunardi, ed., `Manual de pesquisa clínica aplicada à saúde', Blucher,
São Paulo, chapter 27, pp. 349364.
Molyneaux, L., Gilliam, S. K. e Florant, L. C. (1947), `Dierences in virginia death rates by
color, sex, age, and rural or urban residence', American Sociological Review 12, 525535.
Morettin, P. A. e Toloi, C. M. (2004), Análise de Séries Temporais, Edgard Blücher, São Paulo.
R Core Team (2017), R: A Language and Environment for Statistical Computing, R Foundation
for Statistical Computing, Vienna, Austria.
Selvin, S. (1975a), `On the monty hall problem (letter to the editor)', American Statistician
29(3), 134.
Selvin, S. (1975b), `A problem in probability (letter to the editor)', American Statistician
29(1), 6771.
Wickham, H. (2009), ggplot2: Elegant Graphics for Data Analysis, Springer-Verlag New York.
77
ufjf.br/tiago_magalh
aes
REFERÊNCIAS BIBLIOGRÁFICAS 78
Estatística Econômica Magalhães, T. M.