ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos...

90
1 2 0/3 Fraternidade Igualdade Liberdade ´ ηνα

Transcript of ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos...

Page 1: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Universidade Federal de Juiz de Fora

Instituto de Ciências Exatas

Departamento de Estatística

ESTATÍSTICAECONÔMICA

Tiago M.

MAGALHÃ[email protected]

12

0/3

Fraternidade Igualdade Liberdade

Aθηνα

Page 2: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

ii

Estatística Econômica Magalhães, T. M.

Page 3: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Prefácio

Esta apostila foi criada para auxiliar os alunos das disciplinas EST012 - Estatística Econô-

mica I e EST022 - Estatística Econômica II, oferecida pelo Departamento de Estatística do

Instituto de Ciências Exatas da Universidade Federal de Juiz de Fora. Ela foi criada a partir

das minhas notas de aulas dos cursos mencionados anteriormente e também do curso: Uma

introdução à análise exploratória de dados e métodos estatístico, que é oferecido nos cursos

de verão do Instituto de Matemática e Estatística da Universidade de São Paulo. Porém, o

embrião deste material orginou-se da notas de aula de Introdução à Estatística ministrada pelo

professor Vicente de Paula na Universidade Federal do Ceará, a quem deixo os meus agradeci-

mentos. Por m, entre em contato comigo, caso tenha sugestões a fazer ou tenha encontrado

erros.

Juiz de Fora, 03 de março de 2020

Tiago M. Magalhães

iii

Page 4: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

iv

Estatística Econômica Magalhães, T. M.

Page 5: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Sumário

Lista de Figuras ix

Lista de Tabelas xi

1 Conceitos iniciais 1

1.1 Operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 Multiplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.1 Elemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.2 Pertinência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.3 Conjuntos especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.4 Operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Combinações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3.1 Fatorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3.2 Coeciente binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Medidas resumo 7

2.1 Denições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1 Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.2 Tipos de variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Séries estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2.1 Tipos de séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

v

Page 6: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

SUMÁRIO vi

2.3 Distribuição de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.4 Medidas resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.4.1 Medidas de posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4.2 Medidas de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Métodos grácos 21

3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.2 Grácos para uma variável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.2.1 Grácos para variáveis qualitativas . . . . . . . . . . . . . . . . . . . . . 22

3.2.2 Grácos para variáveis quantitativas . . . . . . . . . . . . . . . . . . . . 23

3.3 Grácos para duas ou mais variáveis . . . . . . . . . . . . . . . . . . . . . . . . 25

3.3.1 Grácos para duas variáveis quantitativas . . . . . . . . . . . . . . . . . 25

3.3.2 Grácos para variáveis qualitativas e quantitativas . . . . . . . . . . . . . 27

3.4 Considerações nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Introdução à probabilidade 31

4.1 Experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.2.1 Probabilidade em espaços amostrais equiprováveis . . . . . . . . . . . . . 34

4.3 Probabilidade condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.4.1 Sensibilidade e especicidade . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.5 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5 Variável aleatória 47

5.1 Variável aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.1.1 Variável aleatória discreta . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.1.2 Variável aleatória contínua . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Estatística Econômica Magalhães, T. M.

Page 7: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

SUMÁRIO vii

5.2 Distribuição de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.3 Função distribuição acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.4 Esperança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.5 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

6 Distribuições 57

6.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6.2 Distribuição de binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

6.3 Distribuição geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

6.4 Distribuição binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

6.5 Distribuição hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

6.6 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.7 Distribuição uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

6.8 Distribuição exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.9 Distribuição normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6.9.1 Importância da normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.9.2 Distribuição normal padrão . . . . . . . . . . . . . . . . . . . . . . . . . 72

6.9.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.10 Aproximação da binomial pela normal . . . . . . . . . . . . . . . . . . . . . . . 74

Referências Bibliográcas 77

Estatística Econômica Magalhães, T. M.

Page 8: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

SUMÁRIO viii

Estatística Econômica Magalhães, T. M.

Page 9: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Lista de Figuras

2.1 Terminal Butantã, São Paulo/SP (Créditos: Google imagens). . . . . . . . . . . 11

3.1 Localização de Minas Gerais no Brasil (Créditos: Wikipédia). . . . . . . . . . . 21

3.2 Grácos de barras para a região de origem. . . . . . . . . . . . . . . . . . . . . . 23

3.3 Grácos para a região de origem. . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.4 Grácos para as alturas (cm) dos alunos. . . . . . . . . . . . . . . . . . . . . . . 25

3.5 Gráco de dispersão da velocidade (mph) de um carro e a distância (pés) até

parar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.6 Grácos de séries temporais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.7 Taxa de mortalidade, Virginia, 1940. . . . . . . . . . . . . . . . . . . . . . . . . 28

3.8 Dotplot da taxa de mortalidade na Virgina em 1940. . . . . . . . . . . . . . . . 29

3.9 Número de insetos exterminados por inseticida. . . . . . . . . . . . . . . . . . . 30

4.1 Representação de Ω. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2 Árvore de possibilidades para o Paradoxo de Monty Hall. . . . . . . . . . . . . . 38

4.3 Sensibilidade do exame do Exemplo. . . . . . . . . . . . . . . . . . . . . . . . . 40

5.1 Distribuição de probabilidades para VA X descrita na Tabela 5.2. . . . . . . . . 50

5.2 P(a ≤ X ≤ b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

6.1 Distribuição de probabilidades de uma VA Bernoulli. . . . . . . . . . . . . . . . 58

6.2 Distribuição de probabilidades de uma VA binomial. . . . . . . . . . . . . . . . . 60

6.3 Distribuição de probabilidades de uma VA geométrica. . . . . . . . . . . . . . . 62

6.4 Distribuição de probabilidades de uma VA binomial negativa. . . . . . . . . . . 64

ix

Page 10: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

LISTA DE FIGURAS x

6.5 Distribuição de probabilidades de uma VA hipergeométrica (10, 3, n). . . . . . . 65

6.6 Distribuição de probabilidades de uma VA Poisson. . . . . . . . . . . . . . . . . 66

6.7 VA uniforme(a, b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.8 VA uniforme para diferentes intervalos (a, b). . . . . . . . . . . . . . . . . . . . . 68

6.9 VA exponencial para diferentes valores de λ. . . . . . . . . . . . . . . . . . . . . 69

6.10 VA normal para diferentes valores de µ e σ2. . . . . . . . . . . . . . . . . . . . . 71

6.11 FDP de uma VA normal em função de µ e σ2. . . . . . . . . . . . . . . . . . . . 72

6.12 VA normal padrão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.13 Distribuição de probabilidades de uma bin(10, 1/2) e a FDP de uma normal(5, 2, 5). 75

Estatística Econômica Magalhães, T. M.

Page 11: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Lista de Tabelas

2.1 Procedimento de construção de uma distribuição de frequências. . . . . . . . . . 10

2.2 Notas de 50 alunos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3 Dados dos funcionários. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.4 Visitantes dos sítios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.5 Tempo de realização das tarefas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.6 Salários em reais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.7 Idades dos entrevistados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1 Participantes por região. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2 Altura (cm) dos alunos do IME-USP . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3 Estatísticas descritivas para altura (cm) dos alunos do IME-USP . . . . . . . . . 25

3.4 Taxa de mortes por 1000 habitantes na Virginia em 1940. . . . . . . . . . . . . . 28

3.5 Quantidade de insetos exterminados. . . . . . . . . . . . . . . . . . . . . . . . . 29

4.1 Todos os possíveis resultados, escolhendo inicialmente a Porta 1. . . . . . . . . 38

4.2 Distribuição dos pacientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.3 Motivos para voltar a trabalhar. . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.4 Cargo na nova atividade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.5 Atributos dos funcionários. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.1 Conjuntos Ω e Y associados ao experimento ε e a VA Y , respectivamente. . . . . 48

5.2 Distribuição de probabilidades de X. . . . . . . . . . . . . . . . . . . . . . . . . 49

6.1 Distribuição de probabilidades da VA X para n = 4 e p = 0,2 e 0,7. . . . . . . . 60

xi

Page 12: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

LISTA DE TABELAS xii

Estatística Econômica Magalhães, T. M.

Page 13: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 1

Conceitos iniciais

1.1 Operações

1.1.1 Soma

Sejam a, b e c, três números quaisquer, a soma tem as seguintes propriedades:

• Comutativa: a+ b = b+ a;

• Associativa: (a+ b) + c = a+ (b+ c);

• Identidade: a+ 0 = a.

Somatórios. Sejam a1, a2, . . . , an, n números quaisquer. Então,

n∑i=1

ai = a1 + a2 + · · ·+ an.

1.1.2 Multiplicação

Sejam a, b e c, três números quaisquer, a multiplicação tem as seguintes propriedades:

• Comutativa: a× b = b× a;

• Associativa: (a× b)× c = a× (b× c);

• Identidade: a× 1 = a.

1

Page 14: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

1.2. CONJUNTOS 2

Produtórios. Sejam a1, a2, . . . , an, n números quaisquer. Então,

n∏i=1

ai = a1 × a2 × · · · × an.

Frações. Sejam a e b, dois números quaisquer. Uma fração é a seguinte representação:

a

b,

que pode ser interpretada com a divisão (operação inversa da multiplicação) de a por b.

1.2 Conjuntos

Na matemática, um conjunto é uma coleção de elementos.

Exemplos.

• O conjunto dos números naturais: 0, 1, 2, 3, ...;

• O conjunto de todos os alunos de uma sala de aula;

• O conjuto de músicos na banda The Bealtes.

Por convenção, todo conjunto é representado por uma letra do alfabeto em maiúsculo: A,B,C, . . . , Z.

1.2.1 Elemento

Elemento de um conjunto é qualquer coisa que pertença a um determinado conjunto.

Exemplos.

• a é um elemento do conjunto das vogais, a ∈ a, e, i, o, u;

• John Lennon é um elemento do conjunto musical The Beatles.

1.2.2 Pertinência

Pertinência é a característica associada a um elemento ao qual faz parte de um conjunto.

Estatística Econômica Magalhães, T. M.

Page 15: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

1.3. COMBINAÇÕES 3

Exemplos.

• a pertence ao conjunto das vogais;

• John Lennon pertence ao conjunto musical The Beatles.

1.2.3 Conjuntos especiais

• Conjunto unitário: é o conjunto composto por apenas um elemento.

• Conjunto vazio (∅): é o conjunto com zero elementos.

• Conjunto universo: é o conjunto com todos os elementos.

• Conjunto iguais: dois conjuntos A e B são ditos iguais se todo elemento de A é também

elemento de B e vice-versa.

1.2.4 Operações

Sejam A e B são dois conjuntos não vazios e U o conjunto Universo.

• União (A ∪B): são os elementos que pertencem a A ou pertencem a B.

• Interseção (A ∩B): são os elementos que pertencem simultaneamente a A e B.

• Diferença (A−B): são os elementos que pertencem a A e não pertencem a B.

• Complementar (Ac): são os elementos que pertence a U e não pertencem a A.

1.3 Combinações

1.3.1 Fatorial

Seja n um número natural, denimos como fatorial de n, denotado por n!, o número:

n! = n× (n− 1)× (n− 2)× · · · × 3× 2× 1.

Estatística Econômica Magalhães, T. M.

Page 16: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

1.3. COMBINAÇÕES 4

Exemplos.

1! = 1

2! = 2× 1 = 2

3! = 3× 2× 1 = 6

Por convenção, 0! = 1.

Exemplo. O professor José irá tirar dúvidas de três alunos: Alberto, Hellinton e Sylvio. De

quantas maneiras os alunos poderão ser atendidos de forma individual e por ordem de chegada?

Existem 6 possibilidades de atendimento:

Maneira 1: Alberto, Hellinton, Sylvio;Maneira 2: Alberto, Sylvio, Hellinton;Maneira 3: Hellinton, Alberto, Sylvio;Maneira 4: Hellinton, Sylvio, Alberto;Maneira 5: Sylvio, Alberto, Hellinton;Maneira 6: Sylvio, Hellinton, Alberto.

De maneira mais simples, ao invés de termos que listar todas maneiras, basta notarmos que

6 = 3! = número de alunos!

1.3.2 Coeciente binomial

Sejam n e k dois números naturais, denimos como coeciente binomial a seguinte expressão:

(n

k

)=

n!

k!(n− k)!.

Aplicação. Sorteios em que a ordem dos sorteados não é importante.

Estatística Econômica Magalhães, T. M.

Page 17: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

1.4. EXERCÍCIOS 5

Exemplo. Quantas são as possíveis combinações de números em um sorteio da mega-sena?

Resposta:

(60

6

)= 50.063.860.

Exemplo. O professor José irá sortear um trabalho para ser resolvido por um dos seus quatro

alunos: Alberto, Christian, Hellinton e Sylvio. De quantas maneiras isso é possível? Resposta:

(4

1

)= 4.

O professor percebeu que o trabalho precisa resolvido por dois alunos ao mesmo tempo. De

quantas maneiras isso é possível? Resposta:

(4

2

)= 6.

1.4 Exercícios

1. Seja D o conjunto das faces de um dado, isto é, D = 1, 2, 3, 4, 5, 6.

(a) Quem é o conjunto dos números pares, P?

(b) Quem é o conjunto dos números ímpares, I?

(c) Quem é o conjunto interseção entre P e I, P ∩ I?

(d) Quem é o conjunto D − I?

(e) Se T é o conjunto das faces maiores que 3. Quem é o conjunto T?

(f) Se U é o conjunto das faces menores ou iguais a 1. Quem é o conjunto U?

(g) Quem é o conjunto da união entre T e U , T ∪ U?

2. Em um avião há 122 passageiros dos quais 96 são brasileiros, 64 são homens, 47 fumantes,

51 homens brasileiros, 25 homens fumantes, 36 brasileiros fumantes e 20 homens brasileiros

fumantes. Determine entres os passageiros quantos deles eram:

Estatística Econômica Magalhães, T. M.

Page 18: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

1.4. EXERCÍCIOS 6

(a) Mulheres brasileiras não fumantes;

(b) Homens fumantes não brasileiros;

(c) Mulheres fumantes;

(d) Mulheres fumantes não brasileiras;

(e) Homens brasileiros não fumantes.

Estatística Econômica Magalhães, T. M.

Page 19: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 2

Medidas resumo

2.1 Denições

2.1.1 Estatística

É o ramo da matemática aplicada que cuida da coleta, análise e interpretação dos dados

(Fisher).

População. É um conjunto de indivíduos ou objetos que possuem pelo menos uma caracte-

rística em comum.

Amostra. É um subconjunto da população.

Estatística descritiva. Tem com o intuito de apresentar as observações de maneira resu-

mida, através de tabelas, grácos e/ou medidas.

Inferência estatística. Tira resultados e conclusões de uma amostra (signicativa da popu-

lação) e estende a população.

2.1.2 Tipos de variáveis

Quantitativas. É o resultado de contagem (variável discreta) ou mensuração (variável con-

tínua).

7

Page 20: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.2. SÉRIES ESTATÍSTICAS 8

Qualitativas. Quando se refere a qualidade ou atributo de um indivíduo. Se não houver

ordem em suas realizações, é dita qualitativa nominal, caso contrário, qualitativa ordinal.

2.2 Séries estatísticas

É toda e qualquer seleção de dados organizados em uma tabela, que responda a três ques-

tionamentos básicos:

1. O quê? Se refere ao fenômeno estudado.

2. Quando? Se refere ao período de tempo no qual se estudou o fenômeno.

3. Onde? Se refere a região geográca onde foi estudado o fenômeno.

2.2.1 Tipos de séries

Temporal. É aquela em que o único fator variável é o tempo, permanecendo constantes o

fenômeno estudado e a região geográca.

Observações:

• Fonte primária: o pesquisador é responsável pela coleta de informações.

• Fonte secundária: quando as informações são retiradas de estatísticas já existentes.

Geográca. É aquela em que o único fator variável é a região geográca, permanecendo

constantes o fenômeno estudado e o tempo.

Especicativa. É aquela em que varia somente o fenômeno estudado.

Mista. Composição de duas ou mais séries.

2.3 Distribuição de frequências

Exemplo. Foi perguntado a 27 alunos do curso de Estatística Economica I quantos dias

eles estudaram na semana anterior. As respostas foram:

Estatística Econômica Magalhães, T. M.

Page 21: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.3. DISTRIBUIÇÃO DE FREQUÊNCIAS 9

0 3 3 0 2 4 1 1 23 2 2 2 4 3 5 1 54 1 5 3 2 5 4 0 0

O que podemos observar/comentar?

Distribuição de frequências. Uma maneira de se dispor um conjunto de dados para se ter

uma ideia global sobre eles, ou seja, de sua distribuição. Para os dados anteriores:

Dias Freq. obs.0 41 42 63 54 45 4

Observação. Em algumas situações, é conveniente adicionar informações extras a distribui-

ção de frequências, como a frequência acumulada, relativa ou relativa em porcentagem. Para

os dados anteriores:

Dias f fR fR(%) fac0 4 4/27 400/27 41 4 4/27 400/27 82 6 6/27 600/27 143 5 5/27 500/27 194 4 4/27 400/27 235 4 4/27 400/27 27

Em que:

• f é a frequência observada;

• fR é a frequência relativa;

• fR(%) é a frequência relativa percentual;

• fac é a frequência relativa acumulada;

se n é o total de observações, temos que f1 +f2 + · · ·+fn = n, fRi= fi/n, fRi

(%) = 100×fi/n,

faci = f1 + f2 + · · ·+ fi, i = 1, 2, . . . , l e l é o número de observações distintas.

Estatística Econômica Magalhães, T. M.

Page 22: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.4. MEDIDAS RESUMO 10

Construção de uma distribuição de frequências. Em situações com muitas observações

ou para o caso de variáveis quantitativas contínuas, o procedimento para a construção de uma

distribuição de frequências é o seguinte, denir:

1. Rol: a organização dos dados em ordem crescente;

2. Amplitude total (AT ): Valor máximo (max) − valor mínimo (min);

3. Número de classes (c): c ≈ 1 + 3, 22 logn10 (fórmula de Sturges);

4. Amplitude de classes (h): h ≈ AT/c.

E construir a distribuição de frequências como mostra a Tabela 2.1.

Tabela 2.1: Procedimento de construção de uma distribuição de frequências.

Classe Freq. obs.1: min (inclusive) |- min +h f12: min +h (inclusive) |- min +2h f2...

......

c: min +(c− 1)h (inclusive) |- min +ch fc

2.4 Medidas resumo

Exemplo. Marcio é aluno da disciplina de Estatística Avançada I, com prova marcada para

as 8h, sem a possibilidade de entrada após este horário. As 7h44, ele chega no Terminal Butantã

(ver Figura 2.1) e, neste exato momento, os dois ônibus das linhas que lhe serve, 8012 e 8022,

estão prestes a partir.

Desesperado, ele pergunta para o scal quanto tempo cada um deles leva até chegar ao

Departamento de Estatística. O scal responde: nestas mesmas condições, eu observei, em

minutos:

8012 13 15 12 10 19 17 10 14 15 158022 16 16 15 16 16 14 15 15 14 15

Qual o ônibus Marcio deveria pegar?

Estatística Econômica Magalhães, T. M.

Page 23: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.4. MEDIDAS RESUMO 11

Figura 2.1: Terminal Butantã, São Paulo/SP (Créditos: Google imagens).

2.4.1 Medidas de posição

Média (X). É o ponto de equilíbrio de um conjunto de observações. Dado um conjunto

de observações X1, X2, . . . , Xn, dene-se média aritmética como o quociente entre a soma das

observações e o número de termos do conjunto.

X =X1 +X2 + · · ·+Xn

n=

∑ni=1Xi

n.

Propriedades da média:

1. Se somarmos uma constante a todos os elementos do conjunto, a nova média cará somada

desta constante.

2. Se multiplicarmos todos os elementos de um conjunto por uma constante, a nova média

cará multiplicada por esta constante.

3. A soma dos desvios tomados em relação a média é nula.

Isto é,

1.(X1 + c) + (X2 + c) + · · ·+ (Xn + c)

n= X + c;

2.(X1 × c) + (X2 × c) + · · ·+ (Xn × c)

n= X × c;

3. (X1 − X) + (X2 − X) + · · ·+ (Xn − X) = 0.

Estatística Econômica Magalhães, T. M.

Page 24: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.4. MEDIDAS RESUMO 12

Mediana (Md). É o valor que divide exatamente no meio um conjunto de dados, isto é,

o número de observações a sua direita é o mesmo a sua esquerda. Seja X1, X2, . . . , Xn um

conjunto de dados não ordenados com n observações e X(1), X(2), . . . , X(n) o conjunto de dados

anterior ordenado, então

• Se n é ímpar, a mediana é o valor da observação que está na posição n+12

do conjunto de

dados ordenados,

Md = X(n+12

).

Então,

X(1), X(2), . . . , X(n−12

), Md , X(n+32

), X(n+52

), . . . , X(n)

50%←− 50%−→.

• Se n é par, a mediana é a média dos valores das observações que estão nas posições n2e

n2

+ 1 do conjunto de dados ordenados,

Md =X(n

2) +X(n

2+1)

2.

Então,

X(1), X(2), . . . , X(n2−1), Md , X(n

2+2), X(n

2+3), . . . , X(n)

50%←− 50%−→.

Moda (Mo). É o valor mais frequente de um conjunto de observações.

Relações entre X, Md e Mo.

• Se X > Md > Mo, a distribuição dos dados é assimétrica à direita.

• Se X < Md < Mo, a distribuição dos dados é assimétrica à esquerda.

• Se X = Md = Mo, a distribuição dos dados é simétrica.

Estatística Econômica Magalhães, T. M.

Page 25: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.4. MEDIDAS RESUMO 13

Quartis. Os quartis Q1 a Q3 dividem o conjunto de observações em quatro partes, da seguinte

maneira:

• Q1: deixa 25% dos elementos abaixo dele e 75% acima.

• Q2: deixa 50% dos elementos abaixo dele e 50% acima.

• Q3: deixa 75% dos elementos abaixo dele e 25% acima.

SeX1, X2, . . . , Xn é um conjunto de dados não ordenados com n observações eX(1), X(2), . . . , X(n)

o conjunto de dados anterior ordenado, supondo n par, então

X(1), . . . , X(n−54

), Q1, X(n+74

), . . . , X(n−12

), Q2, X(n+32

), . . . , X( 3n−54

), Q3, X( 3n+74

), . . . , X(n)

25%←− 25%−→50%←− 50%−→

.

Entre as possibilidades de calcular os quartis, sugerimos a seguinte:

• Q2: é a mediana de todas as observações (Md);

• Q1: é a mediana das observações que são menores que Md;

• Q3: é a mediana das observações que são maiores que Md.

Intervalo interquartil (IIQ). É a diferença Q3 − Q1, utilizada para avaliar o grau de

espalhamento dos dados.

Exemplo (continuação). Com o conhecimento de medidas de posição, o scal obteve:

Linha Min Q1 Md X Moda Q3 Max

8012 10 12,3 14,5 14,0 15 15 19

8022 14 15,0 15,0 15,2 15 e 16 16 16

Agora, qual o ônibus Marcio deveria pegar?

Estatística Econômica Magalhães, T. M.

Page 26: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 14

2.4.2 Medidas de dispersão

Variância (S2). Mede o grau de dispersão dos valores em torno da média. Quanto menor a

variância, maior a homogeneidade. É calculada da seguinte forma

S2 =

∑ni=1(Xi − X)2

n− 1=

∑ni=1X

2i − nX2

n− 1.

Propriedades da variância. Sejam X um conjunto de dados e c uma constante, então:

1. Var(c) = 0;

2. Var(X ± c) = Var(X);

3. Var(cX) = c2Var(X);

Desvio padrão (S). É a raiz quadrada da variância, isto é, S =√S2

Coeciente de variação (CV ). É o quociente entre o desvio padrão e a média, em porcen-

tagem,

CV =S

X× 100.

Exemplo (continuação). Com o conhecimento de medidas de dispersão, o scal obteve:

Linha Min Q1 Md X Moda Q3 Max S CV

8012 10 12,3 14,5 14,0 15 15 19 2,9 20,5

8022 14 15,0 15,0 15,2 15 e 16 16 16 0,8 5,2

Finalmente, qual o ônibus Marcio deveria pegar?

2.5 Exercícios

1. Classique as seguintes variáveis:

(a) Número de alunos em uma sala;

Estatística Econômica Magalhães, T. M.

Page 27: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 15

(b) Número de erros por páginas em um livro;

(c) Temperatura;

(d) Peso;

(e) Sexo;

(f) Região de procedência;

(g) Classicação do vestibular;

(h) Patente militar.

2. Classique as seguintes séries estatísticas:

(a) Produção de arroz em Minas Gerais no período de 2001 a 2003;

(b) Casos de febre amarela em Belo Horizonte, Juiz de Fora e Uberlândia no ano de

2017;

(c) Casos de febre amarela e sarampo em Juiz de Fora em 2017;

(d) Produção de milho, arroz e feijão, nos estados de Minas Gerais, Rio de Janeiro e São

Paulo no ano de 2017;

(e) Produção de milho, arroz e feijão, nos estados de Minas Gerais, Rio de Janeiro e São

Paulo no período de 2000 a 2002.

3. Complete os dados que faltam:

X f fac fR1 4 0,082 43 164 75 5 286 387 458

4. Na Tabela 2.2 estão dadas as notas de 50 alunos. Construa a distribuição de frequências.

Estatística Econômica Magalhães, T. M.

Page 28: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 16

Tabela 2.2: Notas de 50 alunos.

60 85 33 52 65 77 84 65 74 57

71 35 81 50 35 64 74 47 54 68

80 61 41 91 55 73 59 53 77 45

41 53 78 48 69 85 67 39 60 76

94 98 66 66 73 42 65 94 88 89

5. Provar as propriedades da média.

6. Provar as propriedades da variância.

7. Considere uma empresa com três funcionários que ganham 2, 4, 6 salários mínimo.

(a) Se dermos uma abono de um salário mínimo a todos os funcionários, o que acontecerá

com a média e com a variância?

(b) Se dermos um aumento de 35% a todos os funcionários, qual será a nova média

salarial e a variância?

8. Um questionário foi aplicado aos dez funcionários do setor de contabilidade de uma em-

presa, fornecendo os dados da Tabela 2.3.

Tabela 2.3: Dados dos funcionários.

Funcionário Escolaridade Idade Salário (R$) Anos na empresa

1 Superior 34 1600,00 5

2 Superior 43 1950,00 8

3 Médio 31 1360,00 6

4 Médio 37 1370,00 8

5 Médio 24 1250,00 3

6 Médio 25 1000,00 2

7 Médio 27 1100,00 5

8 Fundamental 22 550,00 2

9 Fundamental 21 850,00 3

10 Fundamental 26 850,00 3

(a) Classique cada uma das variáveis. (Note que Funcionário não é variável mas um

identicador).

Estatística Econômica Magalhães, T. M.

Page 29: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 17

(b) Calcule a média e a mediana dos salários para os 10 funcionários.

(c) Divida os funcionários em três grupos segundo a escolaridade: Fundamental (F),

Médio (M) e Completo (C). Calcule a média e a mediana para salário. Compare-as

com os valores obtidos em (b). Comente.

(d) Calcule a mediana do tempo de empresa dos funcionários. Considerando o valor

obtido, construa dois grupos: funcionários recentes (R), com número de anos na em-

presa menor ou igual à mediana, e funcionários antigos (A), com tempo de empresa

superior à mediana. Calcule média e desvio padrão de salário para cada grupo.

(e) Calcule o desvio padrão e o coeciente de variação de salário para os grupos em (d).

Qual é mais homogêneo?

9. O Instituto de Matemática e Estatística da Universidade de São Paulo disponibiliza para

seus alunos de pós-graduação um domínio de internet. Um funcionário da Seção de

Informática (SI) retira uma amostra de tamanho 4 de domínios existentes e verica o

número de visitas entre os anos de 2013 a 2017. A Tabela 2.4 apresenta os resultados

dessa amostragem.

(a) Qual é a variável de interesse?

(b) Classique cada uma das variáveis. (Note que Observação não é uma variável mas

um identicador).

(c) Calcule a média, a mediana e o desvio padrão do número de visitas para cada um

dos domínios. Qual é o website mais popular? Justique.

(d) O funcionário da SI fez uma investigação e descobriu que a página www.ime.usp.br/∼diegog

não existia em 2013. Exclua a Observação 1 e refaça o item (c).

10. Um pesquisador desenvolveu um teste para avaliar a capacidade de crianças com idade

entre 7 e 12 em realizar certa tarefa. Quinze crianças foram submetidas ao teste, e o

tempo para realização foi anotado. Os resultados estão na Tabela 2.5:

(a) Calcule o tempo médio de realização do teste para o conjunto de 15 crianças.

Estatística Econômica Magalhães, T. M.

Page 30: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 18

Tabela 2.4: Visitantes dos sítios.

Observação Domínio Ano Visitas

1 www.ime.usp.br/∼diegog 2013 0

2 www.ime.usp.br/∼diegog 2014 32

3 www.ime.usp.br/∼diegog 2015 28

4 www.ime.usp.br/∼diegog 2016 47

5 www.ime.usp.br/∼diegog 2017 42

6 www.ime.usp.br/∼manuelg 2013 39

7 www.ime.usp.br/∼manuelg 2014 32

8 www.ime.usp.br/∼manuelg 2015 39

9 www.ime.usp.br/∼manuelg 2016 35

10 www.ime.usp.br/∼manuelg 2017 35

11 www.ime.usp.br/∼montoril 2013 11

12 www.ime.usp.br/∼montoril 2014 12

13 www.ime.usp.br/∼montoril 2015 10

14 www.ime.usp.br/∼montoril 2016 7

15 www.ime.usp.br/∼montoril 2017 17

16 www.ime.usp.br/∼rfarias 2013 42

17 www.ime.usp.br/∼rfarias 2014 33

18 www.ime.usp.br/∼rfarias 2015 41

19 www.ime.usp.br/∼rfarias 2016 31

20 www.ime.usp.br/∼rfarias 2017 33

Tabela 2.5: Tempo de realização das tarefas.

Criança 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Tempo (min) 11 4 7 17 8 16 23 10 8 6 24 8 9 5 11

(b) O pesquisador decide que as crianças cujo tempo de realização do teste for superior

à média mais 1,5 vezes o desvio padrão serão submetidas a procedimentos didáticos

especiais. Alguma criança precisará receber o programa especial? Comente.

(c) Qual é o intervalo inter-quartil para esse conjunto de dados?

11. Um empresa de seguros exige dos seus clientes as seguintes informações: Cargo na úl-

tima empresa em que trabalhou; Escolaridade; Estado Civil; Idade; IMC; Número de

lhos; Signo; Tempo de habilitação. Classique as variáveis solicitadas em: Quantitativa

contínua; Quantitativa discreta; Qualitativa ordinal; Qualitativa nominal.

Estatística Econômica Magalhães, T. M.

Page 31: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 19

12. Na Tabela 2.6, apresentamos a distribuição de frequências (incompleta) dos salários se-

manais (em R$) de n funcionários amostrados de uma certa empresa.

Tabela 2.6: Salários em reais.

Xi fi faci fri100 197 0,513200 91300 349400 20500 10 379600 383700 383800

(a) Qual é a variável de interesse? Classique-a.

(b) Complete a tabela. Qual foi tamanho da amostra?

(c) Calcule a média, a mediana e a moda.

(d) Calcule a variância, o desvio padrão e o coeciente de variação.

13. Estudando-se o consumo diário de leite (C) em uma certa região, vericou-se que 20%

das famílias consomem até 1 litro (C < 1), 50% das famílias consomem entre 1 e 2 litros

(1 ≤ C < 2), 20% das famílias consomem entre 2 e 3 litros (2 ≤ C < 3) e o restante entre

3 e 4 litros (3 ≤ C < 4).

(a) Qual a variável em estudo? Classique-a.

(b) Escreva as informações em forma de tabela de frequências.

(c) Calcule a mediana.

(d) Qual o valor do 1o quartil?

14. Um pesquisador da rádio 103,9 Tempo FM aborda 30 transeuntes ao acaso e pergunta-

lhes as idades, obtendo as seguintes respostas:

(a) Qual é a variável que está sendo estudada? Classique-a

(b) Resuma as informações obtidas na forma de uma distribuição de frequências (log3010 =

1, 48).

Estatística Econômica Magalhães, T. M.

Page 32: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

2.5. EXERCÍCIOS 20

Tabela 2.7: Idades dos entrevistados.

35; 26; 39; 25; 39; 22;

42; 40; 39; 22; 21; 40;

16; 32; 39; 21; 28; 39;

18; 37; 23; 14; 27; 44;

30; 32; 21; 15; 26; 43.

Estatística Econômica Magalhães, T. M.

Page 33: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 3

Métodos grácos

3.1 Motivação

O Estado de Minas Gerais é uma das 27 unidades federativas do Brasil, sendo o quarto

estado com a maior área territorial e localizado na Região Sudeste do país. Limita-se ao sul e

sudoeste com São Paulo, a oeste com o Mato Grosso do Sul, a noroeste com Goiás e Distrito

Federal, a norte e nordeste com a Bahia, a leste com o Espírito Santo e a sudeste com o Rio de

Janeiro. Toda essa descrição poderia ter melhor compreendida ou mesmo ser resumida com a

Figura 3.1.

Figura 3.1: Localização de Minas Gerais no Brasil (Créditos: Wikipédia).

21

Page 34: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.2. GRÁFICOS PARA UMA VARIÁVEL 22

De maneira simples, um gráco tem dois objetivos:

1. Resumir um conjunto de dados de forma mais agradável;

2. Auxiliar ou ser uma alternativa na transmissão de uma informação.

Observação: Os grácos que serão apresentados neste capítulo foram construídos com o pacote

ggplot2 (Wickham 2009) do software estatístico R (R Core Team 2017).

3.2 Grácos para uma variável

Os grácos desta seção são indicados para as situações em que há apenas uma variável de

interesse no conjunto de dados.

3.2.1 Grácos para variáveis qualitativas

Uma variável é considerada qualitativa quando ela é uma característica ou um atributo.

Gráco de barras. Para cada categoria possível da variável qualitativa de interesse, é dese-

nhado um retângulo na vertical (horizontal) e a altura (comprimento) de retângulo é proporci-

onal a frequência absoluta ou relativa da categoria.

Gráco de setores. Um círculo é dividido em tantos setores quantas forem as categorias da

variável qualitativa de interesse. A área de cada setor é proporcional à frequência relativa da

categoria:

100% (Total) 360o

% da categoria Xo

Este gráco é interessante quando estamos interessados em comparar a proporção de cada

categoria com o valor total. É uma alternativa ao gráco de barras utilizando a frequência

relativa.

Gráco de waes. Também é conhecido como gráco de setores quadrado. Dentro um

quadrado, pequenos quadradinhos são pintados proporcionalmente ao número de observações

dentro cada categoria da variável de interesse.

Estatística Econômica Magalhães, T. M.

Page 35: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.2. GRÁFICOS PARA UMA VARIÁVEL 23

0

10

20

30

Centro−Oeste Nordeste Norte Sudeste SulRegião

Par

ticip

ante

s

(a) Frequência absoluta.

0

25

50

75

100

Centro−Oeste Nordeste Norte Sudeste SulRegião

Par

ticip

ante

s (%

)(b) Frequência relativa.

Figura 3.2: Grácos de barras para a região de origem.

Exemplo. Em um congresso de Estatística em São Tomé das Letras (MG), foram sorteados

100 participantes e lhes foi perguntado a região de origem. O resultado desta pesquisa está

apresentado na Tabela 3.1. As Figuras 3.2 e 3.3 apresentam os grácos de barras e setores para

este conjunto de dados. Por estas guras, percebemos uma grande participação de sudestinos,

seguidos pelo dos nordestinos.

Tabela 3.1: Participantes por região.

Região Centro-Oeste Nordeste Norte Sudeste Sul

Participantes 7 33 20 37 3

3.2.2 Grácos para variáveis quantitativas

Uma variável é considerada quantitativa quando ela é o resultado de uma contagem ou uma

mensuração.

Histograma. É a representação gráca de uma distribuição de frequências. Desenhamos

um retângulo para cada intervalo de classe, com base igual a amplitude da classe e altura

proporcional a frequência da classe.

Estatística Econômica Magalhães, T. M.

Page 36: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.2. GRÁFICOS PARA UMA VARIÁVEL 24

25

50

75

0/100

Regiao Centro−Oeste Nordeste Norte Sudeste Sul

(a) Gráco de setores.

Centro−Oeste Nordeste Norte Sudeste Sul

(b) Gráco de waes.

Figura 3.3: Grácos para a região de origem.

Boxplot. É a representação gráca dos dados através de um retângulo, construído com os

quartis dados. O boxplot fornece informações como assimetria e a existência de valores atípicos.

Exemplo. 30 alunos do curso de Estatística do IME-USP são sorteados e verica-se a altura,

com a distribuição de frequência e as medias de posição apresentadas nas Tabelas 3.2 e 3.3,

respectivamente. A Figura 3.4a apresenta o histograma das alturas dos alunos, enquanto, a

Figura 3.4b apresenta o boxplot das alturas. De maneira geral, pela Figura 3.4, podemos ver

que a distribuição das alturas é assimétrica à direita, isto é, existe uma concentração de alunos

com alturas menores que a média 183,8 cm.

Tabela 3.2: Altura (cm) dos alunos do IME-USP

I.C. Freq. obs.

176 ` 178 1

178 ` 180 4

180 ` 182 6

182 ` 184 6

184 ` 186 6

186 ` 188 1

188 ` 190 3

190 ` 192 3

Estatística Econômica Magalhães, T. M.

Page 37: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 25

Tabela 3.3: Estatísticas descritivas para altura (cm) dos alunos do IME-USP

Min Q1 Md X Q3 Max

177,1 180,6 183,4 183,8 185,3 191,0

0

2

4

6

180 185 190Altura (cm)

Fre

quên

cia

(a) Histograma.

Max(Min, Q1 − 1.5IIQ) Min(Max, Q1 + 1.5IIQ)

MdQ1 Q3

180 184 188Altura (cm)

(b) Boxplot.

Figura 3.4: Grácos para as alturas (cm) dos alunos.

3.3 Grácos para duas ou mais variáveis

Na prática, um conjunto de dados tem mais do que uma variável de interesse. Nesta seção,

apresentaremos grácos que combinam duas ou mais varáveis de interesse em uma mesma

gura.

3.3.1 Grácos para duas variáveis quantitativas

Gráco de dispersão. Para uma mesma unidade amostral, o par de variáveis quantitativas

é plotado em um plano cartesiano. Pode ser usado com a nalidade de vericar uma possível

relação entre essas duas variáveis.

Gráco de série temporal. Semelhante ao gráco de dispersão, a diferença é que uma das

variáveis é o tempo e os pontos costumam estar conectados para ajudar na identicação de

uma tendência temporal.

Estatística Econômica Magalhães, T. M.

Page 38: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 26

Exemplo. Em um conjunto de dados de 1920, foi vericado a velocidade (milhas por hora) de

carros no momento da freagem e a distância (em pés) percorrida entre o momento da freagem

até a parada total (Ezekiel 1930). A Figura 3.5 apresentam o diagrama de dispersão para estes

dados. Por esta gura, parece haver uma relação entre a velocidade e a distância percorrida

até parar, no caso, quanto maior a velocidade, maior é a distância percorrida entre o momento

da freagem e a parada total.

Exemplo. Conjunto de dados com a série de chuvas (mm) na cidade de Fortaleza (CE) entre

os anos de 1849 e 1997 (Morettin e Toloi 2004). A Figura 3.6a apresenta gracamente os indíce

ao longo desses anos.

Exemplo. O preço diário das ações da Petrobrás (Petróleo Brasileiro S.A., PETR4) e do Itaú

Unibanco (ITUB4) entre os dias 19 de março de 2019 a 17 de março de 2020. Por se tratarem de

séries avaliada na mesma escala, elas podem ser plotada em um mesmo gráco, como mostra a

Figura 3.6b. A gura mostra que as ações tiveram uma forte queda nos últimos dias observados,

além disso, ITUB4 se manteve mais valorizado em relação à PETR4.

0

25

50

75

100

125

5 10 15 20 25Velocidade (mph)

Dis

tânc

ia (

pés)

Figura 3.5: Gráco de dispersão da velocidade (mph) de um carro e a distância (pés) até parar.

Estatística Econômica Magalhães, T. M.

Page 39: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.3. GRÁFICOS PARA DUAS OU MAIS VARIÁVEIS 27

1000

2000

1850 1900 1950 2000Ano

Chu

va (

mm

)

(a) Chuva em Fortaleza.

10

20

30

2019−03−19 2019−07−17Ano

Pre

ço (

R$)

ITUB4

PETR4

(b) Preço das ações ITUB4 e PETR4.

Figura 3.6: Grácos de séries temporais.

3.3.2 Grácos para variáveis qualitativas e quantitativas

De maneira simples, se o conjunto de dados tiver mais do que uma variável de interesse e uma

dela sendo uma variável qualitativa, o procedimento é separar o banco de dados por categoria

da variável qualitativa e aplicar os grácos vistos anteriormente, de forma apropriada.

Gráco de barras e histograma. Para cada categoria da variável qualitativa, é construído

um gráco de barras se a segunda variável for qualitativa ou um histograma se for quantitativa.

Dotplot. Uma alternativa ao gráco de barras, em que as caixas são substituídas por pontos.

Exemplo. Os dados da Tabela 3.4 são referentes a taxa de mortes por 1000 habitantes na

Virginia em 1940 (Molyneaux et al. 1947), divididos pelo sexo e a região habitada. Pelas Figuras

3.7 e 3.8, podemos ver que houve uma taxa de mortalidade na faixa etária dos 70 a 74 e que,

de maneira, geral o sexo masculino tem uma taxa de mortalidade maior em comparação com o

sexo feminino.

Boxplot e dotplot. Para cada categoria da variável qualitativa, é construído um boxplot se

o interesse for apresentar as medidas de posição ou um dotplot se for o número de observações.

Estatística Econômica Magalhães, T. M.

Page 40: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.4. CONSIDERAÇÕES FINAIS 28

Tabela 3.4: Taxa de mortes por 1000 habitantes na Virginia em 1940.

Taxa de mortes

I.C. Masc. rural Fem. rural Masc. urbano Fem. urbano

50-54 11,7 8,7 15,4 8,4

55-59 18,1 11,7 24,3 13,6

60-64 26,9 20,3 37,0 19,3

65-69 41,0 30,9 54,6 35,1

70-74 66,0 54,3 71,1 50,0

0

50

100

150

200

Rural Male Rural Female Urban Male Urban FemaleRegião

Taxa

de

mor

talid

ade

IC 50−54 55−59 60−64 65−69 70−74

(a) Gráco de barras.

0

20

40

60

Rural Male Rural Female Urban Male Urban FemaleRegião

Taxa

de

mor

talid

ade

IC 50−54 55−59 60−64 65−69 70−74

(b) Histograma.

Figura 3.7: Taxa de mortalidade, Virginia, 1940.

Exemplo. A Tabela 3.5 mostra o resultado de um teste com 6 inseticidas, em que eles fo-

ram avaliados pela quantidade de insetos exterminados, cada inseticida foi testado 12 vezes

(Beall 1942). Pela Figura 3.9, o inseticida F foi o que apresentou o maior número de insetos

exterminados, porém apresentou também uma maior variabilidade.

3.4 Considerações nais

Um gráco:

1. é uma forma alternativa de apresentação das informações;

2. deve ser utilizado de acordo com a variável de interesse;

Estatística Econômica Magalhães, T. M.

Page 41: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.5. EXERCÍCIOS 29

20

40

60

Rural Male Rural Female Urban Male Urban FemaleRegião

Taxa

de

mor

talid

ade

IC 50−54 55−59 60−64 65−69 70−74

Figura 3.8: Dotplot da taxa de mortalidade na Virgina em 1940.

Tabela 3.5: Quantidade de insetos exterminados.

No de insetos exterminados

Inseticida 1 2 3 4 5 6 7 8 9 10 11 12

A 10 7 20 14 14 12 10 23 17 20 14 13

B 11 17 21 11 16 14 17 27 19 21 7 13

C 0 1 7 2 3 1 2 1 3 0 1 4

D 3 5 12 6 4 3 5 5 5 5 2 4

E 3 5 3 5 3 6 1 1 3 2 6 4

F 11 9 15 22 15 16 13 10 26 26 24 13

3. deve ser o mais claro possível;

4. deve respeitar as escalas;

5. deve ter as unidades de medidas apresentadas.

3.5 Exercícios

1. Construir os grácos pertinentes aos dados da Tabela 2.2.

2. Construir grácos:

Estatística Econômica Magalhães, T. M.

Page 42: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

3.5. EXERCÍCIOS 30

0

10

20

A B C D E FInseticida

Inse

tos

mor

tos

(a) Boxplot.

0

10

20

A B C D E FInseticida

Inse

tos

mor

tos

(b) Dotplot.

Figura 3.9: Número de insetos exterminados por inseticida.

(a) para os dados da Tabela 2.3;

(b) Levando em considerações os itens (c) e (d).

3. Construir os grácos pertinentes aos dados da Tabela 2.4.

4. Construir os grácos aplicáveis aos dados da Tabel 2.5.

5. Para os dados da Tabela 2.7

(a) contruir o boxplot das idades;

(b) Levando em consideração o item (b), fazer o histograma.

Estatística Econômica Magalhães, T. M.

Page 43: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 4

Introdução à probabilidade

Probabilidade é a quanticação de um incerteza. Neste capítulo, apresentamos formas

de calcular as probabilidades a partir do conhecimento do mecanismo gerador, chamado de

experimento.

4.1 Experimento

Um experimento é um teste ou um conjunto de testes com a nalidade de vericar uma

hipótese. Eles podem ser divididos em:

• Determinístico: Conhecemos o resultado atencipadamente, isto é, a priori.

• Probabilístico: Conhecemos o resultado somente após a realização, isto é, a posteriori.

Exemplos.

1. Lançamento de uma moeda duas vezes;

2. Intenções de votos para um determinado candidato;

3. Tempo de vida de uma nova lâmpada;

4. Satisfação dos cliente de um determinado produto.

Espaço amostral (Ω). São todos os resultados possíveis de um experimento probabilístico.

31

Page 44: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.1. EXPERIMENTO 32

Exemplos. Os respectivos espaços amostrais dos exemplos anteriores são:

1. Ω = (cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa);

2. Ω = [0, 100];

3. Ω = (0,∞);

4. Ω = Insatisfeito, pouco satisfeito, satisfeito, muito satisfeito.

Evento (E). É um subconjunto do espaço amostral.

Exemplos. Para os exemplos anteriores, temos os possíveis eventos:

1. E: mais caras do que coroas;

2. E: o candidato a presidente ganhar no primeiro turno;

3. E: tempo de vida maior que 34 anos;

4. E: 80% dos entrevistados se declararem, no mínimo, satisfeitos.

Eventos mutuamente exclusivos. Dois eventos A e B são ditos mutuamente exclusivos

quando a interseção entre eles é igual ao conjunto vazio (A ∩B = ∅).

Exemplos.

1. Em um lançamento de um dado, sejam P : a face é par e I: a face é ímpar. Note que:

P ∩ I = ∅.

2. Em uma seleção de pessoas, sejam J : a pessoa selecionada ter nascido em Juiz de Fora e

U : a pessoa selecionada ter nascido em Uberlândia. Note que: J ∩ U = ∅.

Eventos especiais. Existem dois eventos que se destacam entres todos os eventos possíveis

de um experimento, são eles

• O evento impossível: ∅.

• O evento certo: Ω.

Estatística Econômica Magalhães, T. M.

Page 45: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.2. PROBABILIDADE 33

Exemplo. Em um lançamento de um dado convencional, sejam:

• E1: a face ser um número par e ímpar. E1 = ∅.

• E2: a face é um número entre 1 e 6. E2 = 1, 2, 3, 4, 5, 6 = Ω.

Conjunto das partes. Seja um conjunto A, o conjunto das partes, P(A), é o conjunto com

todos os possíveis subconjuntos de A.

Exemplo. Se A = 1, 3, 5, então

P(A) = ∅, 1, 3, 5, 1, 3, 1, 5, 3, 5, 1, 3, 5 = Ω.

4.2 Probabilidade

A Probabilidade é uma quanticação da incerteza. É um peso dado para cada resultado

de um experimento. A probabilidade foi construída a partir de três denições, chamadas de

Axiomas da Probabildade, são elas

1. 0 ≤ P(E) ≤ 1;

2. P(Ω) = 1;

3. Dados dois eventos A e B mutuamente exclusivos, então:

P(A ∪B) = P(A) + P(B).

A partir dos Axiomas da Probabildade, quatro propriedades ou teoremas podem ser obser-

vados e demonstrados:

1. Se ∅ é o conjunto vazio, então P(∅) = 0;

2. Se Ac é o complemento do evento A, então P(Ac) = 1− P(A);

3. Se A ⊂ B, então P(A) ≤ P(B);

Estatística Econômica Magalhães, T. M.

Page 46: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.3. PROBABILIDADE CONDICIONAL 34

4. Sejam A e B dois eventos quaisquer, então

P(A ∪B) = P(A) + P(B)− P(A ∩B).

4.2.1 Probabilidade em espaços amostrais equiprováveis

Um espaço amostral é equiprovável se todos os seus elementos têm a mesma probalidade de

ocorrer. Neste tipo de espaço amostral, o cálculo de uma probabilidade é bem simples. Seja

um evento E associado a um espaço amostral Ω, podemos calcular a probabilidade do evento

E ocorrer da seguinte maneira

P(E) =número de casos favoráveis à E

número de casos possíveis=n(E)

n(Ω).

4.3 Probabilidade condicional

Sejam A e B dois eventos de um mesmo espaço amostral, a probabilidade da ocorrência de

um deles sabendo-se que o outro ocorreu é denida como

P(A|B) =P(A ∩B)

P(B), (4.1)

note que P(B) 6= 0, pois B já ocorreu. Se o espaço amostral for equiprovável, temos que:

P(A ∩B) =n(A ∩B)

n(Ω)e P(B) =

n(B)

n(Ω).

Logo,

P(A|B) =n(A ∩B)

n(B).

Teorema da multiplicação. A ocorrência simultânea de dois eventos A e B do mesmo

espaço amostral é igual ao produto da probabilidade de um deles pela probabilidade condicional

do outro, isto é, na equação (4.1), passamos o denominador da fração no lado direito para o

Estatística Econômica Magalhães, T. M.

Page 47: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.4. TEOREMA DE BAYES 35

lado esquerdo multiplicando, temos que:

P(A ∩B) = P(B)P(A|B). (4.2)

4.4 Teorema de Bayes

Sejam A1, A2, . . . , An, eventos mutuamente exclusivos, tais que

A1 ∪ A2 ∪ · · · ∪ An = Ω,

como mostra a Figura 4.1a, com todas as probabilidades P(Ai), i = 1, . . . , n, conhecidas. E

seja B um evento qualquer de Ω, tal que todas as probabilidades condicionais P(B|Ai) são

conhecidas.

A1 A2 A3

A4 A5 A6

A7 A8 A9

(a) Mutuamente exclusivos.

A1 A2 A3

A4 A5 A6

A7 A8 A9

B

(b) M.E. mas com um evento em comum.

Figura 4.1: Representação de Ω.

Note que

B = (A1 ∩B) ∪ (A2 ∩B) ∪ · · · ∪ (An ∩B),

com (Ai ∩ B) e (Aj ∩ B) mutuamente exclusivos, para i 6= j, como descreve a Figura 4.1b.

Estatística Econômica Magalhães, T. M.

Page 48: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.4. TEOREMA DE BAYES 36

Dessa forma, podemos escrever a probabilidade do evento B como

P(B) = P(A1 ∩B) + P(A2 ∩B) + · · ·+ P(An ∩B) (4.3)

= P(A1)P(B|A1) + P(A2)P(B|A2) + · · ·+ P(An)P(B|An),

a equação (4.3) é denominada de Teorema da probabilidade total.

Então, por (4.1) e (4.3), temos, para todo evento Ai, que

P(Ai|B) =P(Ai ∩B)

P(B)=P(Ai)P(B|Ai)

P(B)(4.4)

=P(Ai)P(B|Ai)

P(A1)P(B|A1) + P(A2)P(B|A2) + · · ·+ P(An)P(B|An),

esta probabilidade condicional P(Ai|B), em (4.4), é conhecida como Regra ou Teorema de

Bayes.

Exemplo (o Paradoxo de Monty Hall). Em seu programa de televisão, o apresentador

Monty Hall apresentava três portas aos concorrentes. Atrás de uma delas estava um um carro,

enquanto nas outras duas, um bode cada. O jogo se desenvolvia em três etapas:

1a etapa, o concorrente escolhia uma das três portas;

2a etapa, Monty Hall abria uma das outras duas portas que o concorrente não havia esco-

lhido e que continha um dos bodes;

3a etapa, o apresentador perguntava aos concorrentes se eles permaneceriam com a porta

que escolhida no início do jogo ou se eles pretendiam mudar para a outra porta que ainda

estava fechada.

Após a decisão dos participantes, cumprindo-se as 3 etapas, a porta escolhida era então aberta.

Sabendo que o carro está atrás de uma das duas portas restantes, qual deveria ser a decisão ser

tomada pelo concorrente, car com a porta escolhida inicialmente ou mudar de porta? Qual

dos itens abaixo representa a probabilidade dos concorrentes ganharem o carro?

Estatística Econômica Magalhães, T. M.

Page 49: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.4. TEOREMA DE BAYES 37

(a) 1/3. (b) 1/2. (c) 2/3.

Se o jogo não precisasse das 2a e 3a etapas, é fácil observar que a probabilidade de ganhar o

carro seria 1/3, mas não é isso que acontece. Por simplicidade, admita que, em um determinado

jogo, o partcipante escolheu a Porta 1, o apresentador abriu a Porta 3 e os eventos

• S: o participante ganhar o carro trocando a porta escolhida, i.e., escolher a Porta 2, na

3a etapa;

• Sc: o participante ganhar o carro mantendo a porta escolhida, i.e., manter a Porta 1, na

3a etapa;

• P : o apresentador abrir a Porta 3 na 2a etapa.

Então, pelas probabilidades dadas na Tabela 4.1, pelo Teorema de Bayes, podemos vericar

que

P(S|P ) =P(S ∩ P )

P(P )=

P(P |S)P(S)

P(P |S)P(S) + P(P |Sc)P(Sc)

=1× (1/3)

1× (1/3) + (1/2)× (1/3)=

(1/3)

(1/3) + (1/6)=

(1/3)

(3/6)=

2

3.

Logo, se o participante trocar de porta, suas chances de vitória dobram em relação ao início

do jogo. Se o concorrente optar pela manutenção da porta, suas chances se mantém. A Figura

4.2, apresenta a solução desse problema através de uma árvore de possibilidades. Por m, é

importante ressaltar que, a suposição inicial do participante escolhendo a Porta 1 e localização

do carro e dos bodes não interferem no valor 2/3. Esta solução foi apresentada em duas cartas,

Selvin (1975b) e Selvin (1975a).

Estatística Econômica Magalhães, T. M.

Page 50: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.4. TEOREMA DE BAYES 38

Tabela 4.1: Todos os possíveis resultados, escolhendo inicialmente a Porta 1.

Localização Porta Probabilidade Decisão

do carro aberta Total Ficar Trocar

Porta 21/6 Carro Bode

Porta 1 (1/2)

(1/3) Porta 31/6 Carro Bode

(1/2)

Porta 2 Porta 31/3 Bode Carro

(1/3) (1)

Porta 3 Porta 21/3 Bode Carro

(1/3) (1)

Etapa 1

Carro Bode Bode

Manter Trocar Manter Trocar Manter Trocar

Carro Bode BodeBode Carro Carro

Figura 4.2: Árvore de possibilidades para o Paradoxo de Monty Hall.

4.4.1 Sensibilidade e especicidade

Seja um exame A, a Sensibilidade e a Especicidade são medidas que avaliam a capacidade

de discriminação do exame A. A Sensibilidade é a proporção de pacientes doentes que apresen-

tam resultado positivo no exame A. E a Especicidade é a proporção de pacientes sadios que

apresentam resultado negativo no exame A. A sensibilidade e a especicidade do exame A são

determinadas usando como referência um Padrão-Ouro.

Estatística Econômica Magalhães, T. M.

Page 51: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.4. TEOREMA DE BAYES 39

Tabela 4.2: Distribuição dos pacientes.

Resultado Doente pelo Padrão-OuroTotal

do exame A Sim Não

Positivo Positivo verdadeiro Falso positivo Positivos

Negativo Falso negativo Negativo verdadeiro Negativos

Total Doentes Não doentes Total de examinados

Então, temos que

Sensibilidade =Positivos verdadeiros

Doentese Especicidade =

Negativos verdadeirosNão doentes

.

Exemplo. Apenas uma em cada dez pessoas de uma população tem tuberculose. Das pessoas

que tem tuberculose, 80% reagem positivamente ao teste Y , enquanto apenas 30% das que não

tem tuberculose reagem positivamente. Uma pessoa da população é selecionada ao acaso e

o teste Y é aplicado. Qual a probabilidade de que essa pessoa tenha tuberculose, se reagiu

positivamente ao teste?

Solução. Sejam os eventos:

• T : Uma pessoa ter tuberculose;

• T c: Uma pessoa não ter tuberculose;

• P : o Teste Y dar positivo para tuberculose.

Pelo enunciado, temos que: P(T ) = 0, 1, P(T c) = 0, 9, P(Y |T ) = 0, 8 e P(Y |T c) = 0, 3. Então

P(T |Y ) =P(T ∩ Y )

P(Y )=

P(T ∩ Y )

P(Y ∩ T ) + P(Y ∩ T c)=

P(Y |T )× P(T )

P(Y |T )× P(T ) + P(Y |T c)× P(T c)

=0, 8× 0, 1

0, 8× 0, 1 + 0, 3× 0, 9=

0, 08

0, 08 + 0, 27=

8

35.

Estatística Econômica Magalhães, T. M.

Page 52: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.5. INDEPENDÊNCIA 40

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00Probabilidade de verdadeiro positivo

Sen

sibi

lidad

e

(a) Verdadeiro positivo.

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00Probabilidade de falso positivo

Sen

sibi

lidad

e(b) Falso positivo.

Figura 4.3: Sensibilidade do exame do Exemplo.

4.5 Independência

Dois eventos A e B são ditos independentes quando a probabilidade da interseção entre eles

é igual ao produto de suas respectivas probabilidades, isto é, (4.2) pode ser escrito como

P(A ∩B) = P(A)× P(B),

a ocorrência de um evento não altera a probabilidade de ocorrência de um outro evento. De

(4.1):

P(A|B) =P(A ∩B)

P(B)=P(A)× P(B)

P(B)= P(A).

4.6 Exercícios

1. Demonstre os quatro teoremas da Probabilidade.

2. Em um lançamento de um dado convencional, sejam os seguintes eventos: E1: face par;

E2: face que não seja 1 ou 4 e E3: face maior ou igual a 3. Calcule:

Estatística Econômica Magalhães, T. M.

Page 53: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 41

(a) P(E1); (b) P(E1 ∩ E2); (c) P(Ec3).

3. Se P(A) = 1/2, P(B) = 1/3 e P(A ∩B) = 1/4. Determine:

(a) P(A ∪B)

(b) P(Ac ∪Bc)

(c) P(Ac ∩B)

(d) P(Ac ∪B)

4. Seja ε: Lançamento de dois dados, e sejam A = (x, y); x+ y = 8; B = (x, y); x = y;

C = (x, y); x+ y = 10; D = (x, y); x > y e E = (x, y); x = 2y. Determine

(a) P(A)

(b) P(B)

(c) P(C)

(d) P(D)

(e) P(A|B)

(f) P(C|D)

(g) P(D|E)

(h) P(A|C)

(i) P(C|E)

(j) P(C|A)

(k) P(A|D)

(l) P(B|C)

(m) P(A|E)

(n) P(B|E)

(o) P[A|(B ∩ C)]

(p) P[(A ∩B)|(C ∩D)]

5. Três cavalos A, B e C estão em uma corrida. A tem 2 vezes mais probabilidade de ganhar

que B e B tem 2 vezes mais probabilidade de ganhar que C. Assumindo que empates são

impossíveis, quais são as probabilidades de vitórias de cada um dos cavalos?

6. Considere um lote com 20 peças das quais 6 contém defeitos. Retiramos 2 peças uma

após a outra, sem reposição. Qual a probabilidade das duas peças serem perfeitas?

7. Uma urna contém X bolas brancas e V bolas vermelhas, uma segunda urna contém Z

bolas brancas e Y bolas vermelhas. Sem se vericar a cor, uma bola é escolhida ao acaso

da urna 1 e posta na urna 2. Em seguida, uma bola é escolhida ao acaso da urna 2. Qual

a probabilidade que esta bola seja branca?

8. A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido 3/5.

Calcular a probabilidade de:

Estatística Econômica Magalhães, T. M.

Page 54: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 42

(a) Apenas o homem estar vivo; (b) Pelo menos um estar vivo.

9. A probabilidade de fechamento de cada relé no circuito fechado é dada por θ, θ é um valor

entre 0 e 1. Se todos os relés funcionam de forma independente, qual será a probabilidade

que haja corrente entre os terminais?

2

1

4

3

10. Em novembro de 1994, a Intel anunciou que uma falha sutil em seu chip Pentium poderia

afetar 1 em 9 problemas de divisão. Suponha que um computador realize 20 divisões no

decorrer da execução de um programa e que os erros sejam independentes. Responda:

(a) Qual é a probabilidade de nenhum erro ocorrer?

(b) Qual é a probabilidade de ocorrer pelo menos um erro?

11. Na turma de Estatística Avançada II existem apenas dois alunos matriculados: Leandro

e Márcio. Em um determinado dia, o professor da disciplina propõe um exercício que

Leandro tem probabilidade 7/9 de resolver e Márcio 5/7, independentemente um do outro.

Calcule a probabilidade de:

(a) apenas Márcio conseguir resolver o exercício;

(b) os dois alunos conseguirem resolver o exercício;

(c) o exercício ser resolvido;

(d) que dois alunos não consigam resolver o exercício.

12. Numa cidade do interior do país existem três companhias de telefonia celular: A, B e

C. Constatou-se que entre 1500 famílias, 1100 têm telefone celular, sendo que 470 só

têm celular da companhia A; 230 só têm celular da companhia B; 140 só têm celular da

Estatística Econômica Magalhães, T. M.

Page 55: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 43

companhia C; 57 só têm celulares das companhias A e B; 73 só têm celulares das companhias

A e C; 85 só têm celulares das companhias B e C e 45 têm celulares das três companhias.

(a) Qual é a probabilidade de que uma família escolhida ao acaso tenha pelo menos dois

celulares?

(b) Qual é a probabilidade de que uma família escolhida ao acaso tenha exatamente dois

celulares?

13. Um terço dos executivos que se aposentam retornam ao trabalho após 1,5 anos de aposen-

tadoria. De acordo com a Russel Reynolds Association, a distribuição de probabilidades

para a razão para o retorno está na apresentada na Tabela 4.3 e para o caminho utilizado

na Tabela 4.4.

Tabela 4.3: Motivos para voltar a trabalhar.

Razão para Satisfação com Evitar Contribuir com

o retorno o trabalho o tédio a sociedade

Probabilidade 0,53 0,29 0,18

Tabela 4.4: Cargo na nova atividade.

Caminho NovaAutônomo Consultor

Iniciou umaa

utilizado companhia nova rma

Probabilidade 0,38 0,32 0,23 0,07

Assumindo que razões para o retorno e caminho utilizado sejam independentes:

(a) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,

volte para evitar o tédio e o faça como consultor?

(b) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,

volte para evitar o tédio ou volte como consultor?

(c) Qual a probabilidade de que um executivo aposentado que decide voltar ao trabalho,

volte para evitar o tédio dado que o faça como consultor?

Estatística Econômica Magalhães, T. M.

Page 56: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 44

14. Dados estatísticos mostram que, em uma determinada área de concurso, 75% dos candi-

datos aprovados estudam muito e 90% dos que estudam muito são aprovados. Sabe-se

ainda que, 3% dos candidatos inscritos são aprovados.

(a) Qual a probabilidade de que um candidato inscrito estude muito para o concurso?

(b) Qual a probabilidade de um candidato ser aprovado no concurso dado que não estu-

dou muito?

(c) Qual a probabilidade de um candidato estudar muito dado que não foi aprovado no

concurso?

15. A empresa M & B tem 15.800 empregados classicados quanto ao setor onde trabalha,

idade e sexo, de acordo com a Tabela 4.5:

Tabela 4.5: Atributos dos funcionários.

Setor SexoIdade

< 25 anos 25 a 40 anos > 40 anos

AdministrativoMasculino 1100 2300 2000

Feminino 900 2200 1800

TécnicoMasculino 600 1400 1400

Feminino 200 1100 800

Determine a probabilidade de escolhermos, ao acaso,

(a) Um empregado com 40 anos de idade ou menos;

(b) Um empregado do sexo feminino com pelo menos 25 anos;

(c) Dentre os funcionários do setor técnico, um que tenha 40 anos de idade ou menos;

(d) Um empregado do setor administrativo, sabendo-se que é do sexo masculino.

16. No Brasil, a probabilidade de que um indivíduo, aleatoriamente sorteado, goste de fu-

tebol é 1/4, enquanto que a probabilidade dele gostar de novela é 1/2. Determine a

probabilidade de que goste de futebol e não de novela, nos seguintes casos:

(a) Se gostar de futebol e novela são eventos disjuntos;

Estatística Econômica Magalhães, T. M.

Page 57: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 45

(b) Se gostar de futebol e novela são eventos independentes;

(c) Se todos que gostam de futebol gostam de novela;

(d) Se a probabilidade de gostar de futebol e de novela é 1/16;

(e) Se dentre os que não gostam de novela, a probabilidade de não gostar de futebol é

1/4.

17. Em uma pesquisa feita pelo Instituto de Pesquisa do Norte (IPEN), em 2012, vericou-se

que em Manaus-AM, 10,7% dos homens e 7,4% das mulheres torcem para o Palmeiras.

Sabe-se que em 2012, 51,2% dos manauaras eram do sexo feminino.

(a) Qual a probabilidade de um habitante de Manaus selecionado ao acaso ser palmei-

rense?

(b) Se um habitante de Manaus, selecionado ao acaso, arma que é palmeirense, qual a

probabilidade do manauara ser do sexo feminino?

18. Numa pesquisa sobre os hábitos de fumar de uma população, constatou-se que 75% dos

homens entrevistados fumam, 47% das mulheres fumam e 60% dos entrevistados eram ho-

mens. Para uma pessoa aleatoriamente sorteada dessa população, calcule a probabilidade

de:

(a) Fumar;

(b) Não fumar, sabendo-se que é homem;

(c) Ser uma mulher, sabendo-se que não fuma.

19. Em um certo colégio, 4% dos alunos e 1% das alunas tem mais que 160cm de altura.

Além disso, 60% dos estudantes são do sexo feminino. Se um estudante é selecionado

aleatoriamente e tem mais de 160cm, qual a probabilidade deste estudante ser do sexo

feminino?

Estatística Econômica Magalhães, T. M.

Page 58: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

4.6. EXERCÍCIOS 46

Estatística Econômica Magalhães, T. M.

Page 59: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 5

Variável aleatória

5.1 Variável aleatória

Sejam um experimento ε e Ω o seu respectivo espaço amostral, isto é, todos valores possíveis

de ε. Denimos como variável aleatória (VA) qualquer função que associe cada elemento de Ω

a um número real.

Exemplos.

1. Sejam ε: o lançamento de duas moedas honestas, e X a variável aleatória que conta o

número de faces caras voltadas para cima após o lançamento. Denindo c para face

cara e c para face coroa, temos que

Ω = (cc), (cc), (cc), (cc)

↓ X

X = 0, 1, 2 (⊂ R)

2. Sejam ε: o lançamento de um dado honesto, e Y a variável aleatória que eleva ao quadrado

e subtrai 7 o valor da face voltada para cima. Como mostra a Tabela 5.1, todos os valores

possíveis do experimentos são as faces 1 a 6 e todos os valores possíveis de Y são os valores

-6, -3, 2, 9, 18, 29.

47

Page 60: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.1. VARIÁVEL ALEATÓRIA 48

Tabela 5.1: Conjuntos Ω e Y associados ao experimento ε e a VA Y , respectivamente.

Ω

Y -6 -3 2 9 18 29

Suporte. É o conjunto com todos os valores possíveis de uma variável aleatória. A notação

costuma ser uma versão estilizada da letra (maiúscula) que representa a VA. Por exemplo, X

é o suporte da VA X.

Exemplos (continuação). Para os experimentos e VA descritos anteriormente, temos que

1. Todos os valores possíveis para X são X = 0, 1, 2;

2. Todos os valores possíveis para Y são Y = −6,−3, 2, 9, 18, 29.

5.1.1 Variável aleatória discreta

Uma VA é discreta (VAD) se todos os seus possíveis valores são contáveis, enumeráveis.

Exemplos.

1. X: O número de eleitores do partido dos Democratas na cidade de Smallville. X =

0, 1, . . . ,M, em que M é o número de eleitores em Smallville.

2. Y : A quantidade de pacotes do álbum da copa do mundo comprados até encontrar a

gurinha do Neymar. Y = 1, 2, . . ..

3. Z: O número de erros tipográcos na página 2 da apostila do professor Girafales. Z =

0, 1, . . ..

5.1.2 Variável aleatória contínua

Uma VA é contínua (VAC) se for denida como uma medição de uma quantidade.

Estatística Econômica Magalhães, T. M.

Page 61: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.2. DISTRIBUIÇÃO DE PROBABILIDADES 49

Exemplos.

1. X: A proporção de eleitores do partido dos Democratas na cidade de Smallville. X =

[0, 1].

2. Y : O tempo entre o início da greve dos caminhoneiros e o governo iniciar as negociações.

Y = [0,∞).

3. Z: O resultado nanceiro ao investir em ações da Petrobras.

Z = (−∞,∞).

5.2 Distribuição de probabilidades

Descrevem a aleatoriedade inerente a um determinado evento de interesse, respeitando al-

gumas suposições, isto é, quanticam todos os possíveis valores de uma variável aleatória.

Exemplo. A distribuição de probabilidades para a variável aleatória X: número de caras em

um lançamento de duas moedas, é dada por

Tabela 5.2: Distribuição de probabilidades de X.

X 0 1 2

P(X) 1/4 2/4 1/4

Função de probabilidades. SejaX uma variável aleatória discreta, isto é, X = x1, x2, . . . , xn ⊂

R. Denimos como função (ou distribuição) de probabilidades,

p(x) = P(X = x),

a função que determina a probabilidade X assumir um valor particular x, ∀x ∈ R.

Adicionalmente, p(x) respeita as seguintes condições:

1. 0 ≤ p(x) ≤ 1, para x ∈ X ;

2. p(x) = 0, para x /∈ X ;

Estatística Econômica Magalhães, T. M.

Page 62: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.2. DISTRIBUIÇÃO DE PROBABILIDADES 50

3.∞∑

x=−∞

p(x) =∑x∈X

p(x) = 1.

Em palavras, a probabilidade de uma VAD assumir um valor que não pertence ao seu

suporte é zero. E esta probabilidade está entre zero e um se o valor de interesse está dentro

do suporte dela. E a soma de todas das probabilidades de cada possível valor, pertecente ao

suporte, é igual a um.

Exemplo. A VA descrita na Tabela 5.2, que também pode ser representada pela Figura 5.1.

0.0

0.1

0.2

0.3

0.4

0.5

0.0 0.5 1.0 1.5 2.0Variável aleatória X

Pro

babi

lidad

es

Figura 5.1: Distribuição de probabilidades para VA X descrita na Tabela 5.2.

Função densidade de probabilidades. Chamamos uma função não negativa f(x) de função

densidade de probabilidade (FDP) de uma V.A.X quando, para qualquer conjuntoA de número

reais:

P(X ∈ A) =

∫Af(x)dx, ∀x ∈ (−∞,∞).

E f(x) tem as seguintes propriedades:

1. f(x) ≥ 0, para x ∈ X ;

Estatística Econômica Magalhães, T. M.

Page 63: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.2. DISTRIBUIÇÃO DE PROBABILIDADES 51

2. f(x) = 0, para x /∈ X ;

3.∫ ∞−∞

f(x)dx =

∫Xf(x)dx = 1.

Em palavras, a probabilidade de X pertencer a um conjunto A é calculada integrando a

FDP no conjunto A. Por exemplo,

PX ∈ (a, b) = P(a ≤ X ≤ b) =

∫ b

a

f(x)dx.

a bVariável aleatória contínua

Fun

ção

dens

idad

e de

pro

babi

lidad

es

Figura 5.2: P(a ≤ X ≤ b).

Note que, se a = b,

P(a ≤ X ≤ a) = P(X = a) =

∫ a

a

f(x)dx = 0.

Dessa maneira,

P(X ≤ a) = P(X < a) =

∫ a

−∞f(x)dx.

Estatística Econômica Magalhães, T. M.

Page 64: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.3. FUNÇÃO DISTRIBUIÇÃO ACUMULADA 52

5.3 Função distribuição acumulada

Uma função distribuição acumulada (FDA) F (x) de uma variável aleatória X, é uma função

que calcula a probabilidade de X ser menor ou igual a um valor especíco x, isto é,

F (x) = P(X ≤ x).

Uma f.d.a. F (x) tem as seguintes propriedades:

• F é não decrescente, isto é, se a < b, então F (a) < F (b);

• limx→∞

F (x) = 1;

• limx→−∞

F (x) = 0.

Caso discreto.

F (x) =x∑

t=−∞

P(X = t).

Caso contínuo.

F (x) =

∫ x

−∞f(t)dt.

Além disso,

d

dxF (x) = f(x).

5.4 Esperança

Esperança ou valor esperado de uma VAX é a média ponderada de todos os valores possíveis

que X assume. A ponderação para o valor x é a probabilidade de X = x.

Estatística Econômica Magalhães, T. M.

Page 65: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.5. VARIÂNCIA 53

Caso discreto.

E(X) =∑x∈X

xP(X = x).

Caso contínuo.

E(X) =

∫Xxf(x)dx.

X 0 1 2

P(X) 1/4 2/4 1/4

Exemplo (continuação). calculamos a esperança de X da seguinte forma:

E(X) =∑x∈X

xP(X = x) =2∑

x=0

xP(X = x)

= 0× 1

4+ 1× 2

4+ 2× 1

4

= 0 +2

4+

2

4=

4

4= 1.

Propriedades da esperança. Sejam X e Y duas variáveis aleatórias e c uma constante,

temos que:

1. E(c) = c;

2. E(X ± c) = E(X)± c;

3. E(cX) = cE(X);

4. E(X ± Y ) = E(X)± E(Y ).

5.5 Variância

A variância de uma VA X é a média ponderada da distância entre a média de X e cada

um dos valores possíveis que X assume. Assim como na esperança, a ponderação para cada

Estatística Econômica Magalhães, T. M.

Page 66: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.6. EXERCÍCIOS 54

distância é a probabilidade de X = x. Isto é, a variância mede a dispersão da V.A. X em torno

da sua média.

Var(X) = E([X − E(X)]2

)= E(X2)− [E(X)]2.

X 0 1 2

P(X) 1/4 2/4 1/4

Exemplo (continuação). calculamos a esperança de X2 da seguinte forma:

E(X2) =∑x∈X

x2P(X = x) =2∑

x=0

x2P(X = x)

= 02 × 1

4+ 12 × 2

4+ 22 × 1

4

= 0 +2

4+

4

4=

6

4=

3

2.

Pela denição de variância:

Var(X) = E(X2)− [E(X)]2 =3

2− [1]2 =

3

2− 1 =

1

2.

Propriedades da variância. Sejam X e Y duas variáveis aleatórias independentes e c uma

constante, temos que:

1. Var(c) = 0;

2. Var(X ± c) = Var(X);

3. Var(cX) = c2Var(X);

4. Var(X ± Y ) = Var(X) + Var(Y ).

5.6 Exercícios

1. Considere uma urna em que temos 4 bolas brancas e 6 bolas pretas. Vamos retirar, ao

acaso, 3 bolas, uma após a outra e sem reposição. Seja X: o número de bolas brancas.

Estatística Econômica Magalhães, T. M.

Page 67: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.6. EXERCÍCIOS 55

Construa a distribuição de probabilidades da VA X.

2. Em uma classe, há 6 homens e 3 mulheres. Sorteados 3 alunos, ao acaso e sem reposição,

dena X: o número de homens sorteados.

(a) Escrever o suporte da VA X.

(b) Construa a distribuição de probabilidades da VA X.

(c) Calcular a esperança de X.

(d) Calcular a moda de X.

(e) Calcular o desvio padrão de X.

(f) Calcular a esperança de Y = 2X − 1.

(g) Calcular a variância de Z = 3X − 2.

(h) Refazer os itens anteriores para o caso com reposição.

(i) Refazer os itens anteriores para o caso em que há 6 homens e 2 mulheres.

(j) Refazer os itens anteriores para o caso em que há 20 homens e 20 mulheres.

3. O jogo consiste em se atirar um dado, se der faces 2 ou 5, a pessoa ganha R$ 50 por ponto

obtido; se der faces 1 ou 6, a pessoa ganha R$ 100 por ponto obtido; se der faces 3 ou 4,

a pessoa paga R$ 150 por ponto obtido. Responda: o jogo é honesto? Calcule o desvio

padrão da distribuição.

4. Seja X a diferença entre o número de caras e coroas obtidas após o lançamento de uma

moeda 3 vezes.

(a) Escreva os valores possíveis da VA X.

(b) Construa a distribuição de probabilidades da VA X.

(c) Calcular a esperança de X.

(d) Calcular a variância de X.

(e) Refazer os itens anteriores para o caso com n lançamentos.

Estatística Econômica Magalhães, T. M.

Page 68: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

5.6. EXERCÍCIOS 56

Estatística Econômica Magalhães, T. M.

Page 69: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Capítulo 6

Distribuições

Algumas variáveis aleatórias se destacam por serem facilmente encontradas na natureza ou

por terem uma grande aplicabilidade. Neste capítulo apresentaremos as principais VA, junta-

mente com os experimentos que as descrevem, as distribuições de probabilidades, as esperanças

e as variâncias.

6.1 Distribuição de Bernoulli

Experimento de Bernoulli. Um experimento com apenas dois resultados possíveis: su-

cesso ou fracasso, em que P(sucesso) = p e P(fracasso) = 1−p, p é um valor entre zero e um,

não necessariamente conhecido.

Exemplos:

1. Lançamento de uma moeda e o interesse ser a face cara;

2. Lançamento de um dado e o interesse ser por faces pares;

3. O tempo de vida de uma lâmpada ser maior que 8 anos;

4. O corpo de um paciente não rejeitar um novo orgão transplantado.

VA de Bernoulli. Seja a variável aleatória X: a ocorrência de sucesso em um experimento

de Bernoulli, com probabilidade de sucesso p. Então, a VA X tem distribuição de Bernoulli

57

Page 70: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.1. DISTRIBUIÇÃO DE BERNOULLI 58

com probabilidade p e com distribuição de probabilidades dada por

X 0 1

P(X) 1− p p

p = 0.2

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00x

p(x)

(a) Probabilidade de sucesso igual a 0,2.

p = 0.7

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00x

p(x)

(b) Probabilidade de sucesso igual a 0,7.

Figura 6.1: Distribuição de probabilidades de uma VA Bernoulli.

A função de probabilidades de uma Bernoulli é dada por:

P(X = x) = px(1− p)1−x,

em que p ∈ (0, 1) e x ∈ 0, 1. Note que,

P(sucesso) = P(X = 1) = p1(1− p)1−1 = p,

P(fracasso) = P(X = 0) = p0(1− p)1−0 = 1− p.

A esperança e a variância são, respectivamente:

E(X) = p e Var(X) = p(1− p).

Estatística Econômica Magalhães, T. M.

Page 71: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.2. DISTRIBUIÇÃO DE BINOMIAL 59

6.2 Distribuição de binomial

Experimento binomial. Um experimento binomial tem 3 características:

1. uma realização com n repetições independentes;

2. cada repetição admite apenas dois resultados: sucesso ou fracasso;

3. a probabilidade de sucesso não se altera em cada repetição.

Observação. Um experimento binomial é a soma dos resultados de n experimentos inde-

pendentes de Bernoulli. O valor de n é conhecido, mas a probabilidade de sucesso p não é

necessariamente conhecida.

VA binomial. Seja X: o número de sucessos em um experimento binomial, com n repetições

e probabilidade de sucesso p. Então, a VA X tem distribuição binomial, com parâmetros n e

p, de forma alternativa,

X ∼ binomial(n, p) ou X ∼ bin(n, p).

A função de probabilidades de uma VA X ∼ binomial(n, p) é dada por:

P(X = x) =

(n

x

)px(1− p)n−x,

em que p ∈ (0, 1) e x ∈ 0, 1, . . . , n. A esperança e variância de X são dadas, respectivamente,

por

E(X) = np e Var(X) = np(1− p).

Exemplo. Seja X uma VA binomial com 4 repetições e probabilidade de sucesso igual a

1. p = 0, 2;

2. p = 0, 7.

As distribuições de probabilidades são

Estatística Econômica Magalhães, T. M.

Page 72: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.3. DISTRIBUIÇÃO GEOMÉTRICA 60

Tabela 6.1: Distribuição de probabilidades da VA X para n = 4 e p = 0,2 e 0,7.

p X 0 1 2 3 4

0,2P(X)

256/625 256/625 96/625 16/625 1/625

0,7 81/10000 189/2500 367/1387 1029/2500 2401/10000

0.00

0.25

0.50

0.75

1.00

0 1 2 3 4x

p(x)

(a) n = 4 e p = 0, 2.

0.00

0.25

0.50

0.75

1.00

0 1 2 3 4x

p(x)

(b) n = 4 e p = 0, 7.

Figura 6.2: Distribuição de probabilidades de uma VA binomial.

6.3 Distribuição geométrica

Experimento geométrico. Um experimento geométrico tem 3 características:

1. a realização de indenidas repetições independentes até a ocorrência do resultado dese-

jado;

2. cada repetição admite apenas dois resultados: sucesso ou fracasso;

3. a probabilidade de sucesso não se altera em cada repetição.

A probabilidade de sucesso não se altera, porém ela pode ser desconhecida.

VA geométrica. Seja X: o número de fracassos até a ocorrência do primeiro sucesso em

um experimento geométrico, com probabilidade de sucesso p. Então, a VA X tem distribuição

Estatística Econômica Magalhães, T. M.

Page 73: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.3. DISTRIBUIÇÃO GEOMÉTRICA 61

geométrica, com probabilidade p, de forma alternativa,

X ∼ geométrica(p) ou X ∼ geom(p).

Exemplo. Comprar pacotes do álbum da Copa do Mundo de 2018 até encontrar a primeira

gurinha do Gabriel Jesus (GJ). Seja X: o número de pacotes comprados sem a gurinha do

GJ até o pacote premiado. Então, se encontramos:

• no primeiro pacote comprado, tivemos 0 fracassos (X = 0),

• no segundo pacote, tivemos 1 fracasso (X = 1),

• no terceiro, tivemos 2 fracassos (X = 2),

• ...

A função de probabilidades de uma VA X ∼ geométrica(p) é dada da seguinte forma:

P(X = x) = p(1− p)x,

em que p ∈ (0, 1) e x ∈ 0, 1, 2, . . .. Com esperança e variância dadas, respectivamente, por,

E(X) =1− pp

e Var(X) =1− pp2

.

VA geométrica (forma alternativa). Seja Y : o número de repetições até a ocorrência do

primeiro sucesso em um experimento geométrico, com probabilidade de sucesso p. Então, a VA

Y tem distribuição geométrica, com probabilidade p. Além disso, temos que Y = X + 1. Com

função de probabilidades dada por

P(Y = y) = p(1− p)y−1,

em que p ∈ (0, 1) e y ∈ 1, 2, . . .. E,

E(Y ) =1

pe Var(Y ) =

1− pp2

.

Estatística Econômica Magalhães, T. M.

Page 74: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.4. DISTRIBUIÇÃO BINOMIAL NEGATIVA 62

Exemplo (continuação). Comprar pacotes do álbum da Copa do Mundo de 2018 até en-

contrar a primeira gurinha do Gabriel Jesus. Seja Y : o número total de pacotes comprados

até o pacote premiado. Então, se encontramos:

• no primeiro pacote comprado, tivemos 1 repetição (Y = 1),

• no segundo pacote, tivemos 2 repetições (Y = 2),

• no terceiro, tivemos 3 repetições (Y = 3),

• ...

0.00

0.25

0.50

0.75

1.00

0 3 6 9x

p(x)

(a) p = 0, 2.

0.00

0.25

0.50

0.75

1.00

0 3 6 9x

p(x)

(b) p = 0, 7.

Figura 6.3: Distribuição de probabilidades de uma VA geométrica.

6.4 Distribuição binomial negativa

Experimento binomial negativo. Um experimento binomial negativo tem 3 caracterís-

ticas:

1. a realização de indenidas repetições independentes até a ocorrência de r resultados

desejados;

2. cada repetição admite apenas dois resultados: sucesso ou fracasso;

3. a probabilidade de sucesso não se altera em cada repetição.

Estatística Econômica Magalhães, T. M.

Page 75: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.4. DISTRIBUIÇÃO BINOMIAL NEGATIVA 63

Observação. Um experimento binomial negativo é a soma dos resultados de r experimen-

tos independentes geométrico. A quantidade r é conhecida e a probabilidade p poderá ser

desconhecida, mas sempre será assumida igual em cada repetição do experimento.

VA binomial negativa. Seja X: o número de fracassos até a ocorrência do r-ésimo sucesso

em um experimento binomial negativo, com probabilidade de sucesso p. Então, a VA X tem

distribuição binomial negativa, com r sucessos e probabilidade p, de forma alternativa,

X ∼ binomial negativa(r, p) ou X ∼ bn(r, p).

A função de probabilidades de uma VA X ∼ binomial negativa(r, p) é dada da seguinte

forma:

P(X = x) =

(r + x− 1

x

)pr(1− p)x,

em que p ∈ (0, 1) e x ∈ 0, 1, 2, . . .. E,

E(X) =r(1− p)

pe Var(X) =

1− pp2

.

VA binomial negativa (forma alternativa). Seja Y : o número de repetições até a ocor-

rência do r-ésimo sucesso em um experimento binomial negativa, com probabilidade de sucesso

p. Então, a VA Y tem distribuição binomial negativa, com r sucessos e probabilidade p. Além

disso, temos que Y = X + r. Com função de probabilidades dada por

P(Y = y) =

(y − 1

r − 1

)pr(1− p)y−r,

em que p ∈ (0, 1) e y ∈ r, r + 1, . . .. E,

E(Y ) =r

pe Var(Y ) =

r(1− p)p2

.

Estatística Econômica Magalhães, T. M.

Page 76: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.5. DISTRIBUIÇÃO HIPERGEOMÉTRICA 64

0.00

0.25

0.50

0.75

1.00

0 3 6 9x

p(x)

(a) r = 3 e p = 0, 2.

0.00

0.25

0.50

0.75

1.00

0 3 6 9x

p(x)

(b) r = 3 e p = 0, 7.

Figura 6.4: Distribuição de probabilidades de uma VA binomial negativa.

6.5 Distribuição hipergeométrica

Experimento hipergeométrico. Um experimento hipergeométrico tem 3 características:

1. Uma amostra sem reposição de tamanho n será retirada de uma população com N

elementos;

2. cada elemento é classicado como sucesso ou fracasso;

3. existem K sucessos e N −K fracassos na população.

VA hipergeométrica. Seja X: o número de sucessos em uma amostra de tamanho n, reti-

rada de uma população de tamanho N . Então, a VA X tem distribuição hipergeométrica, com

K sucessos, em uma população de tamanho N e amostra de tamanho n, de forma alternativa,

X ∼ hipergeométrica(N,K, n) ou X ∼ hg(N,K, n).

A função de probabilidades de uma VA X ∼ hipergeométrica(N,K, n) é dada da seguinte

Estatística Econômica Magalhães, T. M.

Page 77: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.6. DISTRIBUIÇÃO DE POISSON 65

forma:

P(X = x) =

(K

x

)(N −Kn− x

)(N

n

) ,

em que N ∈ 0, 1, 2, . . ., K ∈ 0, 1, 2, . . . , N, n ∈ 0, 1, 2, . . . , N e x ∈ max(0, n + K −

N), . . . ,min(n,K). E,

E(Y ) = nK

Ne Var(Y ) = n

K

N

(N −K)

N

N − nN − 1

.

0.00

0.25

0.50

0.75

1.00

0 1 2 3x

p(x)

(a) n = 2.

0.00

0.25

0.50

0.75

1.00

0 1 2 3x

p(x)

(b) n = 7.

Figura 6.5: Distribuição de probabilidades de uma VA hipergeométrica (10, 3, n).

6.6 Distribuição de Poisson

Distribuição de Poisson. Chamamos de um experimento de Poisson, experimentos que

contam o número de sucessos em um intervalo contínuo ou região especicada.

Exemplos:

1. número de chamadas telefônicas em uma central no período de 1 hora;

Estatística Econômica Magalhães, T. M.

Page 78: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.7. DISTRIBUIÇÃO UNIFORME 66

2. número de navios que chegam no porto de Santos no período de uma semana;

3. número de defeitos observados em uma parede de 3× 3m.

A distribuição de probabilidades de uma Poisson é dada por:

P(X = x) = e−λλx

x!,

em que λ ∈ (0,∞) e x ∈ 0, 1, . . .. Temos que,

E(X) = Var(X) = λ.

0.0

0.1

0.2

0.3

0.4

0.5

0 5 10 15x

p(x)

(a) λ = 2.

0.0

0.1

0.2

0.3

0.4

0.5

0 5 10 15x

p(x)

(b) λ = 7.

Figura 6.6: Distribuição de probabilidades de uma VA Poisson.

6.7 Distribuição uniforme

Uma VA X é uniforme no intervalo (a, b) se a probabilidade de um evento ocorrer, dentro

do intervalo (a, b), é proporcional ao comprimento do intervalo no qual o evento está contido.

A VA X pode ser denotada como

X ∼ uniforme(a, b) ou X ∼ U(a, b).

Estatística Econômica Magalhães, T. M.

Page 79: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.8. DISTRIBUIÇÃO EXPONENCIAL 67

Se X ∼ U(a, b), sua função densidade de probabilidade é dada por

f(x) =1

b− a,

em que x ∈ (a, b), a ∈ R, b ∈ R e a < b. E sua função distribuição acumulada é dada por

F (x) = P(X ≤ x) =x− ab− a

,

em que x ∈ (a, b), a ∈ R, b ∈ R e a < b. Nas Figuras 6.7 e 6.8, apresentamos, respectivamente,

a FDP e a FDA de forma geral e para valores especícos de a e b.

1

b − a

a bx

f(x)

(a) FDP.

0.00

0.25

0.50

0.75

1.00

a bx

F(x

)

(b) FDA.

Figura 6.7: VA uniforme(a, b).

Temos também que, se X ∼ U(a, b), então

E(X) =a+ b

2e Var(X) =

(b− a)2

12.

6.8 Distribuição exponencial

Seja um evento P , que ocorre de forma independente e com taxa de ocorrência λ, constante.

A VA X que mede o tempo entre duas ocorrências de P é chamada exponencial, com taxa λ.

Estatística Econômica Magalhães, T. M.

Page 80: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.8. DISTRIBUIÇÃO EXPONENCIAL 68

0.00

0.25

0.50

0.75

1.00

0 1 2 3 4 5x

f(x)

U(2, 3) U(1, 3) U(1, 4)

(a) FDP.

0.00

0.25

0.50

0.75

1.00

0 1 2 3 4 5x

F(x

)

U(2, 3) U(1, 3) U(1, 4)

(b) FDA.

Figura 6.8: VA uniforme para diferentes intervalos (a, b).

A VA X pode ser denotada por

X ∼ exponencial(λ) ou X ∼ exp(λ).

Se X ∼ exp(λ), sua FDP é dada por

f(x) = λe−λx,

em que x ∈ (0,∞) e λ > 0. E sua FDA é dada por

F (x) = P(X ≤ x) = 1− e−λx,

em que x ∈ (0,∞) e λ > 0. Na Figura 6.9, apresentamos a FDP e a FDA para valores

especícos de λ.

Se X ∼ exp(λ), então

E(X) =1

λe Var(X) =

1

λ2.

Comentários.

Estatística Econômica Magalhães, T. M.

Page 81: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.8. DISTRIBUIÇÃO EXPONENCIAL 69

0.0

0.5

1.0

1.5

2.0

0 1 2 3x

f(x)

Exp(0,5) Exp(1,0) Exp(2,0)

(a) FDP.

0.00

0.25

0.50

0.75

1.00

0.0 2.5 5.0 7.5 10.0x

F(x

)

Exp(0,5) Exp(1,0) Exp(2,0)

(b) FDA.

Figura 6.9: VA exponencial para diferentes valores de λ.

• É a versão contínua da distribuição geométrica;

• Tem a propriedade da perda de memória, isto é,

P(X > x+ t|X > t) = P(X > x), ∀x, t ≥ 0.

Suponha que um evento P ocorreu há t minutos, a propriedade quer dizer que, a probabilidade

de um novo evento P precisar de mais x minutos para acontecer novamente, em um total

de x + t entre as duas ocorrências, sabendo que já se passaram t minutos é simplesmente a

probabilidade de um novo evento P precisar de mais x para acontecer. Então, o conhecimento

de quando o último evento ocorreu é irrelevante.

Forma alternativa. A FDP e FDA de uma VA exponencial pode ser escrita em função de

sua média. Seja µ = E(X) = 1/λ, a FDP da VA X ∼ exp(µ), ca denida como

f(x) =1

µe−(1/µ)x,

Estatística Econômica Magalhães, T. M.

Page 82: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.9. DISTRIBUIÇÃO NORMAL 70

em que x ∈ (0,∞) e µ > 0. E sua FDA,

F (x) = P(X ≤ x) = 1− e−(1/µ)x,

Se X ∼ exp(µ), então

E(X) = µ e Var(X) = µ2.

Reescrever a função densidade de probabilidade de uma variável aleatória exponencial em

função da média é bastante útil no contexto de Modelos de Regressão, onde há a suposição de

que o comportamento de um fenômeno, no caso, caracterizado por uma VA exponencial, pode

ser descrito por outras condições, variáveis.

6.9 Distribuição normal

Uma variável aleatória X tem distribuição normal com parâmetros µ e σ2, denotada por

X ∼ N(µ, σ2) ou X ∼ normal(µ, σ2), se sua função densidade de probabilidade é dada por

f(x) =1

σ√

2πexp

−1

2

(x− µσ

)2, (6.1)

em que x ∈ R, µ ∈ R e σ2 > 0. Na Figura 6.10, apresentamos a FDP e a FDA de uma VA

normal para valores especícos de µ e σ2.

Nota. A distribuição normal tem origem nos trabalhos de Gauss (1809), sobre erros de ob-

servações astronômicas, por isso também ela é conhecida como distribuição gaussiana.

Propriedades:

1. f(x) é simétrica em relação à µ, isto é, f(x+ µ) = f(µ− x);

2. f(x) tem valor máximo quando x = µ e este valor é 1/σ√

2π;

3. f(x)→ 0 quando x→ ±∞;

Estatística Econômica Magalhães, T. M.

Page 83: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.9. DISTRIBUIÇÃO NORMAL 71

0.00

0.05

0.10

0.15

−10 0 10 20 30x

f(x)

N(10, 5) N(5, 5) N(10, 1)

(a) FDP.

0.00

0.25

0.50

0.75

1.00

−10 0 10 20x

F(x

)

N(10, 5) N(5, 5) N(10, 1)

(b) FDA.

Figura 6.10: VA normal para diferentes valores de µ e σ2.

4. f(x) tem dois pontos de inexão: µ− σ e µ+ σ.

Se X ∼ N(µ, σ2), então

E(X) = µ e Var(X) = σ2,

isto é, os parâmetros que caracterizam um VA normal são a média e a variância. Eles também

servem para quanticar a massa de probabilidade abaixo da curva normal. Por exemplo, entre

µ − 3σ e µ + 3σ, a área sob a curva normal é 0,997. A Figura 6.11 apresenta mais algumas

relações entre esses parâmetros.

6.9.1 Importância da normal

Importância prática. Inúmeros fenômenos encontrados no mundo real podem ser descritos

como uma distribuição normal. Menções à distribuição normal podem ser encontradas até

mesmo na Cultura Pop, como na série de TV The Simpsons e no livroO parque dos dinossauros

(Crichton 2009).

Importância teórica. A distribuição normal é uma distribuição limite, isto é, sob algumas

condições, outras variáveis aleatórias podem ser aproximadas pela VA normal. Este resultado

Estatística Econômica Magalhães, T. M.

Page 84: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.9. DISTRIBUIÇÃO NORMAL 72

0.0015

0.02350.135

0.34 0.34

0.1350.0235

0.0015

1

2πσ2

− ∞ µ − 3σ µ − 2σ µ − σ µ µ + σ µ + 2σ µ + 3σ + ∞x

f(x)

Figura 6.11: FDP de uma VA normal em função de µ e σ2.

é conhecido por Teorema Central do Limite.

Exemplos de aplicação da variável aleatória normal na área da saúde podem serem encon-

trados em Magalhães e Diniz (2020).

6.9.2 Distribuição normal padrão

Se X tem distribuição normal com parâmetros µ e σ2, e denimos uma nova variável, Z,

da seguinte forma,

Z =X − µσ

,

então Z tem distribuição normal de parâmetros 0 e 1, sua FDP. é dada por

f(z) =1√2π

exp

−z

2

2

,

em que z ∈ R, ou seja, a FDP de Z é a mesma de X, apresentada em (6.1), substituindo µ por

0 e σ2 por 1.

Propriedades:

Estatística Econômica Magalhães, T. M.

Page 85: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.9. DISTRIBUIÇÃO NORMAL 73

1

−2 0 2x

f(x)

(a) FDP.

0.00

0.25

0.50

0.75

1.00

−2 −1 0 1 2x

F(x

)(b) FDA.

Figura 6.12: VA normal padrão.

1. f(z) é simétrica em relação ao 0, isto é, f(z) = f(−z);

2. f(z) tem valor máximo quando z = 0 e este valor é 1/√

2π;

3. f(z)→ 0 quando z → ±∞;

4. f(z) tem dois pontos de inexão: −1 e 1.

Se Z ∼ N(0, 1), então

E(Z) = 0 e Var(Z) = 1.

6.9.3 Resultados

Se X1, X2, . . . , Xn são variáveis aleatórias independentes, e cada uma delas tem distribuição

N(µ, σ2), então

X =X1 +X2 + · · ·+Xn

n∼ N(µ, σ2/n)

isto é, a média de variáveis aleatórias normais também tem distribuição normal. Podemos

Estatística Econômica Magalhães, T. M.

Page 86: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 74

também padronizar a VA X, dessa forma,

Z =X − µσ/√n∼ N(0, 1).

6.10 Aproximação da binomial pela normal

Se X tem distribuição binomial com n repetições e probabilidade de sucesso p e, adicional-

mente,

np ≥ 5 e p ≤ 1/2,

a VA X pode ser considerada também, aproximadamente, como uma VA normal com média

np e variância np(1− p).

Exemplo. Uma VA X ∼ bin(10, 1/2). Como n × p = 10 × 1/2 = 5(≥ 5) e p ≤ 1/2, temos

que X tem, aproximadamente, uma distribuição normal de média µ = n× p = 10× 1/2 = 5 e

variância σ2 = n× p× (1− p) = 10× 1/2× 1/2 = 2, 5. A Figura 6.13 apresenta a distribuição

de probabilidades de uma binomial(10, 1/2) e a função densidade de probabilidade de uma

normal(5, 2, 5).

Estatística Econômica Magalhães, T. M.

Page 87: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 75

0.00

0.05

0.10

0.15

0.20

0.25

0.0 2.5 5.0 7.5 10.0x

p(x)

Bin(10, 0.5) N(5, 2.5)

Figura 6.13: Distribuição de probabilidades de uma bin(10, 1/2) e a FDP de uma normal(5, 2, 5).

Estatística Econômica Magalhães, T. M.

Page 88: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

6.10. APROXIMAÇÃO DA BINOMIAL PELA NORMAL 76

Estatística Econômica Magalhães, T. M.

Page 89: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

Referências Bibliográcas

Beall, G. (1942), `The transformation of data from entomological eld experiments', Journal of

Economic Behavior & Organization 29, 243262.

Crichton, M. (2009), O parque dos dinossauros, L&PM, Porto Alegre.

Ezekiel, M. (1930), Methods of Correlation Analysis, Wiley, New York.

Gauss, C. F. (1809), Theoria motus corporum coelestium in sectionibus conicis solem ambien-

tium, s.n., Hamburgi.

Magalhães, T. M. e Diniz, M. A. (2020), Normalidade dos dados: suposições, transformações e

valores atípicos, in A. Lunardi, ed., `Manual de pesquisa clínica aplicada à saúde', Blucher,

São Paulo, chapter 27, pp. 349364.

Molyneaux, L., Gilliam, S. K. e Florant, L. C. (1947), `Dierences in virginia death rates by

color, sex, age, and rural or urban residence', American Sociological Review 12, 525535.

Morettin, P. A. e Toloi, C. M. (2004), Análise de Séries Temporais, Edgard Blücher, São Paulo.

R Core Team (2017), R: A Language and Environment for Statistical Computing, R Foundation

for Statistical Computing, Vienna, Austria.

Selvin, S. (1975a), `On the monty hall problem (letter to the editor)', American Statistician

29(3), 134.

Selvin, S. (1975b), `A problem in probability (letter to the editor)', American Statistician

29(1), 6771.

Wickham, H. (2009), ggplot2: Elegant Graphics for Data Analysis, Springer-Verlag New York.

77

Page 90: ESTATÍSTICA ECONÔMICA ufjf.br/tiago magalhaes · 2020. 8. 27. · Lista de abTelas xi 1 Conceitos iniciais 1 ... De maneira mais simples, ao invés de termos que listar todas maneiras,

ufjf.br/tiago_magalh

aes

REFERÊNCIAS BIBLIOGRÁFICAS 78

Estatística Econômica Magalhães, T. M.