1
Medida de Tendência Central
um valor no centro ou no meio
de um conjunto de dados
2
Média(Média Aritmética)
o número obtido somando-se todos os valores de um conjunto de dados,
dividindo-se pelo total de elementos deste conjunto de dados.
Definições
3
Notação Σ denota somatório de um conjunto de valores.
x é a variável usada para representar valores individuais dos dados
n representa o número de valores em uma amostra
N representa o número de todos os valores de uma população.
4
Notação
µ (minúscula grega ‘mu’) e denota a média de todos os valores de uma população
pronuncia-se ‘x-barra’ e denota a média de um conjunto de valores amostrais
x = nΣ x
x
Nµ =
Σ x
Calculadoras fornecem a média dos dados
5
DefiniçõesMedianavalor do meio de um conjunto de valores, quando estes estão dispostos em ordem crescente (ou decrescente).
geralmente denotada por x (lê-se ‘x-til’)
não é afetada por valores extremos
~
6
6,72 3,46 3,60 6,44
3,46 3,60 6,44 6,72
não há um meio exato -- média de dois valores
3.60 + 6.442
(número par de valores)
MEDIANA é 5,02
6,72 3,46 3,60 6,44 26,70
3,46 3,60 6,44 6,72 26,70(número ímpar de valores)
há um meio exato MEDIANA é 6,44
7
DefiniçõesModa
o valor que ocorre mais freqüentementeBimodal
MultimodalAmodal
denotada por MÉ a única medida de tendência central que pode ser
usada com dados nominais
8
Exemplos
a. 5 5 5 3 1 5 1 4 3 5
b. 1 2 2 2 3 4 5 6 6 6 7 9
c. 1 2 3 6 7 8 9 10
Moda é 5
Bimodal - 2 e 6
Amodal
9
DefiniçõesPonto médio
o valor que está a meio caminho entre o maior e o menor valor do conjunto de dados.
Ponto médio= maior valor + menor valor
2
10
Média de uma Tabela de Freqüências
usar pontos médios das classes da variável x
x = Formula 2-2fΣ (f • x)
Σx = ponto médio da classe
f = freqüência
Σ f = n
11
Média Ponderada
x =w
Σ (w • x)Σ
12
Melhor Medida de Tendência CentralVantagens - Desvantagens
Tabela 2-13
13
DefiniçõesSimétricaDados são simétricos se a metade esquerda de seu histograma é aproximadamente a imagem-espelho da metade direita.
AssimétricaUma distribuição de dados é assimétrica quando não é simétrica.
14
Assimetria
Moda = Média = Mediana
SIMÉTRICA
Média Mediana
Média Mediana
Moda Moda
ASSIMÉTRICA À DIREITA(negativamente) ASSIMÉTRICA À ESQUERDA
(positivamente)
15
Tempo de Espera de Clientes em Diferentes Bancos
em minutos
Banco A
Banco B
6,5
4,2
6,6
5,4
6,7
5,8
6,8
6,2
7,1
6,7
7,3
7,7
7,4
7,7
7,7
8,5
7,7
9,3
7,7
10,0
16
Tempo de Espera de Clientes em Diferentes Bancos
em minutos
Banco A
Banco B
6,5
4,2
6,6
5,4
6,7
5,8
6,8
6,2
7,1
6,7
7,3
7,7
7,4
7,7
7,7
8,5
7,7
9,3
7,7
10,0
Banco BBanco A
7.15
7.20
7.7
7.10
7,15
7,20
7,7
7,10
Média
Mediana
Moda
Ponto médio
17
Dotplots of Waiting Times
Figura 2-1a
18
Medidas de Variação
19
Medidas de Variação
Amplitude
valormaior menor
valor
20
Medidas de Variação
Desvio-padrãouma medida de variação dos valores
em relação à média
(desvio médio em relação à média)
21
Fórmula do Desvio-padrão Amostral
Σ (x - x)2S = n - 1Fórmula 2-4
Calculadoras fornecem o desvio-padrão amostral
22
Desvio-padrão AmostralFórmula Abreviada
Fórmula 2-5
n (n - 1)n (Σx2) - (Σx)2s =
Calculadoras fornecem o desvio-padrão amostral
23
Fórmula do Desvio Absoluto Médio
Σ x - xn
24
Desvio-padrão Populacional
2Σ (x - µ)Nσ =
Calculadoras fornecem o desvio-padrão amostral
25
Medidas de Variação
Variância
Desvio-padrão ao quadrado
sσ
2
2
}Notação
26
VariânciaΣ (x - x )2
n - 1s2 = Variância
amostral
Σ (x - µ)2
Nσ 2 = Variância
populacional
27
Desvio-padrão de uma Tabela de Freqüências
Fórmula 2-6
Usar os pontos médios de classe como os valores x
n (n - 1)
n [Σ(f • x 2)] -[Σ(f • x)]2
S =
28
Regra Prática (desvio-padrão em termos de amplitude
x + 2sx - 2s x
(máximo valor)(mínimo valor)
Amplitude ≈ 4s
Amplitude4
maior valor - menor valors ≈ 4
=
29
Valores Amostrais Usuais
valor mínimo “usual” ≈ (média) - 2 (desvio-padrão)
mínimo ≈ x - 2(s)
valor máximo “usual” ≈ (média) + 2 (desvio-padrão)
máximo ≈ x + 2(s)
30
Regra Empírica(aplicada a distribuições em forma de sino)FIGURA 2-15
x - 3s x - 2s x - s x x + 2s x + 3sx + s
68% estãodentro de 1 desvio-padrão
34% 34%
95% estão dentro de 2 desvios-padrão
0.1% 0.1%2.4% 2.4%
13.5% 13.5%
99.7% dos dados estão dentro de 3 desvios-padrão a contar da média
31
Teorema de Chebyshevaplica-se a distribuições com qualquer forma.
a proporção (ou fração) de qualquer conjunto de dados a menos de K desvios-padrão a contar da média é sempre pelo menos 1 - 1/K2 , onde K é um número positivo maior do que 1.
pelo menos 3/4 (75%) de todos os valores estão no intervalo que vai de 2 desvios-padrão abaixo da média a 2 desvios-padrão acima da média.
pelo menos 8/9 (89%) de todos os valores estão no intervalo que vai de 3 desvios-padrão abaixo da média até 3 desvios-padrão acima da média.
32
Medidas de VariaçãoDado Isolado
Para um conjunto de valores típico, é raro um valor do mesmo diferir da média mais de 2 ou 3 desvios-padrão.
1
Medidas de Posição
2
Medidas de Posição
Escores z (ou escore padronizado)é o número de desvios-padrão pelo qual um dado valor x dista da média (para mais ou para menos)
3
Medidas de Posiçãoescore z
Amostra População
z = x - µσ
x - xsz =
Arredondar para 2 casas decimais
4
Interpretando Escores ZFIGURA 2-16
Valores Incomuns
Valores Incomuns
ValoresUsuais
- 3 - 2 - 1 0 1 2 3
Z
5
Medidas de Posição
Quartis, Decis,Percentis
6
Quartis
25% 25% 25% 25%
Q1, Q2, Q3dividem as observações ordenadas
em quatro partes iguais
Q3Q2Q1(mínimo) (máximo)
(mediana)
7
DecisD1, D2, D3, D4, D5, D6, D7, D8, D9
dividem os dados ordenados em dez partes iguais
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
8
Percentis
P1, P2, P3, P4, ..., P98, D99
dividem os dados ordenados em cem partes iguais
9
Quartis, Decis, Percentis
Fractis(Quantis)
dividem os dados em partes aproximadamente iguais
10
Determinação do Percentilde um dado valor de x
Percentil do valor x = • 100número de valores inferiores a x
Número total de valores
11
Determinação do valor referente a um dado percentil
n total de valores no conjunto de dados
k percentil a ser utilizado
L indicador que dá a posição de um escore
Pk k-ésimo percentil
L = • nk100
12
Início
Ordenar os dados.(do menor para o maior.) Determinação do kmo
PercentilCalcular
L = n onde
n = número de valoresk = percentil desejado
)( k100
Modificar L, arredondando seu valor para o maior inteiro mais próximo.
O valor de Pk é o Lmo
valor a contar do mais baixo.
L é um número
inteiro?
Não
O valor do kmo percentil está a meio caminho entre o Lmo valor e o próximo valor mais alto no conjunto original de dados.Obtém-se Pk somando-se o Lmo
valor ao próximo valor mais alto e dividindo-se o resultado por 2.
Sim
Figura 2-17
13
Quartis DecisQ1 = P25
Q2 = P50
Q3 = P75
D1 = P10
D2 = P20
D3 = P30
•••
D9 = P90
14
Intervalo Interquartil: Q3 - Q1
Intervalo Semi-interquartil:
Quartil Médio:
Amplitude de percentis 10-90: P90 - P10
Q3 - Q1
2
2Q1 + Q3
Top Related