Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3...

46
1 Medida de Tendência Central um valor no centro ou no meio de um conjunto de dados

Transcript of Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3...

Page 1: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

1

Medida de Tendência Central

um valor no centro ou no meio

de um conjunto de dados

Page 2: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

2

Média(Média Aritmética)

o número obtido somando-se todos os valores de um conjunto de dados,

dividindo-se pelo total de elementos deste conjunto de dados.

Definições

Page 3: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

3

Notação Σ denota somatório de um conjunto de valores.

x é a variável usada para representar valores individuais dos dados

n representa o número de valores em uma amostra

N representa o número de todos os valores de uma população.

Page 4: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

4

Notação

µ (minúscula grega ‘mu’) e denota a média de todos os valores de uma população

pronuncia-se ‘x-barra’ e denota a média de um conjunto de valores amostrais

x = nΣ x

x

Nµ =

Σ x

Calculadoras fornecem a média dos dados

Page 5: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

5

DefiniçõesMedianavalor do meio de um conjunto de valores, quando estes estão dispostos em ordem crescente (ou decrescente).

geralmente denotada por x (lê-se ‘x-til’)

não é afetada por valores extremos

~

Page 6: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

6

6,72 3,46 3,60 6,44

3,46 3,60 6,44 6,72

não há um meio exato -- média de dois valores

3.60 + 6.442

(número par de valores)

MEDIANA é 5,02

6,72 3,46 3,60 6,44 26,70

3,46 3,60 6,44 6,72 26,70(número ímpar de valores)

há um meio exato MEDIANA é 6,44

Page 7: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

7

DefiniçõesModa

o valor que ocorre mais freqüentementeBimodal

MultimodalAmodal

denotada por MÉ a única medida de tendência central que pode ser

usada com dados nominais

Page 8: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

8

Exemplos

a. 5 5 5 3 1 5 1 4 3 5

b. 1 2 2 2 3 4 5 6 6 6 7 9

c. 1 2 3 6 7 8 9 10

Moda é 5

Bimodal - 2 e 6

Amodal

Page 9: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

9

DefiniçõesPonto médio

o valor que está a meio caminho entre o maior e o menor valor do conjunto de dados.

Ponto médio= maior valor + menor valor

2

Page 10: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

10

Média de uma Tabela de Freqüências

usar pontos médios das classes da variável x

x = Formula 2-2fΣ (f • x)

Σx = ponto médio da classe

f = freqüência

Σ f = n

Page 11: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

11

Média Ponderada

x =w

Σ (w • x)Σ

Page 12: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

12

Melhor Medida de Tendência CentralVantagens - Desvantagens

Tabela 2-13

Page 13: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

13

DefiniçõesSimétricaDados são simétricos se a metade esquerda de seu histograma é aproximadamente a imagem-espelho da metade direita.

AssimétricaUma distribuição de dados é assimétrica quando não é simétrica.

Page 14: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

14

Assimetria

Moda = Média = Mediana

SIMÉTRICA

Média Mediana

Média Mediana

Moda Moda

ASSIMÉTRICA À DIREITA(negativamente) ASSIMÉTRICA À ESQUERDA

(positivamente)

Page 15: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

15

Tempo de Espera de Clientes em Diferentes Bancos

em minutos

Banco A

Banco B

6,5

4,2

6,6

5,4

6,7

5,8

6,8

6,2

7,1

6,7

7,3

7,7

7,4

7,7

7,7

8,5

7,7

9,3

7,7

10,0

Page 16: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

16

Tempo de Espera de Clientes em Diferentes Bancos

em minutos

Banco A

Banco B

6,5

4,2

6,6

5,4

6,7

5,8

6,8

6,2

7,1

6,7

7,3

7,7

7,4

7,7

7,7

8,5

7,7

9,3

7,7

10,0

Banco BBanco A

7.15

7.20

7.7

7.10

7,15

7,20

7,7

7,10

Média

Mediana

Moda

Ponto médio

Page 17: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

17

Dotplots of Waiting Times

Figura 2-1a

Page 18: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

18

Medidas de Variação

Page 19: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

19

Medidas de Variação

Amplitude

valormaior menor

valor

Page 20: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

20

Medidas de Variação

Desvio-padrãouma medida de variação dos valores

em relação à média

(desvio médio em relação à média)

Page 21: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

21

Fórmula do Desvio-padrão Amostral

Σ (x - x)2S = n - 1Fórmula 2-4

Calculadoras fornecem o desvio-padrão amostral

Page 22: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

22

Desvio-padrão AmostralFórmula Abreviada

Fórmula 2-5

n (n - 1)n (Σx2) - (Σx)2s =

Calculadoras fornecem o desvio-padrão amostral

Page 23: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

23

Fórmula do Desvio Absoluto Médio

Σ x - xn

Page 24: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

24

Desvio-padrão Populacional

2Σ (x - µ)Nσ =

Calculadoras fornecem o desvio-padrão amostral

Page 25: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

25

Medidas de Variação

Variância

Desvio-padrão ao quadrado

2

2

}Notação

Page 26: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

26

VariânciaΣ (x - x )2

n - 1s2 = Variância

amostral

Σ (x - µ)2

Nσ 2 = Variância

populacional

Page 27: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

27

Desvio-padrão de uma Tabela de Freqüências

Fórmula 2-6

Usar os pontos médios de classe como os valores x

n (n - 1)

n [Σ(f • x 2)] -[Σ(f • x)]2

S =

Page 28: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

28

Regra Prática (desvio-padrão em termos de amplitude

x + 2sx - 2s x

(máximo valor)(mínimo valor)

Amplitude ≈ 4s

Amplitude4

maior valor - menor valors ≈ 4

=

Page 29: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

29

Valores Amostrais Usuais

valor mínimo “usual” ≈ (média) - 2 (desvio-padrão)

mínimo ≈ x - 2(s)

valor máximo “usual” ≈ (média) + 2 (desvio-padrão)

máximo ≈ x + 2(s)

Page 30: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

30

Regra Empírica(aplicada a distribuições em forma de sino)FIGURA 2-15

x - 3s x - 2s x - s x x + 2s x + 3sx + s

68% estãodentro de 1 desvio-padrão

34% 34%

95% estão dentro de 2 desvios-padrão

0.1% 0.1%2.4% 2.4%

13.5% 13.5%

99.7% dos dados estão dentro de 3 desvios-padrão a contar da média

Page 31: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

31

Teorema de Chebyshevaplica-se a distribuições com qualquer forma.

a proporção (ou fração) de qualquer conjunto de dados a menos de K desvios-padrão a contar da média é sempre pelo menos 1 - 1/K2 , onde K é um número positivo maior do que 1.

pelo menos 3/4 (75%) de todos os valores estão no intervalo que vai de 2 desvios-padrão abaixo da média a 2 desvios-padrão acima da média.

pelo menos 8/9 (89%) de todos os valores estão no intervalo que vai de 3 desvios-padrão abaixo da média até 3 desvios-padrão acima da média.

Page 32: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

32

Medidas de VariaçãoDado Isolado

Para um conjunto de valores típico, é raro um valor do mesmo diferir da média mais de 2 ou 3 desvios-padrão.

Page 33: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

1

Medidas de Posição

Page 34: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

2

Medidas de Posição

Escores z (ou escore padronizado)é o número de desvios-padrão pelo qual um dado valor x dista da média (para mais ou para menos)

Page 35: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

3

Medidas de Posiçãoescore z

Amostra População

z = x - µσ

x - xsz =

Arredondar para 2 casas decimais

Page 36: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

4

Interpretando Escores ZFIGURA 2-16

Valores Incomuns

Valores Incomuns

ValoresUsuais

- 3 - 2 - 1 0 1 2 3

Z

Page 37: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

5

Medidas de Posição

Quartis, Decis,Percentis

Page 38: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

6

Quartis

25% 25% 25% 25%

Q1, Q2, Q3dividem as observações ordenadas

em quatro partes iguais

Q3Q2Q1(mínimo) (máximo)

(mediana)

Page 39: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

7

DecisD1, D2, D3, D4, D5, D6, D7, D8, D9

dividem os dados ordenados em dez partes iguais

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9

Page 40: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

8

Percentis

P1, P2, P3, P4, ..., P98, D99

dividem os dados ordenados em cem partes iguais

Page 41: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

9

Quartis, Decis, Percentis

Fractis(Quantis)

dividem os dados em partes aproximadamente iguais

Page 42: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

10

Determinação do Percentilde um dado valor de x

Percentil do valor x = • 100número de valores inferiores a x

Número total de valores

Page 43: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

11

Determinação do valor referente a um dado percentil

n total de valores no conjunto de dados

k percentil a ser utilizado

L indicador que dá a posição de um escore

Pk k-ésimo percentil

L = • nk100

Page 44: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

12

Início

Ordenar os dados.(do menor para o maior.) Determinação do kmo

PercentilCalcular

L = n onde

n = número de valoresk = percentil desejado

)( k100

Modificar L, arredondando seu valor para o maior inteiro mais próximo.

O valor de Pk é o Lmo

valor a contar do mais baixo.

L é um número

inteiro?

Não

O valor do kmo percentil está a meio caminho entre o Lmo valor e o próximo valor mais alto no conjunto original de dados.Obtém-se Pk somando-se o Lmo

valor ao próximo valor mais alto e dividindo-se o resultado por 2.

Sim

Figura 2-17

Page 45: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

13

Quartis DecisQ1 = P25

Q2 = P50

Q3 = P75

D1 = P10

D2 = P20

D3 = P30

•••

D9 = P90

Page 46: Medida de Tendência Central - Lupércio F. Bessegatobessegato.com.br/PUC/iec_transp_02.pdf3 Notação Σ denota somatório de um conjunto de valores. x é a variável usada para representar

14

Intervalo Interquartil: Q3 - Q1

Intervalo Semi-interquartil:

Quartil Médio:

Amplitude de percentis 10-90: P90 - P10

Q3 - Q1

2

2Q1 + Q3