UOL - Jornalismo de Dados e Visualiza o - No es de Estat ...· JORNALISMO DE DADOS E VISUALIZAÇÃO

download UOL - Jornalismo de Dados e Visualiza o - No es de Estat ...· JORNALISMO DE DADOS E VISUALIZAÇÃO

of 84

  • date post

    10-Feb-2019
  • Category

    Documents

  • view

    213
  • download

    0

Embed Size (px)

Transcript of UOL - Jornalismo de Dados e Visualiza o - No es de Estat ...· JORNALISMO DE DADOS E VISUALIZAÇÃO

JORNALISMO DE DADOS E VISUALIZAO

Noes de Estatstica para Jornalistas

Marcelo Leme de Arrudawww.chancedegol.com.br

Introduo

1 Somatrio ()

Soma geral de termos

Conceitos matemticos

Notao:

soma

ia

dos valores ai

1=i

para i variando de 1

n

at n.

Introduo

1 Somatrio ()

Conceitos matemticos

87654321

8

1

XXXXXXXXXi

i +++++++==

Exemplos:

151296335

1

++++==j

j

)416()39()24()(4

2

2 +++++=+=n

nn

Introduo

2 Produtrio ()

Produto geral de termos

Conceitos matemticos

Notao:

produto

ia

dos valores ai

1=i

para i variando de 1

n

at n.

Introduo

2 Produtrio ()

Conceitos matemticos

4321

4

1

XXXXXi

i ==

Exemplos:

432)1(3

1

=+=k

k

56

45

34

23

1

33336

3

3

==j jj

Introduo

3 Fatorial (!)

Produto de todos os nmeros de 1 at n

Conceitos matemticos

nninn

i

== =

)1(321!1

K

Definio:

Introduo

3 Fatorial (!)

Conceitos matemticos

54321!5 =

Exemplos:

987654321!9 =

1!0 =por definio:

Introduo

4 Permutao (P)

De quantas maneiras se pode ordenar (permutar) um conjunto de k elementos?

Conceitos matemticos

Resposta:

* Temos k escolhas possveis para o primeiro elemento (i.e. k elementos possveis).

* Para cada uma dessas k alternativas, temos k-1 escolhas possveis para o segundo elemento (i.e. k(k-1) pares possveis).

Introduo

4 Permutao (P)

De quantas maneiras se pode ordenar (permutar) um conjunto de k elementos?

Conceitos matemticos

Resposta:

* Para cada uma dessas k(k-1) alternativas, temos k-2 escolhas possveis para o terceiro elemento (i.e. k(k-1)(k-2) trios possveis)

* e assim por diante, at o ltimo elemento, para o qual s h uma escolha possvel.

Introduo

4 Permutao (P)

De quantas maneiras se pode ordenar (permutar) um conjunto de k elementos?

Conceitos matemticos

Resposta:

!1)2()1( kkkkPk == Klogo,

Permutao - Exemplo:

elementos: letras A, B, C e D

* 4 alternativas para a primeira letra:

A B

C D

total de alternativas:

4

Permutao - Exemplo:

elementos: letras A, B, C e D

* Para cada uma dessas possibilidades, temos 3 alternativas para a segunda letra:

AB BA

CA DA

AC BC

CB DB

AD BD

CD DC

total de alternativas:

4 x 3

Permutao - Exemplo:

elementos: letras A, B, C e D

* Para cada uma dessas possibilidades, temos 2 alternativas para a terceira letra:

ABC ABD BAC BAD

CAB CAD DAB DAC

ACB ACD BCA BCD

CBA CBD DBA DBC

ADB ADC BDA BDC

CDA CDB DCA DCB

total de alternativas:

4 x 3 x 2

Permutao - Exemplo:

elementos: letras A, B, C e D

* Para cada uma dessas possibilidades, temos 1 alternativa para a quarta letra:

ABCD ABDC BACD BADC

CABD CADB DABC DACB

ACBD ACDB BCAD BCDA

CBAD CBDA DBAC DBCA

ADBC ADCB BDAC BDCA

CDAB CDBA DCAB DCBA

total de alternativas:

4 x 3 x 2 x 1 = 4!

Introduo

5 Combinao

De um conjunto de n elementos, de quantas maneiras pode-se escolher k deles?

Conceitos matemticos

=k

nC kn,

Notao:

combinao de n elementos, tomados (escolhidos) k

Combinao - Exemplo:

Mega Sena: n = 50 e k = 6

Ento temos:

* 50 possibilidades para o primeiro nmero sorteado

* 49 possibilidades para o segundo nmero sorteado

* 48 possibilidades para o terceiro nmero sorteado

* 47 possibilidades para o quarto nmero sorteado

* 46 possibilidades para o quinto nmero sorteado

* 45 possibilidades para o sexto nmero sorteado

Combinao - Exemplo:

Mega Sena: n = 50 e k = 6

Portanto, teramos, a princpio:

50 x 49 x 48 x 47 x 46 x 45 possibilidades

MAS:

(25, 14, 19, 38, 07, 50) foi contabilizada

e assim por diante - e todas essas possibilidades so, na realidade, a mesma possibilidade!

(14, 38, 50, 07, 25, 19) tambm foi contabilizada

(38, 25, 14, 50, 19, 07) tambm foi contabilizada

Combinao - Exemplo:

Mega Sena: n = 50 e k = 6

Precisamente, cada possibilidade foi contabilizada

P6 = 6! vezes (o nmero de permutaes possveis

de um conjunto de 6 elementos).

Logo, o nmero correto de possibilidades diferentesde selecionarmos 6 nmeros dentre os 50 da Mega Sena :

!6454647484950

6,50=C

Combinao - Exemplo:

Mega Sena: n = 50 e k = 6

Essa frmula pode ficar mais fcil de ser manipulada se multiplicarmos numerador e denominador da seguinte forma:

124344124344

!6454647484950

6,50 =

K

KC

e chegarmos a:

!44!6!50

6,50 =C

Introduo

5 Combinao

De um conjunto de n elementos, de quantas maneiras pode-se escolher k deles?

Conceitos matemticos

)!(!!

, knk

n

k

nC kn

=

=

Resposta: generalizando o exemplo anterior, podemos chegar frmula

Introduo

=SOMA(...) soma valores de uma rea da planilha

No Excel:

=MULT(...) multiplica valores de uma rea

=FATORIAL(k) calcula k!

=COMBIN(n;k) calcula Cn,k

ATENO: o Excel possui uma funo PERMUT, mas ela calcula o nmero de arranjos (e no de permutaes).

I Estatstica Descritiva

Medidas que descrevem e resumem caractersticas relevantes de um conjunto de dados. Se dividem em:

* Medidas de Tendncia Central

Medidas relativas a localizao, posio, ordem de grandeza dos dados.

* Medidas de Disperso

Medidas relativas a como os dados se distribuem (se dispersam) ou se concentram.

I Estatstica Descritiva

1 Mdia (aritmtica)

* Medidas de Tendncia Central

n

XX

n

ii

== 1Notao:

onde nn XXXXX ,,,,, 1321 L representam os dados que esto sendo analisados e n a quantidade de dados em questo.

I Estatstica Descritiva

2 Mediana

* Medidas de Tendncia Central

Valor que divide os dados ao meio, ou seja, deixando exatamente 50% dos dados acima e 50% abaixo dele.

Isso significa que:

a) Quando n impar, a mediana o valor central dos dados ordenados;

b) Quando n par, a mediana a mdia dos dois valores centrais dos dados ordenados.

I Estatstica Descritiva

3 Moda

* Medidas de Tendncia Central

Valor que aparece com maior freqncia no conjunto de dados.

Observaes:

a) Quando existe mais de um valor mais freqente, diz-se que a distribuio dos dados bimodal, trimodal, multimodal etc.

b) Quando os dados so trabalhados de forma agrupada, fala-se em faixa modal, grupo modal etc.

I Estatstica Descritiva

Exemplo 1:

* Medidas de Tendncia Central

Dados: 2 1 2 6 3

ento:n = 5

X1 = 2 X2 = 1 X3 = 2

X4 = 6 X5 = 3

dados ordenados: 1 2 2 3 6

I Estatstica Descritiva

Exemplo 1:

* Medidas de Tendncia Central

Mdia:

Mediana = 2 (1 2 2 3 6)

8,25

36212 =++++=X

Moda = 2 (1 2 2 3 6)

I Estatstica Descritiva

Exemplo 2:

* Medidas de Tendncia Central

Dados: 3 1 4 6 4 3

ento:n = 6

X1 = 3 X2 = 1 X3 = 4

X4 = 6 X5 = 4 X6 = 3

dados ordenados: 1 3 3 4 4 6

I Estatstica Descritiva

Exemplo 2:

* Medidas de Tendncia Central

Mdia:

Mediana = (1 3 3 4 4 6)

5,36

346413 =+++++=X

Moda = distribuio bimodal (1 3 3 4 4 6)

5,32

43 =+

=MED(...) mediana dos valores de uma rea

=MODO(...) moda dos valores de uma rea

ATENO: para conjuntos de dados multimodais, a funo MODO retorna somente uma das modas.

I Estatstica Descritiva

* Medidas de Tendncia Central

=MDIA(...) mdia dos valores de uma rea

No Excel:

I Estatstica Descritiva

* Observao: tipos de dados

a) Qualitativos (exemplo: time de preferncia):s permite moda.

b) Ordinais (exemplo: avaliao de satisfao): moda e mediana.

c) Quantitativos Discretos (exemplo: idade): moda (nmero), mediana e mdia.

d) Quantitativos Contnuos (exemplo: IMC): moda (faixa), mediana e mdia.

DAD

OS

NUM

RIC

OS

DAD

OS

NO

NUM

RIC

OS

I Estatstica Descritiva

1 Varincia

* Medidas de Disperso

1

)(1

2

2

==

n

XXS

n

ii

Notao:

interpretao: mdia das distncias (quadrticas) de cada valor mdia.

obs: s vezes usa-se a notao 2 em vez de S 2.

I Estatstica Descritiva

2 Desvio Padro

* Medidas de Disperso

1

)(1

2

2

===

n

XX

SS

n

ii

Notao:

obs: O desvio padro segue a mesma unidad