Indici di localizzazione Σ N -...

29
Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza. Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice di localizzazione o di posizione). A seconda dei casi si potrà adottare l'uno o l'altro indice in base all'esperienza. Media aritmetica:x= Σ Σ Σ i x i /N dove x i sono i risultati delle N misure. "Scarto dalla media" o scarto: (x i - x). La media aritmetica costituisce il legame (vincolo) tra la somma dei dati (Σ Σ Σ x i ) ed il loro numero (N), e gode delle seguenti proprietà: Indici di localizzazione

Transcript of Indici di localizzazione Σ N -...

Page 1: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Ogni misura è composta di almeno tre dati:un numero, un'unità di misura, un'incertezza.

Misure ripetute forniscono dati numerici distribuiti attorno ad un valore centrale indicabile con un indice (indice di localizzazione o di posizione ). A seconda dei casi si potrà adottare l'uno o l'altro indice in base all'esperienza.

Media aritmetica : x = ΣΣΣΣix i/N dove xi sono i risultati delle N misure .

"Scarto dalla media " o scarto : (x i - x). La media aritmetica costituisce il legame (vincolo) tra la somma dei dati (ΣΣΣΣ x i) ed il loro numero (N), e gode delle seguenti proprietà:

Indici di localizzazione

Page 2: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

1) ΣΣΣΣ (x i - x) = 0, per cui gli scarti indipendenti sono (N-1).

2) ΣΣΣΣ (x i - x)2= minimo (metodo dei minimi quadrati).

La media si applica direttamente alla curva normale dell’errore , curva di Gauss ,

Fre

quen

za d

ati

x ≡≡≡≡ µµµµ

Page 3: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Altri indici di posizione si applicano ad altri tipi didistribuzione , come questa di frequenze unimodali e modestamente asimmetrica :

Fre

quen

za d

ati

x ≡≡≡≡ µµµµ

Page 4: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

b) MODA: valore cui corrisponde il massimo di frequenza.

c) MEDIANA : valore che divide in due il campo di misura, quando i dati replicati sono ordinati in ordine crescente o decrescente, con metà dati a destra e metà a sinistra (media dei valori di mezzo se n è pari).

Questi indici di posizione sono significativi in alcuni casi particolari, ma sono insensibili a quanto avviene ai margini.

In una distribuzione di frequenze unimodale e moderatamente asimmetrica , gli indici di posizione sono legati fra loro secondo la relazione empirica:

Page 5: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

[(MEDIA – MODA) = 3 (MEDIA - MEDIANA)]

Moda Mediana Media

Un'estensione del concetto di mediana (valore che divide l'insieme dei dati in due parti uguali) è quello che riguarda i valori che dividono l'insieme in quattro parti uguali . Tali valori vengono chiamati "quartili ".

Page 6: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

0 25 50 75 100I quartile II quartile III quartile IV quartile

Allo stesso modo, vengono definiti "decili " e "percentili " i valori che dividono l'insieme dei dati rispettivamente in 10 e 100 parti uguali.

d) MEDIA TRONCATA : si calcola come media aritmetica della porzione centrale dei dati ; vengono scartate (di solito simmetricamente) le code della distribuzione.

e) MEDIA GEOMETRICA : rappresenta il prodotto di N numeri.

Media geometrica = N√π√π√π√πi x i i = 1 →→→→ N

Il simbolo ππππ indica il prodotto di tutti i valori.

Page 7: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

In relazione alla diversa sensibilità ai dati aberranti , la media ne è influenzata, la mediana non è influenzata dalla loro presenza, la media troncata rappresenta un compromesso tra le prime due, in quanto si basa su un numero consistente di dati ma non usa gli estremi del campione, tra i quali si possono trovare i valori aberranti.

Indici di dispersione

a) CAMPO DI VARIAZIONE : Il modo più semplice per indicare la variabilità di un insieme di dati, è di esprimerlo come differenza tra il più grande (valore massimo ) ed il più piccolo (valore minimo ) dei dati sperimentali o misure.

b) DEVIAZIONE MEDIA (Mean Deviation) : MD = [∑∑∑∑ x i – x ]/N

Page 8: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Viene definita anche «scostamento semplice medio assoluto dalla media aritmetica»

c) DEVIAZIONE STANDARD : ∑∑∑∑(x i – x)2

√√√√ (N-1)

d) VARIANZA : s2 = [∑∑∑∑ (x i - x)2] / (N-1)

La deviazione standard, chiamata anche scarto quadratico medio, viene indicata con s.

s è cioè la radice quadrata dei quadrati degli scarti dalla media aritmetica divisi per il numero di gradi di libertà.

La varianza di un insieme di dati è definita come il quadrato della deviazione standard.

Page 9: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Quando il numero di dati sperimentali disponibili è moltoelevato (al limite tende ad infinito) la deviazione standard èdefinita dalla relazione: σσσσ = √√√√ [∑∑∑∑ (x i – x)2] / N dove x i è la misura iesima , x è la media e N il numero di prove .

Nel caso più frequente, in cui i dati sperimentali sono limitati , la deviazione standard viene stimata attraverso la grandezza sdefinita dalla relazione: s = √√√√ [∑∑∑∑ (x i – x)2] / (N – 1) dove N-1rappresenta i gradi di libertà .

Si utilizza s, al posto di σσσσ per evidenziare il fatto che, avendo a disposizione una serie limitata di dati, non si ha la pretesa dicalcolare la deviazione standard , ma solo di darne una valutazione che risulterà tanto più attendibile quanto maggiore èil numero di prove effettuate .

Page 10: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Proprietà della deviazione standard o dello scarto quadratico medio

Se la variabile x ha distribuzione normale con media x e varianzas2, allora:

a) Il 68,27% dei casi è compreso tra x–s e x+s (cioè una deviazione standard da ogni parte della media).

b) Il 95,45% dei casi è compreso tra x – 2s e x + 2s (cioè due deviazioni standard da ogni parte della media).

c) Il 99,73% dei casi è compreso tra x – 3s e x + 3s (cioè tre deviazioni standard da ogni parte della media).

Page 11: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Quando N tende ad infinito , il valore medio delle misure sperimentali (in assenza di errori sistematici) tende al valorevero , convenzionalmente indicato con µµµµ, mentre la deviazione standard stimata s (o campionaria ) tende alla deviazione standard della popolazione σσσσ.

Il valore di s (deviazione standard campionaria ) indica la imprecisione di una misura ed è legata agli errori casuali .

Quindi l’imprecisione , di solito, viene espressa come deviazione standard (s) e descrive l’accordo tra due o più misure replicate , cioè la vicinanza reciproca delle misure all’interno di un insieme di misurazioni e risulta correlata agli errori casuali .

Page 12: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Più utile può essere l’espressione della imprecisione (come ripetibilità o riproducibilità ) in termini di coefficiente di variazione o deviazione standard relativa percentuale(RSD%), cioè di imprecisione percentuale : CV = RSD % = [s / x] x 100

È chiaro che ad un piccolo CV corrisponde poca dispersione dei dati attorno ad un valore medio e quindi un’elevata precisione ed una bassa imprecisione .

Il Laboratorio può stimare la imprecisione del proprio metodo effettuando misure replicate dello stesso materiale di controllonella stessa serie analitica (ripetibilità , imprecisione entro-saggio), oppure in serie analitiche differenti (riproducibilità , imprecisione tra-saggi).

Page 13: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

È evidente che la ripetibilità risulterà migliore della riproducibilità ; infatti, nella replica dello stesso campione in serie analitiche differenti , concorreranno ad aumentare la variabilitàanche cause di errore (differenze nelle condizioni sperimentali del saggio, differenze nei reattivi) che non sono presenti quando lemisure vengono replicate all’interno della stessa serie analitica .

Per lo stesso motivo la riproducibilità calcolata da replicati eseguiti in un periodo molto lungo potrà risultare più elevata rispetto a quella stimata da replicati eseguiti in un intervallo di tempo relativamente più breve .

Dispersione o Range: è un altro termine che spesso viene utilizzato per descrivere la precisione di un insieme di risultati replicati. Esso è la differenza tra il valore più grande e quello piùpiccolo dell’insieme.

Page 14: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Livelli di fiducia

Il valore esatto della media per una popolazione di dati non può mai essere determinato con assoluta precisione perchérichiederebbe un infinito numero di misure.

La teoria statistica ci permette comunque di fissare dei limiti attorno ad una media sperimentale x nei quali il valore vero µ sitrova con una certa probabilità.

Questi limiti sono denominati limiti di fiducia e l’intervallo da essi definito è noto come intervallo di fiducia.

L’estensione dell’intervallo di fiducia, che deriva dalla deviazione standard del campione, dipende dall’accuratezza di s.

Page 15: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

I limiti di fiducia definiscono quindi un intervallo attorno ad x che con una certa probabilità contiene µ.

L’intervallo di fiducia è, a sua volta, definito dai limiti di fiducia.

Il livello di fiducia fissa i limiti entro cui deve trovarsi il valore vero.

L’espressione generale per i limiti di fiducia (LF) di una singola misura è data dall’equazione:

LF per µ = x ± zσ

Per la media di N misure si utilizza l’errore standard della media σ/√√√√N al posto di σ, per cui LF per µ = x ± zσ/√N

Page 16: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto
Page 17: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Per tenere in considerazione la variabilità di s, si utilizza l’importante parametro statistico t (t di Student), definito dall’equazione:

Quando non si conosce σ, ma si dispone di s, che essendo ottenuto da un piccolo insieme di dati, può essere piuttosto incerto e quindi affetto da notevole variabilità.

x - µt =

s

Il valore di t dipenderà dal livello di fiducia desiderato ed anche dal numero di gradi di libertà utilizzati nel calcolo di s.

Come conseguenza, non disponendo di una buona stima di σ, i limiti di fiducia saranno necessariamente più ampi.

Page 18: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto
Page 19: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

I limiti di fiducia per la media x di N misure replicate possono essere derivati da t attraverso l’equazione:

t sLF per µ = x ±

√ N

Page 20: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Il Metodo dei Minimi Quadrati per la Il Metodo dei Minimi Quadrati per la

realizzazione di Curve di Calibrazionerealizzazione di Curve di Calibrazione

La maggior parte dei metodi analitici è basata su una curva di calibrazionecurva di calibrazione ricavata sperimentalmente, in cui viene riportata una quantità misurata ( y) in funzione della concentrazione nota ( x) di una serie di standard.

x

y

Page 21: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Normalmente, a causa degli Normalmente, a causa degli Normalmente, a causa degli Normalmente, a causa degli errori indeterminatierrori indeterminatierrori indeterminatierrori indeterminatiassociati al processo di misurazione, non tutti i associati al processo di misurazione, non tutti i associati al processo di misurazione, non tutti i associati al processo di misurazione, non tutti i punti si trovano punti si trovano punti si trovano punti si trovano esattamenteesattamenteesattamenteesattamente sulla retta.sulla retta.sulla retta.sulla retta.

Di conseguenza, Di conseguenza, Di conseguenza, Di conseguenza, èèèè necessarionecessarionecessarionecessario cercare di cercare di cercare di cercare di derivare la retta derivare la retta derivare la retta derivare la retta ““““miglioremiglioremiglioremigliore”””” che interpoli i punti.che interpoli i punti.che interpoli i punti.che interpoli i punti.

Consideriamo la procedura di regressione piConsideriamo la procedura di regressione piConsideriamo la procedura di regressione piConsideriamo la procedura di regressione piùùùùsemplice, il semplice, il semplice, il semplice, il metodometodometodometodo dei minimi quadratidei minimi quadratidei minimi quadratidei minimi quadrati....

Esiste una tecnica statistica, chiamata Analisi di Analisi di RegressioneRegressione, che consente di ottenere tale retta in maniera obiettiva, e di specificare le incertezz e associate al suo utilizzo.

Page 22: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Per applicare questo metodo deve esistere una relazione lineare tra la variabile misurata ( y) e la concentrazione dell’analita ( x).

Questa relazione è espressa come:

y = aa + bbx

aa intercetta (sull’asse delle y)

bb coefficiente di regressione , pendenza della retta

La deviazione verticale di un punto dalla retta èchiamato residuo.

Page 23: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

La linea costruita con il metodo dei minimi quadrati è tale da minimizzare la somma dei quadrati dei residui corrispondenti a tutti i punti.

00,5

11,5

22,5

33,5

44,5

5

0 0,5 1 1,5 2 2,5

Concentrazione

Ass

orba

nza Residuo = yi – (bxi + a)

Page 24: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Si può dimostrare che per l’equazione di questa retta, che è del tipo y = a + bx , il coefficiente angolare b (coefficiente di regressione) è dato dalla relazione.

ΣΣΣΣ (x i – x) (y i – y)b =

ΣΣΣΣ (x i – x)2

Dove x i sono tuti i valori della variabile indipendente x ed y i quelli della variabile dipendente y.

L’intercetta a si ottiene poi dall’equazione: a = y - bx

Page 25: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

Per stabilire fino a che punto l’equazione di regressione calcolata con il metodo dei minimi quadrati può essere usata al fine di trovare un valore di x conoscendo quello di y, si calcola un particolare parametro, chiamato coefficiente di determinazione.

[ ΣΣΣΣxy – (ΣΣΣΣx)(ΣΣΣΣy)/n ] 2

R2 =[ ΣΣΣΣx2 – (ΣΣΣΣx)2/n] [ ΣΣΣΣy2 – (ΣΣΣΣy)2/n]

R2 può assumere valori compresi tra 0 ed 1. Se R2 = 1 esiste una

perfetta relazione lineare fra x ed y, per cui ad un determinato

valore di x corrisponde uno ed un solo valore di y.

Page 26: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

La radice quadrata del coefficiente di La radice quadrata del coefficiente di determinazione determinazione èè il il coefficiente di correlazionecoefficiente di correlazione ::

r = √R2

r può assumere valori compresi tra -1 ed +1

Un coefficiente di correlazione > 0,99 viene considerato in indicatore di linearità

Page 27: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

ββββββββ--CAROTENE negli oli di semi (CAROTENE negli oli di semi (λλλλλλλλ = 464nm)= 464nm)

y = 0,0175 + 0,1733x y = 0,0175 + 0,1733x

RR22 = 0,9999= 0,9999

0,99997r = 0,250,0412STD 1

0,17327bb = 0,500,1134STD 2

0,01751aa = 2,000,3747STD 3

10,001,7517STD 4

20,003,4810STD 5

ppmppmAbsAbs

0,0000

0,5000

1,0000

1,5000

2,0000

2,5000

3,0000

3,5000

4,0000

0,0 5,0 10,0 15,0 20,0 25,0

ppm

Abs

Page 28: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

ββββββββ--CAROTENE negli oli di semi (CAROTENE negli oli di semi (λλλλλλλλ = 464nm)= 464nm)

x = (y x = (y -- a)/ba)/b

conc (ppm) = (Abs conc (ppm) = (Abs -- 0,0175)/0,17330,0175)/0,1733

5,50,9713zucca

0,90,1771mais

0,10,0304girasoleppmppmAbsAbs

Page 29: Indici di localizzazione Σ N - people.unica.itpeople.unica.it/filippomariapirisi/files/2010/09/Chim-Anal-3.pdf · Media aritmetica : x = ... MEDIA GEOMETRICA : rappresenta il prodotto

LA SENSIBILITLA SENSIBILITÀÀ

La La sensibilitsensibilitàà di un metodo indica quanto esso sia di un metodo indica quanto esso sia sensibile alle variazioni di concentrazione di un sensibile alle variazioni di concentrazione di un analita. Può essere individuata attraverso la analita. Può essere individuata attraverso la pendenza (b) della retta.pendenza (b) della retta.