CAPITOLO 1 RIFLESSIONE E RIFRAZIONE DELLE ONDE ... · %t2 =0 (1.1) dove εµ=1/v2, con ......

115
1 CAPITOLO 1 RIFLESSIONE E RIFRAZIONE DELLE ONDE ELETTROMAGNETICHE 1.1 Richiami sulle onde elettromagnetiche 1 Consideriamo un dielettrico perfetto, isotropo, illimitato, dove siano nulle le cariche localizzate (ρ=0) e le correnti (J=0). Sappiamo che in esso il campo elettromagnetico (e.m.) è descritto dalle equazioni di Maxwell (I) "# E = 0 (II) "# B = 0 (III) "$ E = - %B %t (IV) "$ B = &μ %E %t dove E e B sono i vettori campo elettrico e campo magnetico e ε e μ sono la funzione dielettrica e la permeabilità assolute del mezzo. Da esse vogliamo trarre un’equazione che descriva la propagazione dell’onda e.m. Se prendiamo il rotore del secondo membro della (III), teniamo conto della (I) e ricordiamo l’identità "# ("# E ) = -" 2 E + "("$ E ) otteniamo, essendo "("# E )=0 , " 2 E = -"# $B $t = $ ("# B ) $t = %μ $ 2 E $t 2 Operando in modo parallelo per il vettore B, si ottengono infine le equazioni delle onde e.m., che descrivono la propagazione dei due campi " 2 E # $μ % 2 E %t 2 = 0 " 2 B # $μ % 2 B %t 2 = 0 (1.1) dove εμ=1/v 2 , con v=velocità dell’onda nel mezzo. In forma compatta 1 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. da IV.3 a IV.6.

Transcript of CAPITOLO 1 RIFLESSIONE E RIFRAZIONE DELLE ONDE ... · %t2 =0 (1.1) dove εµ=1/v2, con ......

1

CAPITOLO 1

RIFLESSIONE E RIFRAZIONE DELLE ONDE ELETTROMAGNETICHE

1.1 Richiami sulle onde elettromagnetiche1 Consideriamo un dielettrico perfetto, isotropo, illimitato, dove siano nulle le cariche localizzate (ρ=0) e le correnti (J=0). Sappiamo che in esso il campo elettromagnetico (e.m.) è descritto dalle equazioni di Maxwell

!

(I) " #E = 0

(II) " #B = 0

(III) " $E = -%B

%t

(IV) " $B = &µ%E

%t

dove E e B sono i vettori campo elettrico e campo magnetico e ε e µ sono la funzione dielettrica e la permeabilità assolute del mezzo. Da esse vogliamo trarre un’equazione che descriva la propagazione dell’onda e.m. Se prendiamo il rotore del secondo membro della (III), teniamo conto della (I) e ricordiamo l’identità

!

" # (" #E) = -"2E +"(" $E)

otteniamo, essendo

!

"(" #E) = 0 ,

!

"2E = -" #

$B

$t=$(" #B)

$t= %µ

$2E

$t2

Operando in modo parallelo per il vettore B, si ottengono infine le equazioni delle onde e.m., che descrivono la propagazione dei due campi

!

"2E # $µ

%2E

%t2= 0

"2B # $µ

%2B

%t2= 0

(1.1)

dove εµ=1/v2, con v=velocità dell’onda nel mezzo. In forma compatta 1 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. da IV.3 a IV.6.

2

E = 0 B = 0 dove

=

!

"2# $µ

%2

%t2=%2

%x2+%2

%y2+%2

%z2#

1

v 2

%2

%t2

è l’operatore dalembertiano. Fissando l’attenzione sul campo elettrico, ricordiamo che la soluzione dell’equazione è un’onda viaggiante di carattere periodico che può essere espressa in forma esponenziale con esponente complesso

!

E =E0exp i(k " r #$t + %)[ ] (1.2)

dove il vettore d’onda k, avente modulo 2π/λ, è orientato come la direzione di propagazione dell’onda, ω è la pulsazione eguale a 2πν=2π/T, e dove ν è la frequenza espressa in Hz, T il periodo in secondi e ϕ è la fase iniziale. La velocità dell’onda è data da

!

v ="

T=#

k=

1

$µ=

c

$rµr

(1.3)

con c=velocità dell’onda nel vuoto e εr, µr rispettivamente funzione dielettrica e permeabilità magnetica relative del mezzo rispetto al vuoto. Nel caso comune in cui µr≈1, dalla definizione di n come rapporto c/v tra la velocità della luce nel vuoto e nel mezzo, si deduce n≈(εr)1/2. Ricordiamo inoltre che campo elettrico e magnetico vibrano in un piano perpendicolare alla direzione di propagazione, essendo sempre tra loro perpendicolari, e che il rapporto dei loro moduli è

!

E / B = v (1.4)

mentre quello tra E e il campo magnetizzante H è

!

E / H = µE / B = µ " = Z

(dove Z è detta impedenza caratteristica del materiale; per il vuoto

!

Z0 = µ0 "0 = 377 #). 1.1.2 Onde e.m. piane e sferiche. Se una sorgente è posta all’infinito, il fronte d’onda, ossia il luogo dei punti in cui l'argomento della funzione è costante a un dato tempo, si presenta piano. Se non c’è assorbimento dell’onda, l’ampiezza E0 nella (1.2) si

3

mantiene costante al variare della distanza dalla sorgente. Per propagazione lungo x, le derivate parziali seconde rispetto a y e z sono nulle e l’equazione delle onde si riduce all’equazione di D’Alembert

!

"2E

"x2= #µ

"2E

"t2 (1.5)

Se invece la sorgente è al finito ed è puntiforme o a simmetria sferica e il mezzo è omogeneo e isotropo, il fronte d’onda è sferico. Nel laplaciano che compare nelle (1.1), riscritto in coordinate sferiche, l’unico termine non nullo è quello relativo alla derivata rispetto a r, per cui l’equazione d’onda diventa

!

1

r2

"

"rr

2 "E

"r

#

$ % %

&

' ( ( = )µ

"2E

"t2

Si verifica facilmente che l’equazione si trasforma nella

!2(rE)

!r2= "µ

!2(rE)

!t2 (1.6)

il che comporta che l’onda viaggiante che la soddisfa abbia un’ampiezza inversamente proporzionale alla distanza percorsa a partire dalla sorgente. 1.1.3 Stati di polarizzazione della luce.2 Il vettore E è scomponibile in ogni istante in due componenti tra loro ortogonali. Se la differenza di fase tra esse varia in modo casuale nel tempo e nello spazio, il vettore campo elettrico cambia orientazione da istante a istante (e così il vettore B, sempre perpendicolare a E) e la luce è detta non polarizzata. Se invece la differenza di fase si mantiene costante, la luce è polarizzata: per una differenza di fase pari a 0 o π, il vettore elettrico mantiene sempre la stessa orientazione nello spazio e si parla di polarizzazione lineare. Nel caso di un’onda piana che si propaga lungo z con differenza di fase nulla tra le due componenti, il campo può essere rappresentato parametricamente dalle equazioni

E1= iE

01cos(kz -!t +")

E2= jE

02cos(kz -!t +")

(1.7)

e rappresentato come in Fig. 1.1 (a) nel caso z=0. E oscilla da un massimo positivo E0 a un massimo negativo -E0 con pulsazione ω. Se invece la differenza di fase mantiene nel tempo il valore costante π/2, le equazioni diventano

2 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. da X.5.

4

E1= iE

01cos(kz -!t)

E2= jE

02cos(kz -!t + " / 2) = jE

02sin(kz -!t)

(1.8)

e la rappresentazione è quella di Fig. 1.1 (b), sempre per z=0. Si ha cioè una polarizzazione ellittica, con il vettore campo elettrico che ruota attorno all’origine degli assi con velocità angolare ω. Nel caso particolare in cui E01=E02, la polarizzazione ellittica diventa circolare. Si può avere polarizzazione ellittica per valori dello sfasamento diversi da π/2, con ampiezze E01 e E02 (ossia le proiezioni di E lungo gli assi coordinati) che possono essere anche eguali. Ritroveremo questi concetti quando parleremo delle lamine mezz’onda e quarto d’onda (Par. 8.2.1). Una trattazione matematica della polarizzazione verrà fatta nel Cap. 5.

Fig. 1.1. (a) Polarizzazione lineare: componenti del campo in fase tra loro; (b) polarizzazione ellittica: componenti del campo con sfasamento generico.

In generale, l’interazione della luce con la materia dà luogo a una serie di fenomeni che dipendono essenzialmente dalla frequenza della radiazione considerata e dalle proprietà fisiche del mezzo. L’intervallo delle frequenze delle onde elettromagnetiche è molto ampio e va dalle onde cosidette a radiofrequenza (ν~102 Hz) ai raggi γ (~1018 Hz). Per una comprensione completa della interazione della “luce” con la materia si deve ricorrere a una rappresentazione quantomeccanica del campo elettromagnetico, la cui struttura è descrivibile in termini di particelle elementari di massa nulla dette fotoni. Come si dirà meglio nel Par. 7.1, a un fotone è associata una frequenza ν (quella del campo elettromagnetico oscillante considerato), un'energia E=hν (dove h=6.63⋅10-34 J⋅s è la costante di Planck) e una quantità di moto p=hν/c. Qui accenniamo soltanto ad alcuni importanti fenomeni che riguardano le onde elettromagnetiche in relazione alla loro frequenza, lasciando una trattazione completa a testi e corsi più avanzati. È comunque opportuno ricordare che, sebbene un’onda elettromagnetica possa variare la sua velocità (e quindi la lunghezza d’onda λ) all’interno di un mezzo, è la frequenza dell’onda, dipendente solo dalla sorgente, a determinare il tipo di interazione con la materia.

(a) (b)

x ω

y

E02

0 E01

ωt E0

y

E02

0 E01

E0

arctg(E02/E01)

5

Radiofrequenze: 3⋅106 ≥ λ ≥ 0.3 m 102 ≤ ν ≤ 109 Hz 4⋅10-13 ≤ E ≤ 4⋅10-6 eV A questo intervallo delle onde elettromagnetiche è generalmente associata la trasmissione di segnali radio (da 500 kHz a 100 MHz), televisivi (100 MHz), e della telefonia mobile (900 MHz e 1800 MHz). A causa della bassa energia associata ai fotoni in questa banda di frequenze la loro interazione con la materia è generalmente trascurabile. Microonde: 0.3≥λ≥10-3 m 109≤ν≤3⋅1011 Hz 4⋅10-6≤E≤1.2⋅10-3 eV Vengono usate nelle telecomunicazioni e nei radar e sono di interesse nella radioastronomia. Sono inoltre in grado di eccitare il moto rotazionale di molecole in possesso di un momento di dipolo permanente come ad esempio l’acqua (che ha una frequenza di risonanza del proprio moto rotazionale a 2.45 GHz). Vale la pena di menzionare che la radiazione di fondo cosmico dell’Universo cade nella regione delle microonde. Infrarosso: 10-3≥λ ≥0.79⋅10-6 m 3⋅1011≤ν ≤3.8⋅1014 Hz 1.2⋅10-3≤E ≤1.6 eV L’interazione della radiazione infrarossa con la materia provoca essenzialmente il moto vibrazionale delle molecole nei gas e nella materia condensata. Incidentalmente, lo spettro di emissione di un corpo a 37 °C si trova centrato intorno a 10 µm e quello di un corpo a 3000 K a 1 µm. Visibile: 0.79⋅10-6≥λ ≥0.38⋅10-6 m 3.8⋅1014≤ν ≤7.9⋅1014 Hz 1.6≤E ≤3.3 eV L’interazione della luce visibile con la materia riguarda soprattutto l’eccitazione quantomeccanica degli elettroni di valenza degli atomi in livelli di energia superiore, detti stati eccitati. Il Sole, la cui superficie si trova a circa 6000 K, presenta uno spettro di emissione centrato nell’intervallo spettrale del visibile. Ultravioletto: 0.38⋅10-6≥λ≥6⋅10-10 m 7.9⋅1014≤ν≤5⋅1017 Hz 3.3≤E≤2⋅103 eV Tale radiazione interagisce con molte sostanze provocando negli atomi l’eccitazione degli elettroni più interni. Per fotoni di energia che si avvicina all’estremo

6

dell’intervallo ultravioletto si possono avere fenomeni di ionizzazione degli atomi e delle molecole, che consistono nel definitivo allontanamento di uno o più elettroni dall’atomo o molecola considerati. Raggi X: 6⋅10-10≥λ≥6⋅10-12 m 5⋅1017≤ν≤5⋅1019 Hz 2⋅103≤E ≤2⋅105 eV I raggi X provocano la ionizzazione degli elettroni dagli atomi e dalle molecole anche dai livelli più profondi (ovvero vicini al nucleo) negli atomi più pesanti. Raggi γ: λ<6⋅10-12 m ν>5⋅1019 Hz E>2⋅105 eV Vengono prodotti nelle reazioni nucleari e data la loro elevata energia producono effetti di ionizzazione secondaria legati ai prodotti della loro interazione con i nuclei degli atomi. 1.2 Passaggio di un’onda e.m. da un mezzo a un altro3 Si abbia un’onda elettromagnetica che passa da un mezzo ad un altro. Le condizioni di continuità, in ogni punto della superficie di separazione, sono

!

E1t "E2t = 0

!

D1n "D2n = #

dove E1t, E2t sono le componenti del vettore campo elettrico tangenti alla superficie, rispettivamente nel primo e nel secondo mezzo, D1n, D2n sono quelle del vettore spostamento normali alla superficie, e σ è la densità superficiale di carica elettrica. Per il campo magnetico invece si ha

!

H1t "H2t = Js

!

B1n "B2n = 0

dove H è il vettore campo magnetizzante, B il vettore intensità di induzione magnetica, Js la densità di corrente superficiale. Se non vi sono né cariche né correnti, si ritrova la conservazione al confine tra i due mezzi delle componenti tangenti di E e H e di quelle normali di D e B. 1.3 Riflessione e rifrazione Consideriamo un’onda che incida in un punto della superficie di separazione di due mezzi trasparenti, omogenei e isotropi, aventi indice di rifrazione n1 e n2, con direzione di propagazione formante un angolo θi con la normale alla superficie. Si chiama piano di incidenza il piano formato dalla direzione di propagazione dell’onda e da detta normale. Sperimentalmente si sa che parte dell’onda viene riflessa e parte viene rifratta, cioè penetra nel secondo mezzo. Sia θi’ l’angolo di riflessione e θr quello di rifrazione (Fig. 1.2). L’espressione per il campo elettrico dell’onda incidente è 3 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. X.1 e X.2.1.

7

Fig. 1.2. Caso n1<n2.

!

Ei =E0i exp i(ki " r #$t)[ ] (1.9a)

dove ki è il vettore d’onda, r è il raggio vettore, ω è la pulsazione, o anche

Ei= E

0iexp i(

!n

ck

i" r #!t )

$

%&&

'

()) (1.9b)

se si tiene conto della relazione k=ω/v=ωn/c. Si suppone per il momento che l’avanzamento dell’onda nel mezzo avvenga senza attenuazione. Quanto al campo B, la sua espressione è ottenibile dalla relazione E=Bxv. Al confine tra i due mezzi il campo elettrico si divide in onda riflessa

!

Ei'

=E0i' exp i(ki

' " r #$t)% & '

( ) * (1.10a)

e onda rifratta

!

Er =E0r exp i(kr " r #$t)[ ] (1.10b)

Nelle equazioni scritte, affinché possano essere soddisfatte le condizioni di eguaglianza dei campi al confine, per Ei, Er ed E’i si è considerata la stessa pulsazione ω e si è esclusa la possibilità di mutui sfasamenti. La continuità dei campi richiede inoltre che, per qualsiasi istante t, siano eguali gli argomenti nelle funzioni esponenziali, ossia

!

ki " r = ki'" r = kr " r (1.11)

Si noti che, essendo la lunghezza d’onda data da

!

" =2#v

$ (1.12)

1

2

θi θi’

θr

Piano di incidenza

z

x

8

si ha

!

"i = "i' mentre

!

"r =n1

n2

"i

È conveniente scegliere come piano di incidenza il piano (x,z), con l’origine dell’asse z nel punto di incidenza. In tal caso è z=0 e kiy=0, quindi, proiettando sugli assi l’equazione (1.11), si ha

!

kixx = kix' x + kiy

' y = krxx + kryy

condizione che è verificata per qualsiasi punto di incidenza (x,y) soltanto se sono nulli i termini in y, ossia

!

kiy' y = kryy = 0

ciò che porta a scrivere

!

kixx = kix'

x = krxx

e a concludere che i tre vettori d’onda ki, ki’ e kr giacciono tutti nello stesso piano (z,x). Allora, esprimendo i k in termini delle lunghezze d’onda (k=2π/λ), si ha

!

2"

#i

sin$i =2"

#i

sin$i'

=2"

#r

sin$r

dove si è tenuto conto del fatto che λi’=λi, trattandosi di uno stesso mezzo. Perciò

!

"i = "i' (1.13a)

!

sin"i

sin"r

=n2

n1

(1.13b)

essendo

!

"r /n1 = "i /n2 . La (1.13a) afferma che l’angolo di incidenza e l’angolo di riflessione sono eguali. La (1.13b), detta legge di Cartesio-Snell o legge dei seni, indica che il raggio rifratto si avvicina alla normale se il secondo mezzo è più rifrangente del primo e viceversa. Se si fa riferimento all’indice di rifrazione relativo del primo mezzo rispetto al secondo, n12=n1/n2, la legge dei seni si può trovare espressa come

!

n12 sin"i = sin"r . 1.4 Angolo limite e riflessione totale interna Se il raggio passa dal mezzo più rifrangente a quello meno rifrangente – caso dunque in cui n1 > n2 – quando l’angolo di incidenza è abbastanza grande da far sì che l’angolo di rifrazione raggiunga il valore π/2, poiché sinθr non può superare il valore 1, il raggio non può più penetrare nel secondo mezzo ma viene interamente riflesso all’interno del

9

primo con angolo eguale a quello di incidenza. Si parla allora di riflessione totale interna (si veda il raggio C in Fig. 1.3). La soglia per tale effetto è detta angolo limite e si trova ponendo sin θr=1 nella seconda delle (1.13):

!

sin"i # n2 n1 . È grazie alla riflessione totale interna che è possibile realizzare la trasmissione di un fascio di luce all’interno di una fibra ottica. Altro effetto rilevante: un osservatore posto nel mezzo più rifrangente (ad esempio acqua) può vedere nell’altro mezzo (ad esempio aria) soltanto quegli oggetti che stanno all’interno di un cono con asse normale alla superficie di separazione e passante per il suo occhio, il cui angolo al vertice è eguale al doppio dell’angolo limite. All’esterno del cono la superficie di separazione gli appare riflettente come uno specchio.

Fig. 1.3. Caso n1>n2.

1.4.1 Esempi e applicazioni. Caso aria (n1=1) e acqua (n2=1,33): sinθi,lim=1/1,33, da cui θi,lim=48,7°. Caso aria (n1=1) e vetro (n2=1,50): sinθi,lim=1/1,50, da cui θi,lim=41,8°. Quindi un angolo di incidenza di 45° è in questo secondo caso maggiore dell’angolo limite. Ciò permette di realizzare deviatori e riflettori di raggio luminoso nei modi illustrati in Fig. 1.4.

Fig. 1.4. Modi di utilizzazione dell’effetto di riflessione totale interna.

1.4.2 Onda evanescente.4 Benché nel passare da un mezzo più rifrangente a un mezzo meno rifrangente sia possibile avere, al confine, riflessione totale interna, nella zona oltre il confine è comunque presente un campo elettrico oscillante, che decade

4 Testo consigliato G.R. Fowles, Modern Optics, Par. 2.9.

1

2

θi

θr

z

x

Angolo limite

B

C

A

10

rapidamente. Tale campo è detto onda evanescente. Consideriamo l’espressione (1.10b) scritta in precedenza per il campo trasmesso

!

Er =E0r exp i(kr " r #$t)[ ] (1.10b)

Con riferimento alla Fig. 1.3, possiamo scrivere

!

kr " r = krxsin#r $krzcos#r = krxsin#r + ikrz n2sin

2#i $1

dove si è utilizzata la legge dei seni (1.13b), con aria come mezzo meno denso e indice n per quello più denso, e si è fatta la sostituzione (in condizioni di riflessione totale essendo sempre n2sin2θi > sinθr = 1),

!

cos"r = 1 # sin2"r = 1 # n

2sin

2"i = # i n2sin

2"i #1

L’equazione scritta indica che l’angolo di rifrazione è immaginario. Allora la funzione d’onda (1.10b) del campo trasmesso può essere così riscritta

!

Er =E0rexp "# |z|[ ]exp i(krxsin$r "%t)[ ] (1.14)

avendo introdotto un coefficiente di estinzione

!

" = kr n2sin

2#i $1

Il primo esponenziale nella (1.14) mostra che il campo elettrico, all’esterno del mezzo più denso, si estingue rapidamente su una distanza dell’ordine della lunghezza d’onda della luce (come è facile rendersi conto utilizzando ad esempio per θi l’angolo limite per il sistema aria-vetro, riportato in Par. 1.4.1). Il secondo esponenziale indica invece che il campo evanescente è un’onda che viaggia parallelamente al confine, con velocità data da ωn/krsinθi. La presenza dell’onda evanescente può essere verificata sperimentalmente in diversi modi, sui quali non ci soffermiamo.

1.5 Principio di Fermat e rifrazione Il principio di Fermat afferma che la luce, nel propagarsi da un punto a un altro, percorre il cammino che richiede il tempo più breve. Mostriamo che, applicando tale principio, si ritrova la legge di Cartesio-Snell della rifrazione. Siano A e B i due punti, con A origine delle ascisse, e si esprima il cammino percorso dal raggio scegliendo un punto x generico di transito sulla superficie di separazione; basterà cercare per quale valore di x il tempo di percorrenza è minimo (Fig. 1.5).

11

Fig. 1.5. La legge dei seni dedotta con il principio di Fermat.

Il tempo impiegato dalla luce per andare da A a B è dato da

!

tp =AP

v1

+PB

v2

=

d12

+ x2" # $

% & '

1/ 2

c /n1

+

d22

+ (d ( x)2" # $

% & '

1/ 2

c /n2

Facendo la derivata dtp/dx ed eguagliandola a 0 si trova nuovamente

!

sin"i

sin"r

=n2

n1

Lo stesso procedimento può essere utilizzato per confermare la legge della riflessione speculare. Una terza dimostrazione delle leggi di riflessione e rifrazione verrà proposta in seguito – Par. 4.1.1 - come applicazione del principio di Huygens. 1.6 Relazioni di Fresnel per la riflettanza e la trasmittanza5 Utilizzando le due relazioni di continuità, avendo tenuto conto che è εr=n2 (se µr≈1),

!

E1t = E2t

!

D1n = D2n = n12E1n = n2

2E2n

valide per mezzi trasparenti in assenza di cariche e di correnti, possiamo ricavare delle espressioni per i coefficienti di riflessione e di trasmissione dell’ampiezza del campo elettrico oscillante dell’onda (le stesse relazioni valgono anche per l’ampiezza del campo magnetico). Si abbia un fascio di raggi paralleli incidenti con angolo θi. Conviene ragionare separatamente sulle ampiezze delle due componenti vettoriali del campo Ep, Es, ottenute rispettivamente proiettando il vettore E nel piano di incidenza e sulla normale ad esso. 1° caso, componente di E nel piano di incidenza (p). Facendo riferimento alla Fig. 1.6 [con le definizioni date da (1.9a), (1.10a) e (1.10b)] e considerando la componente dei campi polarizzata nel piano di incidenza si ottiene dalle relazioni di continuità:

5 Testo consigliato: Mazzoldi-Nigro-Voci, Fisica, Vol. II, Par. 14.4.

A

B

x

θi

θr

n1

n2

d1

d2

0 d P

12

!

E 0ip cos"i #E 0ip' cos"i = E 0rp cos"r

!

n12E 0ip sin"i + n1

2E 0ip' sin"i = n2

2E 0rp sin"r

Fig. 1.6 Fig. 1.7 Utilizzando la relazione

!

n12 /n2

2= (sin"r /sin"i )

2 e svolgendo alcuni passaggi, alla fine si perviene alle relazioni di Fresnel per le ampiezze delle componenti del campo elettrico parallelo al piano di incidenza

!

rp =E 0ip'

E 0ip

=tg("i #"r )

tg("i + "r ) (1.15a)

!

tp =E 0rp

E 0ip

=2sin"r cos"i

sin("i + "r ) cos("i #"r ) (1.15b)

2° caso, componente di E normale al piano di incidenza (s): La derivazione delle formule analoghe alle (1.15) in questo caso la si ottiene utilizzando le relazioni di continuità per il campo di induzione magnetica B

!

B1n = B2n

!

1

µ1

B1t =1

µ2

B2t

e ragionando sulle proiezioni di B come mostrato in Fig. 1.7

!

"1

µ1

B01p cos#i +1

µ1

B0ip' cos#i = "

1

µ2

B01p cos#r

!

B01p sin"i + B0ip' sin"i = B01p sin"r

1

2

θi θi’

θr

Ei Ei’

Er

s p

1

2

θi θi’

θr

Eis Eis’

Ers

Bip Bip

Brp

13

Essendo Es=vBp=cBp/n e µ1~µ2 si ha per i campi elettrici

!

"1

v1

E 0is cos#i +1

v1

E 0is'

cos#i = "1

v2

E 0rs cos#r

!

1

v1

E 0is sin"i +1

v1

E 0is'

sin"i =1

v2

E 0rs sin"r

da cui si ottiene

!

rs =E 0is'

E 0is

= "sin(#i "#r )

sin(#i + #r ) (1.16a)

!

ts =E 0rs

E 0is

=2sin"r cos"i

sin("i + "r ) (1.16b)

Nota. In molti testi la componente parallela p viene contrassegnata dalla lettera greca π o dal segno //, così come la componente normale s viene indicata con σ o con |. La componente s si può trovare anche indicata come TE, da Transverse Electric (ossia vettore E trasversale rispetto al piano di incidenza), la componente p come TM, da Transverse Magnetic (ossia campo B trasversale rispetto al piano di incidenza, quindi E a 90°). Ciò che si misura in laboratorio è l’energia ottica trasportata dal raggio luminoso nell’unità di tempo, ossia la potenza luminosa W. Ricordiamo che l’intensità luminosa è legata alla potenza luminosa e al campo elettrico da

!

I =W

S"

E 02

2Z (J/s)/m2 (1.17)

dove S è la sezione del fascio luminoso,

!

Z = µ " ~ (1 n) µ0 "0 = Z0 /n è l’impedenza ottica del mezzo, Z0 quella del vuoto, e nella (1.3) si è assunto che la µr del mezzo valga circa 1, per cui

!

n = "r . Riflettanza. È il rapporto tra la potenza ottica riflessa e quella incidente

!

R =Wi

'

Wi

=E 0i'

2

E 0i2

(1.18a)

14

Trasmittanza. È il rapporto tra la potenza ottica rifratta e quella incidente

!

T =Wr

Wi

=IrSr

IiSi

=n2E 0r

2cos"r

n1E 0i2

cos"i

(1.18b)

dove i coseni sono indice della variazione nella sezione del fascio luminoso (Fig. 1.8).

Fig. 1.8. Nella rifrazione, la sezione del fascio cambia, quindi il rapporto delle potenze incidente e rifratta è diverso da quello delle corrispondenti intensità.

Sostituendo le (1.15) e (1.16) nelle (1.18), scritte per le due componenti parallele (p) e perpendicolari (s) al piano di incidenza, si trova

!

Rp =E 0ip'

2

E 0ip2

=tg2("i #"r )

tg2("i + "r ) (1.19a)

!

Tp =E 0rp

2

E 0ip2

=n2

n1

cos"r

cos"i

4 sin2 "r cos2 "i

sin2("i + "r ) cos2("i #"r )=

sin2"i sin2"r

sin2("i + "r ) cos2("i #"r ) (1. 19b)

!

Rs =E 0is'

2

E 0is2

=sin2("i #"r )

sin2("i + "r ) (1.20a)

!

Ts =E 0rs

2

E 0is2

=n2

n1

cos"r

cos"i

4 sin2 "r cos2 "i

sin2("i + "r )=

sin2"i sin2"r

sin2("i + "r ) (1.20b)

Le espressioni ottenute sono rappresentate nelle Figg. 1.9(a) e 1.9(b).

θi

θr

Si

Sr

15

0

0,2

0,4

0,6

0,8

1

0 20 40 60 80

Rp

, T

p

Angolo di incidenza

1/2

Riflettanza componenteparallela piano incidenza

Trasmittanza componenteparallela piano incidenza

Angolo diBrewster

0

0,2

0,4

0,6

0,8

1

0 20 40 60 80

Rs, T

s

Angolo di incidenza

1/2

Riflettanza componentenormale piano incidenza

Trasmittanza componentenormale piano incidenza

(a) (b)

Fig. 1.9(a,b). Riflettanza e trasmittanza della potenza ottica associata alle componenti parallela (a) e normale (b) al piano di incidenza in funzione dell’angolo di incidenza θi. I calcoli sono fatti per il caso in cui il primo mezzo è l’aria e il secondo il vetro, ossia per un rapporto n2/n1=1.5.

Per ciascuna componente del campo, la somma dei due coefficienti vale sempre 1, garantendo la conservazione dell’energia. Si noti che per θiπ/2, ossia per incidenza radente, i coefficienti di riflessione tendono a 1 e quelli di trasmittanza 0, vale a dire che la luce è interamente riflessa, come da uno specchio perfetto. Nel caso in cui l’onda incide da un mezzo più rifrangente a uno meno rifrangente valgono le stesse relazioni che portano ai grafici di Figg. 1.9 (a) e (b), salvo che occorre tener conto della presenza dell’angolo limite. In Figg. 1.9 (c) e (d) sono raffigurate le relazioni di Fresnel nel caso n1=1.5 e n2=1.

(c) (d)

Fig. 1.9(c,d). Riflettanza e trasmittanza della potenza ottica associata alle componenti parallela (c) e normale (d) al piano di incidenza in funzione dell’angolo di incidenza θi. I calcoli sono fatti per il caso in cui il primo mezzo è il vetro e il secondo l’aria, ossia per un rapporto n2/n1=0.67.

0 20 40 60 80

0.0

0.2

0.4

0.6

0.8

1.0

Tp

Rp

n1=1.5

n2=1

Inte

nsity

!i (°)

0 20 40 60 80

0.0

0.2

0.4

0.6

0.8

1.0

Ts

Rs

n1=1.5

n2=1

Inte

nsity

!i (°)

16

Se la luce incidente non è polarizzata, si può ragionare come se essa in ogni istante risultasse dalla combinazione di due componenti, una polarizzata p e l’altra s, ciascuna di potenza ottica pari al 50% di quella totale. La riflettanza e la trasmittanza sarebbero allora date da

!

R =1

2(Rs + Rp)

!

T =1

2(Ts +Tp) con R+T =1

e avrebbero l’andamento illustrato in Figg. 1.10(a,b).

(a) (b) Fig. 1.10. Trasmittanza e riflettanza di luce non polarizzata in funzione dell’angolo di incidenza: (a) per n2/n1=1.5 e (b) per n2/n1=0.67.

1.6.1 Incidenza normale. Per incidenza normale, il campo elettrico giace nella superficie di separazione dei due mezzi. La condizione al confine è allora E1=E2, ossia

!

E 0i = E 0i'

+ E 0r

mentre la conservazione dell’energia, essendo

!

I = nE 02

2Z0 , permette di scrivere

!

n1E 0i2

= n1E 0i'

2

+ n2E 0r2

(si noti che la sezione del fascio è ora eguale nei due mezzi). Il sistema a due incognite E0i’, E0r ha come soluzioni:

!

E 0i'

=n1 " n2

n1 + n2

E 0i

!

E0r

=2n1

n1 + n2

E 0i

0 20 40 60 800.0

0.2

0.4

0.6

0.8

1.0

R

T

n1=1.5

n2=1

Inte

nsi

ty

!i (°)

17

ovvero

!

r =n1 " n2

n1 + n2

!

t =2n1

n1 + n2

da cui

!

R =(n1 " n2)2

(n1 + n2)2

!

T =n2

n1

t2=

4n1n2

(n1 + n2)2 (1.21)

dove il termine n2/n1 proviene dal rapporto Z1/Z2 delle impedenze dei due mezzi e si verifica nuovamente che è R+T=1. 1.7 Angolo di Brewster Il coefficiente di riflessione Rp dato dalla (1.19a) diventa 0 allorché θi+θr=π/2, o ciò che è lo stesso quando θi’+θr=π/2 (il raggio riflesso esce formando un angolo retto con il raggio rifratto). L’angolo di incidenza per cui questo si verifica si chiama angolo di Brewster (pronuncia circa “bruster”). Possiamo trovare una relazione tra detto angolo (che contrassegniamo con il pedice B) e gli indici di rifrazione dei due mezzi:

!

sin"iB

sin"rB

=sin"iB

sin(# /2 $"iB)=

sin"iB

cos"iB

= tg"iB

ma poiché vale la (1.13b), si conclude

!

"iB = arctg(n2 n1) (1.22)

Una determinazione dell’angolo di Brewster consente una misura dell’indice di rifrazione relativo dei due mezzi. 1.7.1 Esempi aria/vetro e aria/acqua. Nel caso del vetro (n2=1.5), l’angolo di Brewster vale

!

"iB = arctg(1.5 1) = 56°

e la riflettanza a incidenza normale

!

R =(n1 " n2)2

(n1 + n2)2= 0.04 (4%)

Nel caso dell’acqua (n2=1.33), si ha rispettivamente

!

"iB = arctg(1.33 1) = 53° e R=0.02

18

1.7.2 Mezzo assorbente. Consideriamo il caso di incidenza normale su un mezzo non perfettamente trasparente. Mostreremo nel prossimo capitolo che in tal caso il campo nel mezzo assorbente dovrà essere espresso tramite un vettore d’onda complesso k e dunque un indice di rifrazione complesso ñ=n+iκ. Tralasciando i passaggi, si può mostrare che la riflettanza a incidenza normale, è esprimibile come

!

R =(n1 " n2)2

+ #22

(n1 + n2)2+ #2

2 (1.23)

Se κ2>>n1, com’è il caso dei metalli nel visibile e nell’infrarosso a causa del forte assorbimento della radiazione da parte degli elettroni liberi, R1. Inoltre, si introduce uno sfasamento tra i raggi incidente e riflesso che è funzione di n2 e κ2. La misura di tale sfasamento, operata in aggiunta a quella della riflettanza, fornisce una seconda equazione per la determinazione dell’indice di rifrazione complesso del secondo mezzo (questa procedura prende il nome di ellissometria). 1.7.3 Polarizzazione delle onde rifratta e riflessa. Le equazioni (1.19) e (1.20) e le corrispondenti Figg. 1.7 (a) e (b) mostrano che se la luce incidente è non polarizzata, i raggi rifratti e riflessi sono almeno parzialmente polarizzati. Il raggio riflesso lo è del tutto allorché l’incidenza avviene all’angolo di Brewster. In tal caso, essendo Rp=0, il campo elettrico dell’onda riflessa vibra interamente in direzione perpendicolare al piano di incidenza (direzione detta “asse del polarizzatore”), mentre quello del raggio rifratto rimane solo parzialmente polarizzato perché, sebbene Tp valga 1, Ts rimane alquanto elevato. Tale circostanza permette di ricavare un’onda polarizzata per riflessione facendola incidere con l’angolo di Brewster su una lamina di materiale trasparente [si veda lo schema in Fig. 1.11(a)]. Nelle vicinanze dell’angolo di Brewster il raggio riflesso rimane comunque fortemente polarizzato. Il suo grado di polarizzazione , illustrato in Fig. 1.11(b), si definisce nel modo seguente

!

"R = (Rs # Rp)/(Rs + Rp) (1.24)

0

0,2

0,4

0,6

0,8

1

0 20 40 60 80

Gra

do d

i pola

rizzazio

ne

Angolo di incidenza

Rs - Rp

Rs + Rp

(a) (b)

Fig. 1.11. (a) All’angolo di Brewster il raggio riflesso è interamente polarizzato in direzione normale al piano di incidenza (cerchietto nero). (b) Grado di polarizzazione del raggio riflesso.

1

2

θiB θiB’

θrB

50% Es 50% Ep Solo Es

Sia Es che Ep

con Ep > Es

19

1.7.4 Polaroid. Esistono modi più semplici di ottenere luce interamente polarizzata. Tra questi i “polaroid”, lamine di plastica trasparente sulle quali è stato depositato un sottile strato di gelatina costituita da macromolecole organiche in forma di lunghe catene parallele. Queste molecole hanno la proprietà di trasmettere la componente del campo elettrico che oscilla normalmente alla direzione delle catene (direzione che rappresenta quindi l’asse del polarizzatore), mentre l’altra viene interamente assorbita (Fig. 1.12). I polaroid vengono in particolare utilizzati come dispositivi antiriflesso, purché siano opportunamente orientati in modo da lasciar passare solo la componente Rp dei raggi riflessi da una superficie (ossia quella che si annulla all’angolo di Brewster), risultando tanto più efficaci quanto più il raggio emerge con angolo prossimo a quello di Brewster.

Fig. 1.12. Polarizzazione della luce tramite polaroid.

Per scopi di ricerca in laboratorio si preferisce produrre luce polarizzata per mezzo di prismi polarizzatori, che esamineremo nel Par. 8.2.2. 1.8 Legge di Malus Se la luce emergente da un dispositivo polarizzante – sia esso un polaroid, un Nicol, o un riflettore posto all’angolo di Brewster – viene fatta passare attraverso un secondo polarizzatore (l’analizzatore), si osserva che la sua intensità dipende dall’angolo α formato dagli assi dei due polarizzatori. Precisamente, per una rotazione di 2π, l’intensità varia con continuità passando due volte per lo zero e altrettante per un valore massimo che in condizioni ideali (cioè in assenza di perdite) è la metà dell’intensità del raggio non polarizzato a monte del primo polarizzatore. Se I1 è l’intensità del fascio prima dell’analizzatore, l’intensità emergente I2 è descritta dalla legge di Malus:

!

I2 = I1 cos2" (1.25)

È immediato rendersi conto di tale dipendenza considerando che il campo elettrico trasmesso è dato dalla proiezione del campo emergente dal primo polarizzatore sull’asse permissivo dell’analizzatore, quindi E2=E1cosα e che le intensità sono proporzionali ai quadrati dei campi.

Catene molecolari

Fascio di luce non polarizzato

Fascio di luce polarizzato normalmente alla direzione delle catene

20

CAPITOLO 2

LA DISPERSIONE DELLA LUCE

2.1 Rifrazione da parte di un prisma6 L’indice di rifrazione di un mezzo non è una costante, bensì dipende dalla lunghezza d’onda della radiazione. Sperimentalmente si osserva infatti che se un fascio di luce bianca incide sulla superficie di separazione tra due mezzi, gli angoli di rifrazione sono diversi per le varie componenti cromatiche, come illustrano le Figg. 2.1 (a) e (b). La legge dei seni deve dunque riscriversi

!

n1("1)sin #i = n2("2)sin #r

(a) (b)

Fig. 2.1. (a) L’angolo di rifrazione risulta tanto più piccolo quanto più elevata è la frequenza dell’onda, indicando (b) che n, nella regione di trasparenza del materiale, cresce con ω.

2.1.1. Angolo di deviazione minima. Un modo per studiare sperimentalmente l’andamento di Fig. 2.1 (b) è quello di utilizzare un prisma e cercare l’angolo di deviazione minima di raggi di diversa lunghezza d’onda (conosciuta). Si procede come illustrato in Fig. 2.2 (a). Sia θi il comune angolo di incidenza sulla prima faccia del prisma e sia θrr, diverso per ogni λ della luce, l’angolo di uscita dalla seconda faccia, dopo che i raggi hanno subito due rifrazioni. Sia δ l’angolo di deviazione totale di ciascun raggio monocromatico rispetto al raggio incidente. Se si ruota il prisma in modo da far variare θi, si osserva che tale deviazione presenta un valore minimo δmin, e che ciò si verifica allorché θi=θrr. δmin è diverso per ogni λ e può essere posto in diretta relazione con il particolare valore di n che le compete. La dimostrazione è la seguente. Per maggiore chiarezza ridisegniamo la figura ingrandita per un unico raggio

6 Testo consigliato Mencuccini-Silvestrini, Fisica II, Par. IX.6.

1

2

θi θi’

θr

z

x

Violetto Rosso ω Rosso Violetto

n(ω)

21

Fig. 2.2. Condizioni sperimentali per la misura dell’angolo di deviazione minima.

(monocromatico). Notiamo anzitutto che

α=θr+θr’ dθr=-dθr’ (2.1)

e che, dal triangolo DEB, si ha

δ = (θi – θr) + (θrr – θr’) = (θi + θrr) – (θr + θr’) per cui

θi+θrr = δ+α (2.2)

Derivando δ rispetto all’angolo d’incidenza ed eguagliando a 0, si ha

!

d"

d#i

= 1 +d#rr

d#i

= 0

!

d"rr

d"i

= #1

Dalla legge della rifrazione applicata alle due facce del prisma

sin θi = n sin θr sin θrr = n sin θr’

che, differenziate, danno per la (2.1) cosθi dθi = n cos θr dθr

cosθrr dθrr = n cos θr’ dθr’ = -n cos θr’ dθr

Facendo il rapporto delle ultime due equazioni si ricava, dopo aver nuovamente tenuto conto della (2.1),

!

cos(" #$r )

cos$r

cos$i

cos$rr

= 1

che è appunto soddisfatta se

θrr=θi e α – θr=θr da cui θr=α/2 (e anche θr=θr’)

α

δ θi

θrr θr

θr’ π−α

θi-θr

A

B

C

D E θi θrr

δ

α

22

Sostituendo nella (2.2) si ha

!

"rr = "i =#min + $

2

da cui la relazione cercata

!

n(") =sin#i

sin#r

=sin ($min + %)/2[ ]

sin(%/2)

2.2 Trattazione classica della dispersione della luce Troviamo adesso una relazione teorica che lega l’indice di rifrazione alla lunghezza d’onda della radiazione. È relativamente ovvio che quando un campo elettrico oscillante si propaga in un dielettrico, la polarizzabilità degli atomi non puà essere eguale a quella prodotta da un campo statico, per il fatto che le cariche elettriche – elettroni e nuclei – presentano un’inerzia dovuta alla loro massa, la quale gioca un ruolo tanto più critico quanto più alta è la frequenza di oscillazione. In una grossolana approssimazione, ma che comunque porta a una buona stima alla dipendenza di n da λ osservata sperimentalmente, tratteremo il problema come se gli elettroni all’interno degli atomi fossero degli oscillatori classici, con frequenze proprie di oscillazione corrispondenti ai possibili salti di energia ΔE tra le orbite quantizzate dell’atomo di Bohr (quindi frequenze ν=ΔE/h, dove h=6.626176

!

"10-34 J⋅s è la costante di Planck). Partiamo dal caso in cui tutti gli Z elettroni dell’atomo si comportino allo stesso modo e fissiamo l’attenzione su una transizione che corrisponde a una pulsazione risonante ω0=2πν0=2π ΔE/h. L’equazione di Newton, supponendo che il campo elettrico locale sia essenzialmente eguale al campo associato all’onda all’esterno del materiale, ossia Eloc=E0exp[i(ωt-kx)], per una data posizione x che possiamo prendere come origine, si scrive

!

m " " r + m# " r +kr = ZeE0 exp(i$t) (2.3) dove m è la massa dell’elettrone γ è un coefficiente di dissipazione dell’energia – espresso in s-1, ossia come ω – che corrisponde a un attrito proporzionale alla velocità della particella, e k è una costante di richiamo di tipo elastico. La forza in gioco è naturalmente di tipo coulombiano, ossia proporzionale a 1/r2, ma come si sa già dalla meccanica per piccole oscillazioni attorno alla posizione di equilibrio l’approssimazione elastica è giustificata (Fr=-kr). L’equazione dinamica ha come soluzione, a regime, una soluzione particolare della corrispondente equazione omogenea:

r(t)=r0 exp(iωt) (2.4)

con r’(t)=iωr(t) r”(t)=-ω2r(t) (2.5)

23

Sostituendo le (2.4) e (2.5) nella (2.3), si trova che l’equazione è soddisfatta se

!

r0 =ZeE0

m

1

"02 #"2 # i"$

dove ω0=k/m, come nel caso dell’oscillatore armonico elastico. Il momento elettrico indotto p=Zer risulta quindi complesso, e lo stesso vale per la polarizzabilità del mezzo:

%! =p

E=

Zer0

exp(i"t)

E0

exp(i"t)=

Z 2e2

m

1

"02 #"2 # i"$

(2.6)

Scriviamo α nella forma

%! = |! |exp(i")

dove

| %! | = | %! %!*| =Z 2e2

m ("02 #"2)2 + $ 2"2

!

tg" =#$

$2 %$02

e δ rappresenta il ritardo di fase tra il dipolo indotto p e il campo E. Si noti che per ω=0, la polarizzabilità si riduce a quella reale α=Z2e2/mω0

2 già nota per il campo elettrostatico.

2.2.1 Indice di rifrazione complesso. Il fatto che la polarizzabilità sia complessa si riflette sulla funzione dielettrica e sull’indice di rifrazione, che sono ora complessi, oltre che dipendenti da ω. Le loro espressioni si ricavano passando attraverso la suscettività elettrica complessa χ=N α/ε0, dove N è il numero di atomi nell’unità di volume del materiale. Sempre nell’approssimazione di campo locale eguale a quello esterno – altrimenti si dovrebbe ricorrere alla relazione di Clausius-Mossotti, nota dall’elettrostatica - si ha subito

%!r(") = 1 + %# = 1 +N %$ / !

0 (2.7a)

%n(!) = %"

r(!) = n + i# (2.7b)

Mostriamo adesso che la parte reale n è responsabile degli effetti di dispersione che abbiamo descritto con l’uso del prisma, e che la parte immaginaria κ interviene nei processi dissipativi, ossia nell’assorbimento dell’onda. Introduciamo ñ nell’espressione

24

del campo elettrico viaggiante, ricordando che il vettore d’onda k è dato da ω/v e osservando che la velocità v=c/ ñ è ora complessa

!

E =E0 exp i"(x

v# t)

$

% & &

'

( ) )

=E0 exp i"(n + i*)x

c# i"t)

$

% & &

'

( ) )

=

!

=E0 exp i"(nx

c# t)

$

% & &

'

( ) ) exp(#"*

x

c) (2.8)

Il campo E è dato dal prodotto di un’onda viaggiante con velocità c/n (reale), dove n=n(ω), e di una funzione smorzata in funzione della distanza x percorsa nel mezzo, avente fattore di decadimento β=ωκ/c, di nuovo con κ=κ(ω). Se l’ampiezza si smorza secondo un coefficiente β, l’energia trasportata dall’onda, proporzionale a E2, decade con un coefficiente di assorbimento α= 2β = 2ωκ/c= 4πκ/λ. Ciò porta, per l’intensità luminosa, alla legge di Lambert:

!

I(x) = I0 exp("#x) (2.9)

Vogliamo ora ricavare delle espressioni per le due parti reale n(ω) e coefficiente dell’immaginaria κ(ω) dell’indice di rifrazione. Riprendiamo la (2.7b) e facciamo l’approssimazione

%n(!) = %"

r(!) # 1 +

1

2%"r(!)

che è relativamente buona per N piccolo, ossia per mezzi poco densi. Razionalizzando si trova

n(!) = Re( %n) = 1 +NZ 2e2

2m"0

!02 #!2

(!02 #!2)2 + $ 2!2

(2.10a)

! (") = Im( %n) =NZ 2e2

2m#0

$"

("02 %"2)2 + $ 2"2

(2.10b)

È utile rappresentare nella Fig. 2.3 le equazioni scritte per meglio coglierne il significato fisico. Si osserva che l’assorbimento è massimo e l’indice di rifrazione vale 1 alla pulsazione di risonanza ω0. L’indice di assorbimento κ va a zero su ambo i lati del massimo. La semilarghezza Δω della campana, come sappiamo dalla meccanica, si presenta tanto maggiore quanto più elevato è il termine di dissipazione γ. Per γ=0, caso però soltanto ideale, la campana diventa una funzione delta di area nulla, dunque non si

25

ha dissipazione e il mezzo è trasparente. L’indice di rifrazione reale n tende al valore 1 per frequenze elevate perché l’inerzia impedisce alle cariche di seguire l’oscillazione del campo, dunque il comportamento del mezzo non differisce da quello del vuoto. Per basse frequenze, invece, n si mantiene sempre al di sopra del valore 1 per il contributo

Fig. 2.3. Parte reale e parte immaginaria dell’indice di rifrazione di un mezzo assorbente.

della polarizzazione statica degli atomi, sempre possibile. Nella zona di frequenze corrispondenti alla radiazione visibile la derivata dn/dω è positiva, come indicato dall’evidenza sperimentale (Fig. 2.1b). Tra il massimo e il minimo di n si osserva una regione di dispersione anomala che conduce a un indice di rifrazione minore di 1. Tale regione è tipicamente quella della radiazione X. Nella realtà, le transizioni elettroniche possibili all’interno di un atomo sono numerose e si avranno perciò diverse possibili risonanze. Inoltre si possono avere oscillazioni risonanti di particelle con massa assai maggiore, quali gli atomi stessi e le molecole. La polarizzabilità complessiva sarà data dalla somma delle polarizzabilità che provengono da ciascuna risonanza:

%! = %!i

i" =

qi2

mi

(#0i2 $#2) $ i%

i#&

'()*+

(2.11)

e procedendo come nel caso di una sola risonanza si ricavano delle espressioni per la parte reale n e immaginaria κ. Ci limitiamo a dare la prima, importante perché nella regione di trasparenza (come mostra la Fig. 2.4 dove tali espressioni sono rappresentate nel caso di un dielettrico con tre risonanze ben separate), l’indice di rifrazione risente del contributo di tutte le transizioni possibili, anche alquanto elevate in energia, ciò che non si verifica per l’indice di assorbimento:

26

n = 1+fi(!0i

2 "! 2 )

(!0i2 "! 2 )2 + # i

2! 2i

$ (2.12)

dove le varie costanti che competono a ciascun tipo di oscillatore sono state compendiate nel prefattore fi, detto forza dell'oscillatore. Per quanto concerne κ, si vedono delle bande di assorbimento chiaramente risolte. Riguardo a n, si nota che, per ω tendente all’infinito, per le ragioni sopra dette esso

Fig. 2.4. Parte reale e parte immaginaria dell’indice di rifrazione di un mezzo assorbente con tre risonanze.

tende a 1, presentando un minimo al disotto di 1 nella regione degli X. Scendendo in frequenza, n mostra crescenti contributi positivi al valore 1 perché vengono ad aggiungersi uno dopo l’altro i contributi delle diverse risonanze più basse. In genere, le risonanze sopra il visibile corrispondono a transizioni elettroniche all’interno degli atomi, quelle più basse – tipicamente nell’infrarosso - a oscillazioni di particelle più pesanti, quali le molecole. Al limite in cui ω tende a zero - caso statico - tutte le risonanze portano un contributo alla parte reale dell’indice di rifrazione per il fatto che l’inerzia non è più in gioco. 2.2.2 Esempio: comportamento dell’acqua. Lo spettro di assorbimento dell’acqua nella regione che va dal medio infrarosso all’ultravioletto è illustrato schematicamente in Fig. 2.5. Nell’infrarosso, ma anche nella zona delle microonde, l’assorbimento è dovuto alla risonanza con vari tipi di vibrazioni interne alla molecola H2O, molecola dotata di un dipolo elettrico. Le oscillazioni molecolari più importanti sono illustrate in Fig. 2.6. È grazie all’assorbimento nell’infrarosso che le piante traggono energia dalla luce solare; ed è grazie a risonanze nelle microonde che si realizza la cottura dei cibi

27

Fig. 2.5. Spettro di principio dell’indice di estinzione κ dell’acqua in funzione della lunghezza d’onda della radiazione e.m.

negli appositi forni. L’assorbimento nell’ultravioletto ha luogo invece grazie alle transizioni elettroniche che si hanno all’interno degli atomi di ossigeno e di idrogeno. Nella zona del visibile l’acqua è a tutti gli effetti trasparente. Si può misurarne allora l’indice di rifrazione che, al centro della zona visibile, risulta valere attorno a 1.33. Il quadrato di n dà allora un valore per la funzione dielettrica relativa, alla frequenza del campo e.m., εr=1.77, assai più piccolo del valore statico di εr che è 81. Tale differenza è dovuta al fatto che, per frequenza tendente a zero, tutte le possibili oscillazioni, elettroniche e molecolari, vengono attivate dal campo, mentre a frequenze elevate solo le prime continuano a dare un contributo alla polarizzazione, le seconde rimanendo inattive per la maggiore inerzia associata alla massa degli atomi.

Fig. 2.6. Alcuni modi di vibrazione della molecola d’acqua. 2.2.3 Approssimazione dell’oscillatore medio. L’indice di rifrazione nella regione di trasparenza di un materiale è quindi determinato esclusivamente dalle transizioni elettroniche. In effetti, per confronto con l’esperienza, si può verificare che il suo andamento in funzione della lunghezza d’onda può essere descritto in buona approssimazione da un unico oscillatore caratterizzato da un opportuno

!

"0 medio

alquanto più elevato della soglia di assorbimento sul lato delle alte frequenze. Inoltre, poiché nella regione di trasparenza n presenta un andamento alquanto disperso [si veda Fig. 2.1(b)], l’inclusione del termine di attrito γ nella (2.10a) risulta poco influente. Tale approssimazione porta a descrivere l’indice di rifrazione (reale) di un qualsiasi materiale nella zona trasparente tramite l’espressione semplificata:

0.8 0.4

κ

λ = 2πc/ω (in µm)

IR

Visibile

UV

105°

BENDING STRETCHING SIMMETRICO

STRETCHING ASIMMETRICO

O

H

H

28

!

n " 1 +C

#02$%2

(2.13)

dove la costante C e la pulsazione media

!

"0 vanno determinati cercando il miglior

adattamento ai dati sperimentali. 2.2.4 Dispersione e assorbimento da parte di elettroni liberi nei metalli.7 Riprendiamo l’espressione (2.7a) per la ε complessa e introduciamovi la (2.6), ponendo inoltre ω0=0 giacché, se gli elettroni che assorbono la radiazione non sono legati, non si hanno risonanze:

%!r(") = 1 #

NZ 2e2

!0m

1

"2 + i"$= 1 #

"p2

"2 + i"$ (2.14)

dove si è introdotta la cosiddetta “frequenza di plasma”

!

"p =Ne2Z 2

#0m (2.15)

che risulta tanto più elevata quanto più alta è la densità elettronica N, che è come dire la conducibilità elettrica σ del metallo. Ricordando che

%!r(") = (n + i# )2 (2.16)

ed eguagliando le parti reale e immaginaria delle due espressioni (2.14) e (2.16)

!

n2 "#2= 1 "

$p2

$2+ %2

(2.17a)

!

2n" =#p

2

#2+ $ 2

$

# (2.17b)

Dalle (2.17), note la frequenza di plasma e il termine di attrito γ (che è dato dal reciproco del tempo medio tra due collisioni da parte degli elettroni, o tempo di rilassamento τ), si possono ottenere i valori di n e κ in funzione della frequenza. Il

7 Testo consigliato G.R. Fowles, Modern Optics, Par. 6.5.

29

tempo di rilassamento, ottenibile da misure di conducibilità, vale per i metalli attorno ai 10-13 s, corrispondenti a una frequenza γ situata nell’infrarosso. La frequenza di plasma ωp cade invece attorno ai 1015 s-1, che corrisponde alla parte alta del visibile o al vicino ultravioletto. Tenendo presenti tali valori, per n e κ si ottengono gli andamenti rappresentati tipicamente in Fig. 2.7. A basse frequenze, vale a dire nell’infrarosso e visibile inferiore κ è molto elevato e ciò si traduce in un valore della riflettività prossimo a 1, come già si è detto in relazione alla (1.23). Al di sopra della frequenza di plasma l’assorbimento tende a 0 e l’indice di rifrazione si mantiene al disotto del valore unitario (naturalmente per quanto attiene al solo processo di assorbimento da parte di elettroni liberi).

Fig. 2.7. Tipici andamenti degli indici di rifrazione n e di estinzione κ in un metallo nella regione dell’infrarosso e visibile inferiore, dove domina l’assorbimento da elettroni liberi.

In Fig. 2.8 sono mostrate indicativamente le riflettanze a incidenza normale di alcuni tra i principali metalli in funzione della lunghezza d’onda. Quelli che in tutto il visibile presentano un'elevata parte immaginaria κ di ñ, quindi aventi grande potere assorbente - si veda la (1.23) - non presentano colorazione e sono praticamente

Fig. 2.8. Andamenti indicativi della riflettanza di vari metalli attorno alla regione del visibile.

riflettenti al 100% in tutta la gamma da 0.4 a 0.8 µm. Nell’oro e nel rame, κ assume valori alquanto diversi lungo la gamma del visibile: per questo motivo, visti in riflessione, presentano una colorazione rispettivamente gialla e rossastra.

1

0 ω ωp

Regione di trasparenza

Regione assorbente e riflettente

Frequenza di plasma

n κ IR Visibile UV

1

0 λ (µm) 0.2 0.8 0.4

R

VISIBILE

Al

Ag

Cu

Au

!

R =(n "1)2

+ #2

(n + 1)2+ #2

30

CAPITOLO 3

COERENZA DELLA LUCE E FENOMENI DI INTERFERENZA

3.1 Premessa: funzioni di intercorrelazione e di autocorrelazione8 Date due funzioni f(t) e h(t), il prodotto

!

f(t) h* (t + ")

mediato su un lungo intervallo di tempo informa su quanto due funzioni sono correlate (o, se vogliamo, simili), ossia in che misura la seconda funzione riproduce connotati della prima. Si ha una correlazione totale se la funzione h(t) si mantiene nel tempo identica alla f(t) quanto a frequenza, fase e ampiezza. Mostreremo che il grado di mutua correlazione tra due onde è collegato al loro essere più o meno coerenti. Si chiama funzione di intercorrelazione media - o mutua correlazione o cross-correlation media – quella data dalla seguente espressione

!

Cfh(") = limT#$1

2Tf(t)%T

T& h * (t + ")dt'

( ) )

*

+ , , (3.1)

simbolicamente rappresentata come

!

f(t) " h(t) . Si chiama invece funzione di autocorrelazione media quella in cui la h(t) coincide con la f(t) stessa (che naturalmente in un intervallo di tempo τ può mutare):

!

Cff (") = limT#$1

2Tf(t)%T

T& f * (t + ")dt'

( ) )

*

+ , , (3.1)

Essa dà il grado di sovrapposizione di una funzione f(t) con se stessa se traslata sull’asse dei tempi. Le funzioni di autocorrelazione sono di particolare utilità per individuare una segnale che risulti sepolto sotto un rumore di fondo a carattere casuale. La trasformata di Fourier si fonda sulla correlazione mutua tra il segnale misurato e le varie funzioni sinusoidali pure che costituiscono le diverse armoniche. Alcuni esempi di auto- e mutua correlazione per tre funzioni oscillanti tra -1 e 1 con andamento rispettivamente di onda quadra, onda sinusoidale e variazione casuale sono dati in Fig. 3.1.

8 Testo consigliato E. Hecht, Optics, Par. 11.3.4.

31

Fig. 3.1. Esempi di funzioni di autocorrelazione e intercorrelazione, e loro valori medi valutati sulla durata del segnale raffigurato.

3.2 Coerenza parziale e interferenza9 Nello studio dell’interferenza tra onde elettromagnetiche si suppone di norma che le due onde interferenti siano monocromatiche con eguale frequenza e costanti nel tempo in fase e ampiezza, come dire perfettamente coerenti. La luce naturale è generata per emissione occasionale di singoli fotoni (ovvero pacchetti d’onda) da parte di un insieme di atomi i quali agiscono indipendentemente l’uno dall’altro: la radiazione complessivamente prodotta ha allora un’ampiezza e una fase - così come una direzione di polarizzazione - che variano nel tempo in modo del tutto casuale. Inoltre, la luce emessa non è, di norma, monocromatica, in primo luogo perché essa può essere costituita dalla sovrapposizione di più tipi di transizioni tra stati atomici. Questo è il motivo per cui non è possibile osservare fenomeni di interferenza tra raggi luminosi provenienti da sorgenti diverse. È tuttavia possibile avere una coerenza parziale, vale a dire limitata a brevi intervalli di tempo. Se esprimiamo il campo elettrico come funzione complessa, l’intensità della luce varia da istante a istante, quindi la si valuta come media nel tempo del prodotto EE*, dove E è il campo risultante dalla sovrapposizione dei due campi E1 ed E2 che supporremo polarizzati allo stesso modo (quindi sommabili scalarmente):

!

I =< EE * >=< (E1 + E2)(E1*

+ E2*) >=<|E1 |2 + |E2 |2 + 2Re(E1E2

*) >=

!

= I1 + I2+ < 2Re(E1E2*) >

Supponiamo che sia il campo E2 a pervenire con un ritardo τ rispetto a E1, per esempio

a causa di un percorso più lungo dalla sorgente. Chiamiamo funzione di mutua coerenza la funzione di intercorrelazione

9 Testo consigliato G.R. Fowles, Modern Optics, Par. da 3.4 a 3.7.

32

!

"12(#) =< E1(t)E2*(t + #) >

notando che, per τ=0, le funzioni di autocorrelazione

!

"ii (#) =< Ei (t)Ei*(t + #) >

per i due campi valgono:

!

"11(0) =< E1(t)E1*(t) >= I1

!

"22(0) =< E2(t)E2*(t) >= I2

Introduciamo una funzione di intercorrelazione normalizzata, detta grado di coerenza parziale

!

"12(#) =$12(#)

$11(0)$22(0)=$12(#)

I1I2

(3.1)

la quale esprime quanta correlazione esiste tra i due campi in tempi che differiscono per τ (oppure in punti diversi). γ12 varia tra -1 e +1 e nel caso in cui I1=I2=I0 vale semplicemente Γ12/I0. Per l’intensità globale I delle due onde in sovrapposizione si arriva infine a

!

I = I1 + I2 + 2 I1I2 Re "(#)[ ]

dove abbiamo lasciato cadere i pedici di γ. L’espressione per I può scriversi, in alternativa, nel modo seguente:

!

I = I1 + I2 + 2 I1I2 |"(#) |cos$% (3.2)

dove Δϕ è lo sfasamento tra i due campi. Si vede che, in caso di perfetta coerenza al tempo τ, |γ|=1 e la formula ricade in quella già nota per sorgenti coerenti: si ha interferenza massimamente distruttiva allorché cosΔϕ =-1, massimamente costruttiva per cosΔϕ =1. Per 1>|γ|>0 si possono avere effetti di parziale interferenza, laddove per |γ|=0 si ha totale incoerenza e non è possibile avere alcun tipo di interferenza (l’intensità globale è allora semplicemente data dalla somma I1+I2). 3.2.1 Visibilità delle frange. Quando la coerenza è parziale, si pone il problema della visibilità delle frange di interferenza. Convenzionalmente, si definisce un parametro, detto appunto visibilità delle frange, nel modo seguente

33

!

V =Imax " Imin

Imax + Imin

=2 I1I2 |#($) |

I1 + I2

(3.3a)

che per un fascio sdoppiato – tale quindi che I1=I2 - diventa

!

V = |"(#) | (3.3b)

Il contrasto è massimo quando V=1 e invece scompare quando V=0. Si può valutare un tempo di coerenza tra due onde, cercando per quale ritardo τ la visibilità delle frange scende dal suo valore massimo ad altro più piccolo, da stabilire convenzionalmente (tipicamente si può fare riferimento al suo dimezzamento). 3.3 Tempo e lunghezza di coerenza Consideriamo una situazione schematica, obiettivamente poco realistica, che tuttavia è utile a dare un’idea del significato fisico dei termini tempo e lunghezza e della loro dipendenza dalle caratteristiche della sorgente. Prendiamo una sorgente monocromatica e supponiamo che emetta un’onda la cui fase resta costante per un tempo tc (tempo di coerenza), dopodichè varia in modo del tutto casuale nell’intervallo tra 0 e 2π. Il campo elettrico può essere rappresentato da

!

E (t) = E 0 exp(i"t)exp(i#(t))

dove ϕ(t) è una funzione step del genere esemplificato in Fig. 3.2. Ogni salto di fase

Fig. 3.2. Andamento schematico a salti della fase di un’onda.

è associato a qualche effetto perturbativo, ad esempio a un’interazione dell’onda e.m. con un atomo che comporti emissione di un fotone. Dividiamo il raggio in due parti di eguale ampiezza, indi ricomponiamolo (utilizzando per esempio l’ottica di un interferometro di Michelson, mostrata in Fig. 4.26). Valutiamo il grado di mutua coerenza γ in funzione del ritardo tra le due onde

0

π

t tc

2tc

3tc

4tc

ϕ(t)

34

!

"(#) =< E (t)E *(t + #) >

|E |2=

!

= limT"#1

Texp(i$t)exp(i%(t))[ ]0

T& exp('i$(t + ())exp('i%(t + ())[ ]dt =

!

= limT"#exp(i$%)

Texp i &(t) '&(t + %)[ ]{ }0

T( dt (3.4)

con la scomparsa, per effetto dell’integrazione, dei termini periodici. Studiamo ora la funzione ϕ(t)–ϕ(t + τ), rappresentandola nel grafico di Fig. 3.3.

Fig. 3.3. La funzione ϕ(t+τ)-ϕ(t) è diversa da zero solo negli intervalli di tempo ntc<t <ntc+τ (con n=1, 2, 3…), dove assume valori casuali.

Si può osservare che, in ogni intervallo tc, per τ < t < tc, Δϕ=0, mentre per 0<t<τ, Δϕ ≠ 0 con valore casuale tra 0 er 2π. L’integrale in (3.4), effettuato nel primo intervallo tc vale:

!

1

tc

exp i "(t) #"(t + $)[ ]{ }0

tc% dt =1

tc

exp(i&")0

$% dt + exp(0)$tc% dt

' ( )

* + ,

=

!

="

tc

exp(i#$) +tc % "

tc

π

0

0

τ

τ

τ

π ϕ(t+τ)

π ϕ(t)

t tc

2tc

3tc

4tc

0

ϕ(t + τ) − ϕ(t)

35

dove Δϕ assume, al variare di t, valori del tutto casuali, mentre il termine (tc-τ)/tc è eguale per tutti gli intervalli tc. Mediando su un gran numero di intervalli, ossia integrando e normalizzando su un T>>tc, il primo addendo nell'ultima equazione scritta va quindi a zero e il secondo mantiene il suo (unico) valore(tc - τ)/tc. Allora il grado di coerenza parziale, vale a dire la visibilità delle frange, è esprimibile come

!

|"(#) |= (1 $ # tc) per τ < tc

!

|"(#) |= 0 per τ > tc

con l’andamento illustrato dalla retta in Fig. 3.4. Come intuibile, la visibilità va a zero quando il ritardo diventa eguale al tempo tc in cui la fase resta costante. Quindi, in termine di differenza dei cammini ottici dei due raggi interferenti, per la visibilità occorre che essa sia minore della lunghezza di coerenza, definita come Lc=ctc, la distanza, cioè, sulla quale il campo elettrico E oscilla in modo almeno parzialmente

Fig. 3.4. Visibilità delle frange nel modello schematico adottato (retta) e in una reale misura sperimentale.

predicibile. Naturalmente, poiché l’intervallo tra successive emissioni di fotoni varia in maniera casuale, per tc si dovrebbe prendere un opportuno valor medio. L’esperienza mostra che nelle condizioni reali la diminuzione della visibilità con il tempo di coerenza decresce più lentamente di quanto non predica il semplice modello, come mostrato indicativamente dalla curva tratteggiata in Fig. 3.5. 3.4 Larghezza spettrale La radiazione emessa da una qualsiasi sorgente non è mai perfettamente monocromatica. Anche le righe emesse per ricombinazione di elettroni eccitati all’interno di un atomo hanno una loro larghezza di linea spettrale. Le cause di tale “allargamento” sono svariate. Anzitutto si ha un allargamento dovuto all’effetto Doppler associato alla distribuzione delle velocità degli atomi in un gas, che fa sì che la frequenza della radiazione emessa differisca, seppur di poco, da atomo ad atomo. Tale allargamento ha forma di gaussiana, com’è appunto la distribuzione delle velocità, ossia del tipo exp[-(ω−Ω)2/a2]. L’allargamento relativo si può stimare dalla velocità media degli atomi <v>=(3kT/m)1/2, dove m è la massa degli atomi; a metà altezza del picco di emissione (situato alla frequenza ν) esso vale

0 tc

V=|γ(τ)| 1 Sperimentale

Modello

τ

36

!

"#

#=

8ln2

c

kT

m

Una seconda fonte di allargamento sono le collisioni tra atomi nei gas o le loro interazioni quando si trovano a distanze ravvicinate, come nei liquidi, nei solidi o nei gas sotto pressione. Le collisioni possono essere di tipo elastico o anelastico, a seconda che comportino un semplice salto di fase nell’onda elettromagnetica o che determinino perdite di energia che possono essere considerate come dovute a fenomeni di attrito. Come tali portano a un allargamento lorentziano, ossia del tipo [(ω−Ω)2+γ2]-1. A questo si aggiunge l’allargamento cosiddetto “naturale”, anch’esso di tipo lorentziano, essenzialmente legato alla “durata finita” di uno stato eccitato, e può quindi essere riferita al principio di indeterminazione di Heisenberg. Salvo in rari casi il contributo dovuto all’ allargamento naturale è sempre coperto dai contributi dovuti all’ effetto Doppler e alle collisioni. Infine, ma questo è un effetto strumentale, la forma spettrale può venire ulteriormente allargata – anche qui in maniera gaussiana - a causa delle fenditure di ingresso e di uscita dei monocromatori, che di necessità debbono avere un’apertura non nulla. In Fig. 3.5 sono mostrati i due tipi di allargamento gaussiano e lorentziano. In genere essi sono presenti simultaneamente, per cui la forma di linea spettrale corrisponde di norma a una convoluzione delle due funzioni gaussiana e lorentziana.

Fig. 3.5. Allargamento di riga gaussiano (Doppler e strumentale) e allargamento lorentziano (collisioni anelastiche e tempo di vita dello stato eccitato).

3.5 Coerenza spaziale Con coerenza spaziale si intende quella che riguarda un’onda proveniente da una data sorgente, quando essa sia riferita a due diversi punti dello spazio. La coerenza longitudinale, cui si è già fatto cenno, riguarda due punti allineali sulla medesima direzione di propagazione (Fig. 3.6). Siano P1 e P2 tali punti e sia t12=(r2- r1)/c il tempo che l’onda impiega per passare dal primo al secondo. Affinché si abbia una coerenza elevata occorre che sia t12<<tc. Quanto alla coerenza trasversale, essa riguarda due punti situati su direzioni diverse di provenienza dalla sorgente, situati a eguale distanza da essa. Tale coerenza dipende ovviamente dall’estensione della sorgente.

37

Fig. 3.6. La coerenza longitudinale si valuta con riferimento ai punti P1 e P2, quella laterale ai punti P1 e P3.

3.7 Pacchetti d’onda – Coerenza e larghezza spettrale Sappiamo che, dato un segnale elettromagnetico di durata finita Δt – ossia un pacchetto d’onda - il suo campo elettrico è esprimibile tramite l’integrale di Fourier

!

E (t) = a(") cos"t0#$ d" (3.5)

il quale altro non è che l’estensione dello sviluppo in serie nelle armoniche di Fourier ω1, 2ω1, 3ω1… per una funzione periodica il cui periodo di ripetizione si supponga allungato all’infinito. Nella (3.5) i coefficienti a(ω), che danno i “pesi” delle varie ω nel pacchetto, sono espressi da

!

a(") =1

#E 0$%

%& cos"0t cos"tdt (3.6)

essendo E(t)=E0cosωt e ω0 la frequenza centrale del pacchetto d’onda (unico valore presente se Δt ∞). Le E(t) e a(ω) sono dette trasformate di Fourier l’una dell’altra. La distribuzione spettrale della potenza elettromagnetica è descritta evidentemente dal quadrato di a(ω). Non essendovi segnale al di fuori dell’intervallo Δt, gli estremi dell’integrale possono essere sostituiti da –Δt/2 e Δt/2. Si può dimostrare che, nell’approssimazione in cui Δt>>2π/ω0, l’integrale (3.6) assume il valore

!

a(") # $E 0%t

2&

sin("0 $"

2%t)

"0 $"

2%t

(3.7)

e a2(ω), riconducbile all’intensità, ha l’andamento illustrato in Fig. 3.7.

P2

|r3|=|r1|

P3

S

P1

r1 r2

38

Fig. 3.7. Il coefficiente a(ω) in (3.6) è apprezzabilmente diverso da 0 solo in un intervallo di frequenze 2π/Δt attorno alla frequenza centrale del pacchetto ω0.

Si vede che il pacchetto d’onde contiene una gamma continua di frequenze Δω attorno alla frequenza nominale emessa (ω0) - le singole frequenze nel pacchetto d’onda sono dette “fasi” - e che tale gamma è tanto più ampia quanto più breve è la durata del segnale:

!

"#"t = 2$

!

"#"t = 1

!

"E"t = h (3.8)

che, se vogliamo, costituisce un principio di indeterminazione analogo a quello che viene introdotto in meccanica quantistica per le particelle elementari.10 3.7.1 Propagazione del pacchetto – Velocità di fase e di gruppo.11 Occorre chiedersi come si propaga il pacchetto, vale a dire l’energia luminosa, visto che in un mezzo dispersivo le singole “fasi” viaggiano con velocità differenti. Riscriviamo l’integrale di Fourier per un’onda viaggiante:

!

E (x,t) = a(")#$"% exp &i("t &kx)[ ]d"

con Δω <<ω0. Moltiplichiamo e dividiamo per exp[-i(ω0t-k0x)], ottenendo

!

E (x,t) = exp "i(#0t "k0x)[ ] a(#)$%#& exp "i (# "#0)t " (k "k0)x)[ ]{ }d# (3.9)

dove l’esponenziale che precede l’integrale è un’onda viaggiante con velocità

10 Si veda ad esempio G.R. Fowles, Modern Optics, Par. 7.11. 11 Testo consigliato: Amaldi-Bizzarri-Pizzella, Fisica II, Cap. 16.

39

!

v 0 ="0

k0

=c

n("0) (3.10)

detta velocità di fase, mentre l’integrale stesso rappresenta una funzione inviluppo A(x,t) a forma di campana che dà un profilo spazio-temporale all’ampiezza dell’onda viaggiante (si veda in Fig. 3.8 la dipendenza spaziale, disegnata a un istante fissato). La velocità del pacchetto nel suo insieme è quella con cui avanza A(x,t), detta velocità di gruppo, che evidentemente è data da

!

v g =" #"0

k #k0

$d"

dk=

1

dk /d"=

1

d(n" c)/d"

ossia

Fig. 3.8. Profilo spaziale dell’onda viaggiante di frequenza ω0, con ampiezza controllata dalla funzione inviluppo A(x,t).

!

v g =n

c+"

c

dn

d"

#

$ % %

&

' ( (

)1

=c

n1 +

"

n

dn

d"

#

$ % %

&

' ( (

)1

<c

n (3.10)

purché la dispersione dn/dω non sia negativa, cioè anomala. Dunque la velocità di fase, nella regione in cui l’indice di rifrazione reale vale meno di 1, può superare il valore c che la luce ha nel vuoto. Non così la velocità di gruppo, che è sempre minore di c/n, e che corrisponde all’effettivo moto dell’energia, vale a dire del segnale che effettua un comando o porta dell’informazione. In Fig. 3.9 si mostra schematicamente, considerando tre istanti successivi, come la fase può “correre in avanti” rispetto al moto del pacchetto d’onda complessivo.

40

Fig. 3.9. Moto di un pacchetto d’onda: la fase avanza più velocemente del pacchetto nel suo insieme.

Nel caso di un pacchetto d’onda, si conviene di accettare che l’onda possa considerarsi essenzialmente monocromatica e che la sua fase sia prevedibile entro un tempo Δt, vale a dire per la larghezza temporale del pacchetto. Ogni fotone è un pacchetto d’onda con una propria durata caratteristica Δt e la luce, costituita da fotoni, è la sovrapposizione di un grande numero di essi. Ad ogni emissione di un ulteriore fotone, la fase complessiva del fascio luminoso cambia, il che avviene mediamente con un intervallo di tempo <Δt>. Allora la larghezza di banda media in frequenza è data da Δν=Δω/2π=<Δt>-1. Invertiamo ora il ragionamento, partendo da una riga di emissione luminosa avente una larghezza nota Δν: si può stimare che il tempo di coerenza – per il quale è prevedibile la fase dell’onda – valga qualcosa come

!

tc =< "t ># 1/"$

In questa luce, il tempo di coerenza rappresenta una misura della purezza spettrale della sorgente. Possibili esempi sono: (a) un laser di elevata qualità, per il quale la larghezza di riga vale Δν ≈ 104 Hz, e che si caratterizza quindi con una lunghezza di coerenza Lc=ctc=c/Δν ≈ 30 km; (b) un tubo a scarica per il quale Lc ≈ 2.5 mm, e infine (c) la luce solare, la cui lunghezza di coerenza scende di un ulteriore fattore 1000.

41

CAPITOLO 4

DIFFRAZIONE E INTERFERENZA

4.1 Il principio di Huygens-Fresnel12 Il principio di Huygens-Fresnel permette di tracciare i fronti d’onda successivi a un dato fronte, che sia noto indipedentemente dalla natura e dalle caratteristiche della sorgente. Secondo tale principio, che si rivelerà di fondamentale importanza nello studio di almeno due fenomeni, la diffrazione e la birifrangenza, si enuncia nel seguente modo: tutti i punti del fronte d’onda di partenza possono riguardarsi come sorgenti elementari di onde sferiche e la loro superficie inviluppo, tracciata dalla parte dell’avanzamento dell’onda dopo un periodo T della stessa, costituisce il fronte d’onda successivo. Tale costruzione è mostrata in Fig. 4.1 per tre tipi di fronte d’onda, rispettivamente generico, sferico e piano. Si può dimostrare che se si applica la stessa procedura nel verso opposto a quello di avanzamento dell’onda, i fronti d’onda elementari interferiscono distruttivamente e non danno perciò luogo a un fronte d’onda regressivo.

Fig. 4.1. Costruzione di successivi fronti d’onda da uno conosciuto tramite la costruzione di Huygens.

4.1.1 Esempio: legge della rifrazione la costruzione di Huygens.13 Il principio di Huygens-Fresnel si presta a dimostrare in una terza maniera la legge della rifrazione. Si abbia la situazione illustrata in Fig. 4.2: un raggio con fronte d’onda piano incide sulla superficie di separazione (piana) di due mezzi omogenei, formando un angolo θi rispetto alla normale. Sia ν la frequenza del campo e.m. Il fronte d’onda, che è normale al foglio, forma un angolo θi con la superficie. Quando il fronte d’onda tocca il piano di separazione (punto A), si potrà individuare un altro punto B che dista λ1 da esso, essendo λ1=c/n1ν la lunghezza d'onda nel mezzo 1. Facciamo trascorrere un

12 Testo consigliato Mencuccini-Silvestrini, Fisica II, Par. X.7. 13 Testo consigliato Mazzoldi-Nigro-Voci, Fisica, Vol. II, Nota in Esempio 14.2.

Fronte d’onda primitivo

Fronti d’onda Sferici elementari

Nuovo fronte d’onda

Nuovo

Primitivo

Nuovo

Primitivo

42

periodo T=1/ν dell’onda: dopo tale tempo, il punto B sarà avanzato esattamente in B’, al confine dei due mezzi. Se si suppone che il secondo mezzo sia più denso, vale a dire n2>n1 e v1>v2, nel contempo il punto A avrà generato un’onda secondaria sferica alla Huygens, il cui raggio sarà λ2=c/n2ν, più piccolo di λ1. L’omogeneità del secondo mezzo ci assicura che raggio incidente e raggio rifratto giacciono nello stesso piano e che il fronte d’onda sarà piano e perpendicolare al foglio, come nel primo mezzo. Basterà allora individuare due suoi punti per poterlo tracciare. Un punto ovvio è B’, un

Fig. 4.2. Dimostrazione della legge di Cartesio-Snell tramite la costruzione di Huygens.

secondo è, per il principio di Huygens, il punto di tangenza del fronte d’onda con il fronte elementare generato da A, punto che indicheremo con A’. Si potrebbero tracciare fronti d’onda elementari da qualsiasi altro punto del segmento AB ed essi risulterebbero ovviamente tangenti allo stesso piano (si veda come esempio il fronte d’onda in tratteggio generato in D). Quanto alla direzione del raggio nel secondo mezzo, essa è data dalla congiungente di A con A’, visto che A’ è il punto dove A si è spostato nel tempo T=1/ν. Si tratta infine di dimostrare che θr e θi sono legati dalla legge dei seni (1.13b). Consideriamo i due triangoli rettangoli ABB’ e AA’B aventi l’ipotenusa AB’ in comune. I loro cateti λ1 e λ2 sono proporzionali ai seni degli angoli opposti, dunque

!

"2

"1

=sin#r

sin#i

=n1

n2

che è di nuovo la relazione di Cartesio-Snell. È importante aver capito a fondo questa procedura perché verrà in seguito utilizzata sistematicamente nello studio della rifrazione da parte dei mezzi anisotropi. Lasciamo al lettore di verificare in proprio che l’applicazione del principio di Huygens alla riflessione porta al risultato già acquisito che l’angolo di incidenza e l’angolo di riflessione sono eguali.

B

B’

λ1

θr

θr

A’

Fronte d’onda incidente

λ2

Fronte d’onda rifratto

A θi

θi D

43

4.2 Diffrazione Nel caso in cui alla propagazione libera dell’onda si frappone un ostacolo, quale può

essere un bordo o uno schermo opaco con un’apertura, il fronte d’onda muta aspetto: in Fig. 4.3 è illustrato l’esempio di una fenditura, con la stessa disposta perpendicolarmente alla pagina. Mentre il fronte d’onda incidente è piano, il fronte d’onda emergente è grosso modo cilindrico, avendo soltanto una limitata zona centrale, larga quanto la fenditura, dove si mantiene piano. A grande distanza, il fronte diventa a tutti gli effetti pratici cilindrico e lo è perfettamente nel limite in cui la larghezza della fenditura tende a zero; se poi anche la dimensione longitudinale della fenditura si riduce a tutti gli effetti a zero – vale a dire se si ha a che fare con un foro pressoché puntiforme - i fronti d’onda emergenti si presentano sferici. Effetti del genere hanno luogo con ogni tipo di onda, ad esempio con quelle superficiali di un liquido, come è facile verificare per mezzo di un endoscopio (visto in meccanica).

Fig. 4.3. Una fenditura lunga e sottile (qui vista da sopra) trasforma fronti d’onda piani in fronti d’onda grosso modo cilindrici, aventi per asse la fenditura stessa.

4.3 Interferenza da diffrazione: singola fenditura14 Prima di entrare in una trattazione pià approfondita delle figure di interferenza prodotte dalla diffrazione causata da un’apertura, proponiamo una deduzione semplificata (che tuttavia ha un chiaro significato fisico), nelle condizioni di lavoro sperimentale dette “alla Fraunhofer”. Questa modalità consiste nell’osservare l’interferenza dovuta ai vari raggi uscenti dalla fenditura ponendosi a distanza infinita da essa, in modo da poter limitare la considerazione ai soli raggi che escono tra loro paralleli (la modalità sperimentale in cui ci si pone non lontano dalla fenditura è detta “alla Fresnel”). In laboratorio, l’interferenza-diffrazione alla Fraunhofer può essere

14 Testi consigliati Mencuccini-Silvestrini, Fisica II, Par. X.10.1-X.10.4, G.R. Fowles, Modern Optics, Par. 5.4.

Fronti d’onda uscenti

Fronti d’onda entranti

Direzione di propagazione dei raggi

44

osservata ponendosi ad alcuni metri di distanza dalla fenditura, oppure utilizzando una lente L che focalizzi i raggi su uno schermo S posto nel fuoco della lente, che ha cioè l’effetto di portare l’infinito al finito (Fig. 4.4). Sia x la coordinata del generico punto nella fenditura: x varia quindi tra 0 e d, la larghezza della fenditura. Sia inoltre θ l’angolo formato dalla direzione dei raggi incidenti e dei particolari raggi emergenti su cui intendiamo fissare l’attenzione.

Fig. 4.4. Assetto sperimentale di Fraunhofer per l’osservazione dell’interferenza associata alla diffrazione da singola fenditura.

Per calcolare in un generico punto P il campo complessivo dovuto alla sovrapposizione degli infiniti raggi uscenti sotto l’angolo θ, basta integrare su tutti i contributi per 0< x<d, osservando che al livello della fenditura le onde sono tutte in fase perché appartengono allo stesso fronte d’onda, e che quindi per valutare il loro effetto d’interferenza basta considerare soltanto lo sfasamento kxsinθ che ciascuno di essi accumula rispetto al raggio uscente da 0 per il fatto di dover percorrere un cammino più lungo. Esprimendo i campi con una funzione cosinusoidale, il campo risultante è dunque

!

E (P,t) = a cos(kx sin" #$t)0d% dx (4.1)

dove a è una costante. Merita sottolineare la semplicità del metodo di Fraunhofer, che evita di dover considerare gli effetti di interferenza dovuti a raggi con diverso angolo di uscita, permettendo di eseguire un semplice integrale su x, essendo θ, una volta scelto il punto P, un parametro fisso. Poniamo

!

kx sin" = y

!

kd sin" = # (4.2)

usiamo la relazione trigonometrica

!

cos(y "#t) = cosy cos#t + siny sin#t

P

θ

Fenditura

d L S

0

x

d

θ

xsinθ

f

45

e notiamo che per le (4.1)

dx=dy/ksinθ =(d/δ)dy ciò che porta rapidamente a scrivere per il campo risultante

!

E (P,t) =ad

"Acos#t + B sin#t( )

dove

!

A = cosydy0

"# = sin"

!

B = sin ydy0

"# = 1 $ cos"

L’intensità si calcola dal valor medio temporale del quadrato di E. Notando che

!

< cos2"t >=< sin

2"t >= 1/2

!

< sin"t cos"t >= 0

si trova per l’intensità media

!

I(P) =a2d2

"2

A2+ B2

2=

a2d2

2"2sin2 " + 1 + cos2 " #2cos"$ % &

' ( ) =

!

=a2d2

"2(1 # cos") =

a2d2

"22sin2 "

2

Poniamo adesso

!

" =#

2=

kd sin$

2=%d

&sin$ (4.3)

che conduce infine a

!

I(P) =a2d2

2

sin2"

"2

#

$

% %

&

'

( ( (4.4)

È la nota formula che dà la figura di interferenza osservata sullo schermo S in Fig. 4.4. La sua rappresentazione grafica è data in Fig. 4.5. Nell’esperimento con fenditura si osservano delle strisce luminose parallele alternate a strisce buie. Quella centrale - corrispondente a α=0, ossia sinθ=0 - presenta un elevato livello di intensità; i massimi laterali sono molto più deboli e si verificano per α=(±3/2)π, (±5/2)π, (±7/2)π…; gli zeri si incontrano allorché α=±nπ, vale a dire per

!

sin" = ±n#

d$ " (4.5)

46

dove è giustificato porre sinθ≈θ, perchè si ha a che fare con angoli piccoli. Il massimo

Fig. 4.5. Figura di diffrazione “alla Fraunhofer” da parte di una singola fenditura.

centrale, compreso tra i due primi zeri, ha larghezza angolare, come vista dalla fenditura, 2θ=2λ/d. Dalla (4.5) si evince che se d cresce, ossia se la fenditura si allarga, i massimi della figura di diffrazione si restringono: al limite in cui d∞, Δ0, cioè la luce emergente si propaga in linea retta (i fronti d’onda restano piani) e l’effetto di diffrazione sparisce; invece per d0, si ha il massimo sparpagliamento della luce e i fronti d’onda uscenti sono perfettamente cilindrici. 4.3.1 Potere risolutivo spaziale (o potere separatore). La presenza di diffrazione si ha ogni qualvolta la luce deve passare attraverso l’apertura di uno strumento ottico, com’è per un cannocchiale, un telescopio, un microscopio. Ciò rende la visione meno nitida e in particolare impedisce di vedere separati due oggetti troppo vicini. Nel caso di un telescopio, supponiamo di voler osservare due stelle alquanto vicine. L’asse dello strumento verrà posto in modo da passare per la posizione intermedia tra le due stelle, cosicché sullo schermo di osservazione i rispettivi massimi di interferenza cadranno fuori asse da parti opposte (Fig. 4.6). Convenzionalmente, per la separabilità delle immagini delle due stelle

Fig. 4.6. Parziale sovrapposizione dell’immagine di due stelle causata dalla diffrazione da parte dell’apertura del telescopio.

Apertura telescopio

Δθ

Asse ottico

47

osservate si adotta il criterio di Rayleigh: due oggetti appaiono distinti fino al punto in cui il massimo principale dell’uno va a sovrapporsi al primo zero dell’altro, situazione mostrata in Fig. 4.7. Ciò conduce alla seguente definizione di potere risolutivo spaziale (avendo al solito approssimato sinθ≈θ):

!

"#minfendit

=$

d (4.6)

Fig. 4.7. Condizioni limite per la separabilità di due stelle viste al telescopio (criterio di Rayleigh).

Nel caso di un’apertura circolare (foro), le zone luminose e scure hanno forma di cerchi concentrici e il potere separatore va corretto con un fattore 1.22, come dimostreremo nel seguito:

!

"#minforo circ

= 1.22$

d (4.7)

4.3.2 Principio di Babinet. Abbiamo fin qui discusso solamente la diffrazione prodotta da uno schermo sul quale sono praticate fenditure (o fori). Un problema interessante, e a prima vista molto più difficile, è quello delle sfocature delle ombre causate dalla diffrazione. Se abbiamo un oggetto piccolo o sottile, ad esempio un capello e ci interessa la figura di diffrazione a grandi distanze, dobbiamo calcolare l'ampiezza, prodotta dalla diffrazione, A(θ). La maniera ovvia sarebbe immaginare uno schermo che ha una sola singola apertura molto grande, che si estende ovunque eccetto dove c'è l'oggetto. Dovremmo quindi sommare le onde sferiche aventi origine da tutta l'apertura dello schermo, esclusa la piccola zona occupata dall'oggetto. Non è tuttavia necessario risolvere questo problema piuttosto complesso, poiché si può giovarsi di un principio, detto di Babinet, che stabilisce: se si hanno due schermi complementari A e B tali che, dove lo schermo A ha un'apertura praticata su un fondo assorbente, lo schermo B non abbia apertura e sia invece trasparente altrove, la

48

figura di diffrazione I(θ) prodotta dai due schermi sarà identica ad eccezione, esattamente, per l’angolo θ = 0. 4.4 Diffrazione da fenditura doppia15 Si abbiano ora due fenditure vicine e parallele. In questo caso si ha un doppio effetto di interferenza: primo quello individuale di ciascuna fenditura; secondo quello incrociato tra i raggi dell’una e dell’altra fenditura (Fig. 4.8). Poniamoci ancora nelle condizioni di Fraunhofer. Supponendo d<<D, la prima darà una struttura inviluppo a passo lungo, la seconda una struttura fine. L’interferenza tra raggi omologhi – ossia con la stessa x - provenienti dall’una e dall’altra delle due fenditure dipende dalla differenza di cammino ottico δr=r2–r1=Dsinθ, per cui la loro differenza di fase vale

!

"# = 2$%r

&=

2$Dsin'

&

Fig.4.8. Diffrazione da doppia fenditura.

e l’intensità

!

I = I1 + I2 + 2 I1I2 cos"# = 2I(P)(1 + cos"#)

dove si è presa la stessa intensità - I(P) - per le due fenditure. L’espressione per I(P) è data dalla (4.4) che, sostituita nell’ultima espressione scritta, porta infine a

!

I(P) =a2d2 sin2("d sin# $)

("d sin# $)21 + cos(2"Dsin# /$)[ ] (4.8)

15 Testo consigliato Mencuccini-Silvestrini, Fisica II, Par. X.10.3.

d

d

D θ

δr= Dsinθ

49

La (4.8) è rappresentata in Fig. 4.9: il secondo fattore - l’interferenza incrociata – presenta frange con andamento sinusoidale di periodo breve, tanto più breve quanto

Fig. 4.9. Figura di interferenza dovuta alla diffrazione da parte di due fenditure affiancate.

maggiore è la separazione D delle fenditure; il primo fattore modula l’ampiezza del secondo con un andamento tipo fenditura singola, con passo tanto più lungo quanto minore è la larghezza d delle fenditure. 4.5 Reticolo di diffrazione16 Se il numero delle fenditure parallelamente affiancate diventa elevato, si ha un reticolo di diffrazione, il quale può agire per riflessione o per trasmissione. Sia ora D il “passo del reticolo”, come illustrato in Fig. 4.10, d la larghezza delle fenditure e infine N il numero totale dei passi. Evitando di entrare nei dettagli matematici, diremo

Fig. 4.10. Un reticolo di diffrazione per trasmissione.

16 Testo consigliato Mencuccini-Silvestrini, Fisica II, Par. X.10.4 o anche G.R. Fowles, Modern Optics, Par. 5.4.

D

d b

θ

50

che l’espressione dell’intensità osservata al variare dell’angolo di emergenza – sempre nell’assetto di Fraunhofer – è data adesso da

!

I = cost "d2 sin

2#

#2

sin2

N$

sin2 $

(4.9)

dove

!

" =#d sin$

%

!

" =#

$

b

Nsin% =

#Dsin%

$ (4.10)

Detta intensità è rappresentata in Fig. 4.11. Si rileva che i picchi più intensi dell’interferenza incrociata plurima sono contenuti nell’inviluppo formato dal massimo principale della figura di diffrazione di singola fenditura. Accanto a massimi secondari di piccola intensità, che tendono a sparire tanto più quante più sono le fenditure, si hanno massimi principali, il più intenso essendo quello detto di ordine 0 (luce emergente con angolo nullo), gli altri più deboli in ragione del loro numero d’ordine. I massimi principali divengono sempre più stretti all’aumentare del numero delle fenditure e inoltre il rapporto tra la loro intensità e quella dei massimi secondari aumenta come N2. Nei reticoli di uso in laboratorio, N può valere 1000 e oltre: a tali livelli, i massimi principali sono delle righe strettissime e i secondari svaniscono. È

Fig. 4.11. Massimi principali e massimi secondari di un reticolo di diffrazione con luce incidente normalmente ad esso.

utile annotare che i massimi principali si incontrano quando vale

!

sin" = ±n#

D con n=0, 1, 2… (4.11)

dove n rappresenta il loro numero d’ordine, gli zeri per

51

!

sin" = ±m#

ND con n≠m=1, 2, 3… (4.12)

e i massimi secondari per

!

sin" = ±n, #

d con n’=1, 2, 3…

4.5.1 Semilarghezza dei massimi principali. Dalla (4.11), l’ennesimo massimo principale (lato positivo) si ha per

!

sin" = n#

D

mentre dalla (4.12) lo 0 più prossimo ad esso si ha per

sin !" = m#

ND con

!

n

N= n +

1

N

!

m = nN + 1

Poiché θ’ è di poco superiore a θ, possiamo scrivere θ ‘≈θ+δθ, e quindi

sin !" # sin" + cos"$" = n% /D

da cui per la semilarghezza dei massimi principali si ottiene

!" #

sin $" % sin"

cos"=

(nN + 1)& /D % n& /D

cos"=

&

ND

1

cos" (4.13)

il che conferma che i massimi tendono a prendere la forma di righe molto strette per N sufficientemente grande. Dalla (4.11) si nota che i massimi principali di qualsiasi ordine n si osservano per un particolare valore di θ per ogni particolare lunghezza d’onda λ. Il reticolo di diffrazione permette quindi la separazione delle varie componenti cromatiche in un fascio di luce composita e inoltre fornisce un modo per determinare λ. Esso può dunque essere usato in luogo del prisma con il vantaggio di offrire una corrispondenza lineare tra λ e sinθ, e approssimativamente con θ stesso. 4.5.2 Dispersione angolare e potere risolutivo del reticolo. Viene detta dispersione angolare la derivata dθ/dλ. Se δθ è piccolo può essere confuso con il diffrenziale dθ, e così pure δλ con dλ. Differenziando la (4.11) – lato positivo – si ha

!

cos"d" = nd#/ D

52

da cui

!

"#

"$=

n

D cos# (4.14)

dove si osserva che se n cresce o D diminuisce la dispersione dθ/dλ aumenta, che è come dire che la risoluzione spettrale migliora se l’ordine è elevato oppure se il passo del reticolo è piccolo. All’ordine 0 non si ha dispersione e tutte le righe si trovano sovrapposte. L’esempio schematico in Fig. 4.12 aiuta a comprendere la situazione sperimentale quando la luce incidente sul reticolo è costituita, ad esempio, da due righe di lunghezza d’onda λ1 (verde) e λ2 (rossa). Secondo il criterio di Rayleigh già introdotto in Par. 4.3.1 la separazione minima – nella (4.14) - a cui due righe possono vedersi ancora separate corrisponde alla loro semilarghezza (4.13). Allora è

!

"#min = "$min

n

D cos# ed anche

!

"#min =$

N

1

D cos#

Fig. 4.12. Righe dei vari ordini di luce costituita da due componenti cromatiche (verde sovrapposto a rosso dà giallo).

da cui infine

!

"#min =#

Nn

e un potere risolutivo

!

R ="

#"min

= nN (4.15)

Il potere risolutivo cresce quindi linearmente sia con l’ordine del massimo principale sia con il numero totale delle fenditure. Per un buon reticolo R vale attorno a 105. I monocromatori moderni usati in esperimenti di natura spettroscopica sono costituiti da reticoli, o eventualmente da doppi reticoli, nel caso sia necessario, oltre a un buon potere risolutivo, ridurre al minimo la presenza di eventuale luce diffusa che produca un nocivo fondo policromatico. La luce da esaminare viene fatta passare attraverso una sottile fenditura posta all’ingresso del monocromatore, viene poi dispersa dal reticolo di diffrazione e infine analizzata da una fenditura d’uscita. Le varie lunghezze d’onda emergono in successione quando si fa ruotare il reticolo

n=0 n=1 n=2

53

attorno al proprio asse. Un’opportuna ghiera graduata ne fornisce direttamente la lettura per ogni posizione angolare del reticolo (Fig. 4.13).

Fig. 4.13. Monocromatore a reticolo in trasmissione. Una sola componente cromatica può emergere dalla fenditura di uscita, naturalmente con una data larghezza di linea che dipende precipuamente dalla larghezza delle fenditure.

4.6 Trattazione fondamentale della diffrazione17 Vogliamo ora affrontare il fenomeno della diffrazione in modo più formale, partendo dal teorema di Kirchhoff, per giungere a descrivere i risultati nel caso di aperture aventi forma del tutto generica, anche diversa dalla semplice fenditura. 4.6.1 Formula integrale di Kirchhoff-Fresnel. Sia P un punto posto nell’origine degli assi (r=0), nel quale confluisce un’onda sferica e sia S una superficie generica che lo contiene (Fig. 4.14). Data una funzione d’onda scalare E, il teorema di Kirchhoff pone

Fig. 4.14. Condizioni geometriche per l’applicazione del teorema di Kirchhoff.

in correlazione il valore che l’onda ha in P con quelli che essa assume sulla superficie S:

EP=

1

4!

exp(ikr)

r("E)

n#E"

exp(ikr)

r

$

%&

'

()

n

*

+

,,

-

.

//S0 dS (4.16)

dove

!

("…)n è la componente normale a S dell’operatore gradiente. Applichiamo ora il teorema al problema della diffrazione. Si abbia una sorgente s che emette un’onda 17 Testo consigliato G.R. Fowles, Modern Optics, Par. da 5.1 a 5.4.

Fenditura Fenditura

Schermo

Reticolo ruotabile

r SS

P

n

54

sferica monocromatica, Fig. 4.15, la quale incontra sul proprio libero cammino un ostacolo in forma di apertura in uno schermo opaco (Fig. 4.3). Ci chiediamo che perturbazione ottica arriva in P, preso di nuovo come origine. Cominciamo con

Fig. 4.15. Effetto di uno schermo dotato di apertura sulla libera propagazione del segnale luminoso emesso da s.

l’osservare che, per la presenza dell’ostacolo, E è diverso da zero solo sull’apertura. Il valore di E sull’apertura (supposta piccola rispetto alla distanza r dalla sorgente s) è dato da

!

E =E 0

r,exp(ikr,

" i#t) (4.17)

per cui, applicando il teorema (4.16), in P si ha

!

EP =E 0 exp("i#t)

4$

exp(ikr)

r%

exp(ikr,)

r,

&

'

( (

)

*

+ + n

"exp(ikr,)

r,%

exp(ikr)

r

&

' ( (

)

* + + n

,

-

.

.

/

0

1 1 23 d2 (4.18)

dove l’ integrazione è stata limitata alla sola area Σ relativa all’apertura.

!exp(ikr,)

r,

"

#$$

%

&''

n

=( exp(ikr,)

(r,

)

*

++

,

-

.

.cos(n,r,) =

ik exp(ikr,)

r,/

exp(ikr,)

r,2

)

*

++

,

-

.

.cos(n,r,)

!exp(ikr)

r

"

#$

%

&'

n

=( exp(ikr)

(r

)

*++

,

-..cos(n,r) =

ik exp(ikr)

r/

exp(ikr)

r2

)

*++

,

-..cos(n,r)

Essendo k=2π/λ, k/r>>1/r2, k/r’>>1/r’2, λ<<r, λ<<r’, l’integrale (4.18) si riduce a

r’ r

s

P

n

55

EP= !

ikE0exp(!i"t)

4#

exp ik(r + r,)( )rr,

$

%

&&&

'

(

)))

*+ cos(n,r) ! cos(n,r,)$%&

'()

d* (4.19)

(notare il cambiamento di segno davanti all’espressione scritta, che prende il nome di formula integrale di Fresnel-Kirchhoff). Il termine che contiene la differenza dei coseni si chiama fattore di obliquità e fa dipendere l’intensità del raggio diffratto dalla sua inclinazione rispetto al raggio incidente. Applichiamo ora la formula di Fresnel-Kirchhoff a un’apertura in forma di foro circolare. 4.6.2 Applicazione al foro circolare. Diamo alla superficie Σ che riguarda l’apertura nello schermo la forma dettata dal fronte d’onda proveniente da s, quindi di calotta sferica (se l’incidenza può ritenersi essenzialmente normale). Allora, come illustra la Fig. 4.16, r’ è parallelo al vettore n e discorde con esso, e inoltre cos(n, r’)=-1. Il campo elettrico nel punto P a distanza r dall’apertura prende allora la forma

EP= !

ik

4"

E#exp i(kr !$t)( )

r

%

&

'''

(

)

***

#+ cos(n,r) + 1%&

()

d# (4.20)

Fig. 4.16. Condizioni per diffrazione da parte di un’apertura circolare investita da luce con incidenza normale.

dove si è posta come ampiezza EΣ=E0exp(-ikr). EΣ è l’ampiezza (complessa) che perviene al foro da s. Quindi è come se da ogni elemento dΣ della superficie dell’apertura partisse un’onda sferica secondaria (elementare) descritta da

!

dE " =E " exp i(kr #$t)( )

rd"

e in P avesse luogo la sovrapposizione di tutti questi contributi elementari. Possiamo allora concludere che la (4.19) non è altro che la formulazione matematica del principio di Huygens-Fresnel.

r’ r s

P

n

56

Consideriamo adesso in maggior dettaglio il fattore di obliquità nella (4.20), ossia cos(n, r’)+1: A. Propagazione indeviata n parallelo a r' cos(n, r’)=1 fattore di obliquità=2 ampiezza massima ---------- B. Propagazione all’indietro n antiparallelo a r' cos(n, r’)=-1 fattore di obliquità=0 ampiezza nulla (nel principio di Huygens, enunciato originale, questa conclusione non era esplicita) ---------- C. Per propagazione con un angolo generico di deviazione, l’intensità è diversa da zero, ma va decrescendo man mano che ci si sposta dalla condizione A alla condizione B. La presenza del fattore –i davanti all’integrale (4.20) indica che le onde elementari diffratte, in partenza da Σ, sono sfasate di π/2 rispetto all’onda primaria (se si esprimesse il campo incidente con legge sinusoidale, i campi diffratti sarebbero dei coseni). Anche questo risultato non era predicibile sulla base del semplice principio di Huygens. 4.6.3 Esempio: fenditura “alla Fraunhofer” dalla formula di Kirchhoff-Fresnel. Allo stesso risultato raggiunto in Par. 4.3 per la singola fenditura nell’assetto sperimentale di Fraunhofer, si può pervenire dalla formula (4.20). Sono da ritenersi valide le seguenti approssimazioni: (1) piccoli angoli di diffrazione, quindi fattore di obliquità essenzialmente costante ed eguale a 2; (2) onda piana, quindi EΣ e 1/r eguali in tutti i punti dell’apertura. Allora, anticipando che per giungere all’intensità si medierà sul tempo, possiamo tralasciare la dipendenza temporale e scrivere per il campo in P:

!

EP = C exp(ikr)"" d# (4.21)

con dΣ=Ldy (L=lunghezza della fenditura) e r=r0+ysinθ (si veda la Fig. 4.17). Si ha allora

!

EP = C exp(ikr0) exp(iky sin")#d / 2d / 2$ Ldy = CLexp(ikr0)

sin( 1

2kd sin")

1

2kd sin"

= Dsin%

%

dove C e D sono delle costanti, e α=

!

1

2kd sin" . Quadrando,

!

I =|EP |2= I0sin2"

"2

57

come già precedentemente ricavato con procedura ad hoc.

Fig. 4.17. Geometria per l’esecuzione dell’integrale (4.21) nella diffrazione “alla Fraunhofer” da fenditura singola.

4.6.4 Esempio: apertura rettangolare “alla Fraunhofer”. Siano a e b i lati del rettangolo: si tratta ora di eseguire un integrale simile a quello della fenditura singola, ma in due dimensioni. Si ottiene come risultato il prodotto delle due funzioni di distribuzione della luce diffratta relative a due fenditure, larghe rispettivamente a e b, tra loro perpendicolari:

!

I = I0

sin"

"

#

$ % %

&

' ( (

2

sin)

)

#

$ % %

&

' ( (

2

(4.22)

dove

!

" = 1

2ka sin#

!

" = 1

2kbsin#

La figura di diffrazione è schematicamente illustrata in Fig. 4.18.

Fig. 4.18. Schema della figura di diffrazione “alla Fraunhofer” da parte di una finestra rettangolare.

4.6.5 Esempio: apertura circolare “alla Fraunhofer”. Se R il raggio dell’apertura, l’elemento di area dΣ è dato da (si veda la geometria in Fig. 4.19)

!

d" = 2 R2# y2dy

0

-d/2

d/2 y

y sinθ

α

β

58

Fig. 4.19. Geometria per l’esecuzione dell’integrale (4.21) nella diffrazione “alla Fraunhofer” da finestra circolare.

per cui l’integrale (4.21) diventa

!

EP = C exp(ikr0) exp(iky sin")#RR$ 2 R2 # y2dy

Posto

u=y/R ρ=kRsinθ (4.23) si ha

!

EP = C exp(ikr0) exp(i"u)#11$ 1 # u2du

Si tratta di un integrale standard eguale a πJ1(ρ)/ρ, dove J1 è la funzione di Bessel del primo tipo di ordine 1. Allora l’intensità diffratta è

!

I = I02J1(")

"

#

$ % %

&

' ( (

2

(4.24)

con simmetria circolare, per cui le frange di interferenza sono cerchi del tipo tracciato in Fig. 4.20. L’andamento dell’intensità in (4.24) è praticamente eguale a quello della fenditura singola mostrata in Fig. 4.5, con ρ in ascissa al posto di sinθ. Il primo zero nella funzione di Bessel, a fianco del massimo centrale, si ha

Fig. 4.20. Schema delle frange di interferenza per diffrazione prodotta da un’apertura circolare.

Disco di Airy

R

(R2-y2)1/2

y dy

59

per ρ=3.832, che per la seconda delle (4.23) fornisce il relativo sinθ:

!

sin" =3.832#

2$r= 1.22

#

d

dove d=2R è il diametro del foro. Ne consegue che il potere separatore, equazione (4.7), è un po’ inferiore a quello di una fenditura della stessa larghezza d, equazione (4.6). 4.7 Sistemi interferenziali18 Torniamo brevemente sul fenomeno dell’interferenza per illustrare alcuni sistemi con cui è possibile produrre figure di interferenza e realizzare particolari condizioni di impiego, come cavità per laser, o esperimenti di interferometria di varia natura. Si è detto che condizione essenziale per l’interferenza di due onde è che esse siano almeno parzialmente coerenti e abbiano eguale stato di polarizzazione. Il modo più ovvio per avere due sorgenti coerenti è di scindere in due il raggio proveniente da una singola sorgente, caso in cui il requisito di eguale polarizzazione diventa addirittura superfluo. 4.7.1 Esperienza di Young. Un classico modo di studiare le frange di interferenza partendo da un’unica sorgente è quello noto come esperienza di Young. Non ci dilunghiamo su di esso perché si tratta né più né meno di quanto discusso a proposito della doppia fenditura. Thomas Young, di professione medico, utilizzò due forellini praticati in un cartone e investiti da un fronte d’onda piano. L’effetto della diffrazione gli permise di creare una zona sopra uno schermo, nelle condizioni di Fraunhofer, dove i raggi provenienti dai due forellini – agenti come sorgenti coerenti – si sovrapponevano. Lo sfasamento tra due raggi uscenti dai due fori con un angolo θ è dato da Δ=2πδ/λ, dove δ è la differenza di cammino ottico. Young stabilì che quando lo sfasamento tra i raggi è Δϕ=2πn, con n intero, si ha un massimo di intensità luminosa, una frangia oscura invece allorché Δϕ=(n+1/2)π, che in termini di angolo θ corrispondono a

!

sin" =n#

D per i massimi e

!

sin" = (n + 1/2)#

D per i minimi

dove naturalmente se l’ordine n cresce l’intensità nei massimi diminuisce per via del fattore di obliquità.

18 Testo consigliato G.R. Fowles, Modern Optics, da Par. 3.1 a Par 3.3; da Par. 4.1 a 4.4.

60

4.7.2 Interferometro di Fabry-Perot L’interferometro di Fabry-Perot fu introdotto nel 1899 e ha trovato molti impieghi anche prima dell’avvento del laser, del quale costituisce la cavità. Esso permette ad esempio di realizzare dei filtri relativamente monocromatici e, se la posizione di uno specchio può essere variata con una vite micrometrica – si veda la disposizione mostrata in Fig. 4.21 - permette di misurare con estrema precisione la lunghezza d’onda di una radiazione o di risolvere molto bene la struttura fina di una riga atomica. In altre parole, l’interferometro di Fabry-Perot costituisce uno spettrometro ad elevata risoluzione. Per tale impiego, occorre naturalmente che gli specchi siano rigorosamente paralleli e lavorati in modo che la loro superficie sia quanto più possibile piana (per usi grossolani, possono essere piani entro 1/4 della lunghezza d’onda della luce da analizzare, per impieghi più raffinati occorrono planarità prossime a 1/50 di lunghezza d’onda).

Fig. 4.21. Interferometro a scansione di Fabry-Perot utilizzato per evidenziare strutture fine.

4.7.3 Specchi di Fresnel. Fresnel usò l’ingegnoso approccio di sdoppiare il raggio – di fatto creando, da un’unica sorgente s, due sorgenti coerenti virtuali s1 e s2 - per mezzo di due specchi diversamente inclinati [Fig. 4.22(a): si raccomanda di esercitarsi a costruirla correttamente, rispettando la legge della riflessione, illustrata in Fig. 4.22(b)]. Sullo schermo S si osservano delle linee che corrispondono a massimi di

Fig. 4.22 (a). Interferenza prodotta con gli specchi di Fresnel; (b) Costruzione dell’immagine virtuale s’ di un oggetto s formata da uno specchio piano.

s1 s2

Zona di sovrapposizione

s

P

Specchio 1

Specchio 2

Schermo S di osservazione

s s’

(b) (a)

Specchio mobile

Amplificatore

Lente di collimazione

Sorgente

Lente di focalizzazione

Sensore ottico

x

x

61

intensità se la differenza di cammino ottico dei raggi è un multiplo intero di lunghezze d’onda, quindi sfasamenti Δϕ=2πn, con n intero, e a condizioni di buio se invece Δϕ=(n+1/2)π (condizioni ovviamente eguali a quelle di Young). Per il punto P passa la linea luminosa centrale, simmetrica rispetto alle due sorgenti virtuali, la quale corrisponde a cammini ottici eguali e si presenta rettilinea (Fig. 4.23). Le successive frange luminose sono invece delle iperboli che deviano sempre più da una retta man mano che l’ordine n dell’interferenza costruttiva cresce. Se si sposta lo schermo in altra posizione, si vedono qualitativamente le stesse cose, ciò che indica come le frange non sono localizzate su un piano, ma si estendono sulle tre dimensioni. Di fatto, lo schermo rappresenta un piano che va a intersecare figure tridimensionali, e precisamente degli iperboloidi di rotazione che hanno come asse una retta parallela alla congiungente delle due sorgenti virtuali.

Fig. 4.23. Le superfici di massima interferenza costruttiva sono iperboloidi di rotazione: la figura osservata è l’intersezione con essi del piano dello schermo.

4.7.4 Interferenza da film sottili. È il tipico effetto di iridescenza che si osserva sulle pellicole sottili, come un film sottile di benzina su acqua, un’ala di libellula, un film di ossido trasparente su metallo. Trattiamo il caso semplice di un fascio con fronte d’onda piano che incida su tale strato sottile, immerso in aria e con indice di rifrazione eguale a n. Si avranno riflessioni multiple e trasmissioni multiple, come illustrato in Fig. 4.24, e di conseguenza effetti di interferenza da raggi paralleli sia sulla luce

Fig. 4.24. Geometria dell’interferenza da riflessioni multiple in film sottili.

s1 s2 P

Luoghi dei punti dove Δc.o.=nλ

d

θ

i θr A

B

C θi

62

riflessa che su quella rifratta. Si deve calcolare la differenza di cammino ottico tra ciascun raggio e quello contiguo, che è evidentemente sempre la stessa. Se d è lo spessore del film, tale differenza di cammino è

!

"c.o. = 2ABn #AC con

!

2ABn = 2nd /cos"r

!

AC = 2dtg"r sin"i = 2nd sin2 "r /cos"r per cui

!

"c.o. = 2nd cos#r (4.27)

Questa differenza di percorso comporta un ritardo di fase pari a

!

"# =4$

%0

nd cos&r =4$

%d cos&r (4.28)

dipendente quindi sia da d che da λ=λ0/n (λ0=lunghezza d’onda nel vuoto). Ciò comporta una particolare colorazione del film, se questo è investito da luce bianca, al variare dell’angolo di incidenza (e di osservazione). Se ad esempio per il rosso si ha un massimo, per il violetto si è alquanto prossimi a un minimo. Questo spiega l’iridescenza delle varie zone osservate. Di particolare interesse è la considerazione dei successivi raggi, perché porta a descrivere la particolare forma dei massimi di interferenza in funzione del valore della riflettanza R. Consideriamo la somma di tutte le ampiezze dei raggi trasmessi, ricordando che ognuno è sfasato rispetto al successivo secondo la (4.28). Siano t e r rispettivamente i coefficienti di trasmissione e di riflessione dell’ampiezza all’interfaccia; supponendo il mezzo del tutto trasparente, si ha

!

E = E 0t2

+ E 0t2r2 exp(i"#) + E 0t

2r4 exp(i2"#) + …

serie geometrica di ragione r2exp(iΔϕ) la cui somma pertanto è

!

E = E 0t2

1 " r2 exp(i#$) da cui

!

I = I0|t |4

|1 " r2 exp(i#$) |2 (4.29)

Poiché nella riflessione si può avere un cambiamento di fase nell’onda e.m., r va inteso come un numero complesso, dunque si ha |r|2=rr*=R e anche |t|2=tt*=T, dove R e T sono i coefficienti relativi alla potenza ottica riflessa e rifratta (Par. 1.6). La (4.29) diventa allora

63

!

I = I0T 2

|1 " R exp(i#$) |2

dove il nuovo sfasamento Δψ tiene conto sia del ritardo di fase tra raggi contigui che dello sfasamento dovuto alla riflessione (ossia π dal mezzo meno a quello più rifrangente, 0 nel caso opposto). Sviluppiamo il termine a denominatore, ricordando che cosα=1-2sin2α/2:

!

|1 " R exp(i#$) |2= 1 " R exp(i#$)[ ] 1 " R exp("i#$)[ ] = 1 + R2 " R exp(i#$) + exp("i#$[ ] =

!

= 1 + R2 "2R cos#$ = (1 " R)2 1 +4R

(1 " R)2sin2 #$

2

%

&

' '

(

)

* *

da cui si ha per I

!

I = I0T 2

(1 " R)2

1

1 + F sin2 #$

2

= I01

1 + F sin2 #$

2

(4.30)

essendosi posto

!

F =4R

(1 " R)2 (4.31)

che è detto coefficiente di finezza per il fatto che dà una misura della strettezza delle frange luminose di interferenza. La seconda frazione che compare nell’equazione (4.30) è detta funzione di Airy, rappresentata in Fig. 4.25. Essa indica chiaramente

Fig. 4.25. L’andamento della funzione di Airy [

!

1/(1 + F sin2 "# /2)], al variare di R, è indice della distribuzione dell’intensità nell’interferenza a raggi multipli.

come, se la riflettanza tende a 1, si hanno picchi luminosi molto stretti, laddove per R tendente a zero il contrasto luce-buio tende a svanire. In Fig. 4.28 i picchi valgono 1

64

(I=I0, ossia riflessione totale) perché si è supposto il mezzo trasparente, altrimenti i massimi di riflessione resterebbero al di sotto dell’unità. 4.7.5 Film multistrato. Strati sottili multipli – ottenuti per evaporazione su substrati di vetro o di quarzo - sono largamente usati nella ricerca e nella tecnologia perché permettono di realizzare rivestimenti caratterizzati da una vasta gamma controllabile di valori della riflessione e della trasmissione della luce. Ben noti sono i rivestimenti antiriflesso impiegati negli obiettivi fotografici, i filtri ottici interferenziali tipo Fabry-Perot a banda stretta, gli specchi dielettrici ad elevata riflessione utilizzati nelle cavità laser. Evitando di entrare in dettagli che sono largamente tecnologici e invitando gli interessati a consultare testi specifici,19 ci limitiamo a mostrare in Fig. 4.26 (a) e (b) due schemi indicativi di spettri: elevata riflessione di uno specchio dielettrico multistrato per uso nelle cavità laser e trasmissione selettiva da parte di un filtro interferenziale Fabry-Perot multistrato.

Fig. 4.26. (a) Riflessione R di uno specchio dielettrico multistrato; (b) Trasmissione T di un filtro interferenziale multistrato tipo Fabry-Perot.

4.7.6 Interferometro di Michelson. È un’apparecchiatura di estrema sensibilità e versatilità che fu espressamente progettata nel 1880 da Michelson per la misura del “vento di etere”. Lo schema è mostrato in Fig. 4.27. Un fascio collimato prodotto dalla

Fig. 4.27. Interferometro di Michelson.

19 Una trattazione in termini di ottica matriciale è reperibile ad esempio in G.R. Fowles, Modern Optics, Par. 4.4.

Lunghezza d’onda in nm 0.4 0.5 0.6 0.7

1.0

0

0.5 (a)

4 strati

20 strati

R

Lunghezza d’onda in nm 0.45 0.50 0.55

1.0

0

0.5 (b)

T

s A

Schermo

m1

m2

Mobile su scala micrometrica

65

sorgente s viene suddiviso in due parti di eguale intensità da uno specchio semitrasparente A, posto a 45°. Dopo riflessione sugli specchi m1 e m2, i due raggi si ricompongono in un solo fascio che, incidendo sullo schermo S, mostra frange di interferenza. Se il fascio è perfettamente collimato – caso di un laser - e i due specchi sono rigorosamente normali ad esso, le frange hanno geometria circolare, del tipo visto in Fig. 4.20. Altrimenti appaiono come strisce più o meno parallele. Si hanno frange luminose là dove la differenza dei due cammini ottici è pari a un multiplo intero di lunghezze d’onda, frange oscure se essi differiscono per mezza λ. Se con una vite micrometrica si allontana gradualmente uno dei due specchi, si osserva che, una dopo l’altra, le frange oscure prendono il posto di quelle luminose e viceversa. Una delle applicazioni più comune dell’interferometro di Michelson è la misura dell’indice di rifrazione dei gas. Si inserisce una cella di lunghezza nota L su uno dei cammini ottici, indi la si riempie con il gas. Ciò fa sì che le frange luminose si spostino nel campo di osservazione, per il fatto che la presenza di un n≠1 su un tratto L del cammino ottico ha l’effetto di allungarlo. Il numero di frange che “scorre” rispetto alla condizione senza gas (oppure lo spostamento che occorre dare al relativo specchio per riprodurre le condizioni di partenza) dice di quanto è stato tale allungamento e permette di risalire al valore di n.

66

CAPITOLO 5

TRATTAZIONE MATEMATICA DELLA POLARIZZAZIONE

5.1 Polarizzazione lineare, circolare ed ellittica20 Nel Paragrafo 1.1.3 abbiamo già parlato della polarizzazione della luce e definito il concetto di luce completamente polarizzata, di tipo lineare, circolare o ellittica, o di luce completamente non polarizzata o naturale. La condizione intermedia è rappresentata dal caso della luce parzialmente polarizzata, data da una mistura di luce polarizzata e non polarizzata. È utile introdurre il concetto di grado di polarizzazione V (0 ≤ V ≤ 1), che riprenderemo in seguito

unpolpol

pol

II

IV

+=

dove polI e unpolI sono le intensità relative al contributo polarizzato e non polarizzato. Consideriamo ora il caso generale di due onde monocromatiche polarizzate lungo le direzioni x e y, di ampiezze xE

0e yE

0, mutuamente coerenti, cioè con fase relativa φ

costante. L’onda risultante data dalla loro sovrapposizione è, come sappiamo, polarizzata ellitticamente. Il campo elettrico descrive cioè un’ellisse data dall’ espressione

!

Ex2

E 0x2

+Ey

2

E 0y2

"2ExEy

E 0xE 0y

cos# " sin2 # = 0 (5.1)

Detti a e b gli assi maggiore e minore dell’ellisse, ε la sua eccentricità e ψ l’angolo di inclinazione dell’asse maggiore è possibile dimostrare che E0x, E0y e ψ sono legate tra loro nel modo seguente:

!

a2 + b2 = E 0x2 + E 0y

2

±ab = E 0xE 0ysin"

tg 2#( ) =2E 0xE 0y

E 0x2 $E 0y

2cos"

sin 2%( ) =2E 0xE 0y

E 0x2 + E 0y

2sin"

(5.2)

20 Testo consigliato G.R. Fowles, Modern Optics, Par. 2.5.

67

Dalla Fig. 5.1 si vede che l’inclinazione ψ = arctg (E0y/E0x), 0 ≤ ψ < π, e l’eccentricità ε = arctg (E0y/E0x), angolo definito tra –π/4 e +π/4. Il segno di φ determina il senso di rotazione del vettore campo elettrico nel descrivere l’ellisse.

Fig. 5.1. Parametri dell’ellisse. Nel caso in cui E0x = E0y = E0 e φ = ±π/2 la luce è polarizzata circolarmente, destra (D) o sinistra (S) a seconda del segno. Essa è rappresentata in Fig. 5.2 per un dato valore di z. La sua rappresentazione reale è la seguente:

E = iE

0cos(kz-!t) ± jE

0sin(kz-!t) (5.3)

Fig. 5.2. Rappresentazione reale del campo e.m. polarizzato circolarmente.

5.2 Polarizzazione in rappresentazione di ampiezza vettoriale complessa Passiamo ora alla notazione complessa della polarizzazione circolare

E = iE

0exp i(kz-!t)"

#$%± jE

0exp i(kz-!t ± & 2)"

#$%

Essendo valide le identità exp(iπ/2)=i, exp(-iπ/2)=-i, si ha

E0

Ex

Ey ωt

x

y

E0x

E0y a

b

ψ

ε

E

68

E =E

0(i ± ij)exp i(kz-!t)"

#$%

(5.4)

dove la parte reale altro non è che la (5.3) a parte lo scambio dei segni per polarizzazione D e S. Passiamo ora alla polarizzazione ellittica, che si ha ad esempio se E0x ≠ E0y. Se introduciamo un’ampiezza vettoriale complessa

E

0= iE

0x+ jE

0y

La funzione d’onda [ ])(exp= 0 t-kzi !EE (5.5)

rappresenta qualsiasi tipo di polarizzazione, con i seguenti casi particolari: E0 reale polarizzazione lineare E0 complesso polarizzazione ellittica (circolare nel caso speciale in cui E0x=E0y). 5.3 Rappresentazione matriciale della polarizzazione - Vettori di Jones Più in generale, gli stessi E0x, E0y possono essere complessi (ciò permette ad esempio di tener conto di possibili differenze di fase, caso della polarizzazione ellittica). In tale evenienza, essi possono essere così rappresentati

!

E 0x =|E 0x |exp(i"x ) E 0y =|E 0y |exp(i"y )

Si dice vettore di Jones la matrice

!

E 0x

E 0y

"

# $ $

%

& ' '

=|E 0x |exp(i(x )

|E 0y |exp(i(y )

"

# $ $

%

& ' ' (5.6)

che può essere convenientemente normalizzata dividendo per (|E0x|2+|E0y|2)1/2. Si arriva così a rappresentare le varie polarizzazioni nel modo seguente:

!

1

0

"

# $ $

%

& ' ' rappresenta un’onda polarizzata linearmente secondo x (5.7)

!

0

1

"

# $ $

%

& ' ' rappresenta un’onda polarizzata linearmente secondo y

!

1

1

"

# $ $

%

& ' ' rappresenta un’onda polarizzata linearmente a π/4 da x

!

1

i

"

# $ $

%

& ' ' rappresenta un’onda polarizzata circolarmente sinistrorsa

!

1

"i

#

$ % %

&

' ( ( rappresenta un’onda polarizzata circolarmente destrorsa

!

2

i

"

# $ $

%

& ' ' rappresenta un’onda polarizzata ellitticamente sinistrorsa (asse x doppio di y)

69

5.3.1 Uso delle matrici. Come applicazione si consiglia di provare a sommare due o più onde aventi determinate polarizzazioni. Per esempio, due onde di eguale ampiezza polarizzate circolarmente in versi opposti:

!

1

"i

#

$ % %

&

' ( (

+1

i

#

$ % %

&

' ( (

=1 + 1

"i + i

#

$ % %

&

' ( (

=2

0

#

$ % %

&

' ( (

= 21

0

#

$ % %

&

' ( (

che è un’onda polarizzata linearmente secondo x con ampiezza doppia rispetto alle primitive. Un’altra utile applicazione è la previsione dell’effetto prodotto dall’inserimento di un elemento ottico – polarizzatore, lamina di ritardo – nel raggio luminoso. Gli elementi ottici sono rappresentabili come matrici 2x2 (matrici di Jones) nei modi qui sotto indicati (per brevità omettiamo la dimostrazione):

!

1 0

0 0

"

# $ $

%

& ' ' Polarizzatore lineare orizzontale (5.8)

!

0 0

0 1

"

# $ $

%

& ' ' Polarizzatore lineare verticale

!

1

2

1 ±1

±1 1

"

# $ $

%

& ' ' Polarizzatore lineare a ±π/4

!

1 0

0 i

"

# $ $

%

& ' ' Lamina quarto d’onda (λ/4) (sfasa di π/2 le componenti x e y) con asse ottico orizzontale

!

1 0

0 "i

#

$ % %

&

' ( ( Lamina λ/4 con asse ottico verticale

!

1 0

0 "1

#

$ % %

&

' ( ( Lamina λ/2 (sfasa di π le componenti x e y) con asse ottico verticale oppure orizzontale

!

1

2

1 i

"i 1

#

$ % %

&

' ( ( Induce una polarizzazione circolare destrorsa

!

1

2

1 "i

i 1

#

$ % %

&

' ( ( Induce una polarizzazione circolare sinistrorsa

Sia

!

A

B

"

# $ $

%

& ' ' il vettore che rappresenta la luce in ingresso,

!

A/

B/

"

# $ $

%

& ' ' quello in uscita dall’elemento

ottico, il quale ultimo è rappresentato da

!

T =a b

c d

"

#

$ $

%

&

' ' , eventualmente prodotto risultante

di più elementi in serie

!

a b

c d

"

#

$ $

%

&

' '

=an bn

cn dn

"

#

$ $

%

&

' ' …

a2 b2

c2 d2

"

#

$ $

%

&

' '

a1 b1

c1 d1

"

#

$ $

%

&

' ' . Deve allora valere

!

a b

c d

"

#

$ $

%

&

' '

A

B

"

# $ $

%

& ' '

=A

/

B/

"

#

$ $

%

&

' ' .

Esemplifichiamo con il caso di una polarizzazione lineare a π/4 che attraversa una lamina λ/4, facendo riferimento alla Fig. 5.3. Utilizzando le competenti polarizzazioni e matrici date in (5.7) e (5.8) si ha

!

1 0

0 i

"

#

$ $

%

&

' '

1

1

"

# $ $

%

& ' '

=1

i

"

# $ $

%

& ' ' , ossia una polarizzazione in uscita che è

70

circolare sinistrorsa.

Fig. 5.3. Una lamina quarto d’onda trasforma una polarizzazione lineare in circolare se il suo asse ottico è inclinato di π/4 rispetto alla direzione di polarizzazione del raggio incidente.

Un secondo esempio può essere come si trasformano per rotazione di un angolo θ

le matrici di Jones relative ai vari elementi ottici espressi dalle (5.8), del tipo

!

a b

c d

"

#

$ $

%

&

' ' .

In una data base (x,y) sia

!

x

"y

#

$ % %

&

' ( ( un vettore di Jones J; in un’altra base (x’,y’), ruotata di

θ rispetto alla precedente, sia esso

!

x,

"y,

#

$

% %

&

'

( ( . La matrice di rotazione è R(θ), con

R(θ)=

!

cos" sin"

#sin" cos"

$

% & &

'

( ) ) , per cui il vettore nella nuova base sarà J’=R(θ)J. Le matrici di

Jones T si trasformano per rotazione θ nel modo seguente

!

T/

= R(")TR(-")

T = R(")T /R(-")

(5.9)

Nel passare attraverso l’elemento ottico un vettore J1 si trasforma in J2=TJ1 che per rotazione di θ diventa J2‘=R(θ)J2=R(θ)TJ1. Ma la trasformazione inversa dà J1=R(-θ) J1‘, dunque si ha

J2‘=R(θ)TR(-θ)J1‘ vale a dire

J2‘=T’J1‘ (5.10) Consideriamo come applicazione il caso di una lamina λ/2 ruotata di un angolo θ rispetto alla direzione della polarizzazione, per esempio orizzontale, del campo in ingresso (si veda Fig. 5.4).

E

Asse ottico lamina λ/4

π/4

Raggio incidente

Raggio emergente

E

x

71

Fig. 5.4. Una lamina mezz'onda ruota la polarizzazione di un raggio incidente di un angolo 2θ se il suo asse ottico è inclinato rispetto a questa di un angoloθ .

Applicando la trasformazione secondo la rotazione R(θ) alla matrice T(θ) della lamina

data dall'Eq. (5.8) otteniamo T’(θ)=

!

cos2" #sin2"

#sin2" #cos2"

$

% & &

'

( ) ) , che corrisponde alla rotazione di

un angolo 2θ della polarizzazione del raggio emergente dalla lamina. 5.4 Parametri di Stokes21 La rappresentazione matriciale della polarizzazione fatta attraverso il formalismo di Jones si applica solo al caso di luce completamente polarizzata, ma non a quello di luce parzialmente polarizzata o non polarizzata. I parametri di Stokes, introdotti per descrivere lo stato di polarizzazione di un campo e.m. oscillante, permettono di rappresentare quantitativamente qualsiasi stato di polarizzazione. Possiamo definire i parametri di Stokes attraverso il procedimento adottato per misurarli. Si abbiano tre filtri, uno che polarizza linearmente la luce in senso orizzontale, un secondo che la polarizza linearmente a π/4 dall’orizzontale, e un terzo che la polarizza circolarmente in senso sinistrorso (antiorario). Se la luce da caratterizzare non è polarizzata, ciascuno dei tre filtri ne trasmette al più il 50%. Possiamo quindi definire i parametri di Stokes sulla base delle intensità misurate:

!

S0 = I0

S1 = 2I1 " I0

S2 = 2I2 " I0

S3 = 2I3 " I0

(5.11)

21 Testo consigliato E. Hecht, Optics, Par. 8.13.

E

Asse ottico lamina λ/2

Raggio incidente

Raggio emergente

E

y

θ

72

Si nota che se S1>0, nella luce esaminata c’è tendenza a una polarizzazione orizzontale, se S1<0 a una polarizzazione verticale (con limite S1=±I0 rispettivamente nei due casi), mentre per S1=0 la luce può solo essere non polarizzata o polarizzata circolarmente. Il discorso si ripete eguale per S2, dove la tendenza riguarda ora la direzione a π/4 dall’orizzontale. Quanto a S3, esso rivela una tendenza alla polarizzazione destrorsa quando è <0, sinistrorsa se >0, o nessuna delle due quando vale zero. Esprimiamo il campo in modo parametrico (propagazione secondo z, asse orizzontale secondo x) e consideriamo il caso generale di un’onda “quasi monocromatica”

!

Ex = E 0x cos kz "#t + $x (t)[ ]Ey = E 0y cos kz "#t + $y (t)[ ]

Le intensità trasmesse da ciascuno dei tre filtri sono:

!

I1 = E 0x2

I2 =1

2E 0x

2 + E 0y2"

# $ %

& ' + E 0xE 0y cos ()(t)[ ]

I3 =1

2E 0x

2 + E 0y2"

# $ %

& ' + E 0xE 0y sin ()(t)[ ]

(5.12)

dove si è omesso nei secondi membri il fattore ε0c/2 in vista di una successiva normalizzazione dei fattori di Stokes. Si noti che, se la luce è perfettamente monocromatica e coerente, si ha che Δϕ è costante nel tempo. Si vede subito che i parametri di Stokes diventano:

!

S0 = E 0x2

+ E 0y2

S1 = 2 E 0x2 " E 0x

2 " E 0y2

= E 0x2 " E 0y

2

S2 = 2E 0xE 0y cos#$

S3 = 2E 0xE 0y sin#$

(5.13)

È immediato verificare che, nel caso di luce completamente polarizzata.

!

S02

= S12

+ S22

+ S32

Per chiarire ulteriormente, esaminiamo alcuni casi banali.

73

Luce non polarizzata

!

S0 = 2 E 0x2 giacché E 0x

2= E 0y

2

S1 = 0 giacché 2I1 = I0

S2 = S3 = 0 per mediazione di funzioni periodiche

Luce polarizzata linearmente sull’orizzontale

!

S0 = 2 E 0x2

S1 = 2 E 0x2

S2 = S3 = 0

Considerando il caso generale di una polarizzazione ellittica, possiamo esprimere i parametri di Stokes in funzione dei parametri dell’ellisse di Fig. 5.1:

!

S1 = S0 cos 2"( )cos 2#( )S2 = S0 cos 2"( )sen 2#( )S3 = S0sen 2"( )

(5.14)

In questo modo possiamo associare in modo univoco un qualsiasi stato di polarizzazione a un punto S di coordinate S1, S2, S3 che individuano una sfera, detta sfera di Poincaré, di raggio S0 (vedi paragrafo 5.5.2). Si noti che la longitudine e la latitudine del punto S sono date rispettivamente dagli angoli 2ψ e 2ε.

5.4.1 Normalizzazione dei parametri di Stokes.Si suole normalizzare i parametri di Stokes dividendoli per I0. Essi assumono allora i valori

!

S0 = 1

!

S1 =2I1 " I0

I0

!

S2 =2I2 " I0

I0

!

S3 =2I3 " I0

I0

(5.15)

e permettono di introdurre i vettori di Stokes nel modo seguente:

Luce non polarizzata (1,0,0,0) oppure

!

1

0

0

0

"

#

$ $ $ $ $

%

&

' ' ' ' '

Luce polarizzata linearmente orizzontale (1,1,0,0) oppure

!

1

1

0

0

"

#

$ $ $ $ $

%

&

' ' ' ' '

74

Luce polarizzata linearmente verticale (1,-1,0,0) oppure

!

1

"1

0

0

#

$

% % % % %

&

'

( ( ( ( (

Luce polarizzata linearmente a π/4 (1,0,1,0) oppure

!

1

0

1

0

"

#

$ $ $ $ $

%

&

' ' ' ' '

Luce polarizzata linearmente a -π/4 (1,0,-1,0) oppure

!

1

0

"1

0

#

$

% % % % %

&

'

( ( ( ( (

Luce polarizzata circolarmente sinistrorsa

!

1

0

0

1

"

#

$ $ $ $ $

%

&

' ' ' ' '

Luce polarizzata circolarmente destrorsa

!

1

0

0

"1

#

$

% % % % %

&

'

( ( ( ( (

A questo punto possiamo dare una definizione operativa del grado di polarizzazione della luce V introdotto in precedenza

!

V = S12

+ S22

+ S32 (5.16)

dove gli S sono i valori normalizzati. 5.4.2 Sfera di Poincaré. La sfera di Poincaré, a cui abbiamo fatto accenno nel paragrafo 5.4, offre una rappresentazione geometrica dei parametri di Stokes normalizzati, e quindi dei vari stati di polarizzazione della luce. Facciamo corrispondere ai tre assi rispettivamente le polarizzazioni lineare orizzontale e verticale (x), lineare inclinata a π/4 e –π/4 (y), e circolare sinistrorsa e destrorsa (z), e tracciamo la sfera in Fig. 5.5. Al centro della sfera, punto O, si ha S1=S2=S3=0, corrispondente alla luce non polarizzata. I punti interni alla sfera – V < 1 – sono stati di polarizzazione parziale. Ciascun punto sulla superficie, individuato dalle coordinate polari ε, ψ (cfr. Eq. 5.12), corrisponde invece a luce completamente polarizzata in uno o più modi, con i punti principali di polarizzazione “pura” espressamente evidenziati (H=orizzontale, V=verticale, S=sinistrorsa, D=destrorsa, ecc.). Ad esempio, il punto P rappresenta uno stato di polarizzazione mista, con componenti px, py, pz relative ai tre stati principali. Perciò possiamo anche dire che i parametri di Stokes normalizzati sono semplicemente le coordinate cartesiane dello stato di polarizzazione.

75

Fig. 5.5. Sfera di Poincaré. 5.5 Attività ottica22 Con attività ottica da parte di un dato materiale si intende la sua capacità di ruotare il piano di polarizzazione della luce. Ciò può avvenire se si considera che un’onda polarizzata linearmente può essere considerata come risultante dalla sovrapposizione di due onde polarizzate circolarmente, aventi eguale ampiezza e fase, e sensi di girazione opposti. Se l’indice di rifrazione della sostanza è differente per le rotazioni sinistrorsa (S) e destrorsa (D), una delle due avanza più lentamente rispetto all’altra ed emerge con un ritardo di fase. L’onda complessiva in uscita allora risulta ancora polarizzata linearmente, ma in una direzione ruotata rispetto all’onda primitiva. Se nD e nS sono i due indici e d è lo spessore del materiale, lo sfasamento in uscita è

!

" =2# (nD - nS)d

$

per cui la rotazione risulta essere

!

" = # / 2 =$(nD - nS)d

%= Ckd (5.17)

dove C è la concentrazione, nel caso si tratti di una sostanza disciolta in un solvente – ad esempio zucchero in acqua – e k è detto potere rotatorio. Poiché C e d sono noti, e θ si misura, la (5.12) permette di ricavare k e anche la differenza Δn nei due indici nD e nS

!

"n =#$

%d (5.18)

5.5.1 Discussione in termini del metodo di Jones. Nel materiale, le due onde

22 Testo consigliato G.R. Fowles, Modern Optics, Par. 6.9; anche E. Hecht, Optics, Par. 8.10.

S

D

V

H

z

x

y -π/4 π/4

px py

pz

P

(1,1,0,0)

(1,-1,0,0)

(1,0,0,1)

(1,0,0,-1)

O (1,0,0,0)

(1,0,-1,0) (1,0,1,0)

76

circolarmente polarizzate destrorsa e sinistrorsa sono rispettivamente

[ ])-z(exp tkii

1S !"

#

$%&

'

!

1

"i

#

$ % %

&

' ( (

exp i(kDz -)t)[ ]

dove kD=nDω/c e kS=nSω/c. Assumendo che inizialmente la polarizzazione sia orizzontale, il suo vettore di Jones è

!

1

0

"

# $ $

%

& ' '

=1

2

1

(i

"

# $ $

%

& ' '

+1

2

1

i

"

# $ $

%

& ' '

L’ampiezza complessa dell’onda alla fine del percorso d, assumendo l’origine dei tempi a questo istante, è data da

!

1

2

1

"i

#

$ % %

&

' ( (

exp(ikDd) +1

2

1

i

#

$ % %

&

' ( (

exp(ikSd) =

!

=1

2exp(i

kD + kS

2d)

1

"i

#

$ % %

&

' ( (

exp(ikD "kS

2d) +

1

i

#

$ % %

&

' ( (

exp(-ikD "kS

2d)

)

* +

, +

-

. +

/ + =

!

= exp(i")1

2

1

#i

$

% & &

'

( ) )

exp(i*) +1

2

1

i

$

% & &

'

( ) )

exp(-i*)

+

, -

. -

/

0 -

1 -

avendo posto

!

" =kD + kS

2d

!

" =kD #kS

2d

L’ampiezza complessa allora è

!

exp(i")1

2exp(i#) + exp(-i#)( )

1

2i exp(i#) $ exp(-i#)( )

%

&

' '

(

)

* *

= exp(i")cos#

sin#

%

& ' '

(

) * * (5.19)

e rappresenta un’onda polarizzata linearmente con rotazione di θ rispetto a quella incidente. Un’applicazione del potere rotatorio si ha nel prisma di Fresnel, costituito da due parti di quarzo unite insieme, di cui una sinistrorsa e l’altra destrorsa. Se si parte da una radiazione non polarizzata, la diversa rifrazione operata dal sistema sulle due componenti circolari opposte rende possibile la loro separazione, come illustrato in Fig. 5.6. Il prisma serve anche a determinare il senso di girazione di una luce che sia

77

già in origine polarizzata circolarmente.

Fig. 5.6. Grazie al potere rotatorio del quarzo, il prisma di Fresnel permette di avere luce polarizzata circolarmente nell’uno e nell’altro dei versi.

5.6 Modulatori di luce23 La modulazione della luce è di fondamentale importanza per trasporre le informazioni nelle comunicazioni su veicolo ottico. 5.6.1 Effetto Faraday. Vi sono materiali capaci di indurre la rotazione della direzione di polarizzazione della luce allorché si trovano immersi in un campo magnetico. La configurazione sperimentale è illustrata in Fig. 5.7. Al materiale perviene un raggio di luce polarizzata ad esempio verticalmente e propagantesi parallelamente al campo B applicato. All’uscita la polarizzazione si presenta ruotata di un angolo θ, dato da

!

" =VBL (5.20)

dove L è la lunghezza del tragitto nel materiale e V è detta costante di Verdet.

Fig. 5.7. Configurazione per la rotazione di Faraday del vettore campo elettrico di un’onda polarizzata.

Se all’uscita si pone un polaroid analizzatore avente l’asse ottico parallelo alla direzione di polarizzazione della luce entrante e il campo B viene modulato tra 0 e un valore opportuno, si ottiene che l’intensità della luce venga modulata.

23 Testo consigliato G.R. Fowles, Modern Optics, Par. 6.10 e 6.11; anche E. Hecht, Optics, Par. 8.11.

2. Quarzo sinistrorso

Circ. S (n2/n1<1)

1. Quarzo destrorso

Non polarizzata Circ. D (n2/n1>1)

E E θ

B // z

z

L

78

Trattiamo il problema nello stesso modo “classico” con cui, nel Par. 2.2, si è arrivati a una formulazione teorica della dispersione della luce. In presenza di un campo magnetico B (statico o quasi-statico) e del campo elettrico E della luce, l’equazione di moto degli elettroni negli atomi è [confrontare con l’Eq. (2.3)]

!

m " " r + kr +eE0 exp(i#t) + e " r $B = 0 (5.21)

dove –e è la carica dell’elettrone e il termine di attrito è stato trascurato. Cerchiamo una soluzione per r del tipo r0exp(iωt) e introduciamola nell’Eq. (5.15):

!

"m#2r0 + kr0 +eE0 + i#er0 $B = 0

che, moltiplicando per -Ne, diventa un’equazione nella polarizzazione P

!

("m#2+ k)P "Ne2

E0 + i#eP $B = 0

Risolvendo le equazioni nelle componenti di P e ricordando che P=ε0χE si trova per χ un tensore suscettività elettrica con tre componenti diverse da zero:

!

"11 =Ne2

m#0

$02 %$2

($02 %$2)2 %$2$c

2

&

'

( (

)

*

+ +

!

"12 =Ne2

m#0

$$c

($02 %$2)2 %$2$c

2

&

'

( (

)

*

+ +

!

"33 =Ne

2

m#0

1

$2 %$02

&

'

( (

)

*

+ +

dove ω0

2=k/m e ωc=eB/m è la frequenza ciclotronica. In generale, se la suscettività elettrica è data da un tensore anziché uno scalare, e se ha elementi coniugati non diagonali immaginari, il mezzo presenta attività ottica. Si può dimostrare, ma tralasciamo la derivazione, che il potere rotatorio specifico δ è dato da

!

" =#12$

n0%

e sostituendo l’espressione sopra scritta per χ12 (dove supporremo di trovarci nelle condizioni in cui ωωc << |ω0

2- ω2|)

!

" =#Ne2

$mn0%0

&&c

(&02 '&2)2

(

)

* *

+

,

- -

=#Ne3

$m2n0%0

&B

(&02 '&2)2

(

)

* *

+

,

- - (5.22)

ossia una dipendenza lineare di δ da B. 5.6.2 Effetto Kerr elettro-ottico. Si tratta di un effetto di birifrangenza artificiale dovuta all’applicazione di un campo elettrico capace di sviluppare un asse

79

ottico in un mezzo altrimenti isotropo. Tale fenomeno è dovuto all’orientamento di dipoli molecolari, con una birifrangenza artificiale proporzionale al quadrato del campo E (per campi non troppo elevati, altrimenti tende a una saturazione)

!

nparall " nperp = KE 2# (5.23)

dove λ è la lunghezza d’onda definita nel vuoto e K è detta costante di Kerr. Le condizioni sperimentali per realizzare un modulatore di luce tramite l’effetto Kerr sono illustrate in Fig. 5.8. Si polarizza la luce con un polaroid o con un prisma di Nicol, poi la si invia a una cella di Kerr – riempita ad esempio di nitrobenzene, che ha un K elevato - in cui la direzione del campo elettrico applicato, e quindi dell’asse ottico artificiale, sia a π/4 rispetto alla direzione di polarizzazione. Infine la luce viene fatta passare attraverso un analizzatore incrociato rispetto al polarizzatore. In assenza di campo applicato si ha estinzione, ma se agli elettrodi della cella viene applicata una d.d.p., si ha parziale o totale trasmissione. Sia ΔV la tensione modulante applicata tra gli elettrodi: la trasmissione in funzione di ΔV è rappresentata schematicamente in Fig. 5.9, dove viene posta a confronto con l’analogo andamento di una cella di Pockels.

Fig. 5.8. Modulazione dell’intensità di un fascio luminoso mediante una cella di Kerr.

La regione di lavoro si sceglie circa a metà strada tra lo zero e la saturazione, dove la curva presenta un comportamento relativamente lineare. 5.6.3 Effetto Pockels elettro-ottico. L’effetto Pockels, a differenza dell’effetto Kerr, è lineare con il campo elettrico applicato. Esso è tipico di cristalli fortemente ionici e facilmente polarizzabili, per esempio quelli della famiglia delle perovskiti ferroelettriche, come il titanato di bario BaTiO3 o di stronzio SrTiO3, oppure il tantalato di potassio KTaO3. La struttura cristallina è mostrata in Fig. 5.10.

E

Campo el. della luce

Campo el. applicato

Prisma di Nicol polarizzatore

Prisma di Nicol analizzatore

Cella di Kerr con elettrodi

π/4

80

Fig. 5.9. Tipiche curve di trasmissione in celle di Kerr e di Pockels in funzione della d.d.p. applicata.

In presenza di una d.d.p. ai capi del cristallo, applicata ad esempio parallelamente allo spigolo della cella cristallina, si produce un marcato spostamento dello ione Ti+ in senso contrario agli ioni O-, e ciò comporta l’insorgere di un intenso dipolo elettrico e di un asse ottico artificiale. Quanto all’utilizzo, si procede come per la cella di Kerr.

Fig. 5.10. Struttura della cella cristallina delle perovskiti.

Ossigeno -

Stronzio o Bario +

Titanio +

0

Kerr Pockels

T

Zona di lavoro

ΔV

81

CAPITOLO 6

OTTICA GEOMETRICA E MATRICIALE

6.1. Approssimazione del raggio.24 Nel trattare le leggi della rifrazione e della riflessione si è fatta l’approssimazione del raggio luminoso, ignorando quindi effetti fisici più complessi, quali la diffrazione. Detta approssimazione si rende particolarmente utile nella descrizione del comportamento di lenti, specchi, sistemi e strumenti ottici. Prima di addentrarci nell’argomento, occorre precisare il significato di alcuni termini. Intanto diremo che un sistema è stigmatico se esistono due punti A e A’ tali che il primo è il centro dei raggi diretti al sistema ottico (“oggetto”) e il secondo è il centro degli stessi raggi in uscita dal sistema (“immagine”); in tal caso A e A’ sono detti punti coniugati. Un punto oggetto o immagine può essere reale o virtuale: nel primo caso esso è centro di raggi, nel secondo è centro di prolungamenti geometrici di raggi. Un punto coniugato a un punto posto all’infinito è detto fuoco. Si chiama diottro un sistema ottico costituito da due mezzi diversi separati da una superficie. Il caso più comune è il diottro sferico, illustrato in Fig. 6.1 con i vari punti e grandezze di interesse. Vi sono delle

Fig. 6.1. Il diottro sferico. convenzioni che occorre applicare sistematicamente nello scrivere le equazioni che collegano tra loro i punti coniugati e gli altri parametri di un dato sistema ottico, pena risultati privi di senso. 1) L’ascissa p di A, misurata dal vertice V, va presa positiva se cade a sinistra di V, altrimenti negativa; 2) l’ascissa q di A’, misurata dal vertice V, va presa positiva se cade a destra di V; 3) il raggio di curvatura R ha segno positivo se il centro C cade a destra di V. 6.2 Diottro sferico Nell’approssimazione di raggi parassiali, ossia raggi di piccola vergenza (detta approssimazione di Gauss), l’equazione dei punti coniugati del diottro sferico è la seguente (la derivazione è lasciata al lettore come esercizio25):

24 Testo consigliato Mencuccini-Silvestrini, Fisica II, Cap. XI. 25 Reperibile in Mencuccini-Silvestrini, Fisica II, E.XI.4.

R A A’ C V

(oggetto) (immagine) (centro di curvatura)

(vertice)

Mezzo 1 Mezzo 2

p q Asse ottico

82

!

n

p+

n,

q=

n," n

R (6.1)

dove n e n’ sono gli indici di rifrazione rispettivamente del primo e del secondo mezzo. Se sono noti p e q, la (6.1) fornisce una relazione per il raggio di curvatura R:

!

R =(n ,

" n)pq

nq + n,p (6.2)

La costruzione del punto immagine A’ si fa come illustrato in Fig. 6.2 (a) per il diottro convesso (R > 0 e p > 0, quindi q > 0, A’ cade a destra di V) e Fig. 6.2 (b) per quello concavo (R < 0 e p > 0, quindi q < 0, A’ cade a sinistra di V). A’ corrisponde all’intersezione del raggio rifratto nel secondo mezzo con l’asse ottico, il quale è anche un raggio indeviato (la scelta del primo raggio è indifferente se questo è di piccola vergenza: raggi non parassiali darebbero luogo a punti nell’intorno di A’, producendo quindi un’immagine allargata, effetto di astigmatismo). In Fig. 6.2 (a) l’immagine è reale, in (b) virtuale in quanto per trovare l’intersezione A’ con l’asse ottico è necessario utilizzare il prolungamento raggio rifratto.

Fig. 6.2. Costruzione del punto immagine A’ del punto oggetto A nel diottro sferico: (a) convesso, (b) concavo.

Per individuare l’ascissa f2 del fuoco nel secondo mezzo basta cercare il punto dove convergono i raggi paralleli provenienti dall’infinito nel primo mezzo. Il caso convesso è mostrato in Fig. 6.3. Analiticamente, basta porre p ∞ nell’equazione (6.1) ottenendo

A A’ C V p q

θi θr

(a)

A A’ C V p

q

θi θr

(b) V

83

!

n,

f2

=n," n

R

!

f2 =Rn,

n ," n

(6.3a)

e analogamente per q ∞ si ricava l’ascissa f1 del fuoco nel primo mezzo

!

f1 =Rn

n," n

(6.3b)

Dalle (6.3) si deduce

!

f1

f2

=n

n,

!

f2 "f1 = R

e infine

!

f1

p+

f2

q= 1 (6.4)

che è un modo alternativo di scrivere l’equazione del diottro sferico. Costruiamo ora in Fig. 6.3 l’immagine, prodotta da un diottro sferico convesso, di un segmento AB lungo y disposto trasversalmente all’asse ottico. Il punto B è

Fig. 6.3. Costruzione dell’immagine di un segmento AB prodotta da un diottro sferico.

ottenuto dall’intersezione di due raggi principali, ad esempio quello che passa per C (indeviato) e quello che passa per F2 (parallelo all’asse ottico). Un terzo raggio potrebbe essere quello che passa per F1. La lunghezza y’ del segmento immagine è diversa da quella del segmento oggetto. Si definisce ingrandimento lineare trasversale il rapporto delle y’/y. Usando la relazione (6.2) e osservando dai triangoli simili ABC e A’B’C in Fig. 6.3 che y’/y=(q-R)/(p+R) si trova per tale ingrandimento:

!

A/B /

AB=

y /

y=

nq

n /p (6.5)

Si noti che se q>0 e p>0, si ha I>0 e l’immagine è capovolta, come indicato dalla Fig. 6.3, mentre per I<0 l’immagine è diritta.

A A’

C V

p q

B

B’

F2

F1

π/2

R

y

Y’

84

6.2.1 Specchio sferico. Un modo per giungere rapidamente all’equazione dello specchio sferico è quello di trattarlo come un diottro salvo l’accorgimento di prendere n’=-n, in quanto il secondo mezzo è in realtà ancora il primo, salvo il ribaltamento rispetto a V. Allora la (6.1) diventa

!

n

p"

n

q="n " n

R= "

2n

R

!

1

p"

1

q= "

2

R (6.6)

dove |p|=p, |q|=-q perché q è negativo, |R|=-R perché C è a sinistra di V. Quanto ai fuochi cercando i limiti per p∞ e q∞ si trova rispettivamente

!

f2 = R / 2 (<0, ossia a sinistra di V)

!

f1 = "R / 2 = "f2 (>0), ossia a sinistra di V)

il che ci permette di riscrivere la (6.6) nella forma

!

1

p"

1

q= "

1

f (6.7)

dove f=-f1=f2=R/2 è negativo. Essendo p positivo, il q risultante è sempre negativo, come ovvio dato che l’immagine può solo cadere dalla stessa parte dell’oggetto. A titolo dimostrativo costruiamo in Fig. 6.4 l’immagine A’ di un punto A prodotta da uno specchio concavo, facendo notare una volta di più che il fuoco cade a metà strada tra il centro e il vertice.

Fig. 6.4. Immagine del punto A’ prodotta da uno specchio sferico concavo.

Nel caso di uno specchio convesso valgono le stesse formule, salvo che R > 0 perché C cade a destra del vertice. Di conseguenza, pur avendosi di nuovo che F1 e F2 sono coincidenti, essi sono a destra del vertice, come è facile rendersi conto con una banale costruzione geometrica. Anche nel caso dello specchio sferico si definisce un ingrandimento lineare giovandosi della (6.5) ove si ponga n’=-n

F1=F2 C A A’

85

!

y /

y= "

q

p (6.8)

In Fig. 6.5 sono mostrati a titolo di esempio tre casi: (a) l’oggetto AB dista dal vertice più del punto focale e del centro di curvatura (immagine reale, capovolta e rimpicciolita); (b) l’oggetto si trova tra il centro e il fuoco (immagine reale e capovolta); (c) l’oggetto è più vicino al vertice sia del centro che del fuoco (immagine virtuale, diritta, ingrandita). Per verificare i risultati descritti, basta specchiarsi in una conca metallica lucida più o meno sferica, come potrebbe essere un ramaiolo o una zuppiera.

Fig. 6.5. Costruzione dell’immagine A’B’ dell’oggetto AB da parte di uno specchio sferico in tre situazioni tipiche.

6.3 Sistemi diottrici centrati Si chiama così una successione di diottri coassiali, costituiti da materiali diversi, del tipo mostrato in Fig. 6.6. F e F’ sono i fuochi principali del sistema: su ciascun lato, essi rappresentano i punti dove vanno a convergere i raggi che pervengono dall’altro lato del sistema parallelamente all’asse. In queste circostanze, per trovare il punto

Fig. 6.6. Un sistema diottrico centrato. immagine A’ di un punto oggetto A si può applicare a ripetizione la formula (6.1) del diottro – o la (6.4), ma il metodo più rapido si basa sull’introduzione del concetto di piani principali π e π’. Per individuarli si procede nel seguente modo (Fig. 6.7). Il raggio 1 proveniente da sinistra e parallelo all’asse ottico emerge a destra del sistema con l’inclinazione necessaria per intercettare F’ (segmento 1’). Un discorso simmetrico vale

B’

F1=F2 C A

A’

B’

B

F1=F2 C A

A’

B’

B

F1=F2 C A A’

B

(a) (b) (c)

A A’ F’ F

86

per il raggio 2’ proveniente da destra alla stessa distanza dall’asse ottico, il quale deve emergere con l’inclinazione del raggio 2 onde passare per F. L’intersezione delle rette

Fig. 6.7. Individuazione dei piani principali in un sistema diottrico centrato. 1 e 2 definisce il punto principale P e il corrispondente piano π, normale all’asse, che lo contiene. Lo stesso vale per i raggi 1’ e 2’ che individuano P’ e il piano π’. Se ora si misurano le distanze focali e le ascisse dei punti oggetto e immagine dai rispettivi vertici V e V’, è evidente che possiamo applicare direttamente l’equazione (6.4) del diottro semplice:

!

f

p+

f /

q= 1 (6.9)

con un ingrandimento lineare

!

I =nq

n /p (6.10)

dove intervengono esclusivamente gli indici di rifrazione del primo e dell’ultimo mezzo. Circa il segno di I e la disposizione diritta o capovolta dell’immagine valgono le stesse considerazioni fatte dopo la (6.5) per il diottro semplice. La lenti spesse possono essere trattate come una successione di due diottri, dove il primo e il terzo mezzo hanno lo stesso n. Se la lente è in aria, con la nomenclatura illustrata in Fig. 6.8, il sistema di equazioni da risolvere è

!

1

p1

+n

q1,

=n "1

R1

con R1 > 0 (6.11a)

!

n

L " q1,

+1

q2

=1 " n

R2

con R2 < 0 (6.11b)

π π’ F’ F

P P’

V V’ f f’

1

1’

2’

2 y y

87

Fig. 6.8. La lente spessa trattata come due diottri sferici in serie.

6.4 Lenti sottili L’equazione della lente sottile biconvessa in aria può essere dedotta partendo dal sistema di equazioni (6.11) valido per la lente spessa e ponendo L≈0, quindi portando a coincidere i vertici V e V’. Semplifichiamo il sistema scrivendo p1=p, q1’=q’ e q2=q

!

1

p+

n

q /

=n "1

R1

n

"q /

+1

q= "

n "1

R2

equazioni che sommate portano a

!

1

p+

1

q= (n "1)

1

R1

"1

R2

#

$ % %

&

' ( ( (6.12)

sempre con R1 > 0 e R2 < 0. Introducendo i fuochi f e f’ si ha

!

1

f= (n "1)

1

R1

"1

R2

#

$ % %

&

' ( ( =

1

f /

(6.13)

dunque la distanza focale è la stessa nello spazio oggetto e nello spazio immagine (anche se |R1| ≠ |R2|). Se poi è |R1|=|R2|=|R|, si ha

!

1

p+

1

q= (n "1)

2

|R|=

1

f (6.14)

Se la distanza focale f è misurata in metri, il suo reciproco 1/f è espresso in diottrie. Circa l’ingrandimento della lente sottile, è immediato rendersi conto che esso ha la stessa espressione (6.5) del diottro, salvo che n=n’, quindi

A A’ V V’

R1 R2 n=1

n

n=1

L

p1 q2

q1’ L-q1’

88

!

y /

y=

q

p (6.15)

A titolo dimostrativo proponiamo in Fig. 6.9 (a) e (b) la costruzione dell’immagine di un oggetto trasversale AB prodotta da una stessa lente sottile rispettivamente nei due casi in cui l’immagine è reale (il che avviene se p>f) oppure virtuale (p<f). Basta usare, al solito, due raggi principali, il terzo (tratteggiato) servendo come verifica. Rimane infine da precisare che si possono avere lenti piano-convesse, piano-concave, biconcave, eccetera, con risultati ottici differenti, ad esempio che la lente può risultare convergente o divergente. In Fig. 6.10 è mostrato il caso di una lente biconcava divergente. Nel caso esaminato è R1 < 0, R2 < 0, f < 0 e I=q/p < 0.

Fig. 6.9. Lente sottile biconvessa: (a) costruzione di un’immagine reale; (b) immagine virtuale.

Fig. 6.10. Lente sottile biconcava nel caso p>|f|, che genera un’immagine virtuale, rimpicciolita e diritta.

6.4 Telescopio Vi sono due tipi principali di telescopi, quello galileiano e quello kepleriano, che danno immagini rispettivamente diritte (e quindi utili sulla terra, come in marina) e capovolte (e quindi impiegabili nell’esplorazione del cielo). Quello di Galileo fu il primo telescopio di qualità professionale della storia. È costituito da due lenti, la prima biconvessa

F F

y

Y’ A

B

A’

B’

A’B’ reale capovolta

(a)

A’ F F

y

Y’

A

B

B’

A’B’ virtuale diritta

(b)

F’ F A

B

A’

B’ y

Y’

89

(obiettivo), la seconda biconcava (oculare). Le lenti sono disposte in modo che il secondo fuoco dell’obiettivo si sovrapponga al primo fuoco dell’oculare, come mostrato

Fig. 6.11. Il telescopio galileiano. L’inserto giustifica perché l’immagine risulta diritta.

in Fig. 6.11. Se l’oggetto A è molto lontano, l’immagine A’ che ne fa la prima lente cade nel suo secondo fuoco (la sua grandezza si trova subito tracciando il raggio indeviato che passa per V). Poiché tale immagine è anche nel primo fuoco dell’oculare, il raggio (indeviato) che passa per V’ definisce l’angolo β sotto cui l’occhio la vede. L’angolo α dà invece la grandezza angolare dell’oggetto visto a occhio nudo, il che comporta un ingrandimento visuale

!

I ="

#$

tg"

tg#=

fob

foc

< 0 (6.16)

perché foc è negativo. I risulta tanto maggiore quanto più lo è, in modulo, il rapporto delle distanze focali. Che l’immagine del telescopio risulti diritta si evince anche dalla considerazione dell’inserto in Fig. 6.10, dove si vede che i raggi estremi non si incrociano. Merita rilevare che il diametro dell’oculare può essere tanto più piccolo di quello dell’obiettivo quanto più alto è il guadagno. Il telescopio di Keplero fa uso invece di due lenti biconvesse, come mostrato in Fig. 6.12. Anche in questo caso il secondo fuoco dell’obiettivo coincide con il primo

Fig. 6.12. Il telescopio kepleriano. L’inserto giustifica perché l’immagine risulta capovolta. dell’oculare. Ragionando come in precedenza, l’ingrandimento visuale è ora dato da

foc

Oggetto A lontano

α β

Obiettivo Oculare

Fob= Foc

fob

Osservatore

V V’ A’

INSERTO

Ocul. Obiettivo Fob=Foc

-foc

Oggetto A lontano Immagine A’

prodotta dall’obiettivo

α β

Obiettivo Oculare

Fob= Foc

fob

Osservatore

V V’

INSERTO

Ocul.

Obiettivo Fob=Foc

90

!

I ="

#$

fob

foc

> 0 (6.17)

e il suo segno indica che l’immagine è capovolta, come conferma l’inserto in figura, dove è evidente l’inversione alto-basso. Per avere forti ingrandimenti, sia qui che nel telescopio galileiano, occorrono grandi diametri per l’obiettivo (mentre la dimensione dell’oculare può essere assai minore). La realizzazione e la posa in opera di lenti molto grandi, tuttavia, presentano seri problemi tecnologici e fisici, ad esempio aberrazioni cromatiche, per cui oggi si preferisce impiegare telescopi a riflessione, dove la funzione delle lenti è svolta da specchi. Un vantaggio del telescopio kepleriano è che l’immagine A’ dell’obiettivo è reale, per cui si può collocare sul piano che la contiene un reticolo graduato su scala micrometrica, ciò che rende possibili accurate misurazioni quantitative. 6.5 Ottica geometrica nel formalismo matriciale Il formalismo che introduciamo in questa sezione è valido per raggi parassiali. Consideriamo, come illustrato in Fig. 6.13, un raggio che passi per un dato punto P0 in

Fig. 6.13.

un sistema di riferimento che ha per asse orizzontale l’asse ottico e per asse verticale la direzione y trasversale ad esso. Si conviene di caratterizzare il raggio come vettore colonna del tipo

!

Y(s0) =y(s0)

y'(s0)

"

# $ $

%

& ' ' (6.18)

dove l’ordinata y(s0)=y0 e la pendenza y’(s0) sono le coordinate rappresentative del raggio. Quando il raggio si propaga nel vuoto da un punto di ascissa generica s diversa da s0, la pendenza non muta, ossia y’(s)=y’(s0)=y0’, mentre la coordinata y(s)=y0+y0’(s-s0), quindi

!

Y(s) =y0 + y'(s - s0)

y0'

"

# $ $

%

& ' ' (6.19)

y0’ y0 P0

P y

s0 s

91

D’altronde, se ci si sposta da P0(s0) a un P(s) generico, il nuovo Y(s) può essere espresso tramite la matrice di traslazione

!

Mv =m11 m12

m21 m22

"

# $ $

%

& ' ' (6.20)

dove l’indice v sta per “vuoto”, quindi

!

Y(s) =y(s)

y'(s)

"

# $ $

%

& ' '

=m11 m12

m21 m22

"

# $ $

%

& ' '

y0

y0'

"

# $ $

%

& ' '

=m11y0 + m12y0'

m21y0 + m22y0'

"

# $ $

%

& ' ' (6.21)

e dal confronto tra la (6.19) e l’ultimo membro della (6.21) per Mv si ricava

!

Mv =1 s - s0

0 1

"

# $ $

%

& ' ' (6.22)

che è una matrice a determinante unitario. 6.5.1 Lente sottile in aria. Applichiamo il metodo al caso della lente sottile, mostrata in Fig. 6.14, cercando la relazione tra le coordinate dei raggi prima e dopo

Fig. 6.14. Applicazione alla lente sottile. della lente. Proveniendo da sinistra e da destra si ha rispettivamente

!

ptgy0'" py0'" y0

!

y0'" y0 / p

!

qtgy'" qy'" #y0

!

y'" #y0 / q

essendo y’<0, da cui

!

y'-y0'= -y01

p+

1

q

"

# $ $

%

& ' ' = (

y0

f

!

y'= y0'"y0

f (6.23)

A B

P

y0=y y0’ Y’ p q

92

avendo utilizzato l’equazione (6.14) della lente sottile. Se ML è la matrice di trasferimento per la lente sottile, deve essere Y(s)=MLY(s0) e, tenendo conto della (6.23), in luogo della (6.21) si scrive:

!

Y(s) =y(s)

y'(s)

"

# $ $

%

& ' '

=m11 m12

m21 m22

"

# $ $

%

& ' '

y0

y0'

"

# $ $

%

& ' '

=m11y0 + m12y0'

m21y0 + m22y0'

"

# $ $

%

& ' '

=

y0

y0'(y0

f

"

#

$ $ $

%

&

' ' '

e della (6.22):

!

ML =1 0

"1/ f 1

#

$ % %

&

' ( ( (6.24)

anch’essa una matrice a determinante unitario, che ci permette di esprimere, per ogni pendenza del raggio y0’ a sinistra la coniugata y’ a destra. 6.5.2 Sistema diottrico centrato. Ad ogni passaggio da un mezzo all’altro si definisce la relativa matrice di trasferimento. Sia Mi la matrice relativa all’i-mo elemento:

!

Y(s1) = M1Y(s0) (6.25) … …

!

Y(sn) = MnY(sn"1) = MnMn"1 ……M2M1Y(s0) = MY(s0)

dove Y(sn) è il vettore colonna corrispondente all’immagine finale e M=MnMn-1 …… M2M1 è la matrice complessiva di trasferimento del sistema. 6.5.3 Esempio: lente sottile. Usiamo il formalismo matriciale per costruire l’immagine prodotta da una lente sottile di un oggetto lungo y0, posto in s0 e trasversale rispetto all’asse ottico. Le equazioni di interesse sono la (6.14) per i punti coniugati e la (6.15) per l’ingrandimento. Tenendo presente la Fig. 6.15, matricialmente scriviamo:

1. Per lo spazio vuoto a sinistra, Eq. (6.22),

!

M1 =1 s1 - s0

0 1

"

# $ $

%

& ' '

=1 p

0 1

"

# $ $

%

& ' '

2. Per la lente sottile, Eq. (6.24),

!

M2 =1 0

"1/ f 1

#

$ % %

&

' ( (

93

3. Per lo spazio vuoto a destra, Eq. (6.22),

!

M3 =1 s3 - s2

0 1

"

# $ $

%

& ' '

=1 q

0 1

"

# $ $

%

& ' '

Fig. 6.15. Nomenclatura per la lente sottile nella trattazione matriciale.

Ma essendo

!

Y(s3) = M3M2M1Y(s0), si ha

!

y3

y3'

"

# $ $

%

& ' '

=1 ( q /f p + q(1 ( p /f)

(1/f 1 ( p /f

"

# $ $

%

& ' '

y0

y0'

"

# $ $

%

& ' '

= My0

y0'

"

# $ $

%

& ' '

e utilizzando la (6.14), per la matrice di trasferimento complessiva si perviene a

!

M ="q / f 0

"1/ f "p / q

#

$ % %

&

' ( ( (6.26)

dove che il termine m12 sia nullo è una proprietà generale dei sistemi ottici stigmatici. Inoltre, y3=m11y0, quindi m11=-q/p=I, dove il segno meno compare perché qui l’asse per y3 è stato preso rovesciato.

y0

y0’

Y1= Y2

y3

y3’

s1=s2

s0

s3

p

q

Lente

94

CAPITOLO 7

FOTONI E MATERIA

7.1. Natura duale della luce: concetto di fotone26 Finora si è trattata la radiazione luminosa come una perturbazione ondosa. Tale natura spiega molte proprietà della luce, in particolare la rifrazione, la diffrazione e l’interferenza. Vi sono diversi altri aspetti dove invece la luce presenta caratteristiche che la rendono assimilabile a un corpuscolo, ed essi sono lo spettro di emissione da parte di un corpo incandescente, l’effetto fotoelettrico, la pressione di radiazione, la spettroscopia atomica e l’effetto laser. Infatti, se ν è la frequenza dell’onda e.m., l’energia da essa trasportata può presentarsi esclusivamente sotto forma di multipli interi di pacchetti o quanti di energia – i fotoni – tale energia essendo pari a hν, dove h=6.626176x10-27 erg⋅s è la già introdotta costante di Planck. L’intensità luminosa I può dunque esprimersi, oltre che come grandezza proporzionale al quadrato dell’ampiezza del campo elettrico, anche come un flusso di fotoni recanti energia:

!

I = Nvh" (7.1)

dove N è la densità dei fotoni (numero di fotoni contenuti nell’unità di volume) e v è la velocità della luce nel mezzo. L’espressione (7.1) è perfettamente analoga a quella che descrive la densità di corrente elettrica – J=Nvq – dove si ha un moto di particelle con velocità v che trasportano ciascuna una carica q in luogo di un’energia hν. La natura duale della luce fa sì che a un fotone di frequenza ν e lunghezza d’onda λ si debba associare una quantità di moto

!

pfot =h"

v=

h

# (7.2)

e che quindi esso eserciti una pressione sulla materia con cui scambia quantità di moto, il che avviene nei processi di riflessione o assorbimento. Nel caso di assorbimento totale, ad esempio, un fotone (nel vuoto) perde la sua intera quantità di moto hν/c; la pressione è allora data da hν/c per il numero di fotoni che colpiscono in un secondo l’unità di superficie del corpo, vale a dire Nv. Tenendo conto della (7.1), la pressione di radiazione Prad è allora

!

Prad =Nvh"

c=

I

c (7.3)

26 G.R. Fowles, Modern Optics, Par. 7.8-10; anche Mencuccini-Silvestrini, Fisica II, Par. IX.10.

95

Per converso, il principio di de Broglie (pronuncia debròye) assegna una natura duale - corpuscolare e ondosa - anche alle particelle elementari, con una lunghezza d’onda data da

!

"part = h / p = h / mv (7.4)

dove m è la massa della particella. La (7.4) è chiaramente la relazione (7.2) invertita. 7.2 Effetto fotoelettrico27 È l’esperimento dove più esplicitamente si porta in evidenza la natura quantica dell’ energia luminosa. Fu effettuato a fine Ottocento da Lenard, ma le osservazioni non furono capite fino al 1905, quando Einstein ne diede una spiegazione in termini di quanti di energia (fu questo lavoro a fruttargli il premio Nobel). L’apparato sperimentale è mostrato in Fig. 7.1. Una radiazione monocromatica di frequenza ν

Fig. 7.1. Apparato sperimentale per lo studio dell’effetto fotoelettrico.

colpisce un elettrodo metallico C (fotocatodo) posto all’interno di un’ampolla evacuata e mantenuto al potenziale Vc. Purché l’energia dei fotoni hν superi un dato valore di soglia hν0, e indipendentemente dall’intensità della luce - fatto classicamente inspiegabile - la radiazione è capace di proiettare elettroni all’esterno del metallo. Il meccanismo si chiama emissione fotoelettronica (o fotoelettrica). Un anodo al potenziale VA raccoglie gli elettroni fotoemessi, cosicché nel circuito esterno circola della corrente. In Fig. 7.2 (a) è mostrato l’effetto di soglia per una dato metallo e un valore fissato della d.d.p. VA–Vc. L’andamento della fotocorrente i in funzione di VA–Vc è mostrato in Fig. 7.2 (b) per due valori del flusso Φ dei fotoni incidenti. Si nota che la corrente è presente anche quando l’anodo è polarizzato negativamente rispetto al fotocatodo, come se gli elettroni fotogenerati fossero in grado di sopraffare un potenziale antagonista, almeno fino a un dato potenziale Varresto dove la corrente cessa. Questa circostanza merita un esame più approfondito. Esaminiamo in Fig. 7.3, 27 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. XII.3.

i

C A

Potenziometro

- +

96

per un dato flusso fotonico, l’andamento del potenziale di arresto al variare dell’energia hν dei fotoni.

Fig. 7.2. (a) Si ha fotocorrente per hν≥hν0 (hν0 caratteristica del metallo). (b) Fotocorrente per due diversi flussi fotonici.

Fig. 7.3. Il potenziale di arresto cresce linearmente con l’energia dei fotoni.

Si trova che, a partire dalla soglia (la quale dipende esclusivamente dal metallo usato), il potenziale di arresto cresce linearmente con hν, mentre non varia affatto se il flusso fotonico viene modificato. Il potenziale di arresto corrisponde evidentemente alla condizione per cui l’energia potenziale frenante eguaglia l’energia cinetica posseduta dai fotoelettroni al momento dell’uscita dal catodo:

!

q(VA -VB) = 1

2mev

2 (7.5)

La relazione introdotta da Einstein per giustificare il comportamento osservato è la seguente

!

h" = h"0 + 1

2mev

2 (7.6)

Essa afferma che dell’energia del fotone incidente una parte ϕ=hν0 viene utilizzata per compiere il lavoro di estrazione dell’elettrone dal metallo, quella in eccesso venendo acquisita dall’elettrone in forma di energia cinetica. ϕ è detta funzione lavoro e corrisponde all’energia necessaria per innalzare un elettrone dal più alto livello occupato nel metallo – noto come livello di Fermi - al “livello di vuoto”, cioè allo stato energetico di un elettrone privo di movimento collocato nel vuoto (e quindi

i

0 hν fisso

Varresto-Vc VA – Vc

Φ1

Φ2 > Φ1

(b) hν hν0

0

Soglia

(a)

i

hν0 0

-1

-2

-3

hν (eV)

Varresto-Vc

(volt)

Soglia Flusso fissato

97

indipendente dal metallo usato). Il discorso è meglio chiarito dalla rappresentazione schematica di Fig. 7.4.

Fig. 7.4. Schema illustrativo della relazione quantica introdotta da Einstein.

Al crescere del flusso fotonico cresce il numero di elettroni fotoemessi, quindi la fotocorrente, ma non la soglia hν0, né l’energia cinetica degli elettroni (e quindi il potenziale di arresto). I valori di hν0 si aggirano attorno a qualche eV, con un valore molto basso per il cesio, circa 2 ev (corrispondente a λ ≈ 1,24/2=0.62 nm, ossia nel rosso). L’effetto fotoelettrico è base di molteplici applicazioni, sia di laboratorio – ad esempio i fotomoltiplicatori – sia pratiche – ad esempio comandi a distanza su fascio luminoso. In ricerca fondamentale viene oggi largamente usato nella spettroscopia a fotoemissione di elettroni, per lo più fatta con luce di sincrotrone, che permette la caratterizzazione dei livelli elettronici dei solidi. L’effetto fotovoltaico nelle giunzioni p-n a semiconduttore è la sua controparte a stato solido e offre le stesse applicazioni di cui sopra più quella importante delle celle solari. 7.3 Effetto laser28 Il termine laser sta per Light Amplification by Stimulated Emission of Radiation, ossia “amplificazione di luce tramite emissione stimolata di radiazione”. Scoperto negli anni ’50 viene a seguire il maser, che opera invece nella regione delle microonde. Diamo un’illustrazione del fenomeno dell’emissione stimolata. Quando un fotone incide sulla materia e la sua energia coincide con la differenza tra due livelli elettronici, di cui (all’equilibrio) quello inferiore Ei è occupato e quello superiore Ef vuoto, di norma il fotone viene assorbito e l’elettrone viene eccitato al livello superiore, dove resta per un certo tempo tornando poi spontaneamente allo stato di equilibrio. In questo meccanismo di ricombinazione spontanea viene per lo più rilasciato un fotone di opportuna energia. Se invece il fotone trova il materiale in uno stato già eccitato, in cui il livello energetico più alto è occupato e quello inferiore vuoto, allora il fotone può “stimolare” il ritorno istantaneo dell’elettrone allo stato di equilibrio, con la

28 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. XII.8.

Livello di Fermi

Livelli occupati da elettroni

Livello di vuoto

Superficie del metallo

Metallo Vuoto

ϕ= hν0 Energia

x

98

produzione di un secondo fotone identico e coerente con quello in arrivo, oltre che propagantesi nella stessa direzione. Se c’è modo di reiterare il fenomeno con un processo a cascata, si ottiene amplificazione dell’intensità luminosa. I vari meccanismi discussi sono schematizzati in Fig. 7.5.

Fig. 7.5. (a) Assorbimento di un fotone con eccitazione di un elettrone; (b) emissione di un fotone per ritorno spontaneo dell’elettrone allo stato di equilibrio, (c) emissione di un fotone per ricombinazione stimolata dell’elettrone. In ogni caso è hν=Ef–Ei.

Chiamiamo Rif la probabilità che in un secondo un elettrone, per assorbimento di un fotone, passi dallo stato inferiore i a quello superiore f:

!

Rif = Biff(") con

!

" =Ef #Ei

h (7.7)

dove f(ν) è la densità di energia della radiazione elettromagnetica – la stessa considerata da Planck nella teoria del corpo nero - e Bif, detto coefficiente di Einstein, esprime la probabilità quanto-meccanica della transizione. La probabilità globale di ritorno all’equilibrio per un elettrone eccitato, chiamando Afi la probabilità di ricombinazione spontanea - indipendente da f(ν) - è allora

!

Rfi = Afi + Bfif(") (7.8)

dove Bfi è il coefficiente di Einstein per la transizione inversa da f a i. Se il sistema si trova in condizioni di regime, chiamate rispettivamente ni e nf le popolazioni elettroniche nello stato di equilibrio e in quello eccitato, i numeri dei fotoni emessi e di quelli assorbiti in un secondo devono essere eguali, ossia niRif=nfRfi:

!

niBiff(") = nf Afi + Bfif(")[ ] (7.9)

Tenendo conto del fatto che, come mostrato da Einstein, Bif=Bfi, dalla (7.9) si ricava per la densità dei fotoni

Ei

Ef Elettrone

Fotone hν assorbito

(a)

(b)

(c)

Fotone hν emesso

Due fotoni hν emessi

Fotone hν assorbito

99

!

f(") =nf Afi

niBif # nfBfi

=Afi / Bfi

ni / nf #1 (7.10)

La statistica di Boltzmann ci dà per il rapporto ni/nf delle "popolazioni" all’equilibrio termico:

!

ni

nf

=exp(-Ei/kT)

exp(-Ef /kT)= exp(h"/kT)

che sostituito nella (7.10) porta a

!

f(") =Afi /Bfi

exp(h"/kT) #1 (7.11)

Introducendo nell’ultima relazione scritta l’espressione per f(ν) fornita dalla teoria di Planck del corpo nero

!

f(") =8#h"3

c3

1

exp(h"/kT) -1 (7.12)

si ottiene infine

!

Afi

Bfi

=8"h#3

c3 (7.13)

eguaglianza che si dimostra accettabile anche nelle condizioni di sistema perturbato prese in considerazione. Va notato che, se la frequenza ν cresce, il rapporto Afi/Bfi cresce molto rapidamente, vale a dire che l’emissione spontanea diventa tanto più importante quanto più sale la separazione energetica dei due livelli Ef–Ei. Ciò implica che è più facile indurre l’emissione stimolata per fotoni di bassa energia. 7.3.1 Inversione di popolazione. Poiché i fotoni incidenti danno luogo sia a processi assorbitivi che di emissione stimolata, per avere amplificazione della luce è necessario che i secondi prevalgano sui primi, in altre parole occorre che la concentrazione di elettroni eccitati nf superi quella degli elettroni nello stato inferiore ni. Tale condizione di soglia per l’effetto laser è detta inversione di popolazione. Se chiamiamo Nif=niBiff(ν) il tasso di transizioni dal basso all’alto e Nfi=nf[Afi + Bfif(ν)] quello in senso inverso, ricordando sempre che Bif=Bfi, per l’amplificazione deve essere

!

Nfi

Nif

=nf

ni

Afi + Bfif(")

Bfif(")> 1 (7.14)

100

Se il flusso di fotoni è elevato, Afi<<Bfif(ν), l’emissione stimolata diventa l’effetto dominante e la condizione (7.14) si riduce appunto a quella di inversione di popolazione nf>ni. I problemi che si pongono sono, primo, come ottenere l’inversione di popolazione, secondo, come ottenere un’elevata f(ν). Vi sono diverse maniere di eccitare il sistema in modo da portarlo all’inversione di popolazione, delle quali due sono le più comuni: il pompaggio ottico, effettuato con un laser ancillare (tipico dei laser a stato solido, quale il laser a rubino), e la scarica elettrica, prodotta direttamente nel mezzo che deve amplificare la luce (tipico dei laser a gas). È tuttavia indispensabile sottolineare che in entrambi i casi il sistema non può funzionare se i livelli a disposizione sono soltanto due: al massimo si ottiene infatti che nf eguagli ni senza mai superarlo, giacché, data l’eguaglianza tra Bfi e Bfi, dei due processi basso-alto e alto-basso prevale sempre quello in cui la popolazione elettronica risulta maggiore, anche per un solo elettrone. Occorrono dunque almeno tre livelli, dei quali uno agisce da livello di transito momentaneo, come illustrato dalla Fig. 7.6, che è autoesplicativa. In taluni casi tale condizione si raggiunge miscelando più gas: tale è la situazione nel comune laser rosso a elio-neon.

Fig. 7.6. Ruolo dei tre livelli nel meccanismo di amplificazione laser.

7.3.2 Laser a elio-neon.29 Per l’importanza che ha questo laser sia negli impieghi scientifici che negli usi pratici, è opportuno approfondire il meccanismo dei tre livelli. Gli stati energetici di interesse nei due tipi di atomo sono schematicamente mostrati in Fig. 7.7. Il pompaggio avviene per scarica elettrica ai livelli metastabili 23S e 21S dell’elio, con grande efficienza perché non si hanno transizioni ottiche permesse a livelli più bassi. Il livelli 2s e 3s del neon sono praticamente degeneri con i due detti, quindi se un atomo di elio eccitato collide con un atomo di neon, c’è una buona probabilità che degli elettroni si trasferiscano da un gas all’altro, creando una condizione di inversione di popolazione nei livelli eccitati del neon. Si hanno quindi tre possibilità per l’innesco dell’effetto laser, rispettivamente alle lunghezze d’onda 632.8

29 Si veda ad esempio G.R. Fowles, Modern Optics, Par. 9.7.

Pompaggio all’energia Ep - Ei

Decadimento spontaneo all’energia Ep – Ef

Decadimento stimolato all’energia Ef – Ei

Ep

Ei

Ef

Fotone stimolatore hν= Ef – Ei Fotoni in uscita

hν= Ef – Ei

101

nm, 1.1523 µm e 3.39 µm, delle quali la prima, che cade nel rosso, è quella più largamente utilizzata.

Fig. 7.7. Rappresentazione schematica dei livelli attivi nel laser a elio-neon.

7.3.3 Cavità laser e densità di energia ottica. Un’elevata densità di energia ottica si ottiene principalmente tramite le modalità costruttive del laser. È anzitutto indispensabile che i fotoni emessi si incanalino a formare un sottile pennello in modo da mantenersi all’interno di una zona di alta intensità luminosa (“zona attiva”). In secondo luogo, è importante che i fotoni attraversino più volte la zona attiva, il che si ottiene utilizzando le vantaggiose condizioni offerte dalla cavità di Fabry-Perot (si veda il Par. 4.7.2). La cavità di Fabry-Perot consente di realizzare anche l’effetto di interferenza costruttiva, con la formazione di modi stazionari e il corrispondente incremento di potenza ottica. La fisica di tale cavità è del tutto parallela a quella che porta alla formazione di onde stazionarie su una corda vibrante a estremi fissati. Come illustrato in Fig. 7.8, la cavità laser è costituita, nella sua forma più elementare, da una coppia di specchi dielettrici paralleli posti a una certa distanza. Uno specchio è perfettamente riflettente, l’altro quasi totalmente, onde consentire l’utilizzo all’esterno della luce generata nella cavità. Nello spazio tra essi compreso è posto un

Fig. 7.8. Struttura di un laser. Le finestre del tubo contenente il gas attivo sono inclinate all’angolo di Brewster per minimizzare le perdite in riflessione della componente del campo che ha la polarizzazione desiderata.

tubo di quarzo contenente del gas in grado di emettere luce se eccitato ad esempio tramite scarica elettrica. Tale luce sarà costituita da almeno una riga spettrale di

Elio Neon

20

15

Energia (eV)

2 3S

2 1S

2p

2s 3p

3s

1s

3.39 µm

632.8 nm 1.15 µm

Collisioni atomiche

Eccitazione di elettroni da livelli inferiori

L

Tubo con gas a bassa pressione

Finestre di Brewster

Fascio luminoso

Specchio al 100%

Specchio al 99% Fascio in uscita

102

lunghezza d’onda λ, con andamento per lo più gaussiano e larghezza Δλ [Fig. 7.9(a)]. I fotoni emessi nella direzione dell’asse del tubo viaggiano a lungo nel mezzo eccitato perché vengono riflessi più volte avanti e indietro dagli specchi che delimitano la cavità: se l’amplificazione della luce è possibile essa potrà avvenire in maniera cospicua. Occorre tuttavia tenere conto, come per la corda vibrante, che soltanto per alcuni valori della lunghezza d’onda possono insediarsi onde stazionarie (quelle onde che, dopo riflessione da parte di uno dei due specchi, interferiscono costruttivamente con l’onda in arrivo su di esso, ogni altra onda spegnendosi per interferenza distruttiva). Se L è la distanza tra gli specchi, le onde stazionarie, o modi normali della cavità sono quelle caratterizzate dalla condizione

!

L = n"n

con n intero non nullo. La riga di emissione allora viene sostituita da una successione di righe più strette, le cui ampiezze hanno come inviluppo quella originale del gas non inserito nella cavità (si veda Fig. 7.9(b)).

Fig. 7.9. (a) Riga di emissione del gas eccitato fuori cavità, (b) rappresentazione schematica delle effettive lunghezze d’onda emesse dal gas eccitato in cavità (modi normali).

Esempio: sia L=30 cm, λn=500 nm, n=30/(5x10-5)=600000, n+1=600001, λn+1=499.999 nm, il che comporta modi di ordine molto elevato e assai ravvicinati quanto a lunghezza d’onda. Nel laser, si attivano per primi i modi di più alta intensità – vale a dire quelli centrali nella distribuzione di Fig. 7.9(b) - perché consentono di raggiungere più prontamente la soglia per l’amplificazione della luce.

Infine, per un’alta densità ottica, occorre che le perdite siano ridotte al minimo, il che si realizza tipicamente adottando finestre di Brewster agli estremi del tubo contenente il gas, come mostrato appunto in Fig. 7.8, così che almeno per una direzione di polarizzazione della luce laser la riflessione sia identicamente nulla. Il processo di amplificazione della luce inizia quando, eccitando il gas contenuto nel tubo, i primi fotoni vengono emessi in modo spontaneo. I fotoni emessi con una certa inclinazione rispetto all’asse del tubo si perdono senza innescare effetti di amplificazione. Quelli che invece si avviano lungo l’asse fanno un lungo percorso nel gas eccitato (mediamente, se lo specchio di estrazione del fascio laser riflette al 99%, il percorso effettivo è 100 volte la lunghezza della cavità laser), innalzando la densità

λ λ Ordine n, n+1, n+2, n+3…

(a)

(b)

λ0

103

ottica f(ν) e rendendo dominanti i processi di emissione stimolata su quelli di assorbimento e sulle perdite di altra natura. Si ha un processo di moltiplicazione a valanga che porta alle condizioni finali di regime laser. Le caratteristiche del fascio uscente sono: (a) grande intensità, benché di molto inferiore a quella interna alla cavità, (b) elevata purezza cromatica, (c) forte collimazione, ovvero debole divergenza, (d) coerenza spaziale e temporale, (e) polarizzazione parallela al piano di incidenza sulle finestre di Brewster (Rp=0). 7.4 Olografia30 Scoperta da Gabor nel 1947, l’olografia è un’applicazione dell’interferenza che permette di produrre l’immagine tridimensionale di un oggetto. I risultati ottimali si hanno con un fascio di luce laser, ma è possibile realizzare ologrammi anche con luce bianca incoerente. Fig. 7.10 mostra come si effettua la “scrittura” dell’immagine su lastra fotografica. Nella lastra vanno a sovrapporsi una parte del fascio luminoso - il fascio di riferimento, proveniente direttamente dalla sorgente - e un’altra parte che invece viene fatta riflettere dall’oggetto. Ciò determina una complessa figura di

Fig. 7.10. Registrazione su lastra fotosensibile dell’ologramma di un oggetto.

interferenza: nei punti di coincidenza di fase si ha un massimo annerimento del materiale fotosensibile, nessun annerimento nei punti di interferenza distruttiva e tutta una gamma di situazioni intermedie quando la differenza nei cammini ottici cade 30 Testo consigliato, G.R. Fowles, Modern Optics, Par. 5.7.

Lastra fotografica

Oggetto

Specchio semitrasparente

Fascio oggetto

Fascio di riferimento

Laser

Sistema espanditore del fascio laser

104

tra questi due estremi. La lastra in certo senso diviene un reticolo di diffrazione “sui generis”, sagomato secondo la forma e la luminosità dell’oggetto da olografare. La “lettura” della lastra si fa con un fascio di illuminazione eguale a quello usato come riferimento in fase di scrittura (Fig. 7.11). Il fascio diffratto è una precisa copia tridimensionale del fronte dell’onda originalmente riflessa dall’oggetto, cosicché quest’ultimo viene ricostruito in 3-D in modo virtuale (è cioè possibile, per chi guarda l’ologramma, variare la prospettiva dell’immagine con spostamenti del capo come avverrebbe per un oggetto reale). Se si utilizza luce bianca, si ricreano anche i colori.

Fig. 7.11. Riproduzione dell’immagine olografica. Discutiamo brevemente la teoria del fenomeno, utilizzando per semplificare un’onda piana monocromatica. Sia E(x,y)=a(x,y)exp[iΦ(x,y)] il campo (complesso) riflesso dall’oggetto e E0(x,y)=a0(x,y)exp[i(xksinα+yksinβ] quello del fascio di riferimento (α e β specificano la direzione dello stesso). Dopo qualche passaggio, l’intensità registrata dalla lastra risulta allora essere

!

I(x, y) =|E +E 0 |2= a2+ a0

2+ 2aa0cos["(x, y) - xksin# $ yksin%] (7.15)

che è chiaramente descrittiva di una configurazione interferenziale. Allorché si passa alla lettura, l’onda trasmessa ET(x,y) è proporzionale al campo E0 del fascio-sonda moltiplicato per la trasmittanza della lastra, a sua volta proporzionale alla I(x,y) in (7.15), che quindi la condiziona a riprodurre le fattezze dell’oggetto. 7.6. Effetto Compton31

31 Testo consigliato: Mencuccini-Silvestrini, Fisica II, Par. XIV.4.

Immagine virtuale 3-D

Laser di lettura

Osservatore

Ologramma

Fascio diffratto

Fascio analizzatore

105

L’effetto Compton è un meccanismo di interazione elettrone-fotone più complesso del semplice effetto fotoelettrico. Si osserva generalmente nella regione dei raggi X e consiste in pratica in una collisione elettrone-fotone nella quale il fotone non viene distrutto, ma si limita a perdere parte della sua energia a vantaggio dell’elettrone. Mostriamo che, se λ è la lunghezza d’onda del fotone incidente, dopo l’urto essa diventa maggiore ed è data da

!

"/

= " + "c (1 - cos#) (7.16)

dove λc è una costante universale. Anche l’effetto Compton è inspiegabile dal punto di vista classico e richiede i concetti di quantizzazione hν dell’energia luminosa e di quantità di moto hν/c associata al fotone. Quando un fotone di energia hν collide con un elettrone in un atomo, l’urto può essere trattato come un urto meccanico tra particelle libere, per il fatto che l’energia di legame dell’elettrone è molto piccola rispetto a quella del fotone X. Assumiamo inoltre che l’elettrone sia inizialmente fermo, con massa a riposo m0, e pertanto privo di quantità di moto (la direzione e il verso dei vettori quantità di moto caratterizzano i moti delle due particelle prima e dopo l’urto). Scriviamo allora le equazioni di conservazione dell’energia (che si dovrà

Fig. 7.9. Nella collisione col fotone l’elettrone acquista la quantità di moto pel. considerare relativistica) e della quantità di moto, tenendo conto del teorema di Carnot nel triangolo a destra in Fig. 7.9,

!

pel2

= (h"

c)2

+ (h" ,

c)2#2

h"

c

h" ,

ccos$ (7.17)

!

h" #h" ,= E #E 0 (7.18)

dove E=γm0c2 è l’energia relativistica finale dell’elettrone e E0=m0c2 è la sua energia a riposo. La quantità di moto iniziale dell’elettrone, si è detto, è nulla, mentre quella finale è data da pel=γm0v. La quantità (pelc, E) è un quadrivettore, dunque la sua norma

pel

2c2 – E2=- E02 (7.19)

è un invariante relativistico. Sostituendo nelle equazioni di conservazione (7.17) e (7.18), con qualche passaggio si ricava

θ θ’ hν/c

hν’/c pel θ

θ’ hν/c

hν’/c

pel

106

!

" # " ,=

h"" ,

m0c2

(1 - cos$)

ed essendo ν/c=1/λ

!

"/

# " =h

m0c

(1 - cos$) (7.19)

che coincide appunto con la (7.16), dove

!

"c =6.62x10#27erg $ s

9x10#28gx3x1010cm $ s#1= 2.45x10#10cm

valore che è ben verificato sperimentalmente in modo diretto. Una verifica alternativa si può fare producendo la collisione in camera di Wilson o camera a nebbia, e valutando gli angoli θ e θ’ dalle tracce dell’elettrone primario e di un secondo elettrone che interagisca alla Compton con il fotone (Fig. 7.10). Poiché l’angolo θ’ è una funzione di θ e di λc, è possibile risalire di nuovo a quest’ultima grandezza.

Fig. 7.10. Le tracce in camera di Wilson permettono di valutare le direzioni di moto degli elettroni Compton dopo l’urto con il fotone.

θ θ’ Primo

elettrone

Secondo elettrone

Fotone

107

CAPITOLO 8

ANISOTROPIA OTTICA E BIRIFRANGENZA

8.1 Cristalli anisotropi32 Vi sono cristalli che, non avendo una struttura reticolare cubica, sono otticamente anisotropi, presentando uno o più assi di simmetria lungo i quali i parametri ottici, segnatamente l’indice di rifrazione, sono diversi da altre direzioni. I più noti di tali materiali sono il quarzo e la calcite; l’effetto più conosciuto, come illustrato in Fig. 8.1, è la birifrangenza, ossia lo sdoppiamento di un raggio che li attraversi in quello che si chiama raggio ordinario, nel senso che obbedisce alla legge usuale della rifrazione, la legge dei seni, e in un raggio straordinario, che invece si rifrange in modo anomalo. Sperimentalmente, l’effetto può essere facilmente verificato poggiando una lastra di materiale birifrangente su una pagina stampata e notando che si ha uno sdoppiamento della scrittura.

Fig. 8.1. Lamina birifrangente.

Il fatto che il raggio si comporti in modo ordinario o straordinario dipende dal fatto che il suo campo elettrico oscilli in direzione perpendicolare all’asse ottico oppure no. Come conseguenza della differenza negli indici di rifrazione ordinario no e straordinario ns, la velocità di propagazione della luce dipende della direzione di avanzamento dell’onda nel cristallo, assumendo i valori estremi c/no se il cui campo vibra interamente in direzione normale all’asse ottico e c/ns nel caso opposto. Per capire bene gli aspetti dettagliati del fenomeno, e poter valutare la velocità dell’onda in una direzione di moto generica, nonché le modalità di separazione in due raggi distinti, è conveniente introdurre il cosiddetto ellissoide degli indici. 8.1.1 Ellissoide degli indici. Se il mezzo è anisotropo, il fronte d’onda proveniente da una sorgente s puntiforme non può ovviamente essere sferico: in presenza di assi di simmetria, esso sarà piuttosto un ellissoide, come mostrato in Fig. 8.2 (a). Siano v1, v2, v3 le velocità di propagazione lungo gli assi x, y, z. I corrispondenti indici di 32 Testo consigliato: Mazzoldi-Nigro-Voci, Fisica, Vol. II, Par. 14.6; in alternativa: Mencuccini-Silvestrini, Fisica II, Cap. XVI.

OTTICA OTTICA

Ordinario

Straordinario

108

rifrazione - n1=c/v1, n2=c/v2, n3=c/v3 - sono detti indici principali del cristallo. All’ellissoide delle velocità corrisponde dunque un ellissoide degli indici, i cui assi sono di lunghezza inversamente proporzionale ai precedenti [Fig. 8.2 (b)].

Fig. 8.2. Ellissoidi (a) delle velocità e (b) degli indici. L’ellissoide degli indici è descritto dalla seguente equazione

!

x2

n12

+y2

n22

+z2

n32

= 1 (8.1)

Mostriamo in varie situazioni come si ottengono i valori dell’indice di rifrazione a seconda della direzione di provenienza del raggio luminoso. Cominciamo illustrando in Fig. 8.2 il caso elementare di un raggio non polarizzato, con vettore d’onda k diretto come uno degli assi, ad esempio antiparallelo all’asse z, quindi con fronte d’onda piano avente giacitura (x,y). Il fronte d’onda interseca sull’ellissoide degli indici un’ellisse

Fig. 8.2. Caso onda piana con k parallelo all’asse z. di assi n1 e n2. Il campo elettrico oscilla quindi in tale piano e può essere scomposto, al solito, in due componenti di eguale ampiezza dirette lungo i due assi. La componente secondo x viaggia con velocità v1=c/n1, quella secondo y con velocità v2=c/n2. All’uscita

v3

v2

v1

z

x

y s

(a)

n3

n2 n1

x

y

z

(b)

x

n2 n1 y

z

k

Fronte d’onda Ex Ey

109

dal cristallo le due componenti avranno accumulato una differenza di fase, pur rimanendo sovrapposte. Se però il cristallo è uniassico, con l’asse ottico diretto lungo z, l’ellissoide è un ellissoide di rotazione attorno a tale asse, quindi nel piano (x, y) c’è simmetria circolare e n1=n2, v1=v2. Il campo per entrambe le componenti oscilla in direzione normale all’asse ottico, e quindi la comune velocità è vo=c/no, la velocità del raggio ordinario. Secondo caso particolare: asse ottico diretto secondo z, ma fronte d’onda piano che avanza nella direzione delle y negative (si veda Fig. 8.3). In questo caso la componente del campo che vibra secondo l’asse ottico z ha carattere di raggio straordinario con velocità vs=v3=c/n3, l’altra invece di raggio ordinario con velocità vo=v1=c/n1.

Fig. 8.3. Caso onda piana con k perpendicolare all’asse ottico (z).

Caso generale: asse ottico sempre diretto secondo z, incidenza in una direzione generica (si veda Fig. 8.4). Gli indici di rifrazione sono dati dagli assi dell’ellisse

Fig. 8.4. Incidenza con direzione generica, diversa dagli assi. intersezione tra il fronte d’onda piano e l’ellissoide. I loro valori sono n’ e n”, diversi ovviamente dagli indici principali. È utile porre in evidenza il caso particolare in cui l’incidenza avviene nel piano (z,y) formando però un angolo rispetto all’asse ottico z diverso da zero. Allora una delle componenti del campo elettrico vibra perpendicolarmente all’asse ottico, avendo

n3

n1 y

z

k

Fronte d’onda

Ez

Ex

x

n’

n” y

z k

x

Fronte d’onda

110

quindi carattere di puro raggio ordinario e velocità vo=c/no. L’altra vibra a 90° dalla prima, nel piano che contiene l’asse ottico, non necessariamente in direzione parallela all’asse ottico stesso. Concludendo, nel caso dei cristalli isotropi, l’ellissoide degli indici è una sfera e si ha n1=n2=n3; nei cristalli uniassici (quarzo e calcite, ad esempio), si ha n1=n2≠n3; infine, nei cristalli triassici è n1≠n2≠n3. Nel caso isotropo l’equazione dell’ellissoide degli indici si riduce a

!

x2+ y2

+ z2= n2

mentre nel caso uniassico si ha

!

x2+ y2

no2

+z2

ns2

= 1

8.1.2 Costruzione del fronte d’onda. In vista dell’applicazione al fenomeno della doppia rifrazione in un cristallo non isotropo, mostriamo come si costruisce il fronte d’onda nel caso di un cristallo uniassico. Sia s la sorgente puntiforme, posta nell’origine degli assi, e sia l’asse ottico diretto come z. Supponiamo ns < no, fatto che si esprime dicendo che il cristallo è “negativo”. Il fronte d’onda è illustrato in Fig. 8.5: esso appare sdoppiato, la sfera rappresentando il fronte d’onda ordinario e l’ellissoide quello straordinario. Le due circostanze limite sono quella in cui la propagazione

Fig. 8.5. Sdoppiamento del fronte d’onda in un cristallo uniassico negativo (ns < no), com’è la calcite.

avviene lungo l’asse ottico e quella in cui essa avviene perpendicolarmente ad esso (ad esempio lungo y). Nel primo caso, entrambe le componenti Ex e Ey del campo oscillante vibrano normalmente all’asse ottico, quindi hanno comportamento ordinario e velocità eguali a vo=c/no, giungendo assieme in A’, punto dove i due fronti d’onda vengono a coincidere. Se invece l’onda viaggia lungo y solo la componente Ex vibra normalmente all’asse ottico e raggiunge il punto A della sfera; la componente Ez vibra invece lungo l’asse ottico e viaggia quindi alla velocità vs=c/ns>vo, raggiungendo il punto B più

s

Asse ottico

y

z

x

A B

A’

111

lontano. Il comportamento nei casi intermedi è relativamente ovvio dall’esame della figura. 8.2 Birifrangenza Siamo ora in grado, utilizzando costruzioni di Huygens del genere introdotto nel Par. 4.1.1, di descrivere accuratamente il fenomeno della doppia rifrazione. Cominciamo con il prendere in considerazione – Fig. 8.6 - il caso relativamente generale in cui l’asse ottico forma un angolo col piano di separazione dei due mezzi, ma limitando per ora l’analisi al caso di incidenza normale (quindi fronte d’onda piano e parallelo alla superficie di separazione). Procedendo come fatto in relazione alla Fig. 4.2, dal punto A dovremo ora far partire due fronti d’onda elementari, quello ordinario sferico e quello straordinario ellissoidale, con l’asse maggiore orientato, per quanto detto nel paragrafo precedente, a 90° dall’asse ottico e con un punto di coincidenza nella direzione dell’asse ottico. La stessa identica operazione si può fare per qualsiasi altro punto della superficie di separazione. I due fronti d’onda nel secondo mezzo si trovano ora portando il piano tangente ai fronti d’onda elementari. Le direzioni di

Fig. 8.6. Costruzione di Huygens per individuare le direzioni di propagazione dei raggi ordinario e straordinario in un cristallo uniassico negativo (ns < no): incidenza normale e asse ottico inclinato rispetto alla superficie del cristallo.

propagazione si individuano congiungendo il punto A con i punti di tangenza, rispettivamente A’ e A”, in quanto si tratta dei punti dove l’onda partita da A è pervenuta dopo un periodo dell’oscillazione. Entrambi i raggi sono polarizzati, come indicato in figura. È essenziale sottolineare il fatto che, per il raggio straordinario il vettore d’onda non è perpendicolare al fronte d’onda, quindi non soddisfa la legge dei seni. In due casi particolari il raggio non si sdoppia, e cioè quando l’asse ottico è perpendicolare oppure parallelo alla superficie. Nel primo caso, entrambe le componenti del campo hanno carattere ordinario e il comportamento non si distingue

kincid

ko ks

Superficie di separazione

Asse ottico

Fronte d’onda incidente

Fronte d’onda ordinario

Fronte d’onda straordinario

π/2

π/2 ≠π/2

A

A”

A’

Ep Es

112

da quello di un cristallo isotropo, nel secondo esse hanno diverse velocità ma viaggiano sovrapposte, come illustrato in Fig. 8.7 (a) e (b).

Fig. 8.7. Caso di asse ottico (a) normale alla superficie e (b) parallelo alla superficie in un cristallo uniassico negativo (ns<no).

Ora che si sono esaminati i casi più semplici, passiamo a costruire il doppio raggio rifratto in un caso più complesso, ossia asse ottico obliquo rispetto alla superficie di separazione dei due mezzi (benché sempre contenuto nel piano di incidenza) e incidenza obliqua. Si tratta in sostanza di fare una costruzione alla Huygens combinando i procedimenti discussi in relazione alle Figg. 4.2 e 8.6. Con un occhio alla Fig. 8.8, rivediamo brevemente i passi da seguire. Nel tempo che B arriva in B’ nel primo mezzo, da A si è propagata un’onda elementare, sferica per la componente Es del campo e ellissoidale per la Ep. I nuovi fronti d’onda si trovano conducendo i piani passanti per B’ e tangenti ai fronti elementari, mentre le direzioni di propagazione si

Fig. 8.8. Birifrangenza in un caso più generale: incidenza obliqua e asse ottico in direzione generica nel piano di incidenza.

vo=vs Fronte d’onda

unico A’=A”

A Superficie

Fronte d’onda incidente

Ep Es

kincid

Asse ottico

(a)

kincid

Asse ottico

|vo|<|vs|

Superficie

Fronte d’onda incidente

Fronte d’onda ordinario

Fronte d’onda straordinario

A”

A’

Ep

A

Es

(b)

kincid

kincid

ko

ks

Superficie di separazione

Asse ottico

Fronte d’onda incidente

Fronte d’onda ordinario

Fronte d’onda straordinario

A

A”

A’

Ep Es B

B’

λ

Es

Ep

113

trovano congiungendo A con i punti di tangenza rispettivamente A’ e A”. Si verifica subito, nello stesso modo già applicato al caso isotropo, che il raggio ordinario soddisfa alla legge di Cartesio-Snell, laddove il raggio straordinario si rifrange con un angolo che nel caso in esame è addirittura di segno opposto dell’angolo di incidenza. Il fenomeno della doppia rifrazione si presta a diverse applicazioni, di cui diremo nel prossimo paragrafo. 8.2.1 Applicazione: lamine quarto d’onda e mezz’onda. Nella configurazione di Fig. 8.7 (b) i due raggi ordinario e straordinario non si separano, ma uno viaggia più velocemente dell’altro, quindi all’uscita dalla lamina di materiale birifrangente essi presentano uno sfasamento

!

" = (ks #ko)d =2$d

%(ns # no) (8.2)

dove d è lo spessore della lamina e λ è la lunghezza d’onda nel vuoto. È possibile giovarsi di tale effetto per cambiare lo stato di polarizzazione della luce: produrre, ad esempio, la rotazione di π/2 del vettore campo elettrico di un raggio luminoso polarizzato linearmente. Si abbia la condizione sperimentale illustrata in Fig. 8.9. Si fa incidere un raggio polarizzato linearmente su una lamina birifrangente avente l’asse ottico parallelo alla superficie e formante un angolo di 45° con la direzione di polarizzazione della luce. Allora, se si scompone il vettore elettrico in una componente parallela all’asse ottico e l’altra perpendicolare, tra loro in fase, queste viaggiano rispettivamente con la velocità del raggio straordinario e del raggio ordinario, pur rimanendo sovrapposte. Nella ricombinazione all’uscita della lamina in genere non si riotterrà la polarizzazione originaria. Vedremo che se lo spessore della lamina è tale che ϕ=±π (o un suo multiplo dispari), corrispondente a una differenza di cammino ottico eguale a λ/2 (o un suo multiplo dispari), il vettore campo risulta ruotato di 90° e la lamina è detta lamina mezz’onda. Se invece lo sfasamento è ϕ=±π/2 (o un suo

Fig. 8.9. A sinistra: rotazione di 90° della direzione di polarizzazione della luce tramite una lamina mezz’onda; a destra: cambiamento della polarizzazione da lineare a circolare tramite una lamina quarto d’onda.

Asse ottico

E

E

π/4

E//

E|

π/2

Asse ottico

E

E

π/4

E//

E|

114

multiplo dispari), la luce emergente risulta polarizzata circolarmente e la lamina è detta lamina quarto d’onda. Ovviamente la lamina può compiere anche l’operazione inversa, ossia di rendere polarizzata linearmente un’onda polarizzata circolarmente. Cerchiamo per quale spessore d della lamina quarto d’onda si ha l’effetto desiderato. Sia il cristallo uniassico negativo. All’ingresso le due componenti perpendicolare e parallela all’asse ottico sono date da

!

E_| _

= Eo

= E 2

2sin"t

E // = Es

= E 2

2sin"t

e in uscita

!

E_| _

= Eo = E 2

2(sin"t + #)

E // = Es = E 2

2(sin"t + # $ % / 2) =E 2

2(cos"t + #)

quindi la condizione per d, ponendo ϕ=-π/2 nella (8.2), è

!

d ="

4(no # ns )-1

e per la lamina mezz’onda

!

d ="

2(no # ns )-1

8.2.2 Applicazione: prisma polarizzatore di Nicol. Consideriamo ora il caso, non ancora esaminato, in cui l’asse ottico giaccia nella superficie di separazione e sia perpendicolare al piano di incidenza. In tal caso, tracciando i fronti d’onda elementari di Huygens nel secondo mezzo, si nota che una componente del campo vibra sempre normalmente all’asse ottico, l’altra sempre parallelamente ad esso, indipendentemente dalla direzione di propagazione. I fronti d’onda elementari sono allora entrambi sferici, come mostrato in Fig. 8.10, e anche il raggio straordinario obbedisce alla legge dei seni, come si deduce con il ragionamento sui triangoli rettangoli proposto nel Par. 4.1.1. Se un raggio incide sulla superficie dall’interno del materiale, supponendo che il mezzo esterno sia aria con n=1, è possibile scegliere una condizione per cui si ha riflessione totale interna per il raggio ordinario ma non per quello straordinario. Il raggio emergente sarà interamente polarizzato nella direzione dell’asse ottico. Basterà che sia

!

ns < 1/ sin"i < no

115

Fig. 8.10. Condizioni di doppia rifrazione nel prisma polarizzatore di Nicol in cristallo uniassico negativo.

È questa la condizione che si utilizza per realizzare prismi polarizzatori. Il principio costruttivo del prisma di Nicol, di interesse soprattutto storico in quanto oggi superato da altri prismi, come quello di Glan, è illustrato in Fig. 8.11. Due prismi di calcite sono incollati insieme da un sottile strato di balsamo del Canada, che svolge la funzione di mezzo esterno a basso indice di rifrazione. Il raggio entra non polarizzato e perde la componente ordinaria per riflessione totale interna all’interfaccia con il balsamo.

Fig. 8.11. Prisma di Nicol.

B’

ko ks

Fronti d’onda rifratti

A

Asse ottico

B Fronte d’onda incidente

A’ A”

Strato di balsamo

Ordinario

Straordinario

Asse ottico

E//

E|

E// E|