1 Operatori negli spazi di Hilbertzaffaron/operatori.pdflo spazio vettoriale degli operatori lineari...

26
1 Operatori negli spazi di Hilbert 1.1 Operatori lineari in spazi normati Definizione 1 Una mappa lineare (operatore) tra spazi normati f : X Y ` e una mappa che preserva la struttura lineare f (αx + βy)= αf (x)+ βf (y), x, y X, α, β C (1) Un operatore che abbia come immagine C (X C) viene anche chiamato funzionale lineare. Definizione 2 Una mappa lineare tra spazi normati f : X Y si dice limitata se esiste una costante K tale per cui kf (x)k≤ K kxk x X. (2) Una mappa limitata manda insiemi limitati in insiemi limitati. Infatti, un insieme ` e limitato se ` e contenuto in una sfera di raggio r (kxk≤ r); l’immagine della sfera di raggio r ` e per`o contenuta nella sfera di raggio Kr a causa della definizione 2 (kf (x)k≤ Kr). Negli spazi normati il concetto di limitatezza ` e equivalente a quello di continuit` a. Vale infatti il seguente teorema, Teorema 1 Sia f : X Y una mappa lineare tra spazi normati. Le seguenti affermazioni sono tra loro equivalenti: a) f ` e limitata b) f ` e continua c) f ` e continua in un punto Dim: a) b): da kf (y) - f (x)k = kf (y - x)k≤ K kx - yk, segue che x y implica f (x) f (y). b) c): ovvio. c) a): f sia continua in x 0 . Per ogni esiste un δ tale per cui kf (x + x 0 ) - f (x 0 )k = kf (x)+ f (x 0 ) - f (x 0 )k = kf (x)k < (3) per ogni kxk . Fissato e un generico y X , x = δy (2kyk) soddisfa kxk = δ 2 . Quindi kf ( δy 2kyk )k < e, di conseguenza, kf (y)k < 2 δ kyk. f ` e quindi limitata. Definizione 3 Si definisce norma della mappa lineare f il pi` u piccolo dei numeri K per cui l’identit` a (2) ` e valida. La norma di f viene indicata con kf k. Vale quindi kf (x)k≤kf kkxk (4) 1

Transcript of 1 Operatori negli spazi di Hilbertzaffaron/operatori.pdflo spazio vettoriale degli operatori lineari...

  • 1 Operatori negli spazi di Hilbert

    1.1 Operatori lineari in spazi normati

    Definizione 1 Una mappa lineare (operatore) tra spazi normati f : X → Y è unamappa che preserva la struttura lineare

    f(αx+ βy) = αf(x) + βf(y), x, y ∈ X, α, β ∈ C (1)

    Un operatore che abbia come immagine C (X → C) viene anche chiamato funzionalelineare.

    Definizione 2 Una mappa lineare tra spazi normati f : X → Y si dice limitata seesiste una costante K tale per cui

    ‖f(x)‖ ≤ K‖x‖ ∀x ∈ X. (2)

    Una mappa limitata manda insiemi limitati in insiemi limitati. Infatti, un insieme è

    limitato se è contenuto in una sfera di raggio r (‖x‖ ≤ r); l’immagine della sfera di raggior è però contenuta nella sfera di raggio Kr a causa della definizione 2 (‖f(x)‖ ≤ Kr).

    Negli spazi normati il concetto di limitatezza è equivalente a quello di continuità.

    Vale infatti il seguente teorema,

    Teorema 1 Sia f : X → Y una mappa lineare tra spazi normati. Le seguenti affermazionisono tra loro equivalenti:

    a) f è limitata

    b) f è continua

    c) f è continua in un punto

    Dim: a) → b): da ‖f(y) − f(x)‖ = ‖f(y − x)‖ ≤ K‖x − y‖, segue che x → y implicaf(x) → f(y). b) → c): ovvio. c) → a): f sia continua in x0. Per ogni � esiste un δ taleper cui

    ‖f(x+ x0)− f(x0)‖ = ‖f(x) + f(x0)− f(x0)‖ = ‖f(x)‖ < � (3)

    per ogni ‖x‖ < δ. Fissato � e un generico y ∈ X, x = δy(2‖y‖) soddisfa ‖x‖ =

    δ2< δ. Quindi

    ‖f( δy2‖y‖)‖ < � e, di conseguenza, ‖f(y)‖ <

    2�δ‖y‖. f è quindi limitata. 2

    Definizione 3 Si definisce norma della mappa lineare f il più piccolo dei numeri K per

    cui l’identità (2) è valida. La norma di f viene indicata con ‖f‖. Vale quindi

    ‖f(x)‖ ≤ ‖f‖‖x‖ (4)

    1

  • per ogni x ∈ X. Poichè f è lineare, questa identità si può riscrivere come ‖f( x‖x‖)‖ ≤ ‖f‖.La formula (4) è quindi equivalente a

    ‖f(x)‖ ≤ ‖f‖, ‖x‖ = 1 (5)

    e ‖f‖ può anche essere definito come

    ‖f‖ = sup‖x‖=1‖f(x)‖. (6)

    L’insieme degli operatori continui tra due spazi normati X e Y

    B(X, Y ) = {f : X → Y |f lineare limitato} (7)

    munito della mappa f → ‖f‖ è uno spazio vettoriale normato.

    Teorema 2 B(X, Y ) è uno spazio vettoriale normato. È completo se Y è completo.Dim: È immediato verificare che ‖f‖ definisce una norma. Sia An una successione diCauchy in B(X, Y ). Vale quindi ‖An − Am‖ < � per n,m > n0. Da

    ‖An(x)− Am(x)‖ = ‖(An − Am)(x)‖ ≤ ‖An − Am‖‖x‖ < �‖x‖ (8)

    concludiamo che ‖An(x)‖ è una successione di Cauchy in Y per ogni x fissato. Poichè Yè completo, An(x) convergerà a un vettore in Y che chiamiamo A(x). A è ovviamente

    un operatore lineare ed è anche continuo; infatti passando al limite nell’equazione (8)

    otteniamo ‖A(x)−An(x)‖ ≤ �‖x‖ e ‖A(x)‖ = ‖(A(x)−An(x))+An(x)‖ ≤ (�+‖An‖)‖x‖.Quindi A ∈ B(X, Y ). Infine dalle stesse equazioni segue che ‖An − A‖ ≤ � e che lasuccessione An converge ad A nella norma di B(X, Y ). 2

    Ricordiamo che uno spazio vettoriale normato completo si chiama spazio di Banach.

    Se Y è uno spazio di Banach anche B(X, Y ) lo è. In particolare, B(H) ≡ B(H,H), cioèlo spazio vettoriale degli operatori lineari continui in uno spazio di Hilbert, è uno spazio

    di Banach.

    1.2 Isomorfismo tra spazi di Hilbert

    Definizione 3: Un isomorfismo tra spazi normati (o spazi di Hilbert) è una mappa

    lineare biunivoca che preserva la norma: ‖f(x)‖ = ‖x‖.

    Osservazioni: una mappa che preserva la norma si chiama anche isometria. In gen-

    erale, un isomorfismo tra spazi è una mappa biunivoca che preserva le proprietà (alge-

    briche, topologiche, etc...) che sono definite su questi spazi. Nel caso particolare in cui lo

    spazio normato sia anche uno spazio di Hilbert sembrerebbe più naturale definire un iso-

    morfismo come una mappa lineare che preserva il prodotto scalare: (f(x), f(y)) = (x, y).

    2

  • Le due definizioni sono in realtà equivalenti: qualora in uno spazio siano definiti sia un

    prodotto scalare che l’associata norma, una mappa lineare che preserva l’uno preserva

    anche l’altra, e viceversa. Infatti, norma e prodotto scalare si possono ricostruire una

    dall’altro attraverso le identità

    ‖x‖2 = (x, x)4(x, y) = ‖x+ y‖2 − ‖x− y‖2 + i(‖x+ iy‖2 − ‖x− iy‖2) (9)

    Esempio 1: Ogni spazio di Hilbert H separabile è isomorfo a l2. Ricordiamo che uno

    spazio di Hilbert si dice separabile quando possiede un sistema ortonormale completo

    (s.o.n.c.) numerabile. In uno spazio di Hilbert separabile, scelto un s.o.n.c. {xi}, ognix ∈ H si scrive in maniera unica come x =

    ∑aixi. Questa identificazione induce una

    mappa H → l2 : x → {ai} che è un isomorfismo di spazi di Hilbert. Innanzitutto, lamappa è ben definita ed è un’isometria perchè

    ∑|ai|2 = ‖x‖2. La mappa è iniettiva

    per l’unicità dei coefficienti di Fourier, ed è suriettiva perchè, per ogni successione in l2

    vale∑|ai|2 < ∞ e di conseguenza la formula x =

    ∑aixi definisce un elemento di H.

    L’isomorfismo in questione non è naturale perchè richiede la scelta di una base.

    Esempio 2: La trasformata di Fourier può essere pensata come una mappa lineare da

    L2(R) in L2(R). Preserva la norma ‖f̂‖ = ‖f‖ (teorema di Parseval) ed è biunivoca. Èpertanto un isomorfismo.

    1.3 Il teorema di Riesz

    Il teorema di Riesz caratterizza i funzionali lineari continui in uno spazio di Hilbert.

    Ricordiamo dall’algebra lineare che l’insieme dei funzionali lineari in uno spazio vettoriale

    V è anch‘esso uno spazio vettoriale che prende il nome di spazio duale V ∗. Nel caso di

    spazi normati è utile modificare la definizione richiedendo che V ∗ sia lo spazio vettoriale

    dei funzionali lineari continui. Dal teorema 2, segue che V ∗ è uno spazio vettoriale

    normato completo. Nel caso finito-dimensionale, V e V ∗ hanno la stessa dimensione e

    sono quindi banalmente isomorfi. La struttura di spazio di Hilbert consente di definire

    un isomorfismo naturale tra H e il suo duale H∗ per ogni spazio di Hilbert. Per ogni

    x0 ∈ H possiamo definire un particolare funzionale lineare continuo H → C : x→ (x, x0).Il teorema di Riesz garantisce che ogni funzionale continuo ha questa forma e stabilisce

    un’isomorfismo tra H e H∗.

    Teorema 3 (Riesz): Ogni funzionale lineare continuo L su uno spazio di Hilbert H si

    può scrivere in maniera univoca come L(x) = (x, x0). Vale inoltre ‖L‖ = ‖x0‖.

    3

  • Dimostrazione: Nel caso particolare L = 0, x0 = 0 e il teorema è ovvio. Possiamo

    quindi supporre L 6= 0. Definiamo M = {x ∈ H|Lx = 0}. Poichè L è lineare e continuo,M è un sottospazio chiuso di H ed ammette quindi un complemento ortogonale M⊥.

    Scegliamo un particolare z ∈ M⊥ con ‖z‖ = 1. Definito u = L(x)z − L(z)x, abbiamoche L(u) = L(x)L(z) − L(z)L(x) = 0; quindi u ∈ M . Visto che u ∈ M e z ∈ M⊥,0 = (u, z) = L(x)(z, z) − L(z)(x, z). Ne segue che L(x) = L(z)(x, z) = (x, L(z)z).Quindi il teorema vale con x0 = L(z)z. Da |L(x)| = |(x, x0)| ≤ ‖x‖‖x0‖ segue che‖L‖ ≤ ‖x0‖. Visto che |L(x0)| = ‖x0‖2, la disuguaglianza precedente è certamentesaturata e ‖L‖ = ‖x0‖. L’unicità segue dal fatto che, se L(z) = (x, x0) = (x, x′0), allora(x, x0−x′0) = 0; x0−x′0 è quindi nullo perchè ortogonale a qualunque vettore nello spaziodi Hilbert. 2

    1.4 Esempi di operatori negli spazi di Hilbert

    Consideremo operatori lineari A : H → H. Per semplicità le parentesi tonde in A(x)saranno a volte omesse: Ax sta per A(x). Se non altrimenti specificato, useremo lettere

    maiuscole dell’alfabeto latino per indicare operatori negli spazi di Hilbert, lettere minus-

    cole (della parte finale) dell’alfabeto latino per indicare vettori in H e lettere greche per

    indicare scalari.

    Esempio 1: caso finito dimensionale. A : H → H, dimH = N . Scegliamo unabase ei, i = 1, ..., N . Consideriamo lo sviluppo di x e di Ax: x =

    ∑Ni=1 xiei e Ax =∑N

    i=1(Ax)iei. Si ha che

    (Ax)i = (Ax, ei) = (A(N∑j=1

    xjej), ei) =N∑j=1

    xj(Aej, ei) (10)

    Vediamo che A, in termini delle coordinate rispetto alla base scelta, è rappresentato da

    una matrice

    (Ax)i =N∑j=1

    Aijxj, Aij = (Aej, ei) (11)

    Gli operatori negli spazi infinito dimensionali generalizzano il concetto di matrice.

    Come dimostrano i seguenti esempi, molte proprietà valide negli spazi di dimensione

    finita sono false negli spazi di dimensione infinita.

    Esempio 2: operatore di shift in H = l2. A({a1, a2, ....}) = {0, a1, a2, ....} definisce unoperatore lineare continuo con norma 1. È infatti un’isometria: ‖Ax‖ = ‖x‖. È iniettivoma non suriettivo: l’elemento z = {1, 0, 0, ....} non è infatti nell’immagine di A. A mappa

    4

  • H biunivocamente in un suo sottoinsieme proprio A(H) = ({z})⊥. Questo è possibilesolo perchè H è infinito-dimensionale. A si può rappresentare come una matrice infinita

    Aij, i, j = 1, 2.... le cui sole entrate non nulle sono Ai+1,i = 1, i = 1, 2....

    Esempio 3: gli operatori posizione e momento della Meccanica Quantistica. Definiamo

    in L2[a, b] −∞ ≤ a < b ≤ ∞ gli operatori

    x̂ : x̂f(x) = xf(x)

    p̂ : p̂f(x) = −i dfdx

    (x) (12)

    I due operatori soddisfano le regole di commutazione di Heisenberg [x̂, p̂] = i come segue

    dal semplice calcolo

    x̂p̂f(x)− p̂x̂f(x) = −ix ddxf(x) + i

    d

    dx(xf(x)) = if(x) (13)

    Esistono operatori A e B che soddisfano l’algebra astratta di Heisenberg [A,B] = i

    soltanto in spazi infinito dimensionali. Infatti, in uno spazio di dimensione finita N ,

    A e B sarebbero rappresentabili da matrici N per N e l’equazione [A,B] = i sarebbe

    inconsistente, come si vede prendendo la traccia:

    0 = Tr[A,B] = Tr(AB)− Tr(BA) = Tr(AB)− Tr(AB) ≡ N (14)

    dove si è usata la properietà di ciclicità della traccia.

    Esempio 4: operatori differenziali in H = L2(X), X sottoinsieme di Rn. Per semplicità

    consideriamo X = (a, b),−∞ ≤ a < b ≤ ∞ e il più semplice degli operatori differen-ziali: A = −i∂x. L’operatore A ha due seri problemi: 1) Non è continuo. Consideriamoad esempio yn(x) = e

    −nx in L2[0, π]. Ayn = inyn e di conseguenza ‖Ayn‖/‖yn‖ = nnon può essere limitato. 2) Non è nemmeno definito ovunque. Infatti non tutte le fun-

    zioni a quadrato sommabile sono derivabili con derivata ancora appartenente allo stesso

    spazio. A è definito solo su un sottoinsieme D(A) di H che prende il nome di dominiodell’operatore. D(A) contiene almeno tutte le funzioni C1[a, b] ed è un sottoinsieme densodi L2[a, b]. I problemi 1)+2) sono comuni a tutti gli operatori differenziali.

    Osservazione sul dominio: l’esempio 4 descrive una caratteristica generale della teoria

    degli operatori negli spazi di Hilbert: gli operatori di maggior interesse non sono continui

    e non sono nemmeno definiti sull’intero H. Gli operatori continui possono sempre estesi

    all’intero H. Se un operatore continuo A è definito in un dominio D(A) può sempreessere esteso a D(A) per continuità. Vale infatti

    5

  • Teorema 4: Un operatore lineare A in uno spazio normato completo X che sia definito

    e continuo in un sottoinsieme denso U può essere esteso ad un operatore continuo definito

    sull’intero X.

    Dim: Vale ‖Ax‖ ≤ ‖A‖‖x‖ in U . Poichè U è denso in X, ogni x ∈ X sarà limite di unasuccessione di elementi xn in U . Poichè xn converge, sarà di Cauchy, quindi ‖xn−xm‖ < �per n,m sufficientemente grandi. Da ‖Axn −Axm‖ = ‖A(xn − xm)‖ ≤ ‖A‖‖xn − xm‖ <�‖A‖ segue che la successioneAxn è di Cauchy, e quindi, per la completezza diX, convergead un elemento che chiamiamo Ax. Prendendo il limite dell’equazione ‖Axn‖ ≤ ‖A‖‖xn‖otteniamo ‖Ax‖ ≤ ‖A‖‖x‖. La mappa x → Ax definisce quindi un’estensione di Aall’intero spazio X. L’estensione è ancora un operatore continuo con la stessa norma di

    A definito in U .2

    A si può poi estendere ad H in molti modi possibili. Il più semplice è richiedere, ad

    esempio, che si annulli in D(A)⊥

    . In questo modo si ottiene un’estensione continua di A

    all’intero H. Nel seguito supporremo pertanto che ogni operatore continuo sia definito

    sull’intero H.

    Come abbiamo visto, gli operatori non continui sono invece definiti solo su un sottoin-

    sieme di H e, in generale, non sono estendibili all’intero H. In questo caso è importante

    specificare il dominio di definizione. Poichè le proprietà degli operatori possono variare

    a seconda dell’insieme di definizione, nel seguito, la parola operatore implicitamente in-

    dicherà la coppia (A,D(A)). È ragionevole richiedere almeno che il dominio D(A) siaun sottoinsieme denso di H. La mancanza di continuità viene solitamente rimpiazzata

    da una condizione più debole ma sufficiente per molte applicazioni, la chiusura. Un

    operatore si dice chiuso se le due condizioni xn → x e Axn → y implicano y = Ax1. Richiederemo sempre agli operatori non continui di essere densamente definiti (cioè

    D(A) = H) e chiusi.

    1.5 Operatori autoaggiunti e unitari

    Dato un operatore (A,D(A)) densamente definito inH (cioèD(A) = H) esiste l’operatoreaggiunto (A∗,D(A∗)) che soddisfa

    (Ax, y) = (x,A∗y), x ∈ D(A), y ∈ D(A∗) (15)

    ed è definito in

    D(A∗) = {y ∈ H|Ly : H → C, x→ (Ax, y) funzionale lineare continuo} (16)1Nel caso di operatori continui la sola condizione xn → x implica Axn → Ax. Nel caso di operatori

    non continui Axn potrebbe anche non convergere. Per operatori chiusi, se xn converge a x e Axnconverge, quest’ultimo deve convergere a Ax. La definizione di chiusura si può riformulare in maniera

    più semplice cos̀ı: un operatore A si dice chiuso se il suo grafico, cioè l’insieme delle coppie {(x,Ax)},è un sottoinsieme chiuso di H ×H.

    6

  • Nel caso di operatori continui l’equazione (15) vale per tutti gli x, y ∈ H. Nel caso dioperatori non continui, l’aggiunto è definito nel dominio indicato, che potrebbe essere

    diverso da quello di A.

    L’esistenza dell’aggiunto è garantita dal teorema di Riesz. Per y ∈ D(A∗) fissato, lamappa Ly : D(A) → C : x → (Ax, y) è un funzionale lineare continuo definito inD(A). Poichè D(A) è denso in H, il teorema 4 garantisce che Ly si può estendere adun funzionale continuo su H. Per il teorema di Riesz, esiste allora z ∈ H tale per cuiLy(x) = (Ax, y) = (x, z) per ogni x. z dipenderà da y: chiamiamolo z = A

    ∗y. La mappa

    A∗ che associa ad ogni y uno z è un operatore lineare che soddisfa l’equazione (15).

    Esempio 1 Ogni operatore A in CN è associato ad una matrice Aij. Calcoliamo lamatrice associata a A∗. Usando l’equazione (11): (A∗)ij = (A

    ∗ej, ei) = (ej, Aei) =

    (Aei, ej) = Aji. La matrice dell’aggiunto di A è quindi la matrice aggiunta (o coniugata

    hermitiana), cioè la matrice trasposta coniugata: A∗ij = Aji.

    Non è difficile dimostrare che

    Teorema 3: Se A è continuo anche A∗ è un operatore continuo e ‖A∗‖ = ‖A‖. InoltreA∗∗ = A.

    Dim: Se A è continuo, è anche limitato: ‖A‖ < ∞. Usando l’identità di Schwarz,otteniamo:

    |(A∗x, y)| = |(x,Ay)| ≤ ‖x‖‖Ay‖ ≤ ‖x‖‖A‖‖y‖ (17)

    Scegliendo y = A∗x otteniamo: ‖A∗x‖2 ≤ ‖x‖‖A‖‖A∗x‖ cioè ‖A∗x‖ ≤ ‖x‖‖A‖; ne segueche A∗ è limitato, quindi continuo, con

    ‖A∗‖ ≤ ‖A‖. (18)

    In particolare, visto che A∗ è continuo, anche A∗∗ esiste ed è continuo; l’equazione (15)

    ci dice che (A∗∗x, y) = (x,A∗y) = (Ax, y) per ogni x, y e quindi A∗∗ = A. La disug-

    uaglianza (18) applicata a A∗∗ ci dice che ‖A‖ = ‖A∗∗‖ ≤ ‖A∗‖, da cui ‖A∗‖ = ‖A‖.2

    Si può dimostrare [1] che il teorema precedente vale per operatori illimitati nella seguente

    forma: se A è chiuso e densamente definito, A∗ è anch‘esso chiuso e densamente definito

    e soddisfa A∗∗ = A.

    Considereremo tre classi importanti di operatori:

    1. Operatori autoaggiunti. A si dice autoaggiunto se A = A∗.

    7

  • Osservazione importante: nella definizione di autoaggiuntezza, l’affermazione A = A∗

    va intesa come: (A,D(A)) = (A∗,D(A∗)). può succedere che, dato A definito su D(A), A∗

    esista e coincida con A in D(A) ma sia definito in un dominio più ampio D(A∗) ⊃ D(A).In questo caso l’operatore è solo formalmente autoaggiunto. Possiamo quindi definire

    due forme di autoaggiuntezza:

    A è simmetrico se vale

    (Ax, y) = (x,Ay), x, y ∈ D(A) (19)

    Questa condizione garantisce semplicemente che A∗ esiste e coincide con A in D(A). Ingenerale A∗ sarà un’estensione di A: D(A∗) ⊃ D(A).

    A è autoaggiunto se vale A ≡ A∗, cioè se A e A∗ coincidono come operatori (dominioincluso!): D(A) = D(A∗).

    Come vedremo, gli operatori autoaggiunti hanno proprietà che gli operatori simmetrici

    non possiedono. Per operatori continui, che non hanno problemi di dominio, autoaggiun-

    tezza e simmetria coincidono.

    Esempio 1: nel caso finito-dimensionale, A è autoaggiunto se lo è la matrice corrispon-

    dente: Aij = Aji. Una matrice con questa proprietà si chiama anche simmetrica (nel

    caso reale) o hermitiana (nel caso complesso).

    Esempio 2: un altro esempio importante di operatore autoaggiunto è l’operatore A =

    −i∂x in L2[a, b], −∞ ≤ a < b ≤ ∞. L’operatore non è continuo. Consideriamo la formula(15) per funzioni f, g molto regolari, in modo che tutte le formule e le manipolazioni

    formali abbiano senso (notare che la i nella definizione di A è importante):

    (−i∂xf, g) =∫ ba

    (−if ′(t)g(t))dt = −ifg|ba +∫ ba

    f(t)(−ig′(t))dt = −ifg|ba + (f,−i∂xg)

    (20)

    Condizione necessaria perchè l’operatore sia autoaggiunto è che il termine di bordo si

    annulli. È quindi necessario specificare un dominio D(A), ovvero dire quali sono le

    condizioni al contorno delle funzioni considerate. In particolare, l’annullarsi dei termini

    di bordo per tutte le funzioni f, g ∈ D(A) garantisce l’equazione

    (Af, g) = (f, Ag), f, g ∈ D(A) (21)

    garantisce cioè che l’operatore è simmetrico. A∗ è quindi un’estensione di A. Tipicamente

    D(A) viene inizialmente scelto sulla base del problema in considerazione, in modo da

    8

  • annullare i termini al bordo. Se una considerazione più attenta mostra che in realtà A∗ è

    definito su un dominio più ampio, si può tentare di estendere il dominio di A sperando che

    quello di A∗ si restringa. Per approssimazioni successive si può arrivare ad un operatore

    autoaggiunto: D(A) ⊂ D(A1) ⊂ ... ⊂ D(Aaut) ⊂ ... ⊂ D(A∗1) ⊂ D(A∗), dove Aaut ≡A∗aut, dominio incluso. Esistono molti domini diversi in cui A risulta simmetrico, mentre

    ne esiste uno solo in cui A è autoaggiunto.

    Consideriamo, ad esempio, l’operatore −i∂x in L2(R). Ogni funzione in L2(R) si annullaall’infinito e i termini al bordo nell’equazione (20) si annullano automaticamente. Occorre

    però scegliere ancora il dominio dell’operatore imponendo opportuni requisiti di regolarità

    alle funzioni. La scelta più semplice di un dominio denso in L2(R) composto da funzionimolto regolari è S(R). L’operatore −i∂x non è però autoaggiunto S(R). Esistono infattifunzioni g /∈ S(R) che soddisfano la condizione (−i∂f, g) = (f,−i∂g) per ogni f ∈ S(R).Si può dimostrare che −i∂x in L2(R) è simmetrico nel dominio S(R) e autoaggiunto neldominio {fAC , f ′′ ∈ L2(R)} 2.Consideriamo ora l’operatore−i∂x definito sull’intervallo limitato [0, 1]. Definiamo cinqueoperatori diversi, che differiscono solo per la scelta del dominio :

    AL = −i∂x D(AL) = {hAC , h′ ∈ L2[0, 1]|h(0) = 0}AR = −i∂x D(AR) = {hAC , h′ ∈ L2[0, 1]|h(1) = 0}A1 = −i∂x D(A1) = {hAC , h′ ∈ L2[0, 1]|h(0) = h(1) = 0}A2 = −i∂x D(A2) = {hAC , h′ ∈ L2[0, 1]|h(0) = h(1)}A3 = −i∂x D(A3) = {hAC , h′ ∈ L2[0, 1]} (22)

    Non è difficile verificare che A1 è simmetrico, A2 è autoaggiunto, A∗1 = A3 e A

    ∗L = AR.

    Cominciamo con l’osservare che i termini di bordo nell’equazione (20) non si annullano

    per funzioni f, g che appartengono ai domini di AL, AR; questi operatori non sono quindi

    simmetrici. Calcoliamo l’aggiunto di AL: questo dovrà soddisfare l’equazione (ALf, g) =

    (f, A∗Lg) per ogni f ∈ D(AL) e g ∈ D(A∗L). Consideriamo la formula (20): AL e ARagiscono entrambi come −i∂x e, se scegliamo f(0) = 0, i termini al bordo si cancellanoper ogni funzione che soddisfi g(1) = 0. Ne segue che (ALf, g) = (f, ARg) per ogni

    f ∈ D(AL) e g ∈ D(AR), da cui concludiamo che A∗L = AR 3. Consideriamo ora A1, A22Il suffisso AC indica che la funzione deve essere scelta assolutamente continua (cfr Rudin, Real and

    Complex Analysis). Questa richiesta serve a garantire la validità del teorema fondamentale del calcolo

    integrale (f(b) − f(a) =∫ baf ′(x)dx) e la possibilità di integrare per parti. È un requisito tecnico che

    serve ad eliminare alcune funzioni patologiche che pure sono L2 con derivata L2. Alcuni testi riformulano

    le condizioni fAC , f′ ∈ L2 in maniera equivalente richiedendo di lavorare nello spazio di Sobolev H1 (che

    è uno spazio di distribuzioni).3Per essere precisi, abbiamo solo dimostrato che A∗L è un‘estensione di AR: il dominio di A

    ∗L potrebbe

    essere più grande di quello di AR. Possiamo dimostrare che A∗L ≡ AR come segue. Sia dato g ∈ D(A∗L),

    9

  • e A3: abbiamo una catena di operatori, con domini che soddisfano D(A1) ⊂ D(A2) ⊂D(A3) e che coincidono a coppie nell’intersezione dei loro domini. Gli operatori A1 e A2sono simmetrici poichè i termini di bordo nell’equazione (20) si annullano per funzioni

    f, g ∈ D(Ai), i = 1, 2. A3 non è invece simmetrico. Notiamo tuttavia che A1 non èautoaggiunto. Infatti i termini di bordo nell’equazione (20) si annullano anche nel caso

    in cui f si annulla agli estremi e g è arbitraria; per ogni coppia di funzioni f ∈ D(A1)e g ∈ D(A3) vale l’equazione (A1f, g) = (f, A3g). Ne concludiamo che A∗1 = A3. Inmaniera analoga ci si può convincere che A2 = A

    ∗2. A1 è quindi un operatore simmetrico

    ma non autoaggiunto, mentre A2 è autoaggiunto.

    2. Operatori unitari. U si dice unitario se UU∗ = U∗U = I, dove I è l’identità. Nel

    caso finito-dimensionale, U è unitario se lo è la matrice corrispondente. Gli operatori

    unitari preservano norma e prodotto scalare: infatti (Ux, Uy) = (x, U∗Uy) = (x, y). U

    è ovviamente invertibile con inverso U∗. Un operatore unitario è quindi un’isomorfismo

    di H in sè stesso. Visto che ‖U(x)‖ = ‖x‖, U è necessariamente continuo e di norma1. È anche possibile pensare agli operatori unitari come cambi di base nello spazio di

    Hilbert: se {φi} è un s.o.n.c. anche {Uφi} lo è, come si verifica facilmente usando leproprietà che abbiamo appena discusso. Un esempio notevole di operatore unitario in

    L(R) è l’operatore Trasformata di Fourier.

    3. Proiettori. Per ogni sottospazio chiuso S di H abbiamo la decomposizione ortogonale

    H = S + S⊥. Ogni x si scrive in maniera unica come x = y + z con y ∈ S, z ∈ S⊥. Ilproiettore P sul sottospazio S è definito dalla formula Px = y.

    Teorema: P è continuo, autoaggiunto e idempotente (cioè P 2 = P ).

    Dim: P 2 = P è ovvio. Da ‖x‖2 = ‖y‖2 + ‖z‖2, otteniamo ‖Px‖2 = ‖y‖2 ≤ ‖x‖2.Quindi P è continuo e ‖P‖ ≤ 1. Infine, date le decomposizioni ortogonali di due vettorixi = yi + zi, i = 1, 2 con Pxi = yi, (Px1, x2) = (y1, x2) = (y1, y2 + z2) = (y1, y2) =

    (y1 + z1, y2) = (x1, Px2) quindi P è autoaggiunto. 2

    1.6 Autovalori e teoria spettrale

    La teoria spettrale generalizza agli spazi di Hilbert lo studio di autovalori ed autovettori.

    È noto dall’algebra elementare che ogni matrice autoaggiunta ha autovalori reali e una

    che quindi soddisfa (ALf, g) = (f,A∗Lg) per ogni f ∈ D(AL). A∗Lg esiste ed è L2. Esiste quindi anche

    φ(x) = −i∫ 1xA∗Lgdx che soddisfa φ(1) = 0 e −i∂xφ = A∗Lg. Vogliamo dimostrare che φ ≡ g, da cui

    deduciamo che l’azione di A∗L su g è una derivata e che g(1) = 0, cioè A∗L = AR. Da (g,ALf) =

    (A∗Lg, f) =∫ 10A∗Lgf̄ = −i

    ∫ 10∂φf̄ = −iφf̄ |10 +

    ∫ 10φ(−i∂f) = (φ,ALf) deduciamo (g − φ,ALf) = 0.

    Non è difficile convincersi che l’immagine di AL è perlomeno densa in L2: concludiamo che g = φ. Un

    ragionamento analogo può essere usato per rendere rigorosi gli altri argomenti riportati nel testo.

    10

  • base ortonormale di autovettori. In questa base la matrice è diagonale. In uno spazio

    di Hilbert è necessario estendere il concetto di autovalore introducendo autovalori gen-

    eralizzati e lo spettro di un operatore. La teoria spettrale garantisce che un operatore

    autoaggiunto ha spettro reale e può essere diagonalizzato.

    Ricordiamo che λ ∈ C e x ∈ H non nullo si definiscono autovalore e autovettoredell’operatore A in H se vale

    Ax = λx (23)

    Il nucleo Ker(A−λI) dell’operatore A−λI è quindi non nullo e si definisce autospazioassociato all’autovalore λ. L’operatore A− λI non è ovviamente invertibile.

    È utile generalizzare il concetto di autovalore estendendolo a tutti i numeri λ ∈ C percui A− λI non è invertibile nel senso della seguente definizione:

    Def: Si definisce spettro σ(A) dell’operatore A in uno spazio di hilbert H l’insieme dei

    λ ∈ C per cui (A− λI)−1 /∈ B(H). Lo spettro si divide naturalmente in tre sottoinsiemidisgiunti:

    Spettro discreto: l’insieme dei λ ∈ C per cui A − λI non è iniettivo, e quindi non èinvertibile come mappa lineare

    Spettro continuo: l’insieme dei λ ∈ C per cui A−λI è invertibile come mappa lineare,è densamente definito ma (A− λI)−1 : Im(A− λI)→ H non è un operatore continuo

    Spettro residuo: l’insieme dei λ ∈ C per cui A− λI è invertibile come mappa linearema non è densamente definito

    Lo spettro discreto corrisponde all’insieme degli autovalori di A. Infatti se A−λI nonè iniettivo, Ker(A−λI) 6= 0 ed esiste almeno una soluzione non nulla dell’equazione Ax =λx. Lo spettro continuo è la vera novità per gli operatori in spazi infinito dimensionali.

    Poichè A − λI è invertibile, Ker(A − λI) = 0 e λ non è un autovalore. λ appartenenteallo spettro continuo è però un autovalore approssimato:

    Teorema 5: Per ogni λ ∈ C appartenente allo spettro continuo, esiste una successionedi vettori xn tali per cui ‖Axn − λxn‖ → 0.Dim: (A − λI)−1 non è continuo, quindi esiste una sucessione yn tale per cui ‖(A −λI)−1yn‖ ≥ n‖yn‖. Definendo wn = (A − λI)−1yn si ha che ‖Awn − λwn‖ ≤ ‖wn‖/n.Infine se xn = wn/‖wn‖ si ha che ‖Axn − λxn‖ ≤ 1/n→ 0. 2

    11

  • L’equazione agli autovalori può quindi essere approssimata a piacere quando λ appartiene

    allo spettro continuo. Ovviamente la successione xn non può convergere in H. In caso

    contrario, se xn → x ∈ H, il teorema 5 garantisce che Axn → λx, e quindi, sotto lasola condizione che A sia chiuso, Ax = λx e λ sarebbe un autovalore. Tipicamente,

    esiste uno spazio topologico H ⊂ Y di funzioni o distribuzioni a cui può essere estesa ladefinizione dell’operatore A in cui la successione xn ∈ H converge a un vettore x ∈ Ye vale l’equazione Ax = λx come equazione per vettori e operatori in Y . Per questa

    ragione λ appartenente allo spettro continuo si chiama anche autovalore generalizzato e

    la distribuzione x autofunzione generalizzata. Lo spettro residuo è il meno interessante.

    Gli operatore interessanti hanno spettro residuo vuoto.

    Teorema 6: Se A è autoaggiunto, i suoi autovalori sono reali e gli autovettori cor-

    rispondenti ad autovalori diversi sono mutuamente ortogonali. L’intero spettro σ(A) è

    un sottoinsieme dell’asse reale e lo spettro residuo è vuoto.

    Dim: Dato u 6= 0 con Au = λu: λ(u, u) = (λu, u) = (Au, u) = (u,Au) = (u, λu) =λ(u, u). Da (u, u) 6= 0 segue che λ = λ, cioè gli autovalori sono reali. Analogamente,siano u1, u2 due autovettori corrispondenti a due autovalori distinti: Aui = λiui, i = 1, 2.

    λ1(u1, u2) = (λ1u1, u2) = (Au1, u2) = (u1, Au2) = (u1, λ2u2) = λ2(u1, u2). Dalla realtà

    degli autovalori segue che (λ1 − λ2)(u1, u2) = 0. Infine dal fatto che λ1 6= λ2, segue che(u1, u2) = 0. Dimostriamo ora che lo spettro continuo è reale e lo spettro residuo vuoto.

    Dato λ = λ1 + iλ2 con λi ∈ R calcoliamo

    ‖(A− λI)x‖2 = ‖(A− λ1I)x− iλ2x‖2 = ‖(A− λ1I)x‖2 + |λ2|2‖x‖2 (24)

    (i termini misti si annullano per la simmetria di A: ((A − λ1I)x,−iλ2x) + (−iλ2, (A −λ1I)x) = iλ2(((A − λ1I)x, x) − (x, (A − λ1I)x)) = 0). Dall’equazione precedente segueche ‖(A − λI)x‖2 ≥ |λ2|2‖x‖2. Definendo y = (A − λI)x si ha che ‖(A − λI)−1y‖2 ≤‖y‖2/|λ2|2. Se λ2 6= 0 l’operatore inverso (A − λI)−1 è continuo e quindi ogni λ conparte immaginaria non nulla non appartiene allo spettro continuo. Infine, se λ non è un

    autovalore anche λ̄ non lo è, poichè gli autovalori sono reali. Quindi Ker(A− λ̄I) = {0}.Ora, se x ∈ Ker(A − λ̄I) allora 0 = (Ax − λ̄x, y) = (x,Ay) − λ̄(x, y) = (x, (A − λI)y)per ogni y a causa dell’autoaggiuntezza di A; quindi x ∈ (Im(A − λI))⊥. Ne segue(Im(A − λI))⊥ = Ker(A − λ̄I) ≡ {0}. L’immagine dell’operatore A − λI, che è ildominio dell’operatore inverso (A− λI)−1 è quindi denso in H e λ non può appartenereallo spettro residuo che è quindi vuoto. 2

    Si dimostra analogamente che

    Teorema 7: Se A è unitario, i suoi autovalori sono numeri complessi di modulo unitario

    12

  • e gli autovettori corrispondenti ad autovalori diversi sono mutuamente ortogonali. Lo

    spettro è un sottoinsieme del cerchio unitario e lo spettro residuo è vuoto.

    Esempio 1: consideriamo il caso finito-dimensionale. È ben noto che ogni matrice

    autoaggiunta può essere diagonalizzata. Infatti l’equazione agli autovalori (23) si riduce

    ad un‘equazione matriciale Ax = λx in CN . Da (A − λI)x = 0 segue che gli autovalorisoddisfano l’equazione caratteristica

    det(A− λI) = 0 (25)

    Questa è un’equazione polinomiale di gradoN in λ che quindi ha esattamenteN soluzioni.

    Ne concludiamo che esistono esattamente N autovalori λi, i = 1, ..., N . Se sono tutti

    distinti, il teorema 6 garantisce l’esistenza di N autovettori mutuamente ortogonali.

    Possiamo costruire una base o.n.c. {ui}, i = 1, ..., N usando gli autovettori oppor-tunamente normalizzati. Questo cambiamento di base è quello che nei corsi di alge-

    bra lineare si usa per diagonalizzare una matrice simmetrica o autoaggiunta. Nella

    base {ui}, infatti, la matrice associata ad A è diagonale, A = diag(λ1, ..., λN), poichèAij = (Auj, ui) = λj(uj, ui) = λiδij. Nel caso ci siano autovalori multipli, ognuno di

    questi è associato a un sottospazio di CN di dimensione pari alla molteplicità; in ognunodi questi sottospazi possiamo scegliere autovettori mutuamente ortogonali in modo da

    completare un s.o.n.c. in CN .

    Esempio 2: consideriamo l’operatore A2 = −i∂x autoaggiunto in D(A2) = {fAC , f ′ ∈L2[0, 1]|f(0) = f(1)}. I suoi autovalori e autovettori si determinano dall’equazione dif-ferenziale −iy′ = λy che ha soluzioni y = Aeiλx. Le condizioni al contorno (periodicitàdi y) impongono λ = 2πn = 0, 1, 2, .... L’insieme degli autovettori, opportunamente

    normalizzati, un = e2πnx è un s.o.n.c. in L2[0, 1] (base di Fourier).

    Vediamo che l’esempio 2 generalizza in maniera molto semplice il risultato valido in

    uno spazio finito-dimensionale: gli autovettori dell’operatore autoaggiunto possono essere

    scelti in modo da formare un s.o.n.c. in H. Questa situazione non si generalizza ad ogni

    operatore in uno spazio di Hilbert, come dimostra l’esempio seguente:

    Esempio 3: consideriamo ancora l’operatoreA = −i∂x definito però inD(A) = {fAC , f ′ ∈L2(R)}. È anch‘esso autoaggiunto. I suoi autovalori e autovettori si determinano ancorauna volta dall’equazione differenziale −iy′ = λy che ha soluzioni y = Aeiλx. Questesoluzioni però non sono L2(R) per nessun valore di λ. L’operatore A non possiede alcunautovalore nè autovettore. Notiamo tuttavia che, sebbene non sia possibile trovare alcun

    vettore x ∈ H che soddisfi l’equazione Ax = λx, è possibile trovare vettori xn ∈ H che

    13

  • approssimino questa equazione con un errore arbitrariamente piccolo per ogni λ reale:

    ‖Axn − λxn‖ ≤ �. Infatti non è difficile definire delle funzioni xn ∈ C1(R), nulle aldi fuori dell’intervallo (−n − 1, n + 1) e coincidenti con eiλx nell’intervallo (−n, n) chesoddisfino alla proprietà limn→∞ ‖Axn − λxn‖ = 0 per λ reale. Si può dimostrare infatti[1] che lo spettro dell’operatore è puramente continuo e coincidente con l’asse reale. Le

    funzioni uλ = eiλx con λ ∈ R vengono chiamate autovettori generalizzati. In effetti le

    funzioni xn che soddisfano la proprietà dell’autovalore approssimato in questo esempio

    convergono a uλ = eiλx quando n tende all’infinito. Le funzioni uλ non appartengono allo

    spazio di Hilbert L2(R) ma possono essere interpretate come elementi di uno spazio piùampio di distribuzioni Y . Nello spazio Y l’equazione −i∂xuλ = λuλ è soddisfatta.

    Un operatore autoaggiunto generico possiede sia spettro discreto che spettro continuo.

    Il teorema spettrale viene formulato come segue. È possibile associare ad ogni auto-

    valore generalizzato λ una distribuzione uλ chiamata autovettore generalizzato. uλè definito come limite nello spazio delle distribuzioni dei vettori xn ∈ H che appaiononella definizione di autovalore generalizzato. La successione xn non converge ad alcun

    elemento di H, ma converge nel senso delle distribuzioni a uλ che non appartiene ad H.

    Teorema Spettrale: ogni operatore autoaggiunto A in uno spazio di Hilbert è caratter-

    izzato dai suoi autovalori e autovettori {λn, un} che formano un s.o.n. (spettro discreto) eda una o più famiglie continue di autovalori e autovettori generalizzati (spettro continuo)

    {λ, uλ} tali per cui ogni elemento dello spazio di Hilbert si può scrivere come

    f =∑n

    anun +

    ∫a(λ)uλdλ (26)

    Attraverso il teorema spettrale abbiamo effettivamente diagonalizzato l’operatore e ab-

    biamo la possibilità di sviluppare il generico elemento x ∈ H nella base degli autovettori,ordinari e generalizzati. La diagonalizzazione di A segue dalla formula

    Af =∑n

    λnanun +

    ∫λa(λ)uλdλ (27)

    Per una definizione corretta dell’integrale nella precedente formula rimandiamo a [1].

    Esempio 3. Continuazione: ogni funzione in L2(R) si può sviluppare nel set di au-tovettori generalizzati uλ nel senso dell’equazione (26):

    f(x) =

    ∫a(λ)eiλxdλ, (28)

    14

  • Il teorema spettrale, in questo caso, non è altro che l’affermazione che ogni funzione

    in L2(R) possiede una trasformata di Fourier. L’operatore, in questo caso, ha spettropuramente continuo, coincidente con l’asse reale.

    Esempio 4: l’operatore posizione in L2[a, b], −∞ ≤ a < b ≤ ∞ è autoaggiunto neldominio D(x̂) = {f ∈ L2[a, b]|xf ∈ L2[a, b]} come si verifica facilmente. L’equazionex̂ψ = λψ richiede xψ(x) = λψ(x) che non può essere risolta da nessuna funzione ψ(x).

    L’operatore x̂ non ha quindi autovalori. Si può pero’ dimostrare [1] che il suo spettro

    è puramente continuo e coincide con l’intervallo [a, b]. L’equazione agli autovalori è

    risolta dalle distribuzioni uλ = δ(x − λ) per λ ∈ [a, b]. È facile verificare che esisteuna successione di funzioni in L2[a, b] che converge a uλ e che soddisfa la proprietà

    dell’autovalore apprssimato. Il teorema spettrale si riduce in questo caso alla banale

    formula

    ψ(x) =

    ∫ ba

    δ(x− λ)ψ(λ)dλ (29)

    che è valida per ogni ψ ∈ L2[a, b].

    Esiste una classe di operatori che ha spettro puramente discreto. Per questi il teorema

    spettrale vale nella forma:

    Teorema Spettrale per operatori a spettro discreto: l’insieme degli autovettori

    di un operatore autoaggiunto A con spettro puramente discreto possono essere scelti in

    modo da formare un s.o.n.c.

    Gli operatori con spettro puramente discreto generalizzano la teoria spettrale valida per

    spazi finito dimensionali in una forma particolarmente semplice. Ogni elemento f dello

    spazio di Hilbert si può sviluppare nella base degli autovettori di A, {ui},

    f =∑i

    aiui (30)

    La base degli autovettori, in analogia con quanto succede nel caso finito-dimensionale,

    è la base in cui l’operatore è diagonale (Aui = λiui). Questa proprietà si esprime

    formalmente con l’equazione

    Af =∑i

    λiaiui (31)

    che risulta essere vera anche se A non è continuo. Usando l’isomorfismo H ∼ l2, f → {ai}determinato dalla scelta della base {ui}, l’operatore A può essere rappresentato come unamatrice (infinito-dimensionale) diagonale, con entrate uguali agli autovalori.

    15

  • Per concludere, è opportuno notare che il teorema 6 e il teorema spettrale valgono

    per operatori autoaggiunti e non è detto che valgano per operatori che sono soltanto sim-

    metrici. Operatori simmetrici hanno spettro discreto e continuo reale, ma genericamente

    lo spettro residuo non è vuoto e complesso ed infine il teorema spettrale non è valido.

    1.7 Esempi: equazioni integrali, alle derivate ordinarie e parziali

    1.7.1 Equazioni integrali

    Gli operatori integrali sono particolarmente semplici. Alcune applicazioni storiche della

    teoria degli spazi di Hilbert sono infatti alle equazioni integrali.

    Consideriamo un operatore integrale definito in L(Ω) dove Ω è un sottoinsieme di Rn.

    K : f ∈ L2(Ω) → Kf(x) =∫

    k(x, y)f(y)dy (32)

    Se il nucleo integrale k(x, y) ∈ L2(Ω× Ω) l’operatore K è continuo. Infatti, dalla disug-uaglianza di Holder segue che

    ‖Kf‖2 =∫

    |∫

    k(x, y)f(y)dy|2dx ≤∫

    (

    ∫Ω

    |k(x, y)|2dy∫

    |f(w)|2dw)dx

    ≤ ‖f‖2∫

    Ω×Ω|k(x, y)|2dxdy (33)

    È facile verificare che se k(x, y) = k(y, x), K è autoaggiunto. K in realtà è più che

    continuo, è un operatore compatto, cioè manda insiemi limitati in insiemi la cui chiusura è

    compatta [1]. Lo spettro degli operatori compatti è puramente discreto e particolarmente

    semplice.

    Teorema 8: Un operatore autoaggiunto compatto ha autovalori reali λn → 0 ed au-tovettori un che formano un s.o.n.c. Lo spettro è discreto con al più uno spettro continuo

    che consiste del solo punto λ = 0 se questo non è un autovalore.

    1.7.2 Equazioni Differenziali Ordinarie: Problemi agli autovalori

    Un problema classico delle equazioni differenziali ordinarie è il problema agli autovalori

    o problema al contorno. Questo tipo di problema è naturale in Meccanica Quantistica e

    si incontra spesso anche in fisica classica, in particolare quando si risolvono problemi al

    contorno per equazioni differenziali alle derivate parziali.

    Esempio 1: sia data l’equazione differenziale lineare del secondo ordine dipendente da

    un parametro λ

    y′′ + λy = 0 (34)

    16

  • Il teorema di esistenza e unicità garantisce che, date le condizioni iniziali (problema di

    Chauchy)

    y(x0) = y0

    y′(x0) = y1 (35)

    la soluzione esiste, è unica e dipende continuamente dai dati iniziali. Chiediamoci ora

    se la stessa equazione ha soluzioni nell’intervallo [x0, x1] che soddisfano il problema al

    contorno

    y(x0) = 0

    y(x1) = 0 (36)

    Un equazione del II ordine ha sempre due soluzioni linearmente indipendenti yi(x;λ), i =

    1, 2 e la generica soluzione si può esprimere come loro combinazione lineare

    y(x) = c1y1(x;λ) + c2y2(x;λ). (37)

    λ appare in generale come parametro nell’espressione delle soluzioni. Sappiamo che il

    problema di Chauchy (35) ha sempre una soluzione. Nel caso del problema al contorno

    (36), c‘e’ sempre la soluzione banale c1 = c2 = 0. Esisterà una seconda soluzione se e

    solo se il sistema

    c1y1(x0;λ) + c2y2(x0;λ) = 0

    c1y1(x1;λ) + c2y2(x1;λ) = 0 (38)

    ha una soluzione. Solo per alcuni valori particolari di λ, quelli per cui la matrice dei

    coefficienti yi(xj;λ) ha determinante nullo, esisterà una soluzione non banale al problema

    al contorno. Questi valori sono chiamati autovalori. Possiamo riformulare il problema

    in questi termini: risolvere l’equazione agli autovalori Ly = λy per l’operatore L =

    −∂2/∂x2 nel dominio D(L) = {fAC , f ′′ ∈ L2[x0, x1]|f(x0) = f(x1) = 0}. L è il quadratodell’operatore A1 = −i∂x; è simmetrico e, coi metodi della sezione 1.4, si può verificare cheè anche autoaggiunto 4. Il problema è cos̀ı ridotto alla ricerca di autovalori e autovettori

    di un operatore autoaggiunto in uno spazio di Hilbert.

    4Notiamo che −i∂x, con le condizioni f(x0) = f(x1) = 0, non è autoaggiunto mentre il suo quadrato−∂2x lo è. Le condizioni al contorno da imporre agli operatori possono variare col numero di derivate,poichè questo influisce sui termini provenienti dall’integrazione per parti. Intuitivamente, il numero di

    condizioni da imporre ad un operatore differenziale con derivate ordinarie è pari all’ordine dell’operatore

    stesso: f(x0) = f(x1) = 0 contiene due condizioni su f ed è ragionevole da imporre per un operatore

    del secondo ordine ed è invece troppo restrittivo per un operatore del prim’ordine. Per evitare errori, è

    bene verificare l’autoaggiuntezza esaminando i termini al bordo caso per caso.

    17

  • Esaminiamo il caso generale di un‘equazione differenziale lineare del II ordine:

    L̂y = λ̂y (39)

    con

    L̂y = a2(x)y′′ + a1(x)y

    ′ + a0(x), a2(x) > 0. (40)

    È facile verificare che (ridefinendo L e λ) si può sempre ricondurre il problema al seguente:

    Ly = λωy, L = − ddx

    (p(x)

    d

    dx

    )+ q(x). (41)

    con

    p(x) = e∫

    (a1/a2)dx, q(x) = −a0a2e∫

    (a1/a2)dx, ω(x) =e∫

    (a1/a2)dx

    a2(42)

    Notiamo che p(x) > 0 e ω(x) > 0.

    Si definisce problema di Sturm-Liouville (SL) il problema agli autovalori:

    Ly = λωy , a ≤ x ≤ bα1y(a) + α2y

    ′(a) = 0

    β1y(b) + β2y′(b) = 0 (43)

    con αi, βi reali e con almeno uno degli αi e uno dei βi diversi da zero. Nell’equazione (43)

    abbiamo scelto condizioni al contorno indipendenti per i due estremi. È possibile scegliere

    altre condizioni al contorno, ad esempio si possono scegliere condizioni di periodicità:

    f(a) = f(b) , f ′(a) = f ′(b) (44)

    oppure due condizioni più complicate che coinvolgano ciascuna f(a), f(b), f ′(a), f ′(b).

    Come discusso a breve, ogni set di condizioni con la proprietà di rendere autoaggiunto

    l’operatore L definisce un buon problema di SL.

    Vogliamo formalizzare il problema in un opportuno spazio di Hilbert. Dalla teoria gen-

    erale delle equazioni differenziali, sappiamo che le soluzioni del problema (43) definito in

    un intervallo limitato [a, b] e con funzioni p, q, ω sufficientemente regolari sono anch’esse

    funzioni regolari, in particolare sono L2[a, b].

    Osservazione: della presenza della funzione ω in (43) si può facilmente tener conto con-

    siderando la misura ω(x)dx in [a, b]. Consideriamo cioè L2ω[a, b] = {f |∫ ba|f(x)|2ω(x)dx <

    ∞} con prodotto scalare (f, g)ω =∫ baf(x)g(x)ω(x)dx. Il problema (43) per l’operatore

    Lω = L/ω diventa un problema agli autovalori Lωy = λy in L2ω. Notiamo che nel

    prodotto scalare (Lωf, g)ω =∫ ba(Lf)g tutti i fattori di ω si cancellano. Senza perdita di

    18

  • generalità si può anche porre ω = 1: la teoria generale si ottiene sostituendo ovunque

    L→ Lω, (f, g)→ (f, g)ω.

    Consideriamo quindi il problema agli autovalori:

    Ly = λy

    D(L) = {fAC , f ′′ ∈ L2[a, b]ω|α1y(a) + α2y′(a) = β1y(b) + β2y′(b) = 0} (45)

    L è un operatore autoaggiunto. Infatti,

    (Lf, g) =∫ ba((−pf ′)′ + qf)gdx = −pf ′g|ba +

    ∫ bapf ′g′dx+

    ∫ baqfgdx =

    −p(f ′g − fg′)|ba +∫ baf((−pg′)′ + qg) = (f, Lg) (46)

    I termini di bordo che vengono dall’integrazione per parti si annullano a causa delle

    condizioni al contorno scelte (43) o (44). Ad esempio, per (43) e β2 6= 0, all’estremob otteniamo: p(f ′g − fg′)(b) = p(b)(−β1/β2)(fg − fg)(b) = 0. Lo stesso risultato valeper β2 = 0 e per l’estremo a. L’operatore L e’ quindi simmetrico; coi metodi della

    sezione 1.4 si può dimostrare che è anche autoaggiunto. Lo stesso vale per le condizioni

    (44). Condizioni al contorno più generali dovranno essere scelte in modo che i termini al

    bordo dell’integrazione per parti si cancellino e che l’operatore sia autoaggiunto oltre che

    simmetrico. Nel caso in cui l’intervallo [a, b] sia illimitato, i termini al bordo valutati nel

    punto all’infinito si annullano automaticamente piochè ogni funzione L2[a, b] si annulla

    all’infinito. Perciò se a o b o entrambi sono infiniti, in questi punti non occorre imporre

    alcuna condizione. Si richiede tuttavia di trovare una soluzione L2[a, b]: la condizione

    implicita che deve essere imposta all’infinito alle soluzioni dell’equazione differenziale è

    di essere a quadrato sommabile. Questa è la condizione naturale da imporre se si vuole

    formulare il problema in uno spazio di Hilbert. È anche la condizione naturale da imporre

    in un problema di Meccanica Quantistica.

    Usando il teorema 6 otteniamo immediatamente

    Teorema 9: Dato un sistema di SL formulabile come un problema agli autovalori per

    un operatore in uno spazio di Hilbert:

    a) gli autovalori sono reali

    b) le soluzioni (autovettori) corrispondenti ad autovalori diversi sono ortogonali nel

    prodotto scalare di L2ω.

    Gli autovettori di un sistema di SL formano un s.o.n. che non è necessariamente

    completo, dato che un generico operatore avrà anche spettro continuo. Il problema di

    19

  • V=x /2E

    E1

    2

    x

    E

    V=02

    determinare lo spettro di un operatore differenziale è complesso. I metodi più usati per

    determinare lo spettro sono:

    I: studiare il risolvente di L. Ogni equazione differenziale ordinaria si può convertire in

    un’equivalente equazione integrale, ottenuta invertendo l’operatore differenziale

    Lu(x) = λu(x) , → u(x) = λL−1u(x) ≡∫ ba

    k(x, y)u(y)dy (47)

    Il nucleo integrale k(x, y) si chiama funzione di Green associata all’operatore differenziale

    L. Gli operatori integrali sono più semplici studiare e lo spettro di L si può determinare

    studiando lo spettro dell’operatore integrale associato. In particolare, se la funzione di

    Green k(x, y) risulta essere a quadrato sommabile, il teorema 8 garantisce che lo spettro

    dell’operatore integrale, e quindi lo spettro di L, è puramente discreto. Operatori dif-

    ferenziali di questo tipo si chiamano a risolvente compatto. In questo caso gli autovettori

    di L formano un s.o.n.c.

    II: ridurre, se possibile, l’equazione differenziale ad un’equazione di Schroedinger stazionaria.

    Consideriamo l’equazione di Schroedinger stazionaria per una particella sulla retta soggetta

    al potenziale V (x)

    −d2u

    dx2+ V (x)u = Eu (48)

    L’equazione è evidentemente della forma SL con p = 1, q = V (x) e ω = 1; per uniformarci

    alle notazioni della MQ, abbiamo chiamato E l’autovalore λ. La funzione d’onda u

    rappresenta una densità di probabilità, ed è normalizzata∫R |u|

    2dx = 1. La condizione

    da imporre all’infinito è quindi l’integrabilità L2. Equivalentemente, dobbiamo risolvere

    il problema agli autovalori Hu = Eu in L2(R) per l’operatore autoaggiunto H = − d2dx2

    +

    V (x). Alla funzione V (x) si richiede di essere sufficientemente regolare. Consideriamo

    il potenziale indicato a sinistra nella figura. Classicamente la particella di energia E è

    obbligata a muoversi nell’intervallo definito dalla disuguaglianza E − V (x) = p2/2 ≥ 0.Nell’intervallo di energia [E1, E2] la particella è costretta ad oscillare in una regione finita

    di spazio, nell’intervallo [E2,∞] la particella può muoversi fino all’infinito. Come discusso

    20

  • in ogni buon testo di MQ, quantisticamente esisteranno dei livelli energetici discreti Enda cercarsi dove il moto classico é limitato in una regione finita, σd(H) = {En} ⊂[E1, E2] e uno spettro continuo di energie corrispondente ai valori classici dell’energia

    per cui il moto è illimitato, σc(H) = [E2,∞]. Notiamo che gli autovalori dell’operatoreH corrispondono solo ai livelli energetici discreti. L’intero insieme dei possibili valori

    dell’osservabile energia è associato all’intero spettro dell’operatore H. Gli autovalori

    generalizzati uE per E ∈ σc(H) sono tipicamente delle funzioni non in L2(R) che hanno laforma di onde piane per grande x positivo. Nella figura sono indicati due casi limite. Per

    V (x) = 0 lo spettro è puramente continuo σc(H) = [0,∞] con autofunzioni generalizzateche sono onde piane uE = e

    ipx, E = p2/2. Il caso V (x) = x2/2, corrispondente ad un

    oscillatore armonico, ha spettro puramente discreto En = (n+ 1/2) con autofunzioni che

    sono i polinomi di Hermite un = Hn(x)e−x2/2.

    Un risultato generale è il seguente. Il problema di SL con a e b finiti, p, p′, ω e q

    funzioni continue reali in [a, b] e p, ω > 0 il problema si dice regolare. Per sistemi di SL

    regolari vale il teorema [1]:

    Teorema 10: Gli autovettori di un sistema di SL regolare formano un insieme numerabile

    {yn} che, opportunamente normalizzato, è un s.o.n.c. in L2ω[a, b].

    I problemi di SL regolari sono in assoluto i più semplici ma hanno poche applicazioni.

    Esempio 1. continuazione: consideriamo il problema di SL

    y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π) = 0 (49)

    Il problema è regolare con p = 1, q = 0 e ω = 1. La soluzione generale è y = A sin√λx+

    B cos√λx. Le condizioni al contorno impongono B = 0 e sin

    √λπ = 0 da cui λ =

    n2, n = 1, 2, .... Otteniamo l’insieme di autovalori e autovettori: {λn = n2, yn = sinnx}.Osserviamo che gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli

    autovettori, opportunamente normalizzati, formano un s.o.n.c.: i seni sono la base di

    Fourier (dispari) per il semi-periodo [0, π].

    Esempio 1a: consideriamo il problema di SL

    y′′ + λy = 0, 0 ≤ x ≤ πy(0) = y(π)

    y′(0) = y′(π) (50)

    21

  • Il problema è anch‘esso regolare. Le condizioni al contorno questa volta selezionano il

    sistema di autovettori {e2inx} con autovalori λ = 4n2, n ∈ Z. Anche in questo esem-pio gli autovalori sono reali, gli autovettori mutuamente ortogonali e che gli autovettori,

    opportunamente normalizzati, formano un s.o.n.c.: la base di Fourier sul periodo [0, π].

    Notiamo che, in questo esempio, ogni autovalore ha molteplicità due (e±2inx sono en-

    trambi associati all’autovalore 4n2). Autovettori corrispondenti ad autovalori diversi

    sono ortogonali. All’interno di ogni autospazio (di dimensione due) sono stati scelti due

    autovettori ortogonali in modo che l’insieme di tutti gli autovettori formi un s.o.n.c..

    I problemi di SL più interessanti sono però singolari. Un problema può essere sin-

    golare, ad esempio, se p o ω si annullano (o divergono) in a o in b, oppure, ancora più

    semplicemente, se l’intervallo [a, b] non è limitato. Le soluzioni delle equazioni differen-

    ziali potrebbero essere discontinue e illimitate agli estremi dell’intervallo. Usualmente,

    all’estremo singolare si impongono condizioni quali la limitatezza oppure l’integrabilità

    L2 (quest’ultima è la condizione che si impone ad esempio nei problemi provenienti dalla

    Meccanica Quantistica).

    Esempio 2: polinomi di Legendre. Consideriamo

    d

    dx

    ((1− x2)dy

    dx

    )+ λy = 0, −1 ≤ x ≤ 1 (51)

    e richiediamo alle soluzioni di essere limitate in x = ±1. Abbiamo p = 1−x2, q = 0, ω = 1.Il problema è singolare perchè p(±1) = 0. Gli autovalori sono λl = l(l+1) con autovettorii polinomi di Legendre Pl(x) che formano, dopo normalizzazione, un s.o.n.c. in L

    2[−1, 1].

    Esempio 3: polinomi di Hermite. Consideriamo

    d

    dx

    (e−x

    2 dy

    dx

    )+ e−x

    2

    λy = 0, −∞ < x

  • Esempio 4: polinomi di Laguerre. Consideriamo

    d

    dx

    (e−x

    dy

    dx

    )+ e−xλy = 0, 0 < x

  • Per la prima equazione abbiamo p = 1 − x2, q = m2/(1 − x2), ω = 1. Il problema èsingolare perchè p(±1) = 0 e q(±1) = ∞. Gli autovalori sono λl = l(l + 1), |m| ≤ l, l =0, 1, 2... con autovettori Pml (x), polinomi di Legendre generalizzati. Le armoniche sferiche

    Ylm(θ, φ) = Pml (cos θ)e

    imφ formano, dopo normalizzazione, un s.o.n.c. in L2[S2, dΩ(2)],

    dove dΩ(2) = sin θdθdφ è la misura sulla sfera unitaria S2.

    Gli operatori ellittici hanno inoltre importanti proprietà di regolarità

    Teorema 12 - lemma di Weyl: ogni funzione o distribuzione u(x) che risolva l’equazione

    ellittica Lu = f è C∞ nei punti in cui i coefficienti aij(x), bi(x), c(x) e il termine noto

    f(x) sono C∞.

    Questo teorema si applica ad esempio all’equazione di Laplace e di Schroedinger

    stazionaria. Le soluzioni dell’equazione di Laplace sono automaticamente C∞, le soluzioni

    dell’equazione di Poisson o dell’equazione di Schoedinger stazionaria sono C∞ nei punti

    in cui la densità di carica o il potenziale sono C∞.

    Infine, per operatori ellittici, i problemi al contorno formulati su insiemi compatti

    soddisfano teoreni di esistenza, unicità e dipendenza continua dai dati iniziali.

    2 Appendice: Il complemento ortogonale

    Una proprietà importante degli spazi di Hilbert riguarda la possibilità di proiettare un

    vettore su un sottospazio.

    Teorema A: Dato un sottospazio chiuso V dello spazio di Hilbert H, per ogni vettore

    f ∈ H esiste unico un vettore f ∗ ∈ V con la proprietà

    ‖f − f ∗‖ = minv∈V ‖f − v‖ (56)

    Dim: sia d = inf{‖f − v‖, v ∈ V }. Occorre dimostrare che l’estremo inferiore è inrealtà un minimo. Se d = 0, f ∈ V e f ∗ = f . Possiamo quindi supporre che d > 0.Consideriamo gli insiemi Cn = {v ∈ V |‖v−f‖ ≤ d+1/n}. Dall’identità 2(‖x‖2 +‖y‖2) =‖x+ y‖2 + ‖x− y‖2 segue che, se v1, v2 ∈ V ,

    2(‖v1 − f‖2 + ‖v2 − f‖2) = ‖v1 + v2 − 2f‖2 + ‖v1 − v2‖2

    ‖v1 − v2‖2 = 2‖v1 − f‖2 + 2‖v2 − f‖2 − ‖v1 + v2 − 2f‖2 ≤2(d+ 1

    n

    )+ 2

    (d+ 1

    n

    )− 4d2 ≤ 8 d

    n+ 4

    n2(57)

    Nel penultimo passaggio si è usato il fatto che, poiché (v1 +v2)/2 ∈ V , ‖f−(v1 +v2)/2‖ ≥d. Scegliendo una successione di vettori {vn} ∈ Cn avremo che

    ‖vn − vn+p‖2 ≤ 8d

    n+

    4

    n2(58)

    24

  • tende a zero per n → ∞ per qualunque p, poiché vn, vn+p ∈ Cn. Questo implica che{vn} ∈ Cn è di Chauchy e quindi converge. Il limite f ∗ sarà contenuto in V poiché V èchiuso. Da ‖vn− f‖ ≤ d+ 1/n segue che ‖f − f ∗‖ ≤ d. Poiché d è l’estremo inferiore deipossibili valori ‖f − v‖, ne segue che ‖f − f ∗‖ = d. f ∗ è unico: supponiamo infatti cheesistano due vettori che soddisfino d = ‖f − f1‖ = ‖f − f2‖. Usando una minorazioneanaloga a quella della formula (57) otteniamo

    ‖f1 − f2‖2 = 2‖f1 − f‖2 + 2‖f2 − f‖2 − ‖f1 + f2 − 2f‖2 = 4d2 − ‖f1 + f2 − 2f‖2 ≤4d2 − 4d2 = 0

    che è possibile solo per f1 = f2. 2

    Osservazione: il teorema è valido nell’ipotesi meno restrittiva che V sia un insieme

    convesso chiuso. La chiusura è un’ipotesi necessaria.

    Il vettore f ∗ è noto come la miglior approssimazione di f in V . È anche caratterizz-

    abile come la proiezione ortogonale di f su V . Vale infatti:

    Teorema B: f ∗ è univocamente determinato dalla proprietà (f − f ∗, v) = 0 per tutti ivettori v ∈ V .Dim: Se (f − f ∗, v) = 0 per tutti i vettori v ∈ V , vale anche (f − f ∗, f ∗ − v) = 0. Dalteorema di Pitagora segue che ‖f−v‖2 = ‖f−f ∗‖2+‖f ∗−v‖2 e quindi ‖f−f ∗‖2 ≤ ‖f−v‖2per ogni v ∈ V . Ne segue che f ∗ è la miglior approssimazione di f in V . Viceversa, siaf ∗ la miglior approssimazione. Prendiamo v = f ∗ + αw con w ∈ V, α ∈ C. Abbiamo che

    ‖f − f ∗‖2 ≤ ‖f − v‖2 = ‖f − f ∗ − αw‖2 =‖f − f ∗‖2 + ‖α|2‖w‖2 − α(w, f − f ∗)− α∗(w, f − f ∗)∗

    da cui α(w, f − f ∗) + α∗(w, f − f ∗)∗ ≤ |α|2‖w‖2. Prendendo α = |α|eiθ con |α| → 0 siottiene eiθ(w, f − f ∗) + e−iθ(w, f − f ∗)∗ ≤ 0. Prendendo θ = 0, π/2, π, 3π/2 si ottieneRe, Im(w, f − f ∗) ≥ 0 e contemporaneamente Re, Im(w, f − f ∗) ≤ 0, da cui si conclude(f − f ∗, w) = 0. 2

    Dato un insieme S definiamo il suo complemento ortogonale come l’insieme

    S⊥ = {f ∈ H|(f, s) = 0, s ∈ S} (59)

    S⊥ è sempre un sottospazio chiuso di H. Infatti da x, y ∈ S⊥ segue che (αx+ βy, s) = 0per ogni s ∈ S per la linearità del prodotto scalare, e da xn ∈ S → x segue che (x, s) =lim(xn, s) = 0 per la continuità del prodotto scalare.

    25

  • Teorema C: Dato un sottospazio chiuso V di H, ogni f ∈ H si scrive in maniera unicacome f = x+ y con x ∈ V, y ∈ V ⊥. In simboli

    H = V ⊕ V ⊥ (60)

    Dim: x è definito come la proiezione f ∗ di f su V e y come f − f ∗. y ∈ V ⊥ per ilTeorema B. L’unicità della decomposizione segue dal fatto che, se f = x + y = x′ + y′,

    x− x′ = y − y′ uguaglia vettori in V e V ⊥ che hanno in comune il solo vettore zero. Nesegue x = x′ e y = y′. 2

    Osservazione: Se V è un sottospazio non chiuso il Teorema C si può riformulare come

    H = V̄ ⊕ V ⊥. Vale anche S⊥⊥ = S̄. Quest’ultimo risultato segue dalla doppia appli-cazione del risultato precedente, una volta a V = S̄ e l’altra a V = S⊥: H = S̄ ⊕ S⊥ =S⊥ ⊕ S⊥⊥. Eliminando il fattore comune S⊥ si ottiene il risultato voluto.

    References

    [1] Dispense per Metodi Matematici della Fisica, http://castore.mib.infn.it/̃.zaffaron/

    [2] Reed e Simon, Methods of Modern Mathematical Physics, Academic Press, Quattro

    Volumi.

    [3] Mikusinski, Introduction to Hilbert Spaces, Academic Press.

    [4] W. Rudin, Functional Analysis, MacGraw-Hill.

    26