B S K nell'esperimento LHCb - Istituto Nazionale di Fisica … Adalte...

49
Universit` a degli Studi di Roma Tor Vergata FACOLT ` A DI SCIENZE MATEMATICHE FISICHE E NATURALI Corso di laurea triennale in fisica Tesi di laurea triennale Studio del canale di decadimento B + Ψ(2S )K + π + π - nell’esperimento LHCb Relatore: Prof. Emanuele Santovetti Candidato: Pierfrancesco Ulpiani Anno Accademico 2014–2015

Transcript of B S K nell'esperimento LHCb - Istituto Nazionale di Fisica … Adalte...

Universita degli Studi di Roma Tor Vergata

FACOLTA DI SCIENZE MATEMATICHE FISICHE E NATURALI

Corso di laurea triennale in fisica

Tesi di laurea triennale

Studio del canale di decadimento B+ → Ψ(2S)K+π+π−

nell’esperimento LHCb

Relatore:

Prof. Emanuele SantovettiCandidato:

Pierfrancesco Ulpiani

Anno Accademico 2014–2015

Ai compagni di vita.

Indice

1 Introduzione 61.1 Modello standard . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.1 Particelle costituenti la materia . . . . . . . . . . . . . 71.1.2 Particelle mediatrici . . . . . . . . . . . . . . . . . . . 8

1.2 Decadimento delle particelle . . . . . . . . . . . . . . . . . . . 91.3 Cinematica relativistica . . . . . . . . . . . . . . . . . . . . . 9

2 L’esperimento LHCb 112.1 Il rivelatore di LHCb . . . . . . . . . . . . . . . . . . . . . . 12

2.1.1 Vertex Locator (VELO) . . . . . . . . . . . . . . . . . 132.1.2 Rivelatori Ring Imaging Cherenkov (RICH) . . . . . . 142.1.3 Il magnete . . . . . . . . . . . . . . . . . . . . . . . . . 152.1.4 Il sistema di tracciamento . . . . . . . . . . . . . . . . 162.1.5 I calorimetri . . . . . . . . . . . . . . . . . . . . . . . . 192.1.6 Rivelatore di muoni . . . . . . . . . . . . . . . . . . . 212.1.7 Acquisizione dati . . . . . . . . . . . . . . . . . . . . . 23

3 Studio del canale di decadimento B+ 253.1 Selezione degli eventi . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.1 Efficienza . . . . . . . . . . . . . . . . . . . . . . . . . 273.1.2 Fit della massa M(Ψ(2S)K+π+π−) . . . . . . . . . . . 29

3.2 Metodi multivariati . . . . . . . . . . . . . . . . . . . . . . . 303.2.1 Decision tree . . . . . . . . . . . . . . . . . . . . . . . 323.2.2 Boosted decision tree . . . . . . . . . . . . . . . . . . . 333.2.3 Risultati del training della BDT . . . . . . . . . . . . 353.2.4 Fit a seguito dell’applicazione della BDT . . . . . . . . 38

4 Risonanze 41

5 Conclusioni 45

A ROOT 47

Bibliografia 48

2

Elenco delle figure

1.1 Famiglia dei leptoni. . . . . . . . . . . . . . . . . . . . . . . . 71.2 Famiglia dei quarks. . . . . . . . . . . . . . . . . . . . . . . . 71.3 Famiglia dei bosoni di gauge. . . . . . . . . . . . . . . . . . . 8

2.1 Complesso di LHC. . . . . . . . . . . . . . . . . . . . . . . . . 122.2 Schema del rivelatore di LHCb. . . . . . . . . . . . . . . . . . 132.3 Rivelatore VELO. . . . . . . . . . . . . . . . . . . . . . . . . . 142.4 Rivelatore RICH1. . . . . . . . . . . . . . . . . . . . . . . . . 152.5 Vista frontale del magnete ad LHCb. . . . . . . . . . . . . . . 162.6 Sistema di tracciameno il Silicon Tracker in viola e l’Outer

Tracker in blu. . . . . . . . . . . . . . . . . . . . . . . . . . . 172.7 Schema di uno strato del Trigger Tracker. . . . . . . . . . . . 172.8 Sezione dell’Outer Tracker. . . . . . . . . . . . . . . . . . . . 182.9 Illustrazione dei vari tipi di tracce. . . . . . . . . . . . . . . . 192.10 Fibre a wavelenght shifter. . . . . . . . . . . . . . . . . . . . . 202.11 Moduli ECAL. . . . . . . . . . . . . . . . . . . . . . . . . . . 202.12 Schema HCAL. . . . . . . . . . . . . . . . . . . . . . . . . . . 212.13 Schema rivelatore di muoni. . . . . . . . . . . . . . . . . . . . 222.14 Diagramma di flusso dei trigger. . . . . . . . . . . . . . . . . 23

3.1 Distribuzione della massa invariante dei prodotti del decadi-mento B+ → Ψ(2S)K+π+π−. . . . . . . . . . . . . . . . . . . 26

3.2 Distribuzione della massa invariante dei prodotti del decadi-mento B+ → Ψ(2S)K+π+π− compresa in un intorno di ±40 MeV/c2 dal valore nominale della massa del B+ di 5279MeV/c2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.4 Distribuzione della massa invariante dello stato finale dopo la

selezione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.5 Applicazione del fit alla distribuzione della massa del mesone

B+ dopo aver applicato i tagli sui dati. . . . . . . . . . . . . . 313.6 Esempio decision tree. . . . . . . . . . . . . . . . . . . . . . . 333.7 Matrice di correlazione fra variabili di segnale. . . . . . . . . 36

3

3.8 Distribuzione del segnale e del fondo relativo alle variabiliutilizzate per la discriminazione. . . . . . . . . . . . . . . . . 37

3.9 Distribuzione degli eventi di fondo e segnale in funzione delloscore. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.10 Andamento dell’efficienza del segnale e del fondo, purezza delsegnale e significanza in funzione dello score. . . . . . . . . . 39

3.11 Distribuzione della massa del mesone B+ a seguito dell’utiliz-zo della BDT. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.12 Applicazione del fit alla distribuzione della massa del mesoneB+ a seguito dell’utilizzo della BDT. . . . . . . . . . . . . . . 40

4.1 Distribuzione della massa dei mesoni K+ π− a seguito dellaselezione di eventi apportata dalla BDT. . . . . . . . . . . . . 42

4.2 Distribuzione della massa dei mesoni k+ π+ a seguito dellaselezione di eventi apportata dalla BDT. . . . . . . . . . . . . 43

4.3 Fit applicato alla distribuzione della massa dei mesoni K+ π−

privata degli eventi non provenienti dalla risonanza. . . . . . 444.4 Distribuzione della massa dei mesoni π+ π− a seguito della

selezione di eventi apportata dalla BDT; a sinistra viene rap-presentato tutto lo spazio delle fasi mentre a destra è riportatoil fit restringendosi alla risonanza. . . . . . . . . . . . . . . . 44

4

Elenco delle tabelle

3.1 Efficienze su fondo e segnale relative ai tagli sulle variabili. . 283.2 Potere discriminante delle variabili fornite al training della

BDT in ordine decrescente. . . . . . . . . . . . . . . . . . . . 36

5

Capitolo 1

Introduzione

LHCb è un esperimento di LHC (Large Hadron Collider) volto allo studionell’ambito del modello standard (MS) dei parametri della violazione CP edegli adroni in cui è presente il quark beauty (quark b). In esso vengono acollidere nel vertice primario protoni ad alta energia così da produrre moltealtre particelle che potranno decadere o meno, a seconda della loro stabilità,attraverso un decadimento in un vertice secondario. Il decadimento avvienesecondo le leggi della cinematica relativistica. Lo scopo dell’esperimentoè la misura della massa del mesone B+, utilizzando il canale

B+ → Ψ(2S)K+π+π−

dove il mesone Ψ(2S), stato eccitato del mesone J/Ψ (cc), decade, di fattoistantaneamente, in una coppia µ+µ−. Questo canale è facilmente osservabilepoichè le particelle figlie sono tutte particelle cariche e dunque ben rilevabili,inoltre il suo branching ratio1 (BR) è fra i più alti. Il decadimento inesame è descritto dal modello standard che regola le interazioni tra quarke più in generale tra tutte le particelle.

1.1 Modello standard

Il modello standard è il nome con cui si indica la teoria quantistica cheinclude la teoria delle interazioni forti (cromodinamica quantistica) e la teoriaunificata dell’interazione debole con l’elettromagnetica (teoria elettrodeboleWeinberg 1967). Esso presuppone l’esistenza di particelle che formano lamateria e particelle mediatrici di forza. Ogni interzione fondamentale agisceattraverso lo scambio di una particella mediatrice.

1Una particella può decadere in diversi modi, ad ognuno di questi processi possiamoassegnare un branching ratio νi con

∑i νi = 1, esso è la probabilità che una particella

madre decada nell’-iesima combinazione di particelle figlie.

6

Figura 1.1: Famiglia dei leptoni.

Figura 1.2: Famiglia dei quarks.

1.1.1 Particelle costituenti la materia

Nel mondo delle particelle si possono distinguere due tipi: leptoni e adro-ni. I leptoni sono un gruppo di particelle elementari fermioniche (spinsemi-intero); ce ne sono sei: elettrone, muone e tauone, ognuno con il rela-tivo neutrino (fig 1). Le differenze fra elettrone muone e tauone riguardanola massa e il "cosiddetto" numero leptonico avendo tutti carica negativa e−,mentre i neutrini hanno carica nulla e massa un milionesimo di volte inferiorea quella dell’elettrone. I leptoni sono considerati a oggi particelle elemen-tari puntiformi non interagenti tramite interazione forte2. Gli adroni sonodelle particelle composte, soggette anche all’interazione forte, questi si sud-dividono in barioni e mesoni. In particolare i barioni sono costituiti da trequarks mentre i mesoni da una coppia di quark antiquark3. Sono noti oggisei quarks: up, down, charm, strange, top e bottom(fig 2); essi posseggonoun numero quantico aggiuntivo, la carica di colore, e si combinano formandodelle particelle in modo tale da avere sempre colore neutro. Nessun espe-rimento di alte energie ha mai prodotto un quark libero ma d’altra parte

2I leptoni interagiscono esclusivamente tramite interazione debole e, se carichi, tramiteinterazione elettromagnetica.

3Intorno agli anni ’50 furono scoperte nuove particelle così si cercò di classificarle ingruppi con proprietà simili. Una prima simmetria fu associata allo spin isotopico, infattile particelle con lo stesso isospin si comportavano in egual modo per quanto riguarda l’in-terazione forte ma l’interazione elettromagnetica rompeva la simmetria con una variazionefra le particelle di uno stesso multipletto. Tutto ciò suggerì a Gell-Man e Zweig che tuttigli adroni potessero essere costituiti da particelle ancor più elementari: i quarks.

7

Figura 1.3: Famiglia dei bosoni di gauge.

esaminando i quark a distanze piccole sembrano muoversi liberamete comese non fossero completamente legati, questi due effetti sono chiamati libertàasintotica e schiavitù infrarossa. Nella nostra trattazione si concentrerà l’at-tenzione sul mesone B+ il quale è formato da un quark antibottom e un up(b u).

1.1.2 Particelle mediatrici

Ci sono in totale cinque particelle mediatrici di forza (non considerandol’interazione gravitazionale non compresa nel modello standard). Ogni me-diatore è associato ad un’unica interazione (fig. 3). Nell’interazione forte laparticella mediatrice è il gluone; questo tipo di interazione agisce fra parti-celle dotate di carica di colore e il gluone stesso possiede questa proprietàfisica. I nuclei sono tenuti insieme da questo tipo di forza, infatti i quarkdi un protone possono legarsi con i quark di un altro protone attraversol’interazione forte residua. L’interazione debole è responsabile del fatto chetutti i quark e leptoni di massa maggiore decadono per produrre quark eleptoni più leggeri (per questo motivo la materia è costituita dalle particelleelementari più leggere); i mediatori sono i bosoni W+,W− e Z0. Da ultimola particella mediatrice dell’interazione elettromagnetica è il fotone. Ad alteenergie l’interazione elettromagnetica e debole si equivalgono ottenendo untripletto e un singoletto di mediatori senza massa, a basse energie solo ilfotone preserva questa proprietà. Una differenza sostanziale fra interazioneforte e elettrodebole (QCD e QED) è che i fotoni non hanno carica di coloreed è per questo che in QCD il campo è detto colorato.

8

1.2 Decadimento delle particelle

Le particelle elementari massive sono instabili e tendono, come gia accennato,a decadere debolmente in altre particelle meno massive. La legge che logoverna è del tutto simile a quella di un decadimento nucleare radioattivo.Non possiamo prevedere quando questi processi avverranno ma si può definireuna probabilità di trasformazione nell’unità di tempo; questa probabilità èuna costante. Se N particelle sono presenti al tempo t il numero dN didecadimenti nel tempo dt è proporzionale a N.

dN = −λNdt

da cuiNλ = −dN

dt

con λ costante di decadimento o di disentegrazione. Integrando si ottiene

N(t) = N0e−λt

con N0 numero di particelle presenti a t = 0. E’ utile in questo caso definireil tempo di vita medio di una particella definito come l’inverso della costantedi decadimento

τ =1

λ

Nel nostro caso il mesone B+ decadendo per via dell’interazione debole hauna vita media relativamente lunga τ = 1.638 ps ciò agevola l’identificazionedella particella negli eventi per via del suo decadimento distaccato di qualchemillimetro dal punto di impatto dei protoni.

1.3 Cinematica relativistica

Un evento in relatività è definito dalle 4 coordinate spaziotemporali utiliz-zando un quadrivettore la cui trasformazione è descritta dalle trasformazio-ni di Lorentz. Per ottenere delle quantità invarianti sotto rotazione nellospazio-tempo definiamo come prodotto scalare

a · b = a0b0 − ab

con a0 e b0 si indica la parte temporale del quadrivettore mentre con a e bla parte spaziale. Come nella cinematica non relativistica anche in questocaso si dovrà conservare la quantità di moto e l’energia nei decadimenti mabisogna utilizzare delle nuove espressioni per queste due quantità: p = m0vγe E = m0c

2γ. Considerando quindi il quadrimpulso p = (E,pc) la quantitàinvariante che chiameremo appunto massa invariante è

p · p = S = E2 − p2c2

9

Questa quantità è un invariante relativistico per come è stato costruito edinoltre è conservata prima e dopo il decadimento. Scopo della tesi è il calcolodella massa del mesone B+ studiando la distribuzione della massa invariantedelle particelle prodotto.

10

Capitolo 2

L’esperimento LHCb

Il rivelatore LHCb usa le collisioni fra fasci di protoni di LHC ad un’energiadi 14 TeV nel centro di massa. LHC è un collider costituito da un tunnelcircolare di 27 Km di circonferenza ad una profondità compresa fra 50 e175 m sotto i laboratori del CERN. Prima di arrivare alla massima energiai protoni, prodotti dalla ionizzazione di idrogeno gassoso, sono acceleratida una catena di iniezione formata da Linac2, Proton Synchrotron Booster(PSB), Proton Synchrotron (PS) e Super Proton Synchrotron (SPS). NelSPS i protoni,raggiunti 450 Gev di energia sono iniettati nel sincrotroneprincipale LHC arrivando a 7 TeV per fascio. La catena di iniezione utilizzatariflette la storia del CERN essendo costituita da acceleratori, di energia viavia crescente, una volta "punte di diamante" del laboratorio. Ogni fascio ècomposto da un massimo di 2808 pacchetti contenenti 1.15 · 1011 protoni. Ipacchetti dei due fasci circolanti vengono fatti collidere con una frequenzadi 40 MHz. La scelta del tipo di particelle che vengono fatte scontrare èfra le altre cose dovuta alla perdita di energia; infatti accelerando particellecariche a velocità ultra-relativistiche la perdita di energia per radiazione disincrotrone è proporzionale a 1/m4 cosi si è passati da un acceleratore e+-e− (LEP) ad uno p-p (LHC). La macchina accelera i due fasci di particelleche circolano in direzione opposta ciascuno contenuto in un tubo a vuotomediante un gran numero di magneti. I pacchetti collidono in 4 punti lungol’orbita dove sono collocati i quattro principali esperimenti: ATLAS, CMS,LHCb, ALICE. La luminosità 1 maggiore è all’interno dei rivelatori ATLASe CMS, il cui principale obiettivo è quello della scoperta delle particelledi "nuova fisica" e lo studio del bosone di Higgs. Lo scopo di ALICE èinvece quello di studiare la fisica della materia sottoposta alle interazioniforti. Infine LHCb è dedicato allo studio degli adroni con beauty e che saràdescritto più in dettaglio in questa tesi. In figura 2.1 è mostrato la strutturadi LHC e la catena di iniezione.

1Parametro che indica il tasso di collisioni che si verificano in un acceleratore diparticelle

11

Figura 2.1: Complesso di LHC.

2.1 Il rivelatore di LHCb

Il rivelatore LHCb è uno spettrometro a singolo braccio posto in avanti ri-spetto alla zona di interazione con una copertura angolare da 10 mrad a 300mrad nel piano orizzontale e da 10 mrad a 240 mrad in quello verticale. Inesso si studiano le collisioni fra protoni prodotti da LHC con una luminositàminore cosi da avere una sola interazione protone-protone per evento e facili-tare l’analisi dati. Alle sudette energie gli adroni con b e b vengono prodottiin egual quantità sia anteriormente che posteriormente alla zona di interazio-ne ma la zona simmetrica rispetto all’esperimento LHCb, indietro rispettoil punto di interazione, non è stata sfruttata per mancanza di spazio e mo-tivi economici che non consentivano un’ampliamento della galleria. LHCbè composto dai seguenti componenti come possiamo vedere dalla figura 2.2(da sinistra a destra):

• Vertex Locator (VELO)

• primo Ring Imaging Cherenkov (RICH1)

• Trigger Tracker (TT)

• Magnete

• sistema di tracciamento (T1, T2, T3)

12

Figura 2.2: Schema del rivelatore di LHCb.

• secondo Ring Imaging Cherenkov (RICH2)

• calorimetro elettromagnetico (ECAL)

• calorimetro adronico (HCAL)

• camere muoniche (M1-5)

2.1.1 Vertex Locator (VELO)

Il Vertex Locator (VELO) deve provvedere a misure precise delle coordinatedelle traccie vicino alla regione di interazione. Queste informazioni sono utiliper ricostruire interazioni e vertici di decadimento (primari e secondari), ilparametro d’impatto e la vita media degli adroni presi in considerazione.I mesoni B prodotti da un fascio di protoni collimati vivono in media perun tempo dell’ordine del picosecondo durante il quale percorrono al più unadistanza di un millimetro. Il rivelatore LHCb è stato costruito in modo daeseguire un’accurata misura del loro punto di decadimento. Il VELO consi-ste in una serie di moduli di rivelatori al silicio, ognuno dei quali fornisce unamisura della coordinata radiale r e azimutale φ. Ogni modulo ha una for-ma semicircolare con un diametro di 90.5 mm. I moduli di destra e sinistrapossono essere allontanati dall’asse del fascio cosi da assicurarne la sicurezzadurante la fase di iniezione e rimozione dei fasci. Un piccolo taglio al centrodei sensori permette al fascio di passare imperturbato. Le particelle cariche

13

Figura 2.3: Rivelatore VELO.

prodotte, attraversando il silicio, generano delle coppie elettrone-lacuna ri-velate attraverso un’opportuna elettronica. Durante l’acquisizione dei dati isensori sono posizionati a ogni lato del fascio ad una distanza di 7 mm. IlVELO costituisce il principale dispositivo di tracciamento prima del magnetecon una risoluzione per il vertice primario di 40 µm lungo l’asse parallelo alfascio e di 10 µm nella direzione perpendicolare. Questa risoluzione spazialepermette di ottenere una risoluzione temporale di 40 fs sul tempo di volo,molto minore del tempo di vita medio dei mesoni B.

2.1.2 Rivelatori Ring Imaging Cherenkov (RICH)

L’identificazione delle particelle ed in particolare la separazione fra pioni ekaoni è fondamentale in LHCb quando negli stadi finali dei decadimenti deimesoni B ci sono pioni e kaoni. All’interno dei RICH, particelle carichecon velocità superiori a quella della luce nel mezzo emettono un cono diluce Cherenkov. Misurando l’angolo θ a cui viene emessa la luce è possibilerisalire alla sua velocità tramite la relazione

cosθ = nc

v

con n indice di rifrazione del mezzo. Conoscendo l’impulso iniziale dellaparticella la misura di vpermette di determinarne la massa e dunque la suanatura. Questo processo è fondamentale per la riduzione del fondo nell’ac-quisizione dati. In LHCb ci sono due rivelatori RICH. RICH1 posizionato

14

Figura 2.4: Rivelatore RICH1.

dopo il VELO viene utilizzato per particelle cariche con un impulso compresonell’intervallo 1-60 GeV ed è costituito da aereogel e una misclela radiatori diC4F10. L’aerogel è una miscela costituita da una sostanza a stato solido edun gas, ha una densità bassa ma un indice di rifrazione alto che lo rende otti-mo per particelle con quantità di moto di qualche GeV/c mentre i radiatori diC4F10 vengono utilizzati per particelle con impulso compreso nell’intervallo10-65 GeV/c. RICH2 invece, posizionato dietro al sistema di tracciamen-to, utilizza radiatori di CF4 che permette lo studio di particelle con impulsimaggiori, 15-100 Gev/c, ed è limitato a una regione di piccoli angoli dovesi trovano particelle con alta quantità di moto. Le particelle prodotte dallecollisioni per poter raggiungere gli altri sottorivelatori devono traversare glispecchi di RICH1. Per ridurre lo scattering multiplo nel RICH1 sono statiutilizzati specchi sferici rinforzati con fibra di carbonio mentre per RICH2sono utilizzati specchi esagonali in vetro. Come si può notare in figura 2.4in entrambi i rivelatori è presente un rivelatore di fotoni per misurare fotoniCherenkov emessi con una lunghezza d’onda compresa fra 200 e 600 nm:quando il fotone incide sul rivelatore, grazie ad un fotocatodo, si produce unfotoelettrone il quale accelerato da una differenza di potenziale nominale di20 kV attraversa una lastra di silicio generando coppie elettrone lacuna conuna soglia di 3.6 eV.

2.1.3 Il magnete

In LHCb un campo dipolare prodotto da un magnete con un’apertura di±300 mrad orizzontalmente e ±250 mrad verticalmete è utilizzato per mi-surare la quantità di moto delle particelle cariche . Il campo è orientatoverticalmente così che il percorso delle particelle viene deflesso nel pianoperpendicolare al fascio. La forza con cui viene deflesso il fascio, rappresen-tata dal campo magnetico integrato nello spazio, è pari a

∫B dl = 4 Tm.La

bobbina del magnete dissipa una potenza di 4.2MW . La polarità del campo

15

Figura 2.5: Vista frontale del magnete ad LHCb.

magnetico può essere scambiata al fine di ridurre gli errori sistematici nellemisure di violazione di CP provenienti da asimmetrie del rivelatore.

2.1.4 Il sistema di tracciamento

Lo scopo del sistema di tracciamento è quello di fornire un’efficiente ricostru-zione del percorso delle particelle cariche prima e dopo il magnete e dunquedi determinare la loro quantità di moto. Il sistema di tracciamento com-prende quattro stazioni: la prima (TT) è posta tra il RICH1 ed il magnete,mentre le altre tre stazioni (T1-3) sono situate tre metri dopo il magneteprima del RICH2. Per il sistema di tracciamento sono state utilizzate duetipi di tecnologie differenti: il Silicon Tracker e l’Outer Tracker.

Silicon Tracker Il Silicon Tracker utilizza microstreap in silicio di spes-sore 200 µm. Comprende l’intera stazione TT e la zona più interna (InnerTracker) delle stazioni T1-3 (vedi figura 2.6) La sua superficie totale attivaè di 11 m2. Il Trigger Tracker è una stazione di tracciamento piana, largacirca 140 cm e alta circa 130 cm, situata prima del magnete, e copre l’interaaccettanza dell’esperimento. L’Inner Tracker largo 120 cm e alto 40 cm copreuna regione a forma di croce al centro delle tre stazioni (T1-3) poste dopoil magnete. La tecnologia al silicio fornisce una risoluzione spaziale moltoelevata, ma per i suoi costi viene utilizzato solo dove la densità delle parti-celle è più alta cioè in prossimità del fascio.Il principio di funzionamento dirivelatori a semiconduttore è analogo a quello del rivelatore a gas. Al postodel gas il mezzo ora è un volume di semiconduttore in cui le particelle creanocoppie elettrone lacuna (invece di coppie elettrone-ione) che possono essereraccolte per mezzo di un campo elettrico. La densità dei semiconduttori

16

Figura 2.6: Sistema di tracciameno il Silicon Tracker in viola e l’Outer Tracker inblu.

Figura 2.7: Schema di uno strato del Trigger Tracker.

17

Figura 2.8: Sezione dell’Outer Tracker.

porta un alto potere frenante che determina ottime risoluzioni. Quando siavvicinano un semiconduttore drogato n e un altro drogato p si forma unagiunzione n-p che se polarizzata in modo inverso porta ad una zona di svuo-tamento (deplation region) la quale rappresenta il volume sensibile mentrela polarizzazione inversa è il campo che raccoglie le cariche. Le particellequindi producono una coppia elettrone-lacuna nella deplation region dellostrumento. L’impulso elettrico infine viene amplificato e registrato. Nel Sili-con Tracker gli elettrodi sono segmentati cosi che, studiando quale elettrodoha prodotto, l’impulso è possibile determinare il punto in cui è passata laparticella. In totale ci sono 270000 elettrodi che permettono di avere unarisoluzione di 5 µm.

Outer Tracker l’Outer Tracker utilizza camere a ionizzazione di forma ci-lindrica i cui elettrodi sono un cilindro esterno di 5 mm di diametro e un filoanodico centrale e copre la maggior parte dell’area attiva nelle stazioni T1-3(vedi figura 2.6). Una camera a ionizzazione è un rivelatore in cui un campoelettrico viene applicato attraverso un volume riempito di gas. Le particellecariche interagiscono ionizzando il gas e producendo ioni positivi ed elettro-ni, che vengono poi raccolti dagli elettrodi attraverso il campo elettrico. I treOuter Tracker hanno una forma modulare, ognuno costituito da 72 moduliseparati appoggiati su 4 cornici mobili di alluminio. Ogni modulo consistein due pannelli e due muri laterali, che formano una scatola meccanicamentestabile contenente 256 tubi riempiti con una miscela di argon (70%) e dios-sido di carbonio (30%). I due tubi sono costituiti da due lamine: la laminainterna di Kapton (pellicola di poliimmide) dopato con il carbonio che agiscecome catodo e quella esterna di laminato di poliimmide (materiale plasticoad alte prestazioni) ed alluminio che fornisce uno schermo costituendo insie-me al filo anodico una linea di trasmissione per segnale ad alta frequenza.

Nella ricostruzione della traccia le interazioni della particella con il VELO,TT, IT e OT sono combinate insieme e formano la traiettoria della particella

18

Figura 2.9: Illustrazione dei vari tipi di tracce.

fino al calorimtetro. A seconda della traiettoria che le particelle compionoall’interno del sistema di tracciamento si possono distinguere diverse classidi tracce:

• Long tracks, attraversano tutto il sistema di tracciamento dal VELOalle stazioni T. Qui si ha la più precisa determinazione del momento.

• Upstream tracks, attraversano solo il VELO e le stazioni TT. Qui si hain genere un piccolo momento e sono espulse dal rivelatore a causa delcampo magnetico

• Down stream tracks, attraversano esclusivamente le TT e le T stations.

• VELO tracks attraversano solo il VELO e sono generalmente a grandeangolo e sono utili per la ricostruzione del vertice primario.

• T tracks attraversano solo le stazioni T e sono prodotte in interazionisecondarie.

2.1.5 I calorimetri

Lo scopo principale dei calorimetri in LHCb è quello di identificare elettroni,fotoni e adroni, fornendo misure di energia e posizione delle particelle. Ilsistema di calorimetri è diviso in quattro parti: il rivelatore a ScintillatingPad (SPD), il rivelatore Pre-Shower (PS), il calorimetro elettromagnetico(ECAL) e il calorimetro adronico (HCAL).

Scintillating Pad e Pre-Shower Il rivelatore SPD determina se le par-ticelle che colpiscono il sistema di calorimentri sono cariche o neutre, mentreil PS determina il carattere elettromagnetico. Vengono utilizzati insieme a

19

Figura 2.10: Fibre a wavelenght shifter.

Figura 2.11: Moduli ECAL.

ECAL per individuare la presenza di elettroni, fotoni e pioni. I rivelato-ri SPD e PS sono costituiti da pad scintillanti spessi 15 mm e distanziatifra loro tramite un convertitore di piombo. La luce viene rivelata tramitel’utilizzo di fibre wavelenght shifter (WLS) e fotomoltiplicatori.

ECAL Il rivelatore ECAL utilizza una tecnologia che alterna scintillatoria lastre di piombo ed ha lo scopo di individuare gli elettroni e i fotoni. Lecelle variano da 4x4 cm nella parte interna del rivelatore, a 6x6 cm e 12x12cm nel mezzo e nella parte più esterna. L’intero rivelatore ha un’accettanzadi tra 25 e 300 mrad nel piano orizzontale e tra 25 e 250 mrad in quelloverticale.

HCAL Il rivelatore HCAL è situato dopo l’ECAL ed è composto da pia-stre di ferro e piastre scintillanti disposte parallelamente all’asse del fascio.La luce nel dispositivo viene rivelata attraverso l’utilizzo di fibre WLS, postelungo il rivelatore fino al retro dove sono montati dei fotomoltiplicatori. Ladistanza fra le piastre scintillanti e quella delle piastre di ferro corrispondeapprossimativamente alla lunghezza di interazione adronica nel ferro. Co-me in ECAL anche qui i moduli interni hanno dimensione minore rispetto aquelli più esterni, rispettivamente 13x13 cm e 26x26 cm.

20

Figura 2.12: Schema HCAL.

L’efficenza media dell’intero sistema di calorimetri nell’individuare elettroniè circa 95%.

2.1.6 Rivelatore di muoni

Il trigger e l’identificazione dei muoni sono requisiti fondamentali dell’espe-rimento LHCb. I muoni sono presenti nello stato finale di molti decadimentidel mesone B e giocano un ruolo fondamentale nelle misure di asimmetriaCP. Il sistema è composto da cinque stazioni (M1-M5) di forma rettangolareposte lungo l’asse del fascio, con un’accettanza di ±300 mrad orizzontalmen-te e ±250 mrad verticalmente. L’intero sistema comprende 1380 camere dicui 1368 Multi Wire Propotional Chamber (MWPC) e 12 rivelatori a tripla-GEM. L’intera area coperta è di 435 m2 e il minimo impulso necessarioaffinchè un muone attraversi le 5 stazioni è approsimativamente 6 Gev/c.M1 è situata di fronte ai rivelatori SPD e PS, mentre M2-M5 sono postedopo il calorimetro HCAL e sono separate da filtri in ferro spessi 80 cm perassorbire elettroni, adroni e tagliare i muoni a bassa energia. Ogni stazioneè divisa in quattro regioni R1-R4, le quali hanno approssimativamente lastessa accettanza, e la loro granularità è adattata alla densità delle particellein modo da ottenere un rate di conteggi per canale di lettura costante sututto il rivelatore. Il rivelatore fornisce inoltre informazioni sulla posizionein cui è passato il muone.

Multi Wire Propotional Chamber (MWPC) Nelle camere proporzio-nali a molti fili viene utilizzato il principio di funzionamento dei rivelatori agas; sono costituite da due o più piani di fili paralleli tra loro letti da circuitielettronici indipendenti. Quando una particella ionizza il gas solo i fili piùvicini raccolgono il segnale elettrico in questo modo quel filo identifica unacoordinata della particella. Se si utilizzano matrici di fili perpendicolari traloro allora avremo informazioni sulla posizione della particella su un piano.

21

Figura 2.13: Schema rivelatore di muoni.

22

Figura 2.14: Diagramma di flusso dei trigger.

Rivelatori a GEM I rivelatori a GEM sono dei rivelatori a gas. UnaGEM (gas electron multiplier) è costituita da un sottile foglio di materialeplastico (kapton) ricoperto di rame su entrambi i lati. Il foglio contiene tantipiccolissimi fori (diametro 70 µm, passo 140 µm). Applicando una differenzadi potenziale (400 V) tra le facce della GEM si crea un campo elettricomolto alto all’interno dei fori, che innesca la moltiplicazione a valanga. Unguadagno di 106 si può ottenere con una Tripla-GEM.

2.1.7 Acquisizione dati

LHCb lavora ad una luminosità 50 volte più piccola rispetto alla luminositàdi picco di LHC. In questo modo il numero di interazioni per bunch crossingè caratterizzato in media dall’interazione singola cosi da rendere più semplicela ricostruzione del vertice. La frequenza di scontro dei bunch di circa 10 MHzdeve essere ridotta dal trigger a 2kHz alla quale gli eventi sono memorizzatiper un’analisi offline. Questa riduzione è ottenuta da due livelli di trigger:Level-0 (L0) e High Level Trigger (HLT).

Trigger Level-0 L’obiettivo di L0 è di ridurre i 10 MHz della frequenzadi incontro dei bunch a 1 MHz. Il trigger L0 ricostruisce i cluster di elet-troni, adroni e fotoni nei calorimetri o nelle camere muoniche. Inoltre unsistema di pile-up permette di identificare eventi con interazioni multiple fraprotoni infatti la probabilità di che ci siano interazioni multiple è non 0. Leinformazioni dal trigger dei calorimetri e delle camere muoniche sono raccoltidall’L0 Decision Unit che ricava il trigger finale per ogni bunch crossing.

High level Trigger High Level Trigger consiste in una applicazione C++che gira su tutte le CPU dell’Event Filter Farm (EFF). HLT ha informazioniprovenienti da tutti i rivelatori e principalmente si occupa di selezioni offline,esso mira a rigettare eventi non interessanti usando soltanto una parte deidati. HLT è stato pensato come il più flessibile possibile evolvendo conla conoscienza dell’esperimento e con le priorità fisiche. HLT è diviso indue parti HLT1 e HLT2. HLT1 conferma le informazioni ricevute da L0cercando tracce nel VELO e T-station corrispondenti a elettroni , adroni

23

e muoni di L0; l’output ottenuto è caratterizzato da una frequenza di 30kHz la quale permette HLT2 di eseguire una serie di algoritmi di triggerinclusivi e esclusivi per ricostruire parzialmente o totalmente diversi tipi didecadimenti.

Analisi offline Gli eventi registrati da LHCb devono essere immagazzi-nati e processati per un’analisi finale. Stringhe di dati sono prodotte dalrivelatore tramite l’Event Filter Farm del sistema online ed in seguito vengo-no trasferite al CERN Tier-0 centro dei processi offline. Le stringhe inoltredevono essere ora ricostruite da quantità fisiche attraverso algoritmi di pre-selezione ed il risultato è la generazione di un nuovo file di dati, il reducedData Summary Tape (rDST). Gli eventi che passano gli algoritmi di pre-selezione saranno completamente ricostruiti ricreando tutte le informazioniassociate ad ogni evento.

Il CERN è il Tier-0 ed è responsabile della distribuzione dei dati quasi intempo reale ai Tier-1 collocati in molte nazioni. Ci sono 6 stazioni Tier-1:CNAF (Italia), FZK (Germania), IN2P3 (Francia), NIKHEF(Paesi Bassi),PIC (Spagna) e RAL (Inghilterra). Il CERN e tutti i centri Tier-1 sono re-sponsabili di tutte le fasi associate all’elaborazione dei dati. Oltre ai Tier-1ci sono anche centri Tier-2 finalizzati principalmente alla produzione di si-mulazioni Monte Carlo.

I software di ricostruzione possono elaborare sia dati veri dall’esperimento siaeventi simulati. La simulazione permette di capire le condizioni sperimentalie le performance dell’esperimento ed è costituita da due fasi:

• Una fase generatrice che consiste nella generazione di collisioni p-pe dei decadimenti delle particelle prodotte.

• Una fase di simulazione che riproduce i processi fisici che possoavvenire durante l’esperimento.

I software utilizzano molte librerie, ad esempio PYTHIA 6 per generarele collisioni p-p e EvtGen per decadimenti dei b-adroni.

24

Capitolo 3

Studio del canale didecadimento B+

Oggetto del lavoro di tesi è la misura della massa del mesone B+ attraversolo studio del canale di decadimento

B+ → Ψ(2S)K+π+π−

dove il mesone Ψ(2S), stato eccitato del mesone J/Ψ(cc), decade, di fattoistantaneamente, in una coppia di µ+µ−. A tale scopo è necessario fare unostudio statistico non soltanto dei dati forniti dall’esperimento ma anche didati simulati con metodi Monte Carlo 1. Con l’aiuto della simulazione, at-traverso dei tagli su variabili che caratterizzano un evento, possiamo ridurregli eventi di fondo. La presenza del fondo infatti aumenta l’errore nella mi-sura della massa. Facendo degli istogrammi delle sudette variabili su eventisimulati è possibile distinguere il fondo dal segnale, cosi da individuare unaregione di confidenza in cui il segnale è prevalente. L’applicazione di questitagli oltre a diminuire il fondo riduce parte del segnale. L’operazione da svol-gere è eliminare la maggior parte di fondo preservando quanto più possibileil segnale, cosi da mantenere una buona statistica. Dopo aver trovato tutti itagli significativi (con un alto rapporto rumore segnale) possiamo applicarliai dati e fare un fit della distribuzione della massa invariante delle particellefinali ( M(Ψ(2S)K+π+π−) ). In alternativa si userà un metodo multivariato:Bosted Decision Tree (BDT).

3.1 Selezione degli eventi

In figura 3.1 è mostrata la distribuzione della massa invariante delle particellefinali. Si può notare come non sia evidente, a causa del fondo dominante, il

1Per metodo Monte Carlo si intende un metodo che simula l’esperimento in modo più omeno dettagliato. Si basa su un algoritmo che genera una serie di eventi tra loro scorrelatiche seguono la distribuzione di probabilità che si suppone abbia il fenomeno da indagare.

25

Figura 3.1: Distribuzione della massa invariante dei prodotti del decadimento B+ →Ψ(2S)K+π+π−.

picco che mostri la provenienza delle particelle prodotto dal mesone B+. Alfine di selezionare gli eventi del decadimento

B+ → Ψ(2S)K+π+π−

è necessario imporre dei tagli sulle proprietà dei prodotti di decadimento.Un primo taglio riguarda l’impulso trasverso delle particelle figlie. Infattinello scontro protone-protone vengono prodotti molti pioni che hanno peròuna piccola componente di impulso trasverso, d’altra parte i pioni che pro-vengono da un decadimento di un mesone pesante come il B, hanno un altoimpulso trasverso essendo emessi in modo isotropo (nel sistema di riferimen-to del B). Un secondo taglio riguarda la variabile relativa alla differenza frail χ2 del fit di ricostruzione del vertice primario prendendo e non prendendoin considerazione i mesoni K+, π e B+ che indicheremo con 4χ2. Impo-niamo che la variabile in considerazione debba essere maggiore di un certovalore di soglia per pioni e mesoni K+, dovendo provenire dal vertice secon-dario, selezionando così gli eventi con una grande differenza fra i χ2 dei fitdi ricostruzione. Imponiamo invece che debba essere minore di un valore disoglia per i mesoni B+, dovendo provenire dal vertice primario, selezionan-do così gli eventi con una piccola differenza fra i χ2 dei fit di ricostruzione.Un ultimo taglio riguarda il coseno dell’angolo compreso fra l’impulso delmesone B+ e la retta che unisce il vertice primario e quello di decadimentoselezionando gli eventi con angoli molto piccoli.

26

Per selezionare gli eventi di segnale sono stati applicati i seguenti criteri diselezione:

• Impulso trasverso del mesone Ψ(2S) > 1650 MeV/c2 (var1 );

• Impulso trasverso del mesone K+ > 400 MeV/c2 (var2 );

• Impulso trasverso dei mesoni π > 255 MeV/c2 (var3-var4 );

• χ2 del fit di ricostruzione della posizione del vertice primario tramitela traiettoria del mesone Ψ(2S) < 50 (var5 );

• χ2 del fit di ricostruzione della posizione del vertice di decadimentotramite la traiettoria del mesone B+ <35 (var6 );

• 4χ2 relativo ai mesoni π > 7 (var7-var8 );

• 4χ2 relativo al mesoneK+ > 6 (var9 );

• 4χ2 relativo al mesone B+ < 9 (var10 );

• Il coseno dell’angolo compreso fra la retta che unisce il vertice primariocon quello di decadimento e l’impulso del mesone B+>0.99995 (var11 ).

3.1.1 Efficienza

Il valore del taglio è stato deciso in modo da massimizzare la reiezione delfondo e, allo stesso tempo, avere un’alta efficienza del segnale (∼ 94%).Definiamo l’efficienza di un taglio come

ε =numero di eventi a seguito del taglio

numero di eventi prima del taglio

Se consideriamo i tagli sulle variabili totalmente indipendenti allora possia-mo considerare l’efficenza totale come prodotto delle singole efficienze rela-tive ad ogni taglio. In tabella 3.1 sono riportate le efficienze dei singoli taglie quelle totali ottenute nell’ approssimazioni di tagli indipendenti, ottenen-do εts = 0.48 e εtf = 0.00041. Per valutare ε del segnale abbiamo usatoun campione di eventi di segnale simulato mentre per valutare ε del fondoabbiamo usato un campione di eventi appartenente ai dati escludendo glieventi caratterizzati da una massa ricostruita compresa in un intorno di ±40 MeV/c2 dal valore nominale della massa del B+ di 5279 MeV/c2 (figura3.2).In realtà applicando tutti i tagli simultaneamente si ottiene una εts = 0.55 euna εtf = 0.00043, maggiori rispetto a quelle calcolate nell’approssimazionedi tagli indipendenti così che un taglio su una variabile comporta l’elimi-nazione di eventi gia esclusi da un’altra. Questo implica che non possiamoconsiderare le variabili non correlate; è più corretto quindi utilizzare un me-todo multivariato.

27

Figura 3.2: Distribuzione della massa invariante dei prodotti del decadimento B+ →Ψ(2S)K+π+π− compresa in un intorno di ± 40 MeV/c2 dal valore nominale dellamassa del B+ di 5279 MeV/c2.

εs εf

var1 0.93 0.55var2 0.93 0.66var3 0.94 0.74var4 0.94 0.74var5 0.94 0.58var6 0.95 0.24var7 0.94 0.57var8 0.94 0.57var9 0.88 0.24var10 0.95 0.82var11 0.95 0.28εtot 0.48 0.00041

Tabella 3.1: Efficienze su fondo e segnale relative ai tagli sulle variabili.

28

(a) fit in scala lineare (b) fit in scala logaritmica

(c) fit con doppia gaussiana

Figura 3.3

3.1.2 Fit della massa M(Ψ(2S)K+π+π−)

Dopo aver selezionato gli eventi è stato costruito l’istogramma relativo allamassa invariante dei prodotti finali e realizzato un fit per descrivere la di-stribuzione del segnale e quella del fondo. A questo scopo è stata utilizzatauna doppia gaussiana per riprodurre oltre al picco gaussiano, causato dallarisoluzione dello strumento, anche l’andamento delle code dovute ad altrieffetti. Per fittare il fondo combinatorio si è utilizzata una funzione espo-nenziale. Per apprezzare in modo migliore l’utilità di una doppia gaussianapossiamo osservare la fig. 3.3a in cui è fittato un dateset simulato attraversouna gaussiana singla. Il fit sembrerebbe a prima vista compatibile con i datima in scala logaritmica, come mostrato in fig. 3.3b, notiamo delle code nonriprodotte dal fit che nel grafico lineare non erano ben visibili; è necessariodunque utilizzare una doppia gaussiana (fig 3.3c).

In figura 3.4 è riportato l’istogramma della distribuzione della massa inva-riante dello stato finale dopo la selezione. Si può notare un evidente piccorelativo alla massa del mesone B+ oltre ad un fondo piatto; questo tipo difondo è combinatorio ed è dovuto alla presenza di tracce mal ricostruite oaccidentali ovvero vengono utilizzate, per ricostruire la traccia, delle parti-celle che non provengono dal decadimento in esame. Il risultato ottenutoattraverso il fit (figura 3.5) per quanto riguarda la massa del mesone B+ è

29

Figura 3.4: Distribuzione della massa invariante dello stato finale dopo la selezione.

di mB+ = 5280.2± 0.1 MeV/c2 con 1770± 50 eventi di segnale e 2280± 50eventi di fondo. Il numero di eventi di fondo e di segnale ottenuti in questomodo saranno confrontati con i risultati ottenuti attraverso la BDT.

3.2 Metodi multivariati

Con il termine analisi multivariata si indica quell’insieme di metodi statisticiutilizzati per analizzare simultaneamente più variabili. Nel nostro caso l’o-biettivo è di ridurre il numero di variabili cosi da poter discriminare il segnaledal fondo agendo esclusivamente su un parametro. Infatti nel campo dellafisica delle particelle è diventato essenziale estrarre la massima quantità diinformazione dai dati per identificare un segnale molto piccolo in campioni incui il fondo è largamente dominante. I metodi convenzionali per la discrimi-nazione segnale/fondo si basano sull’applicazione successiva di un insieme ditagli sulle singole variabili; il valore dei tagli viene determinato dal confron-to delle densità di probabilità del segnale e del fondo, generato attraversola simulazione Monte Carlo. I metodi di analisi multivariata sfruttano unapproccio più efficiente di quello tradizionale unendo la flessibilità di appli-cazione alla possibilità di identificare le correlazioni presenti tra le variabiliutilizzate, riducendo la dimensionalità del problema. E’ chiaro dunque cometali metodi siano particolarmente utili quando, nell’analisi si usano un nu-

30

Figura 3.5: Applicazione del fit alla distribuzione della massa del mesone B+ dopoaver applicato i tagli sui dati.

mero elevato di variabili per distinguere un segnale su un fondo dominante.In questo caso tenere conto della correlazione all’iterno di un vasto insiemedi variabili diventa fondamentale per effettuare uno studio sufficientementeraffinato.

TMVA o Toolkit for Multivariate Data Analysis è uno strumento che sup-porta un gran numero di algoritmi di analisi multivariata. TMVA forniscequindi un ambiente, integrato a ROOT, per l’elaborazione e l’applicazione dimetodi multivariati a problemi di classificazione. Sono inclusi nel pacchettoi seguenti metodi di analisi:

• Tagli rettangolari ottimizzati

• Projectivelikelihood estimation

• multi-dimensional likelihood estimation

• Artificial neural networks (ANN)

• Boosted decision trees (BDT)

Concentreremo la nostra attenzione in particolare sul Boosted Decision Trees.

31

Un tipico problema di classificazione multivariata affrontato mediante TMVAconsiste di due fasi indipendenti: fase di training e fase di applicazione.

Fase di training In questa fase il metodo multivariato scelto viene alle-nato, testato e valutato con campioni Monte Carlo di dati, scelti in modo daavere una distribuzione analoga a quella dei dati veri. E’ necessario dunquescegliere le variabili che verranno usate per discriminare il segnale dal fondoe fornire al programma il dataset per l’allenamento. E’ inoltre fondamentalericordare che nella fase di training l’efficienza del metodo utilizzato vienevalutata mediante due estimatori gia descritti nei paragrafi precedenti: l’ef-ficienza del segnale e la reiezione di fondo rf = 1 − εf (o equivalentementela semplice efficenza del fondo εf ). Chiaramente la situazione ottimale èquella in cui il taglio permette di ottenere la massima efficienza di segnale ereiezione di fondo.

Fase di applicazione Nella seconda fase il problema di classificazioneviene applicato a campioni di dati di composizione ignota. Per discriminareil segnale dal fondo nel campione vengono utilizzate le stesse variabii scelteprecedentemente con i metodi che hanno dato la risposta più sodddisfacentedurante la fase di allenamento. L’applicazione dei metodi di classificazione alcampione dei dati veri restituisce una variabile di output che viene utilizzataper discriminare il segnale dal fondo all’interno del campione stesso.

3.2.1 Decision tree

Supponiamo quindi di avere la necessità di dividere gli eventi del segnaleda quelli del fondo, che siano disponibili i Monte Carlo di tutte le variabilie di avere a disposizione un numero di variabili utili per la distinzione frasegnale e fondo. Ora prendiamo tutti gli eventi e vediamo cosa accade seli dividiamo in due parti a seconda del valore che una variabile assume perciascun evento; lo scopo è quello di trovare la separazione migliore in modotale da avere da una parte eventi di segnale dall’altra eventi di background;in seguito si ripete questo procedimento per ogni variabile. Una variabile èun buon discriminante solamente se ha un comportamento differente per ilsegnale e per il fondo, ovvero quando è possibile determinare un taglio chesepari in maniera più o meno netta una regione di segnale da una di fondo.Il processo va iterato finché non si ottengono un insieme di eventi, chiamatoleaf, tutti di segnale o di fondo oppure quando non ci sono abbastanza datiper continuare il processo. Ora dobbiamo definire un criterio per determinarela qualità della separazione fra il segnale e il background. Supponendo cheogni evento abbia peso Wi definiamo la purezza di una leaf come

P =

∑sWs∑

sWs +∑

bWb

32

Figura 3.6: Esempio decision tree.

Dove∑

s è la somma su tutti eventi di segnale e∑

b è la somma su tuttieventi di fondo. Se una leaf ha purezza maggiore di 1/2 allora essa è chia-mata leaf di segnale mentre se a purezza minore di 1/2 allora è una leafdi background. Quello che ne risulta è il decisione tree. Questo strumentoÈ molto potente ma instabile infatti un piccolo cambiamento nei dati puòportare a un importante cambiamento nel tree e nei risultati.

3.2.2 Boosted decision tree

È per l’instabilità del decision tree che negli ultimi anni viene utilizzato ilboosted decision tree. Quest’ultimo parte da eventi non pesati costruendoinizialmente un tree come nel metodo precedente. Se un evento è mal clas-sificato (ad esempio un evento di segnale si trova in una leaf di backgroundo viceversa) allora il peso di quell’evento viene incrementato (boosted). Oraviene costruito un secondo tree con i nuovi pesi poi un terzo e così via fino a1000 o 2000 trees. Uno score viene assegnato agli eventi nel seguente modo:se esso si trova in una leaf di segnale allora ha score 1 mentre se si trova inuna leaf di background allora avra score -1. La somma degli score (uno pertree) normalizzata e pesata sarà lo score finale di un evento. Alti score signi-fica che l’evento è molto probabilmente di segnale mentre bassi scores implicache l’evento è molto probabilmente di background. Scegliendo un partico-lare valore dello score con cui tagliare possiamo selezionare una desideratafrazione del segnale, ora non più come prima nel decision tree tagliando sullesingole variabili. Il boost, ovvero il passaggio dal singolo albero alla foresta,stabilizza la risposta del classificatore rispetto alle fluttuazioni e ne miglio-ra le prestazioni. Tutti gli alberi vengono ricostruiti a partire dallo stesso

33

campione di allenamento, i cui eventi vengono ripesati dopo la costruzionedi ciascun albero. Esistono dieversi algoritmi di boosting noi considereremosolamente l’AdaBoost.

AdaBoost Il concetto che è alla base di questo algoritmo è di assegnarepesi maggiori agli eventi che sono stati classificati in modo errato durantel’allenamento dell’albero precedente. Questi pesi vengono utilizzati per otte-nere un nuovo campione di eventi per l’allenamento dell’albero successivo. Seci sono N eventi totali il peso di ogni evento è inizialmente 1/N. Supponiamoche ci siano Ntrees e m sia l’indice del singolo albero.Sia:

• xi il vettore di tutte le variabili dell’i-esimo evento

• yi=1 se l’i-esimo evento è di segnale mentre yi=-1 se l’evento è di fondo

• wi è il peso dell’i-esimo evento

• T (xi)=1 se il set di variabili per l’i-esimo evento porta quell’evento inuna leaf di segnale mentre T (xi)=-1 se il set di variabili lo classificacome un evento di background

• I(yi 6= Tm(xi))=1 se yi 6= Tm(xi) e 0 se yi = Tm(xi)

Definiamo ora le seguenti quantità per l’ m-esimo tree:

errm =

∑Ni=1wiI(yi 6= Tm(xi))∑N

i=1wi

αm = ln1− errmerrm

Allora a seguito del boost il peso cambierà

wi → wieαmI(yi 6=Tm(xi))

Infine si rinormalizzano i pesi

wi → wi

N∑i=1

wi

e lo score per un dato evento è dato da

T (x) =

Ntrees∑i=1

αmTm(x)

che è la somma pesata degli score di ogni singolo albero.

34

Pruning dei BDT A seguito del training del tree si può verificare che cisiano un gran numero di nodi statisticamente irrilevanti; in questo caso siparla di overtraining. La potatura o pruning dei decision trees è un proce-dimento che permette di eliminare le leaves non utili per lo studio statisticoriducendo l’overtraining. E’ interessante notare come il pruning consistanel percorrere l’albero al contrario dal nodo finale a quello iniziale anzichèarrestare la crescita dell’albero preventivamente.

3.2.3 Risultati del training della BDT

In primo luogo è stato effettuato il training della BDT il quale richiede uncampione di eventi di segnale, uno di eventi di fondo e delle variabile sullequali applicare la selezione. A questo scopo sono stati utilizzati un campionedi eventi costituito esclusivamente da segnale, ricavato attraverso la simula-zione, e un campione di eventi costituito esclusivamente da fondo, ricavatoescludendo dal campione dei dati gli eventi caratterizzati da una massa ri-costruita compresa in un intorno di ± 40 Mev/c2 dal valore nominale dellamassa del B+. Per poter completare questa fase vengono infine fornite le va-riabili da utilizzare per la costruzione dell’albero iniziale, esse sono le stesseutilizzate nel metodo precedente relativo a tagli consecutivi sulle variabili alfine di effettuare un confronto. A seguito di questo processo viene generatoun file di output e visualizzati numerosi istogrammi e grafici utili. In fig3.7 è possibile osservare la matrice delle correlazioni fra le variabili utilizzateper la discriminazione. In figura 3.8 è possibile analizzare la distribuzionedel segnale e del fondo associato a ciascuna variabile, in questo modo si puòidentificare quale variabile sia maggiormente discriminante; nel nostro casola variabile in questione è relativa al coseno dell’angolo compreso fra la rettache unisce il vertice primario con quello di decadimento e l’impulso del me-sone B+ (var 11 ) come si può dedurre dalla tabella 3.2 in cui è riportato ilpotere discriminante per ogni variabile utilizzata.In figura 3.9 è mostrata la distribuzione dello score per gli eventi di fondo egli eventi di segnale. Possiamo notare come il segnale si distribuisca intornoa più alti valori dello score rispetto al fondo. Da ultimo, in figura 3.10, èriportato in funzione dello score della BDT l’andamento della significanza2,dell’efficienza sul segnale e sul fondo e la purezza3 del segnale. Il graficodella significanza cambia a seconda del numero di eventi di segnale e difondo presenti nel campione. E’ possibile notare come, all’aumentare delloscore, diminuendo l’efficieza sul fondo troviamo un conseguente aumento

2La significanza è una quantita definita come S =Nsegnale

(Nsegnale +Nfondo)1/2

doveNsegnale

e Nfondo sono, rispettivamente, il numero di eventi di segnale e di fondo. I valori dei taglisono sempre ottimizzati massimizzando questa quantità.

3La purezza di un campione di eventi è definita come Nsegnale

Ntotalitende dunque a 1 se il

campione è composto da soli eventi di segnale.

35

Figura 3.7: Matrice di correlazione fra variabili di segnale.

variabile potere discriminante

var11 0.1502var5 0.1189var1 0.1105var4 0.1089var9 0.09362var10 0.08598var3 0.07933var2 0.07431var7 0.06767var6 0.05732var8 0.05329

Tabella 3.2: Potere discriminante delle variabili fornite al training della BDT inordine decrescente.

36

(a)

(b)

Figura 3.8: Distribuzione del segnale e del fondo relativo alle variabili utilizzate perla discriminazione.

37

Figura 3.9: Distribuzione degli eventi di fondo e segnale in funzione dello score.

della purezza del segnale. Il grafico riporta inoltre il valore dello score per ilquale la significanza è massima, una volta fissati il numero di eventi di segnalee di fondo. Nel nostro caso essi sono stati ricavati dalla conoscenza deglieventi totali e dalla conoscenza, attraverso il fit applicato all’istogrammaottenuto con tagli semplici, degli eventi di segnale con un’efficienza fissatadi circa 50 %.

3.2.4 Fit a seguito dell’applicazione della BDT

Dopo aver effettuato il training della BDT viene utilizzato il file di outputper l’applicazione. L’applicazione genera, attraverso processi mostrati neiparagrafi precedenti, una variabile aggiuntiva ai dati forniti dall’esperimen-to, lo score. A questo punto è stato applicato ai dati il taglio sullo score incorrispondenza del valore suggerito dalla massimizzazione della significanza.La distribuzione ottenuta della massa invariante delle particelle dello statofinale è mostrata in figura 3.11. E’ stato effettuato un fit (figura 3.12) uti-lizzando come nel caso precedente una doppia gaussiana. Il fit ha portatoad una massa mB+ = 5280.1 ± 0.1 Mev/c2 con 2282±51 eventi di segnalee 653±32 eventi di fondo. Possiamo notare come il rapporto segnale-fondosia aumentato in modo significativo rispetto al caso del fit successivo ad unaselezione con tagli semplici; questo dato mostra come quest’ultimo metodoutilizzato sia molto più efficiente del precedente. Così facendo abbiamo ot-tenuto un risultato notevolmente migliore partendo da un file con uno stessonumero di eventi di segnale ed eventi di fondo.

38

Figura 3.10: Andamento dell’efficienza del segnale e del fondo, purezza del segnalee significanza in funzione dello score.

Figura 3.11: Distribuzione della massa del mesone B+ a seguito dell’utilizzo dellaBDT.

39

Figura 3.12: Applicazione del fit alla distribuzione della massa del mesone B+ aseguito dell’utilizzo della BDT.

40

Capitolo 4

Risonanze

I pioni sono le particelle più leggere della famiglia dei mesoni. Se l’energiaè sufficientemente elevata c’è la possibilità di produrre altri mesoni nellacollisione fra protoni. I mesoni prodotti in questo caso hanno massa maggioredi quella del pione e, poichè non esiste una legge di conservazione del numerodi mesoni, possono decadere in due o più pioni attraverso l’interazione fortein un intervallo di tempo dell’ordine di 10−23 s. Nell’esperimento non èpossibile una diretta osservazione di un processo caratterizzato da un cosìpiccolo intervallo temporale. Possiamo tuttavia dedurre l’esistenza di questerisonanze osservando la distribuzione della massa invariante dei prodottifinali vedendo se c’è un picco e trovando di conseguenza la larghezza dellarisonanza. Per quanto riguarda il nostro studio verificheremo la presenza didue risonanze

ρ0 → π+π−

K0∗ → K+π−

Prendendo come esempio il primo decadimento, non osserviamo il mesoneρ0 direttamente ma le particelle osservate sono esclusivamente i due pioni.Dobbiamo ora capire se sia possibile distinguere il processo in cui i pioni sonoprodotti direttamente dal decadimento debole del mesone B+ o attraversouno stato intermedio ρ0. Dalla formula relativistica sappiamo che

mρ = [Eρ2 − c2pρ2]1/2

inoltre per la conservazione dell’energia

Eρ = Eπ+ + Eπ−

e per la conservazione dell’impulso

pρ = pπ+ + piπ+

da cuimρ = [(Eπ+ + Eπ−)2 − c2‖pπ+ + pπ+‖2]1/2

41

Figura 4.1: Distribuzione della massa dei mesoni K+ π− a seguito della selezionedi eventi apportata dalla BDT.

E’ impossibile distinguere il processo diretto della produzione dei pioni daun decadimento debole, ma lo stato finale delle particelle prodotto mostradelle caratteristiche differenti se prodotte direttamente o a seguito di unarisonanza. La distribuzione della massa infatti ha due componenti: un back-ground continuo dovuto allo spazio delle fasi e un picco corrispondente allamassa della risonanza.

Essendo un processo dovuto all’interazione forte la conservazione dell’isospinporta a delle limitazione sui vari decadimenti possibili. Il mesone ρ0 potrebbedecadere in due pioni neutri ma essendo lo spin isotopico del mesone ρ0 paria 1 mentre quello risultante dei due pioni neutri 0 o 2 questo decadimentopuò avvenire solamente per decadimento elettromagnetico, largamento sop-presso rispetto ad un decadimento forte. Ragionamenti simili possono essereapplicati alla seconda risonanza relativa al mesone K0∗.

In figura 3.13 è riportata la distribuzione della massa dei mesoni K+ π−

calcolata con le note formule relativistiche. Possiamo notare oltre il picco,dovuto ad una risonanza, anche un fondo che rappresenta il semplice spaziodelle fasi in cui i mesoni provengono direttamente dal decadimento debole.Per isolare gli eventi della risonanza possiamo utilizzare la distribuzione dellamassa dei mesoni K+π+ riportata in figura 3.14. Essi possono provenire soloin modo diretto dal mesone B+ così da poter considerare questa distribuzio-ne come lo stesso spazio delle fasi che si sovrappone alla risonanza evidentedalla massa dei mesoni K+ π−. Sottraendo l’istogramma associato alla di-stribuzione della massa dei K+π+, pesato in modo opportuno, a quella dei

42

Figura 4.2: Distribuzione della massa dei mesoni k+ π+ a seguito della selezionedi eventi apportata dalla BDT.

K+ π− otteniamo un segnale pulito della risonanza a meno di fluttuazio-ni statistiche evidenti nelle code. Poichè il peso utilizzato nella sottrazionedello spazio delle fasi è 0.75 osserviamo che solamente il 25% dei pioni pro-viene da questo tipo di risonanza. A seguito del fit in figura 3.15, applicatoall’istogramma ottenuto dalla sottrazione, otteniamo un picco centrato inmK0∗ = 889 ± 2 MeV/c2 e con deviazione standard σ = 23 ± 2 MeV/c2 .Questo parametro è compatibile con il mesone K0∗ che nominalmente pos-siede mK0∗ = 896.00 ± 0.02 MeV/c2 e una Full Width at Half Maximum1

(FWHM) pari a 47.4± 0.6 Mev/c2 (σ = 20.2± 0.3 Mev/c2 ).

In figura 3.16, invece, è riportato il corrispondente istogramma per i mesoniπ+ π−. In questo caso non è stato eleborato nessun fit ma possiamo notareun picco che suggerisce la presenza di una risonanza. Ad essa può essereassociato il mesone ρ0 che nominalmente possiede mρ0 = 775.3±0.3 MeV/c2

e una FWHM pari a 149.1± 0.8 Mev/c2.

1Con Full Width at Half Maximum detta larghezza a mezza altezza si indica la larghez-za di una funzione data dalla differenza fra i valori assunti dalla variabile indipendentequando la variabile dipendente è pari a metà del suo valore massimo. Infatti mentre ilprocesso analizzato per il calcolo della massa del mesone B+ porta ad una larghezza dovu-ta alle caratteristiche dello strumento come la risoluzione, nel caso delle risonanze siamoin presenza di un processo in cui non si può intrinsecamente ottenere una misura precisaa causa del principio di indeterminazione di Heisemberg 4E 4 t ≥ ~

43

Figura 4.3: Fit applicato alla distribuzione della massa dei mesoni K+ π− privatadegli eventi non provenienti dalla risonanza.

Figura 4.4: Distribuzione della massa dei mesoni π+ π− a seguito della selezionedi eventi apportata dalla BDT.

44

Capitolo 5

Conclusioni

Il lavoro di tesi può essere sostanzialmente diviso in due parti: la prima stu-dia la distribuzione della massa invariante di tutte le particelle provenientidal decadimento debole al fine di identificare il miglior metodo di selezionisugli eventi, la seconda studia la distribuzione della massa invariante di al-cune particelle dello stato finale al fine di identificare delle risonanze.

Nella prima sezione la distribuzione della massa invariante è stata analizzataselezionando gli eventi attraverso due metodologie differenti: tagli consecuti-vi sulle variabili che descrivono il decadimento e con un metodo multivariato(BDT). Questa analisi è resa fondamentale dalla presenza nei dati di unfondo dominante. Lo scopo principale è stato quello di mettere in evidenzala differenza, attraverso il calcolo della massa del mesone B+, nell’efficienzadi discriminazione del segnale dal fondo per i due metodi. Utilizzando ilprimo metodo è stato ottenuta mB+ = 5280.2 ± 0.1 MeV/c2 con 1770 ± 50eventi di segnale e 2280 ± 50 eventi di fondo mentre utilizzando la BDT èstato ottenuta mB+ = 5280.1± 0.1 Mev/c2 con 2282±51 eventi di segnale e653±32 eventi di fondo, in ottimo accordo con il valore nominale. Possiamoquindi concludere che il secondo metodo utilizzato permette di ottenere unpotere discriminante molto più alto rispetto al primo permettendo di identifi-care nella distribuzione la presenza del mesone B+, inizialmente non visibile.

Nella seconda sezione sono state studiate le masse invarianti dei sistemi (ππ) e (K π) dello stato finale analizzando la presenza di risonanze. Per laprima distribuzione è stato osservato un picco corrispondente al mesone K0∗

(nominalmente mK0∗ = 896.00 ± 0.02 MeV/c2 e FWHM pari a 47.4 ± 0.6Mev/c2) e, dopo aver sottratto la parte non risonante rappresentata dalladistribuzione della massa invariante dei mesoni K+π+, è stato applicato unfit che ha restituito mK0∗ = 889 ± 2 MeV/c2 e con deviazione standardσ = 23± 2 MeV/c2, in buon accordo con il valore nominale.Per i mesoni π+π− è stato realizzato solamente l’istogramma della massa

45

invariante (non avendo un terzo pione con il quale trovare la parte di segnalenon risonante) osservando un picco corrispondente al mesone ρ0 nominal-mente mρ0 = 775.3± 0.3 MeV/c2 e FWHM pari a 149.1± 0.8 Mev/c2.

Nei fit e nel calcolo dei parametri è stato considerato esclusivamente l’incer-tezza statistica della misura (data dal fit) indotta da fenomeni aleatori; nonè stato invece considerato l’errore sistematico la cui valutazione comportauno studio dettagliato che esula dall’obiettivo della tesi.

46

Appendice A

ROOT

ROOT è un pacchetto software scritto in C++ sviluppato dal CERN persostituire i precedenti pacchetti PAW e CERNLIB. Alla piattaforma appar-tengono l’interfaccia grafica e l’interpre a riga di comando CINT. Questosoftware è stato utilizzato nella tesi per analizzare distribuzioni attraversoistogrammi e per il fitting dei dati. Una caratteristica chiave di ROOT è ilcontenitore di dati chiamato tree, con le sue sottostrutture branches e leaves.Questa struttura può essere vista come un modo per accedere facilmente aidati grezzi come in un file. Questa tecnica permette di anallizare i dati sen-za l’ausilio di grandi allocazioni di memoria e quindi di poter lavorare confile di grandi dimensioni come quelli generati dal CERN in modo veloce edefficente.

47

Bibliografia

[1] Kenneth S. Krane; Introductory nuclear physics, Wiley, 1988.

[2] Davide Cieri; Measurements of the charge ratio and inclusive charge pro-duction in pp collision at LHCb, tesi laurea magistrale presso Universitàdegli Studi di Roma "Tor Vergata", 2012.

[3] Giovanni Sabatino; Charmonium production at LHCb: measurments ofthe ψ′ to J/ψ production ratio with the first data, tesi di dottorato pressoUniversità degli Studi di Roma "Tor Vergata", 2010.

[4] W.R.Leo; Thechniques for Nuclear and Particle Physics Experiments,Springer, 1994.

[5] Federica Lionetto; Studio preliminare per la misura di vita media delmesone B0

s nel decadimento B0s → J/ψK0

s , tesi di laurea triennale pressoUniversità degli Studi di Pisa 2010.

48