biosdocumenten.pbworks.combiosdocumenten.pbworks.com/w/file/fetch…  · Web view · 2014-12-16In...

of 28 /28
Samenvatting Moleculaire biologie: Chapter 14: RNA processing I: Splicing 1 Genes in Pieces Als we het transcript van het humaan β-globine zouden voorstellen als een zin, zou het er zo kunnen uit zien: Dit is bhgty het humaan β-globine qwtzptlrbn gen. Twee regio’s (cursief) in het gen geven een boodschap zonder inhoud. Deze regio’s bevatten sequenties die niet gerelateerd zijn met de globine coderende sequentie. Deze worden soms intervening sequences (IVS) genoemd. Ze zijn echter beter gekend onder de naam introns. De gedeelte van de genen die coderen worden exons genoemd. Sommige genen, hoofdzakelijk in lagere eukaryoten bevatten weinig of geen introns. Andere genen hebben introns in overvloedt. Het huidige record (met 362 introns) is voor het humane titin gen, dat codeert voor een zeer groot proteïne in de spieren. 1.1 Evidence for split genes Intronen werden 1977 voor het eerst ontdekt in het adenovirus (in de major late locus). Deze locus bevat verschillende genen dit tot expressie komen in de late fase van de infectie. Deze genen coderen voor structurele proteïnen, zoals hexonen, een van de virale mantel proteïnen. Verschillende experimentele bewijzen toonde aan dat de genen van de adenovirus major late locus onderbroken zijn. Het eenvoudigst te begrijpen bewijs is waarschijnlijk geleverd met een techniek die R-looping wordt genoemd. In R-looping experimenten wordt RNA gehybridiseerd met zijn DNA template. Met andere woorden worden de twee ketens van de DNA template van elkaar gescheiden, zodat een hybride gevormd kan worden met één van deze ketens en de RNA keten. Onder de gebruikte experimentele condities is de hybride dubbelstreng stabieler dan de DNA dubbelstreng. Na de vorming van de hybride wordt deze bestudeerd met behulp van elektronenmicroscopie. Voor dit soort experimenten kunnen 1

Embed Size (px)

Transcript of biosdocumenten.pbworks.combiosdocumenten.pbworks.com/w/file/fetch…  · Web view · 2014-12-16In...

Samenvatting

Moleculaire biologie: Chapter 14: RNA processing I: Splicing

Genes in Pieces

Als we het transcript van het humaan -globine zouden voorstellen als een zin, zou het er zo kunnen uit zien:

Dit is bhgty het humaan -globine qwtzptlrbn gen.

Twee regios (cursief) in het gen geven een boodschap zonder inhoud. Deze regios bevatten sequenties die niet gerelateerd zijn met de globine coderende sequentie. Deze worden soms intervening sequences (IVS) genoemd. Ze zijn echter beter gekend onder de naam introns. De gedeelte van de genen die coderen worden exons genoemd. Sommige genen, hoofdzakelijk in lagere eukaryoten bevatten weinig of geen introns. Andere genen hebben introns in overvloedt. Het huidige record (met 362 introns) is voor het humane titin gen, dat codeert voor een zeer groot protene in de spieren.

Evidence for split genes

Intronen werden 1977 voor het eerst ontdekt in het adenovirus (in de major late locus). Deze locus bevat verschillende genen dit tot expressie komen in de late fase van de infectie. Deze genen coderen voor structurele protenen, zoals hexonen, een van de virale mantel protenen. Verschillende experimentele bewijzen toonde aan dat de genen van de adenovirus major late locus onderbroken zijn. Het eenvoudigst te begrijpen bewijs is waarschijnlijk geleverd met een techniek die R-looping wordt genoemd.

In R-looping experimenten wordt RNA gehybridiseerd met zijn DNA template. Met andere woorden worden de twee ketens van de DNA template van elkaar gescheiden, zodat een hybride gevormd kan worden met n van deze ketens en de RNA keten. Onder de gebruikte experimentele condities is de hybride dubbelstreng stabieler dan de DNA dubbelstreng. Na de vorming van de hybride wordt deze bestudeerd met behulp van elektronenmicroscopie. Voor dit soort experimenten kunnen twee soorten set ups worden gebruikt: (1) er kunnen DNA templates worden gebruikt, waarvan de twee strengen juist voldoende van elkaar zijn gescheiden om hybridisatie toe te laten, of (2) er kan gebruik worden gemaakt van omstandigheden waarbij de twee template ketens volledig van elkaar gescheiden zijn. Van deze tweede optie is er in dit R-looping experiment. Onderstaande figuur toont hiervan de resultaten. Als het hexon gen geen introns bevatte, dan zou een lineaire hybride zijn bekomen, zonder oneffenheden. Maar wat als er wel introns voorkomen in het gen? In het mature mRNA zouden natuurlijk geen introns voorkomen. Als zij er wel zouden voorkomen, dan zouden zij leiden tot de codering van nonsense. Daarom zijn introns sequenties die voorkomen in het DNA, maar niet meer in het mRNA. Dit wil zeggen, dat het mRNA geen volledige hybride meer kan vormen met het DNA. Deze zullen te zien zijn als lussen. Dit is exact wat er werd waargenomden tijdens het experiment en wat er in de figuur te zien is. De lussen worden gevormd in het DNA, maar we zullen ze R-loops blijven noemen, daar ze werden veroorzaakt door hybridisatie met RNA.

De elektronenfoto geeft toont een RNA-DNA hybride met drie lussen (gemerkt met A, B en C). Deze kussen representeren de introns in het hexon gen. Elke lus wordt voorafgegaan door een korte hybridisatie regio. Na de laatste lus wordt gevolgd door een lange hybridisatie regio. De drie eerste exons worden getranscripteerd in een leader regio aan het 5 uiteinde, voor het hexon coderende gedeelte. Het lange exon bevat het coderende gedeelte. Al de genen van de major late locus hebben dezelfde leader regio, maar een verschillende coderende regio.

Als er zo iets verassen wordt gevonden als intronen in virussen, dan moet en zich de vraag stellen of dit ook het geval is bij eukaryoten. Het is dus belangrijk om na te gaan of eukaryote genen ook introns bevatten. En van de eerste experimenten die de aanwezigheid van introns in eukaryoten aantoonde, was een R-looping experiment dat uitgevoerd werd door Piere Chambon et al.

Introns komen ook niet enkel voor in genen die coderen voor mRNA, maar ook in de genen die zorgen voor de aanmaak van tRNA en rRNA. De introns van deze beide types van genen is iets anders dan deze van mRNA. Zo zijn de introns van tRNA genen relatief klein (gaan de van 4 tot 50 bp). Niet al de tRNA genen hebben introns. Degene die ze wel hebben, hebben er ook maar n. Genen die aanwezig zijn in de mitochondrin hebben ook introns.

RNA splicing

De aanwezigheid van introns deed een belangrijke vraag rijzen. Wat is het mechanisme dat zij niet aanwezig zijn in het mature RNA. Om deze vraag op te lossen kunnen er twee hypothesen gesteld worden: (1) de introns worden niet overgeschreven uit het DNA, doordat het RNA polymerase er op n of andere manier overspringt. (2) De intronen worden overgeschreven, waardoor een primair transcript wordt bekomen. De intronen worden er nadien uitgeknipt. Hoe verspillend het aan energie ook mag lijken, is toch de tweede optie de correcte. Het proces dat ervoor zorgt dat de introns uit het primaire transcript worden geknipt wordt RNA splicing genoemd. Het principe van het splicing proces wordt weergegeven in onderstaande figuur. Zoals we verder zullen zien geeft deze figuur een zeer vereenvoudigde versie van het proces weer.

Hoe weten we dat splicing plaatsgrijpt. Eigenlijk was er al onrechtstreeks bewijs dat splicing ondersteunde. Een klasse van grote nucleaire RNA moleculen was gevonden, waarvan algemeen werd geloofd dat deze precursoren zijn van het mRNA (hnRNA). Deze hnRNA moleculen hebben de juiste grote (groter dan mRNA moleculen) en zijn op de juiste plaats (in de nucleus) aanwezig om niet gesplicete mRNA moleculen te zijn. Verder worden hnRNAs zeer snel omgezet naar kleinere RNA molecuelen, wat doet vermoeden dat ze intermediairen zijn bij de vorming van meer stabielere RNA moleculen. Er was echter nog geen rechtstreeks bewijs dat aantoonde dat hnRNA gespliced werd naar mRNA.

Het -globine gen van de muis werd gebruikt om bewijs voor deze hypothese te verzamelen. De precursor van het mRNA van het muis -globine, maakt deel uit van het hnRNA. Het wordt enkel gevonden in de nucleus en wordt zeer snel omgezet. De grootte van het hnRNA is ongeveer 2 maal de grootte van het -globine mRNA. De rode bloedecellen maken zeer veel -globine aan, zodat het relatief eenvoudig is om het mRNA ervan te isoleren en zelfs om de precursoren van dit mRNA te isoleren. Deze hoge abundantie maken de experimenten uitvoerbaar en herhaalbaar. Voor het aantonen dat de precursoren nog steeds de introns bevatten werd er gebruik gemaakt van R-looping. In het experiment werd het matuur mRNA of de precursor gehybridiseerd met het gekloneerde -globine gen. Met elektronen microscopie werden dan de gevormde lussen bestudeerd. We weten dat we er bij matuur mRNA, dat geen intron sequentie bevat, lussen gevormd zullen worden. Als het precursor mRNA nog steeds intronen bevat, dan zou men geen lusvorming verwachten. Dit is wat er werd waargenomen, en in onderstaande figuur is weergegeven. Dit is niet onmiddellijk duidelijk te herkennen uit deze afbeelding, daar er gewerkt is dsDNA, waarbij het mRNA moet tijdens de hybridisatie n streng verwijderen. Het precursor mRNA gaf een hybride zonder lussen, terwijl het mRNA een hybride met lussen gaf. Dit toont aan dat er intronen in het DNA aanwezig zijn.

Splicing signals

Splicing moet op een zeer accurate manier gebeuren. Als er te weinig RNA wordt verwijderd van pre mRNA, dan zijn er niet coderende gedeelten aanwezig in het mRNA, wat er toe zal lijden dat het gevormde protene niet compleet zal zijn (de niet coderende sequenties eindigen vaak in een stop codon). Als er te veel wordt verwijderd, dan worden coderende sequenties verwijderd, en zo mogelijk de functie van het eiwit teniet gedaan. Daar correcte splicing zo belangrijk is, moeten er signalen zijn die de machinerie die instaat voor de splicing exact vertelt waar er geknipt en geplakt moet worden. En manier om uit te zoeken wat de splicing signalen zijn, si door bij verschillende genen te gaan kijken wat de grenzen zijn van de introns en exons, en dan te vergelijken welke delen er gelijk zijn. De meest opvallende observatie was dat alle intronen van pre mRNA op dezelfde manier beginnen en eindigen:

5 exon / GU intron AG / exon 3

De eerste basen van een intron zijn GU en de twee laatste zijn AG. Dit soort conservaties is niet toevallig; het is zeker dat het GU-AG motief deel uitmaakt van het signaal splice here Een typisch intron bevat echter verschillende GUs en AGs. Waarom worden deze dan niet gebruikt als splice sites. Het antwoord is dat splice signalen complexer zijn dan dit. Zij bestaan uit sequenties aan de exon-intron grenzen die verdergaan na UG en AG. Deze sequenties bevatten ook een branchpoint in de buurt van het 3 uiteinde van het intron. Door sequentie-analyse van verschillende genen heeft aangetoond dat het splicing signaal in zoogdieren volgende consensus-sequentie heeft:

5 AG GUAAGU intron YNCURAC YnNYAG G 3

Waarbij de verticale lijnen de overgang van intron naar exon en omgekeerd aangeven, Y een pyrimidine (U of C) is. Yn is een keten van ongeveer 9 pyrimidines. R een purine (A of G) aan, A is een speciale A die gelegen is in de branchpoint sequentie. N geeft elke base aan. De consensus sequentie in gist pre mRNA is ook goed bestudeerd en verschilt een beetje van deze van zoogdieren:

5 - GUAUGU intron UACUAAC YAG - 3

Onderstaande figuur geeft de consensus sequentie weer voor de mens. De grote van de letters geeft de graad van conservering weer. Hoe groter de letter, des te sterker is de hierdoor vertegenwoordigde base geconserveerd.

Het aantonen van consensus-sequenties is een zaak. Het belang van deze sequenties aantonen een andere. Verschillende onderzoeken hebben aangetoond dat als er mutaties optreden die zorgen voor afwijkingen van deze consensus sequenties, dat er dan abnormale splicing fenomeen kunnen optreden, die lijden tot defecte protenen.

The mechanism of splicing of nuclear mRNA precursorsA branched intermediate

En van de belangrijkste zaken die ontbreekt in de figuur die het splicing proces weergeeft is dat het intermediair tijdens de splicing vertakt is, en zo veel gelijkenis vertoont met een lariat (lasso). Onderstaande figuur geeft het twee staps lariat model voor de splicing weer. In de eerste stap zal het intermediair worden gevormd. Dit wordt gevormd door een nucleofiele aanval van de 2-OH groep van een adenosyl nucleotide in het midden van het intron op de fosfodisterbinding gelegen tussen het exon en de eerste G van het intron (5 splice site). Zo wordt er een lus gevormd en wordt het eerste exon verwijderd van het intron. De 3 OH groep voert een nucleofiele aanval uit op de fosfodisterbinding die het 3 uiteinde van het intron verbind met het tweede exon (3 splice site). Deze aanval verwijderd het intron en zorgt ervoor dat de exons met elkaar worden verbonden. Het intron komt in de lariat vorm vrij op hetzelfde moment als de exons met elkaar worden verbonden.

Dit mechanisme wordt ondersteund door experimentele bewijzen. Alle intermediairen zijn teruggevonden geworden.

A signal at the branch

Is er iets speciaal aan het adenine nucleotide dat deelneemt aan de vorming van de vertakking of kan elke A in het intron gebruikt worden voor deze functie? Door het bestuderen van verschillende introns is er een consensus sequentie naar voor gekomen waar de vertakking kan plaatsgrijpen. Deze kan nergens anders optreden.

De eerste aanwijzing voor de aanwezigheid voor een dergelijke sequentie werd geleverd door experimenten met het gist actine gen, uitgevoerd door Langford en Galwitz in 1983. Deze onderzokers kloneerde dit gen, en maakte er verschillende mutaties in. Deze gemuteerde genen werden terug in gistcellen gebracht. Dan onderzochten zij of deze genen splicing konden ondergaan door S1 mapping. Onderstaande figuur geeft hiervan de resultaten weer:

In de eerste mutant werd een regio tussen 35 en 70 bp upstream van de 3 splice site verwijderd. Door deze verwijdering werd splicing volledig geblokkeerd. Dit suggereerd dat deze regio, in de figuur weergegeven als een rode rechthoek, die belangrijk is voor de splicing. In een tweede mutant plaatste zij tussen deze regio en de 3 splice site een extra segment. Bij deze mutanten trad wel splicing op vanaf de 5 splice site, maar deze liep niet door tot aan de 3 splice site. In plaats daarvan werd een afwijkende site gebruikt, die overeenkomt met de eerste downstream gelegen AG sequentie, die gelegen was in het extra DNA element. Dit resultaat suggereert dat de sequentie aangeduid met de rode rechthoek de splicing machinerie vertelt waar de splicing moet plaatsgrijpen. Als er een nieuwe AG site wordt ingebouwd voor de eigenlijke splice site, dan kan deze gebruikt worden in het splicing proces. In een derde mutant werd deze sequentie verlegd tot in het tweede exon. Opnieuw werd de eerste AG sequentie downstream gebruikt als 3 splice site.

Deze sequentie is zo belangrijk daar zij het branchpoint A nucelotide bevat: de laatste A in de sequentie UACUAAC. Deze sequentie is bijna in alle introns van gist hetzelfde. Hogere eukaryoten hebben een meer variabele consensus sequentie gelegen rond het branchpoint: U47NC63U53R72A91 C47. De subscripten geven de frequentie aan waarmee elke base wordt gevonden in de sequentie.

Spliceosomes

In 1985 werd ontdekt dat de lariat vormige splicing intermediairen in gist niet vrij voorkwamen in oplossing, maar dat deze gebonden zijn aan 40S partikels. Deze partikels werden spliceosomen genoemd. In dat zelfde jaar werden ook spliceosomen bij de mens gesoleerd. Deze hebben een sedimentatiecofficint van 60S. Spliceosomen zijn opgebouwd uit pre-mRNA, maar ook uit verschillende andere RNAs en uit protenen. Deze protenen en RNAs komen voor als onder de vorm van small nuclear ribonuclear proteins (snRNPs), die zijn opgebouwd uit small nuclear RNA (snRNA) gekoppeld aan protenen. De snRNAs kunnen met elektroforese gescheiden worden in verschillende species aangeduid als U1, U2, U4, U5 en U6. Alle vijf komen deze snRNAs voor in het spliceosoom en spelen hier een cruciale rol in de splicing. In principe kunnen de consensus sequenties van het branchpoint en de uiteinden van een intron herkend worden door ofwel een protene ofwel door de snRNAs. We hebben nu bewijs dat aantoont dat zowel de snRNAs als de protenen betrokken zijn bij de herkenning van deze signaal sequenties. Onderstaande figuur geeft een typisch intron weer, geflankeerd door exons en de moleculaire species die interageren met de kritische sites.

De splicing signalen worden herkend snRNA U6, U2 en U5.

snRNA U6 bindt met het 5 uiteinde van het intron door middel van baseparing via het U6 snRNA. Deze binding gebeurd voordat er het lariat intermediair wordt gevormd. De binding tussen het 5 uiteinde het snRNP U6 blijft bestaan na de vorming van het intermediair. De associatie van U6 is belangrijk voor het splicing proces. U6 zal ook een binding aangaan met U2 gedurende de splicing.

Het U2 snRNA zorgt voor de herkenning van de consensus sequentie van het branschpoint. Deze baseparing is essentieel voor de splicing. U2 vormt samen met U6 een regio die helix I wordt genoemd. Deze regio zorgt er blijkbaar voor dat de snRNPs juist worden georinteerd voor de uitvoering van de splicing. Verder gaat het 5 uiteinde van U2 snRNA een interactie aan met het 3 uiteinde van U6 snRNA , wat leidt tot de vorming van een regio die helix II wordt genoemd. Dit is belangrijk bij de splicing in zoogdiercellen, maar niet in gistcellen.

Het U5 snRNA bindt met het laatste nucleotide van een exon en het eerste nucleotide van het volgende exon. Dit lijdt er waarschijnlijk toe dat beide exons juist worden geplaatst om aan elkaar gehecht te worden.

snRNP involvement in pre mRNA splicing

verder door in het hoofdstuk zullen we zien dat er introns zijn die zichzelf kunnen uitsplitsen. Hierdoor hebben zij geen splicesoom nodig, daar ze al de katalytische activiteit die nodig is voor het splicing proces zelf hebben. Deze zelf splicende introns kunnen in twee categorien worden ingedeeld. En klasse, groep II introns, maakt gebruik van een lariat intermediair, net zoals de introns die afhankelijk zijn van spliceozomen. Het is dus verleidelijk om te speculeren dat delen van het groep II intron zijn vervangen snRNPs om eenzelfde structuur te kunnen vormen als het groep II intron. Onderstaande figuur geeft een model weer hoe splicing optreedt bij splicezomen en bij groep II introns. Figuur a geeft weer hoe de splicing verloopt in het spliceozzm (in de tweede stap, dus na de vorming van de lariat). Figuur b toont het equivalente model voor groep II introns. Hierbij zijn verschillende zaken vermeldenswaardig. U5 vervangt het ID domein van het groep II intron om de twee exons te positioneren. De ID regio is en internal guid sequence omdat zij ervoor zorgt dat andere regios van het RNA juist worden gepositioneerd voor de katalytische activiteit. U6 vervangt het IC domein van groep II introns. De U2-U6 helix I regio komt overeen met domein V. Als laatste vervangt de U2 branchpoint helix het VI domein. Daar deze snRNPs de katalytische domeinen van het groep II intron vervangen, verwacht men dat deze ook de katalytische activiteit ervan vervangen. Onderzoek heeft aangetoond dat dit het geval is.

Spliceosome assembly and function

Het spliceosoom is opgebouwd uit verschillende componenten, zowel protenen als RNA moleculen. De componenten van het spliceosoom worden op een stapsgewijze manier aan elkaar gehecht. Een gedeelte van de volgorde hoe deze in elkaar worden gezet is al ontdekt. Het monteren, functioneren en demonteren van een spliceosoom wordt de spliceosoom cyclus genoemd.

The spliceosome cycle

Toen verschillende onderzoeksgroepen het spliceosoom voor het eerst isoleerde, vonden zij het U1 snRNP niet. Dit is verassend, daar U1 duidelijk betrokken is bij de base-paring aan de 5 splice site en zo dus essentieel is bij de splicing. Het feit is dat U1 deel uitmaak van het spliceosoom, maar dat de gebruikte isolatiemethoden te ruw waren om U1 meet te isoleren. Om het belang van dit protene te ondersteunen, toonde Ruby en Abelson aan dat U1 het eerste snRNP is dat bind tijdens het splicing proces. Uit dit en ander onderzoek is de spliceosoom cyclus opgesteld, zoals in onderstaande figuur te zien is:

De eerste componenten die een complex vormen zijn U1 (+ mogelijke substraten) en het pre mRNA. Dit complex wordt het commitment complex (CC) genoemd. Op dit complex zal U2 binden, dat met behulp van ATP het A complex zal vormen. Vervolgens binden U4-U6 en U5 om het B1 complex ter vormen. U4 zal dissociren van U6 zodat U6 U1 kan vervangen op de 5 splice site in een ATP afhankelijke reactie om zo het spliceosoom te activeren, U1 en U4 het complex kunnen verlaten (2 en dat U6 baseparen kan vormen met U2 (de snRNAs die gebonden zijn op de snRNPs). Dit geactiveerd complex wordt het B2 complex genoemd. ATP zal vervolgens energie leveren voor het uitvoeren van een eerste splicing stap, waarbij de lariat structuur gevormd zal worden. Zowel het verwijderde exon als het lariat intermediair worden in n complex vastgehouden als het C1 complex. Met de energie van een tweede ATP molecule zal de tweede splicing stap plaatsvinden, waarbij de twee exons aan elkaar worden gezet en waarbij het lariat-vormige intron wordt verwijderd. Deze beide structuren worden vastgehouden in het C2 complex. Inde volgende stap zal het mature mRNA het complex verlaten, en het intron blijft gebonden in het I complex. Ten slotte zal het I complex dissociren in zijn opbouwende componenten. De snRNPs kunnen dan hergebruikt worden in andere spliceosoom complexen. Het lariat-vormige intron zal worden afgebroken.

Commitment, Splice site selection and alternative splicing

snRNPs hebben niet voldoende specificiteit en affiniteit om exclusief en sterk te binden op de grens exon-intron en kunnen dus niet alleen zorgen voor de verwijdering van introns. Om dit bewerkstelligd te krijgen zal er dus gebruik moeten worden gemaakt van andere factoren die helpen om de snRNPs te binden. Ook zijn er enkele splicing factoren nodig om exons en introns te definiren. In deze sectie zullen we voorbeelden zien van splicing factoren en wat hun rol is in het splicing proces. Vervolgens zullen we zien hoe deze factoren er toe bijdragen dat splicing kan verschuiven van n plaats naar een andere.

Exon and intron definition

In principe kan het spliceosoom zowel de introns als de exons herkennen aan de start van het splicing proces (= splicing commitment). Dit gebeurd waarschijnlijk door de binding van splicing factors, zodat een brug wordt gevormd tussen exon en intron. Als de introns worden herkend, dan spreken we van intron definiring en als exons worden herken van exon definiring. Men kan de beide methoden van elkaar onderscheiden door mutaties aan te brengen op de grens exon-intron en nagaan wat er gebeurd. Als er exon definiring optreed, dan zal een mutatie in het 34 uiteinde van een mutatie er toe leiden dat het niet meer herkend wordt. Splicing zal hier dus niet optreden en het zal dus mee verwijderd worden met de omringende introns. Als intron definiring optreedt, en er treedt een mutatie op aan het einde van een intron, dan zal dit niet meer worden verwijderd en is dus aanwezig in het mRNA. Dit staat weergegeven in onderstaande figuur:

Deze test werd door verschillende onderzoekers toegepast. De resultaten hiervan tonen aan dat de spliceosomen in hogere eukaryoten, waaronder de gewervelde gebruik maken van exon definiring. Andere bewijzen wijzen ook in die richting. Soms als er een mutatie aanwezig is in het 3 uiteinde va het exon, lijdt dit het spliceosoom de splicing zal uitvoeren op een cryptische splice site (voorheen een verborgen site). Deze cryptische splice sites zijn bijna altijd gelegen in een exon. Dit verschijnsel is het eenvoudigst te verklaren indien het spliceosoom het exon herkend: het spliceosoom gat op zoek naar een andere splice site in het exon, en niet in het intron. Verder is aangetoond dat de exons in hogere eukaryoten kort zijn (meestal kleiner dan 300 nt), terwijl intronen zeer groot kunnen zijn (verschillende 1000den nt). Exon definiring is hier het logische gevolg van, daar de splicing factoren het volledige exon moeten kunnen overbruggen. Om dit te kunnen realiseren mag het exon niet te lang zijn. Dit is ook in overeenstemming met de waarneming dat artificieel verlengde exons (groter dan 300 nt) worden overgeslagen.

In tegenstelling met de hogere eukaryoten maken gisten gebruik van intron definiring. Dit is ook logisch daar de introns bij gisten korter zijn dan de exons.

Commitment

De start van de vorming van een spliceosoom (commitment) word bepaald door de binding van een RNA bindend protenen dat waarschijnlijk bind op het splicing substraat. Deze binding leidt tot rekrutering van de andere componenten van het spliceosoom, startend met U1. Bijvoorbeeld het SR protene SC35 en SF2/ASF brengen splicing op gang bij respectievelijk het humane -globine gen pre mRNA en het HIV tat pre mRNA.

In gisten bestaan deze SR protenen niet. Dit doet het vermoeden rijzen dat er in deze organismen een ander mechnisme de splicing op gang brengt. Hoewel verschillend onderzoek heeft aangetoond dat de commitment spliceosoom complexen van gisten vele gelijkenissen vertonen met deze van zoogdieren, zijn er toch enkele verschillen. Om deze verschillen bloot te leggen werd er daarom experimenten uitgevoerd om de protenen te bepalen die betrokken zijn bij de splicing commitment in gisten.

In 1993 voerde voerde Rosbach et al studeis uit die ontworpen waren om genen op te sporen waarvan de protenen interacties aangaan met U1 snRNA (dat als eerste in de spliceozoom cyclus word gebruikt, wat de kans dat deze interacties te maken hebben met commitment te maken hebben reel zijn). Voor deze genen te vinden werd een synthetic lethal screen uitgevoerd. Hiervoor werd er in gistcellen mutaties in het U1 snRNA gen aangebracht, waardoor dit temperatuurgevoelig wordt. Het snRNA is werkzaam bij 30C, maar wordt genactiveerd bij de verhoging van de temperatuur (37C). Zij maakte ook een tweede set van mutaties aan, in de genen waarvan werd gedacht dat de producten ervan met het U1 snRNA interacties aangaan. Zij redeneerde dat cellen met het gemuteerde U1 snRNA extreem gevoelig zijn voor mutaties in de genen die hiermee interactie aangaan. Zij zullen hier zo gevoelig voor zijn dat ze niet meer leefbaar zijn. Deze tweede set van mutaties zijn niet dodelijk voor cellen met het wt U1 snRNA. Dit soort mutaties werd mutations-u-die (Mud) genoemd. In deze studie werd 1 gen gevonden dat interactie met U1 snRNA aangaat, het MUD2 gen, dat codeert voor Mud2p.In een vervolgonderzoek werd een synthetic lethal screen uitgevoerd, waarbij het MUD2 gen werd gemuteerd, om na te gaan welke genen hiermee interactie aangaan. Hiermee werd het MSL-5 gen gevonden, dat codeert voor Msl5p, dat later werd hernoemd tot BBP (branchpoint bridging protein).

Abovich en Rosbach vermoedde dat BBP wetrokken was bij de vorming van een brug tussen U1 snRNP op het 5 einde en Mud2p aan het 3 uiteinde. Om deze hyprothese te testen maakte zij gebruik van een combinatie van methoden, waaronder een yeast two hybrid assay. Het principe hiervan staat in onderstaande figuur weergegeven:

Deze techniek maakt gebruik van volgende feiten:

1. Transcriptie activators hebben een DNA bindend domein en een activerend domein

2. Deze doemeinen zijn onafhenkelijk van elkaar.

Om te meten of twee protenen een interactie met elkaar aangaan brengt men deze twee protenen als fusieprotenen tot expressie worden gebracht in gistcellen. Het ene protene wordt gefuseerd met het DNA bindenden domein en het andere mete het transcriptie activerende domein. Als beide protenen een interactie met elkaar aangaan, dan zal het DNA bindend doemin en het transcriptie-activerend domein aan elkaar gekoppeld worden, wat leidt tot de activatie van een reporter gen zoals bijvoorbeeld lacZ of gfp. Deze techniek kan ook gebruikt worden om een onbekend protene op te vissen dat interageert met een gekend protene (figuur c).

Deze onderzoeken toonde aan dat in het gist commitment complex het branchpoint bridging protein (BBP) bind met U1 snRNP op het 5 uiteinde van het intron, en met Mud2p aan het 3 uiteinde van het intron. Zo wordt het intron overbrugt. Dit wordt weergegeven in onderstaande figuur.

Role of the RNA polymerase II CTD

Het CTD van Rpb1 (de grootste subeenheid van RNA polymerase II) stimuleert splicing van substraten die gebruik maken van exon definiring, maar niet bij deze die gebruik maken van intron definiring. Het CTD bind met de splicing factoren en kan er zo voor zorgen dat deze kunnen binden aan de einden van de exons, zodat splicing kan optreden. Daar het CTD van Rpb1 betrokken is bij de splicing, moet dit proces wel gelijktijdig optreden met de transcriptie. Dit staat gellustreerd in onderstaande figuur.

a. Het polymerase heeft het eerste exon getranscripteerd. Het CTD regelt de binding van de splicing factoren aan elk eind van het exon in het pre mRNA, en definieert zo het exon.

b. Het polymerase heeft het tweede exon overgeschreven. Het CTD van het polymerase zal op dezelfde manier de binding van de splicing factoren mediren als bij het eerste exon. Het CTD zal de exons dicht bij elkaar positioneren, zodat beide aan elkaar kunnen gezet worden na het uitsplitsen van het intron.

c. Beide exons worden aan elkaar gespliced, terwijl het polymerase verdergaat met de transcriptie van het gen.

Alternative splicing

Vele eukaryote genen kunnen op verschillende manieren gespliced worden zodat twee of meerdere mRNA moleculen bekomen worden de coderen voor verschillende protenen. In de mens kunnen ongeveer 95% van de genen alternatief gespliced worden. Bij de omschakeling van het ene naar het andere splicing patroon is uiteraard commitment betrokken.

Het eerste voorbeeld van alternatieve splicing werd ontdekt in het gen van de zware keten van immunoglobuline . De zware keten bestaat in twee vormen, een gesecreteerde vorm (s) en een membraan gebonden vorm (m). Het verschil in de twee protenen is gelegen op de carboxy terminus, waar de membraam gebonden vorm een hydrofobe regio heeft dat verankerd in het membraam. Deze regio is niet aanwezig in de gesecreteerde vorm. Uit het onderzoek bleek dat de mRNAs voor beide protenen gelijk zijn aan de 5 kant, maar verschillend aan de 3 kant. Als het gen voor het constante fragment werd gekloneerd, merkte de onderzoekers op dat beide vormen van het immunoglobuline werden gecodeerd door n gen, daar zowel het 3 uiteinde voor het gesecreteerde protene als het 3 uiteinde voor het gebonden protene aanwezig zijn in het gen. Het voorkomen van de twee verschillende protenen kan dan enkel verklaard worden door alternatieve splicing. Hoe dit gebeurd staat gellustreerd in onderstaande figuur.

Onderstaande figuur geeft het algemeen principe van alternatieve splicing weer. De protenen die hierdoor ontstaan worden isovormen genoemd.

Control of splicing

Alternatieve splicing is geen uitzonderlijke gebeurtenis in eukaryote genomen. Zoals hierboven is aangegeven wordt het waargenomen bij meer dan 95% van al de menselijke genen. Veel van deze genen hebben meer dan twee splicing patronen, en sommige zelfs meer dan duizend. Onderstaande figuur illustreert verschillende types van alternatieve splicing.

Transcripten kunnen bijvoorbeeld aangemaakt worden, beginnend vanaf een verschillende promotor sequentie. In dit voorbeeld wordt de transcriptie gestart vanaf de eerste promotor, zodat exon A in het mRNA aanwezig zal zijn. Als er gestart wordt vanf de tweede promotor zal dit exon niet worden ingebouwd. Ten tweede kunnen sommige exons, zoals exon C overgeslagen worden tijdens de transcriptie (= exon skipping), waardoor het niet zal voorkomen in het transcript. Ten derde kan alternatieve splicing van het 5 uiteinde ertoe leiden dat een deel van een exon in het transcript aanwezig is of niet (in dit voorbeeld D). Dit zelfde kan ook plaatsgrijpen aan het 3 uiteinde van exons (in dit voorbeeld bij F).. ten vierde kan ook exon retention optreden. Hierbij wordt een intron niet herkend door het splicozoom. Als laatste kan er nog alternatieve cleavage optreden ten gevolge van twee poly-adenylatie signalen. In dit voorbeeld zijn er 6 sites waar er twee verschillende zaken kunnen gebeuren, wat ons (26) 64 verschillende mRNAs oplevert.

Alternatieve splicing is een proces dat zeer goed wordt gecontroleerd door de cel. Voor deze controle is het noodzakelijk dat sequenties die soms worden herkend als exon in een bepaalde context, soms een deel moeten uitmaken van de introns. Maar wat zorgt ervoor dat dit kan optreden? Een gedeelte van het antwoord zijn de splicing factoren die commitment stimuleren op bepaalde splice sites. Een ander deel van het antwoord is dat exons sequenties kunnen bevatten die bekend staan als exonic splicing enhancers (ESEs), die splicing stimuleren en exonic splicing silencers (ESSs), die de splicing inhiberen. Deze sequenties binden waarschijnlijk protenen die geproduceerd worden door een bepaald celtype, of op bepaalde stadia in de celcyclus, of als respons van externe signalen zoals hormonen. Zulke binding kan dan leiden tot de activatie of de repressie van de splicing op in de buurt gelegen splice sites.

ESEs lijken te interageren met SR protenen (rijk aan serine (S) en arginine (R)), terwijl ESSs interacties aangaan met hnRNP protenen (de protenen die binden met hnRNA). Een protene dat vaak bind met ESSs is het hnRNP A1. Moleculaire biologen hebben bewijs gevonden voor minstens drie mechanismen voor de acties van A1. Deze zijn gellustreerd in onderstaande figuur:

In het eerste mechanisme (figuur a) is een ESS betrokken. Door binding van A1 op dit element, zullen er andere A1 protenes worden aangetrokken die een interactie aangaan met deze A1, zodat er een keten wordt gevormd die de splicing signalen worden afgeschermd zodat het exon niet wordt ingebouwd. Bij de andere twee mechanismen waarbij A1 betrokken is, gebeurd de binding op intronic silencing elements. In het tweede mechanisme (figuur b) zal A1 binden in de buurt van het branchpaoint en verhinderd zo de binding van U2 en dus zo de splicing en het inbouwen van het exon In het derde mechanisme zullen twee A1s binden op twee verschillende intronic silencing elements. Deze A1 protenen zullen met elkaar interageren, zodat het exon een lus vormt en zo wordt genegeerd tijdens de splicing.

Hoe kunnen ESSs worden gedentificeerd? Een methode is het bouwen van een reporter constructie waarmee ESS activiteit kan worden gedetecteerd. Zon methode staat weergegeven in onderstaande figuur. In deze methode wordt er een plasmide gemaakt dat de twee exons van het GFP (Green Fluorescent Protein) gen bevat. Tussen deze twee exons wordt een ander exon ingebouwd. Als dit exon mee wordt vertaald, dan zal dit de werking van het GFP verhinderen (geen fluorescentie). Dit zal gebeuren indien het exon geen ESS sequentie bevat.

Self splicing RNAs

En van de meest verbazingwekkende ontdekkingen in de moleculaire biologie in de jaren 1980 was dat sommige RNA moleculen zichzelf konden splicen zonder de tussenkomst van protenen. Cech et al maakte deze ontdekking tijdens hun onderzoek naar het 26S rRNA gen van Tetrachymena. Dit rRNA gen is vrij ongewoon daar het een intron bevat. Het meest opvallende aan dit gen was dat het pre rRNA zichzelf splicete in vitro. Dit was het eerste voorbeeld van zichzelf splicende RNA moleculen, die intronen bevatten die behoren tot de groep I introns. Verder onderzoek toonde een ander klasse van RNAs aan die introns bevatten die behoren tot de groep II introns, waarvan sommige RNA moleculen ook zichzelf kunnen splicen.

Group I introns

Om het zichzelf splicende RNA aan te maken, maakte Cech et al gebruik van een gekloneerd gedeelte van het 26S rRNA gen, dat het intron bevatte. Dit werd in vitro getranscripteerd door het E. coli polymerase. Als zij de gelabelde producten scheidde met behulp van elektroforese, werden vier grote RNA producten en drie kleinere waargenomen. Deze kleinere fragmenten komen in lengte overeen met het lineaire en circulaire intron (plus een lineair intron waarvan 15 nt ontbreken). Dit was al eens waargenomen in voorgaande studies en suggereert dat het RNA wordt gespliced en dat het verwijderde intron wordt gecirculariseert.

De vraag is of het RNA zelf deze splicing uitvoerde of dat het RNA polymerase hier op n of andere manier bij betrokken was. Om deze vraag te beantwoorden werd de RNA polymerase reactie uitgevoerd in aanwezigheid van polyamines (spermine, spermidine en purescine) die de splicing inhiberen. Na de reactie werden de producten gescheiden met behulp van elektroforese. Na elektroforese werden de 4 RNA bandjes uitgesneden en gencubeerd in omstandigheden waarbij splicing kan optreden (dus in afwezigheid van de polyamines). Dit mengsel werd gescheiden met elektroforese. De fotos van deze gel vertoonden bandjes van de introns. Van deze bandjes werd de sequentie geanalyseerd. Deze kwam overeen met de sequentie van de introns, wat aantoont dat dit pre rRNA in staat is zelf zijn introns uit te splitsen. Ook werd aangetoond dat het lineaire intron zich kan circulariseren als de temperatuur en de Mg2+ concentratie werden verhoogd.

Tot zover is enkel aangetoond dat het rRNA in staat is zelf zijn intron te verwijderen, maar is het ook in staat om zelf zijn exons met elkaar te verbinden? Om dit aan te tonen werd een model splicing reactie gebruikt. Hiervoor werd een gedeelte van het Tetrachymena 26S rRNA gen, dat uit 303 bp van het eerste exon het gehele intron en 624 bo van het tweede exon bestond, gekloneerd in een vector die een promotor bevat voor het faaf SP6 RNA polymerase. Vanuit deze vector werd het substraat voor de splicing gegenereerd in aanwezigheid van [32P]ATP, in omstandigheden waar geen splicing kan optreden. Het substraat werd dan in splicende omstandigheden gebracht in aanwezigheid van GTP en afwezigheid van GTP. Na incubatie werden de mengsels gescheiden met elektroforese. Onderstaande figuur geeft dit weer. In laan 1 wordt het resultaat weergegeven van de reactie in aanwezigheid va GTP. Hierop is te zien dat het lineaire intron aanwezig is en een kleine hoeveelheid van het circulaire intron. Ook is er een prominente band aanwezig met de lengte van de aan elkaar geligeerde exons. Als GTP afwezig is, dan is enkel de band van het substraat aanwezig. Dit is wat we verwachten aangezien de splicing van groep I introns afhankelijk is van GTP. Dit versterkt de aanname dat deze producten afkomstig zijn van het splicing proces. Deze resultaten tonen aan dat het volledige splicing proces wordt uitgevoerd door groep I introns in afwezigheid van protenen.

Onderstaande figuur geeft het mechanisme weer waarmee groep I introns splicing uitvoeren:

Figuur a geeft het pre rRNA weer dat zowel het 17S, het 5,8S en het 26S rRNA bevat. In het 26S rRNA is een intron aanwezig, aangeduid in het rood. De accolade geeft het gekloneerde gedeelte van het 26s pre rRNA weer. In figuur b is het mechanisme voor de zelf splicing weergegeven. In de eerste stap val een guanine moleculen een aanval uitvoeren op de adenine aan het 5 uiteinde van het intron, zodat het loskomt van het eerste exon, en zo het hypothetische intermediair vorm. In de tweede stap zal het eerste exon een aanval uitvoeren op het tweede exon, zodat beide aan elkaar worden gezet en het intron wordt verwijderd.

Group II introns

Groep II introns komen voor in genen van fungi, mitochondrin, chloroplasten en archae. De introns van deze groep die zichzelf kunnen splicen gebruiken hiervoor een ander mechanisme dan de introns van groep I. In groep II introns zal er een lariat structuur worden gevormd, die zeer gelijkend is als die van de introns die gebruik maken van spliceosomen. Deze gelijkenissen impliceert dat er een gelijkenis moet zijn tussen de functie van de snRNPs en de katalytische gedeelten van deze zelf splicende introns. Ze hebben waarschijnlijk zelfs een gemeenschappelijke evolutionaire oorsprong. Er wordt gedacht dat deze introns afkomstig zijn van bacterile groep II introns. Deze introns zijn dan via endosymbiose in terecht gekomen in de eukaryote voorouders. Deze hypothese wordt ondersteund doordat dit type van introns zijn teruggevonden in archae.

1

7