biologia-molecolare

September 24, 2017 | Author: Raffaele Pagliaro | Category: Dna, Proteins, Allele, Chemical Bond, Rna

Share Embed Donate

Report this link

Short Description

Download biologia-molecolare...

Description

Biologia molecolare di Domenico Azarnia Tehran Questo approfondito riassunto del manuale dell'esame di Biologia molecolare tratta i principali temi della materia in modo esaustivo: dalla storia delle scoperte sul Dna, alla composizione dell'Acido Desossiribonucleico, ai meccanismi di riproduzione. Le funzioni dell'RNA vengono trattate approfonditamente e spiegati le principali modalità di trasmissione genetica.

Università: Facoltà: Corso: Esame: Titolo del libro: Autore del libro: Editore: Anno pubblicazione:

Università degli Studi di Roma La Sapienza Scienze Matematiche, Fisiche e Naturali Scienze Biologiche Biologia molecolare Il Gene VIII Benjamin Lewin Zanichelli 2007

Domenico Azarnia Tehran

Sezione Appunti

1. La visione mendeliana del mondo La teoria dell'evoluzione è una delle scoperte scientifiche che hanno influito più profondamente sulla cultura moderna e sulla concezione dell'uomo contemporaneo. Questa fu concepita e messa a punto da Charles Darwin nel corso del 1800. Fino ad allora tutte le costruzioni filosofiche e religiose avevano considerato le forme di vita costanti e immutabili, con l'unica eccezione della specie umana, che era qualcosa di speciale, nettamente superiore a qualsiasi altra specie. Grazie, comunque, a Darwin e successivamente a Mendel si scoprì qualcosa di più sui geni e queste teorie furono scartate con l'avvenire della biologia molecolare. Nella seconda metà del 1700 scienze nascenti, come la geologia, avevano appunto rilevato strati geologici formatosi in tempi successivi in cui si trovavano specie antiche con caratteristiche comuni a quelle attuali, quindi si cominciò a pensare, come fece Jean-Baptiste de Lamarck all'evoluzionismo, secondo il quale caratteri acquisiti durante la vita dell'individuo possono essere trasmessi ai discendenti (eredità dei caratteri acquisiti). Secondo Darwin, invece, si ha dapprima lo sviluppo di un abbondante varietà di individui con caratteristiche diverse, che vengono selezionate tramite il criterio della sopravvivenza del più adatto, o selezione naturale. Successivamente questi caratteri vengono trasmessi alla progenie nel corso del tempo. Dopo iniziali polemiche la teoria dell'evoluzionismo fu scartata dal mondo scientifico e fu accettata la selezione naturale di Darwin. Inoltre, ci si rese conto che la vita doveva essere apparsa sulla Terra circa 4 miliardi di anni fa ma ancora non si conosceva la materia del materiale ereditario. In questo periodo inoltre, un altra importante scoperta, che diede lancio alla biologia molecolare fu la teoria cellulare di SchleidenSchwann che scoprirono le cellule, l'unità fondamentale della vita.

Biologia molecolare

Pagina 1 di 173

Domenico Azarnia Tehran

Sezione Appunti

2. La genetica della trasmissione Mendel vide che un gene può esistere in differenti forme chiamate alleli. Per esempio, il pisello può avere semi gialli oppure verdi. Un allele di un gene responsabile per il colore del seme conferirà ai semi il colore giallo, l'altro allele il colore verde. Inoltre un allele può essere dominante rispetto all'altro, che quindi risulterà essere recessivo (bisogna ricordare che non sempre avviene questo in quanto può esistere codominanza, con la comparsa di un colore intermedio). Mendel poté dimostrare che l'allele per i semi gialli era dominante dopo aver incrociato due piante di pisello, una con semi di colore verde e l'altra con semi di colore giallo. Tutta la progenie della prima generazione (F1) mostrava semi di colore giallo. Tuttavia, incrociando tra loro gli individui della generazione F1 (semi gialli), Mendel osservò la ricomparsa di semi di colore verde. Il rapporto tra semi di colore giallo e di colore verde nella seconda generazione filiale (F2) era di 3:1. Mendel concluse che l'allele per il colore verde dei semi doveva essere mantenuto nella generazione F1, pur non influendo sul colore dei semi di queste piante. La sua spiegazione fu che ogni pianta parentale porta due copie del gene; in sostanza i genitori esano diploidi per i caratteri che stava studiando. Secondo questa teoria, gli individui omozigoti presentano due copie dello stesso allele: o due alleli per i semi gialli o due per i semi verdi. Gli individui eterozigoti, invece, presentano una sola copia per ogni allele. I due genitori nel primo incrocio erano omozigoti e la progenie risultante F1 era eterozigote. Quindi Mendel concluse che le cellule sessuali contengono una sola copia del gene, cioè sono aploidi. Di conseguenza, gli omozigoti possono produrre cellule sessuali o gameti, che hanno un solo allele, ma gli eterozigoti possono produrre gameti aventi uno o l'altro dei due alleli. Mendel, inoltre, scoprì che i geni per i sette diversi caratteri che scelse di studiare, operano indipendentemente l'uno sull'altro. Così le combinazioni tra alleli di due diversi geni (piselli gialli o verdi con semi lisci o rugosi, dove giallo e liscio sono caratteri dominanti, rispetto a verde e rugoso che sono recessivi) diedero i rapporti 9:3:3:1 per le combinazioni giallo/liscio, giallo/rugoso, verde/liscio e verde/rugoso rispettivamente. Da questi esperimenti si possono enunciare tre leggi: 1.Legge della dominanza: gli individui nati dall'incrocio di due individui omozigoti, che differiscono per una coppia allelica, avranno il fenotipo dato dall'allele dominante; 2.Legge della segregazione: gli alleli di un singolo locus segregano indipendentemente l'uno dall'altro (ricomparsa del recessivo nella F1); 3.Legge dell'assortimento indipendente: i diversi alleli si trasmettono indipendentemente l'uno dagli altri, secondo precise combinazioni. L'ereditarietà che segue le semplici leggi che Mendel ha scoperto viene comunemente definita ereditarietà Mendeliana. Il lavoro di Mendel fu trascurato quasi 40 anni e furono riscoperte solo quando tre scienziati, Vries, Correns e Von Tschermak arrivarono con esperimenti diversi alle stesse considerazioni che fece Mendel. Comunque, l'idea che i cromosomi siano a portare i geni fu approfondita da Sutton, Boveri e Morgan ed è nota come teoria cromosomica dell'ereditarietà. Questo presenta un momento cruciale per lo sviluppo genetico. I geni non erano più fattori svincolati, ma erano diventati oggetti osservabili nel nucleo della cellula. Alcuni genetisti, e in particolare, come dicevamo prima, Thomas Hunt Morgan, rimasero scettici riguardo a questa

Biologia molecolare

Pagina 2 di 173

Domenico Azarnia Tehran

Sezione Appunti

idea. L'ironia della sorte stabilì proprio che fosse lo stesso Morgan nel 1910 a fornire la prima definitiva prova a supporto della teoria cromosomica. Morgan lavorava con il moscerino della frutta (Drosophila melanogaster) che era, sotto molti aspetti, un organismo molto più comodo da utilizzare per studi genetici in confronto alla pianta di pisello, grazie alle sue ridotte dimensioni, al breve tempo di riproduzione e all'elevato numero di figli nella progenie. Quando Morgan incrociò moscerini con occhi rossi (carattere dominante) con moscerini con occhi bianchi (carattere recessivo), la maggior parte degli individui della progenie F1, ma non la totalità di essi, aveva gli occhi rossi. Inoltre, quando Morgan incrociò i maschi con gli occhi rossi della generazione F1 e le loro sorelle sempre con gli occhi rossi, un quarto della progenie era rappresentato da maschi con gli occhi bianchi, ma non c'era nemmeno una femmina con gli occhi bianchi. In altre parole il fenotipo del colore degli occhi era legato al sesso e veniva trasmesso, in questi esperimenti, seguendo la trasmissione del sesso. Noi oggi sappiamo che il sesso e il colore degli occhi vengono trasmessi insieme perché i geni che controllano queste caratteristiche sono localizzati sullo stesso cromosoma, il cromosoma X. Comunque, Morgan fu riluttante nel trarre le sue conclusioni fino a quando, nel 1910, non osservò lo stesso comportamento legato al sesso per altri due fenotipo, ali ridotte e corpo giallo. È facile comprendere che geni localizzati su cromosomi separati si comportino indipendentemente negli esperimenti genetici e che geni localizzati sullo stesso cromosoma, come il gene responsabile del fenotipo ali ridotte (miniature) e quello responsabile del fenotipo occhi bianchi (white), si comportino come se fossero legati. Comunque, solitamente i geni localizzati sullo stesso cromosoma non mostrano una perfetta concatenazione genica (linkage). Infatti, Morgan scoprì questo fenomeno quando esaminò il comportamento dei geni legati al sesso che aveva trovato. Per esempio, sebbene white e miniature si trovino entrambi sul cromosoma X, essi rimangono concatenati nella progenie solo il 65,5% delle volta. Gli altri individui della progenie possiedono una nuova combinazione di alleli non riscontrabile nei genitori; per questo si definiscono individui ricombinanti. Questi individui vengono prodotti dallo scambio tra cromosomi omologhi (cromosomi che portano gli stessi geni o gli stessi alleli degli stessi geni). Il risultato di questo meccanismo è lo scambio di geni tra cromosomi omologhi. Nell'esempio precedente, durante la formazione delle uova nella femmina, un cromosoma X che porta gli alleli white e miniature è andato incontro a crossing over con un cromosoma che porta gli alleli per gli occhi rossi e per le ali normali. Poiché il fenomeno del crossing over avvenuto tra questi due geni ha portato gli alleli white e ali normali insieme su un cromosoma e gli alleli rosso (occhio normale) e miniature sull'altro. Dal momento che è stata creata una nuova combinazione di alleli, possiamo chiamare questo processo ricombinazione. Morgan assunse che i geni fossero disposti in maniera lineare lungo il cromosoma, come perle lungo un filo. Questa idea assieme alla consapevolezza della ricombinazione, lo spinse a suggerire che più lontani si trovano due geni lungo un cromosoma e più elevata è la probabilità che essi ricombinino. Successivamente, Sturtevant elaborò questa ipotesi per arrivare ad affermare che esiste una relazione matematica tra la distanza che separa due geni lungo un cromosoma e la frequenza di ricombinazione tra questi due geni. Sturtevant raccolse dati che supportavano questa tesi, conducendo esperimenti sulla ricombinazione nei moscerini della frutta. Questo approccio ha rappresentato il fondamento logico delle tecniche di mappatura genica in uso ancora oggi. Più semplicemente, se due loci ricombinano con una frequenza dell'1% si dice che i geni sono separati da una distanza, sulla mappa, di un centimorgan (dal nome dello stesso Morgan).

Biologia molecolare

Pagina 3 di 173

Domenico Azarnia Tehran

Biologia molecolare

Sezione Appunti

Pagina 4 di 173

Domenico Azarnia Tehran

Sezione Appunti

3. Miescher: l'acido desossiribonucleico L'esistenza di molecole speciali in grado di portare l'informazione genetica fu postulata dai genetisti, molto prima che questo problema fosse preso in considerazione dai chimici. Nel 1869, Friedrich Miescher scoprì nel nucleo della cellula la presenza di una miscela di componenti che egli chiamò nucleina. Il componente principale della nucleina è l'acido desossiribonucleico (DNA). Alla fine del XIX secolo, i chimici hanno compreso quale fosse la struttura del DNA e di un composto a esso simile, l'acido ribonucleico (RNA). Tutti e due sono lunghi polimeri, catene composte da piccoli composti chiamati nucleotidi. Ogni nucleotide è composto da uno zucchero, un gruppo fosfato e una base. La catena si forma in seguito al legame tra gli zuccheri di due basi attigue attraverso i loro gruppi fosfato. Comunque, dal momento che la teoria cromosomica dell'ereditarietà era ormai stata accettata, i genetisti convennero che il cromosoma dovesse essere composto di un polimero di un qualche genere. Sostanzialmente la scelta poteva cadere sulle seguenti tre opzioni: DNA, RNA e proteine. All'inizio si pensò proprio alle proteine in quanto strutture complesse con la loro catena è costituita da unità chiamate amminoacidi. Gli amminoacidi legati tra loro attraverso legami peptidici, formano la catena proteica che è così definita un polipeptide.

Biologia molecolare

Pagina 5 di 173

Domenico Azarnia Tehran

Sezione Appunti

4. Avery, Griffith e altri: il Dna può portare la specificità genetica Oswald Avery e i suoi collaboratori nel 1944 misero appunto un esperimento, eseguito precedentemente da Federick Griffith. Quest'ultimo scienziato nel 1928 gettò le basi per determinare, appunto, che il DNA costituisce il materiale genetico, con il suo esperimento di trasformazione del batterio pneumoccoccus, oggi chiamato Streptococcus pneumoniae. Questi organismi nella forma selvatica sono costituiti da cellule sferiche circondate da un involucro mucoso chiamato capsula. Le cellule formano grandi colonie lucide con aspetto liscio (S). Queste cellule sono virulente, ossia sono in grado di causare infezioni letali se iniettate in un topo. Un particolare ceppo mutante di S. pneumoniae ha perso la capacità di formare la capsula e forma colonie piccole e dall'aspetto ruvido (R). Inoltre questa forma è non virulenta, in quanto non avendo la capsula sono facilmente fagocitati dai globuli bianchi dell'organismo. La scoperta fondamentale di Griffith è costituita dal fatto che era possibile trasformare colonie di tipo R (non virulente) esponendole a colonie di tipo S (virulente) uccise tramite esposizione al calore. Sia le colonie S uccise al calore che le colonie R prese singolarmente non erano in gradi di promuovere un infezione letale. Tuttavia se somministrate insieme erano mortali. In qualche modo il tratto che conferiva la virulenza era passato dalle cellule virulenti morte a quelle non virulenti vive. Inoltre fu scoperto che la trasformazione non è un fenomeno passeggero. Infatti, una volta conferita la capacità a formare la capsula al ceppo non virulento e pertanto uccidere gli organismi ospiti, questa era passata ai discendenti come carattere ereditario. In altre parole le cellule non virulente in qualche modo acquisivano il gene per la virulenza durante la trasformazione. Questo significava che il principio trasformante presente nei batteri uccisi con il calore era costituito probabilmente dallo stesso gene per la virulenza. L'ultimo tassello mancante per completare il mosaico era scoprire la natura chimica della sostanza trasformante. A questo ci pensarono Oswald Avery, Colin MacLeod e Maclyn McCary che nel 1944 completarono il quadro. Come primo passo estrassero le proteine dall'estratto per mezzo di solventi organici e determinarono che l'estratto era ancora in grado di trasformare. Successivamente trattarono l'estratto con diversi enzimi. La tripsina e la chimotripsina, che digeriscono le proteine, non sortirono alcun effetto sulla capacità trasformane, e neanche il trattamento con ribonucleasi, che degrada l'RNA. Pertanto fu escluso che il fattore trasformante potesse essere costituito da proteine o RNA. Avery e collaboratori, d'altra parte, scoprirono che trattando l'estratto di cellule virulenti con la deossiribonucleasi (Dnasi), enzima che degrada il DNA, questo perdeva la capacità di trasformare i ceppi non virulenti. Questi risultati suggerirono, dunque, che il principio trasformante fosse proprio il DNA. Per finire, nel 1952, A. D. Hershey e Martha Chase eseguirono un esperimento che apportò ulteriori prove a favore dell'ipotesi che i geni sono composti da DNA. Questo esperimento prevedeva l'utilizzo di un batteriofago (virus batterico) chiamato T2 che infetta il batterio Escherichia coli. Durante l'infezione i geni del fago penetrano nella cellula ospite e inducono la sintesi di nuove particelle virali. Essendo il fago composto solo da DNA e proteine, questi due scienziati si chiesero se i geni risiedono nelle proteine o nel DNA. Comunque, dal momento che il DNA era la componente maggiore che entrava nella cellula ospite era altamente probabile che contenesse i geni. L'esperimento di Hershey e Chase si basava sulla marcatura radioattiva del DNA e delle proteine, una marcatura distinta per ciascuna delle due molecole. Usarono infatti fosforo-32 (32P) per marcare DNA e

Biologia molecolare

Pagina 6 di 173

Domenico Azarnia Tehran

Sezione Appunti

zolfo-35 (35S) per marcare le proteine. Questa scelta ha un senso se si considera che il DNA è ricco di fosforo mentre le proteine del fago non ne contengono ma invece contengono zolfo mentre il DNA ne è privo. Hershey e Chase permisero ai fagi marcati di infettare i batteri iniettando i loro geni nella cellula ospite. Successivamente staccarono i capsidi vuoti dei fagi dalle cellule batteriche, per mezzo di una agitazione vigorosa, tramite un frullatore (nuova invenzione dell'epoca). Poiché sapevano che i geni dovevano penetrare all'interno delle cellule batteriche, la loro domanda era, cosa è penetrato, il DNA marcato con 32P o le proteine marcate con 35S? Come hanno potuto vedere si trattava di DNA. In generale, quindi, i geni sono composti da DNA.

Biologia molecolare

Pagina 7 di 173

Domenico Azarnia Tehran

Sezione Appunti

5. Garrod: l'azione dei geni Nel 1902 Archibald Garrod notò che la alcaptonuria (una malattia che colpisce l'uomo) sembrava comportarsi come un carattere Mendeliano di tipo recessivo. Era possibile, quindi, che la malattia fosse causata da un gene difettoso, o mutante. Inoltre, il sintomo principale caratteristico di questa malattia era l'accumulo di pigmenti neri nelle urine del paziente, cosa che Garrod imputò, giustamente, ad un'anormale produzione di un composto intermedio in una determinata via biosintetica. Quindi si arrivò alla definizione un gene mutante-un blocco metabolico. Successivamente, nel 1941, Badle e Tatum crearono numerosi mutanti di Neurospora, nei quali il difetto interessava un singolo passaggio di un determinato pathway biochimico e di conseguenza riguardava un singolo enzima. Furono in grado di fare questo, aggiungendo l'intermedio che normalmente sarebbe stato sintetizzato dall'enzima difettivo e dimostrando che questo ripristinava una crescita normale. Quindi aggirando il blocco scoprirono dove questo fosse localizzato. Anche in questo caso, i loro esperimenti genetici dimostrarono che era un singolo gene a essere coinvolto. Così, un gene difettoso dà luogo a un enzima difettoso. In altre parole, un gene sembrò essere responsabile della produzione di un enzima. Questa è l'ipotesi un gene-un enzima. Negli anni successivi, però, sempre altri scienziati dimostrarono che numerose proteine enzimatiche e strutturali sono multimeriche, cioè contengono due o più catene polipeptidiche differenti, in cui ciascun polipeptide è codificato da un gene differente. Per questo la definizione precedente divenne un gene-un polipeptide che successivamente grazie agli esperimenti di Ingram diventò un gene-una catena polipeptidica. Infatti, questo scienziato, dopo aver determinato la sequenza amminoacidica dell'emoglobina normale e di quella dei pazienti affetti da anemia falciforme si accorse che la mutazione di un singolo gene determina la sostituzione di un singolo amminoacido e di conseguenza, quindi, affermò che i geni determinano la struttura primaria delle proteine. Infine, a metà degli anni '40, gli studiosi di biochimica conoscevano le strutture chimiche di DNA e RNA. Degradando il DNA nelle sue componenti base, scoprirono che queste erano costituite da basi azotate, acido fosforico e dallo zucchero desossiribosio. In maniera simile scoprirono che l'RNA era costituito da basi azotate e acido fosforico più uno zucchero diverso, il ribosio. Le quattro basi azotate trovate nel DNA sono adenina (A), citosina (C), guanina (G) e timina (T). L'RNA contiene le stesse basi, fatta eccezione per l'uracile (U) che sostituisce la timina. Le strutture di queste basi rilevano che l'adenina e guanina sono simili in struttura alla purina, pertanto sono dette purine. Mentre, le altre basi sono simili alla struttura delle pirimidina, e sono dette pirimidine. Queste molecole costituiscono l'alfabeto della genetica.

Biologia molecolare

Pagina 8 di 173

Domenico Azarnia Tehran

Sezione Appunti

6. La struttura del Dna Intorno al 1953, uno degli scienziati interessati alla struttura del DNA era Linus Pauling, un chimico teorico del California Istitute of Technology. Era già conosciuto per i suoi studi sui legami chimici e per la scoperta dell'-elica, una caratteristica strutturale importante delle proteine. Pauling, comunque, pubblicò una struttura a tripla elica del DNA, in cui le basi erano esposte all'esterno e le catene fosfodiesteriche all'interno. Quest'ultime però essendo cariche negativamente tendono a respingersi. Un altro gruppo di ricerca impegnato nella determinazione della struttura del DNA era composto da Maurice Wilkins e Rosalind Franklin, esperti in cristallografia, del King's College di Londra. Essi stavano, infatti, utilizzando la tecnica della diffrazione ai raggi X, per analizzare la struttura del DNA. Infine, entrarono in scena James Watson e Francis Crick che non fecero alcun esperimento ma interpretarono i dati ottenuti dai vari gruppi di ricerca per determinare un modello della struttura del DNA. Probabilmente il tassello più importante del mosaico fu costituito da una fotografia del DNA ottenuta da Franklin nel 1952, mediante diffrazione ai raggi-X, mostrata da Wilkins a James Watson durante un incontro a Londra avvenuto il 30 gennaio del 1953. Tuttavia, nonostante questa fotografia dicesse molto riguardo la struttura del DNA, metteva in evidenza un paradosso: il DNA era un'elica con una struttura regolare e ripetuta, ma affinché il DNA potesse assolvere la funzione di materiale genetico doveva avere una sequenza irregolare di basi. Watson e Crick intravidero un modo per risolvere questa contraddizione e per soddisfare le regole di Chargaff (il numero dei residui di A deve essere uguale al numero dei residui di T, così come deve essere uguale il numero di residui G e residui C) allo stesso tempo: il DNA era una doppia elica che presenta i gruppi zucchero-fosfato all'esterno e le basi all'interno. Inoltre, le basi dovevano essere appaiate in modo tale che a una purina presente su un filamento corrispondesse una pirimidina sull'altro. In questo modo l'elica risultava uniforme: non avrebbe presentato rigonfiamenti dove fossero state appaiate due pirimidine (più grandi) e analogamente non avrebbe presentato costrizioni dove fossero state appaiate due purine (più piccole). Pertanto Watson e Crick osservarono che una coppia di basi costituita da adenina e timina, tenute insieme da legami idrogeno, aveva quasi la medesima forma della coppia di basi costituita da citosina e guanina. In questo modo il DNA a doppio filamento sarebbe risultato regolare, formato da coppie di basi di forma simile, senza tener conto della sequenza imprevedibile dei due filamenti di DNA. La distanza fra le coppie di basi adiacenti è di 3,4 A (angstrom) e il passo dell'elica è di circa 34 A; per ogni giro completo di elica ci sono circa 10 coppie di basi.

Biologia molecolare

Pagina 9 di 173

Domenico Azarnia Tehran

Sezione Appunti

7. Le ipotesi sulla copia del Dna L'articolo di Watson e Crick fu pubblicato molto rapidamente per volere di Watson ma Crick voleva includere nell'articolo anche le implicazioni biologiche. Allora, essi si accordarono su una frase che volutamente minimizzava una delle maggiori scoperte scientifiche: “Non è sfuggito alla nostra attenzione che la specificità nell'accoppiamento delle basi che abbiamo proposto, indica l'esistenza di un possibile meccanismo di copia del materiale genetico”. Come provocatoriamente indica questa frase, il modello di Watson e Crick effettivamente suggerisce l'esistenza di un meccanismo di copia del DNA. Dato, infatti, che i due filamenti oltre ad essere antiparalleli (ciò significa che se uno presenta polarità 5'3', l'altro deve presentare polarità 3'5') sono anche complementari, questi possono essere separati, e ciascuno può servire da stampo per la sintesi di un nuovo filamento. Questo modello, quindi prevede, la separazione dei due filamenti parentali, al fine di agire da stampo per la formazione dei filamenti neosintetizzati. Questo modello è detto a replicazione semiconservativa perché ogni duplex generato possiede un filamento parentale e un filamento neosintetizzato. Comunque, questo non è l'unico meccanismo possibile. Un altro potenziale meccanismo è quello della replicazione conservativa, nel quale i due filamenti parentali, restano insieme, e in qualche modo producono un'altra doppia elica figlia, con due filamenti figli completi. Un terzo possibile meccanismo è dettato dal modello della replicazione dispersiva, nel quale il DNA viene frammentato, quindi il nuovo e il vecchio DNA coesistono nello stesso filamento, dopo la replicazione. Nel 1958, Matthew Meselson e Franklin Stahl hanno eseguito il noto esperimento necessario per distinguere quale dei tre modelli fosse quello corretto. I ricercatori hanno marcato il DNA di E. coli con azoto pesante (15N), crescendo le cellule in un terreno arricchito con questo isotopo dell'azoto. Questo processo rende il DNA più pesante rispetto alla condizione naturale. Hanno successivamente spostato, le cellule in un terreno di coltura ordinario, che contiene principalmente 14N, prelevando quindi le cellule in tempi diversi. Infine hanno sottoposto il DNA a ultracentrifugazione per determinare la densità. A questo punto, se la replicazione è conservativa, i due filamenti parentali si trovano associati, inoltre apparirà una doppia elica di nuova sintesi. Poiché quest'ultima elica, è stata generata in presenza di azoto leggero, entrambi i filamenti che la compongono saranno leggeri. L'elica parentale pesante/pesante (H/H) e la doppia elica figlia leggera/leggera (L/L) sarebbero quindi separati dall'ultra centrifugazione per via della loro diversa densità. Se la replicazione è semiconservativa, i due filamenti parentali pesanti sarebbero separati, e quindi entrambi associati ad un filamento figlio leggero. Questa doppia elica ibrida H/L avrà una densità che è una via di mezzo tra quella di una doppia elica H/H e di un elica naturale L/L. Questo è proprio quello che avviene: dopo il primo ciclo di replicazione, si può notare la comparsa di una banda a metà strada tra la doppia elica H/H e quella L/L. Questo risultato esclude la replicazione conservativa, ma è in accordo sia con l'ipotesi semiconservativa della replicazione che con quella dispersiva. I risultati di un ulteriore ciclo di replicazione del DNA escludono anche l'ipotesi della replicazione dispersiva; infatti, l'ipotesi prevede la produzione di un quarto di DNA con 15N e tre quarti con 14N dopo due cicli di replicazione in terreno di crescita con azoto leggero. L'ipotesi semiconservativa invece prevede la metà dei prodotti come H/L e l'altra metà come L/L. In altre parole, gli ibridi H/L prodotti nel primo ciclo di replicazione, si separano ed entrambi si accoppiano ai filamenti di DNA neosintetizzati, generando una proporzione 1:1 di doppie eliche di DNA H/L e L/L.

Biologia molecolare

Pagina 10 di 173

Domenico Azarnia Tehran

Sezione Appunti

Ancora, ciò è precisamente quello che accade. Quindi i risultati supportano fortemente il meccanismo semiconservativo.

Biologia molecolare

Pagina 11 di 173

Domenico Azarnia Tehran

Sezione Appunti

8. La sequenza dei componenti nucleotidici del Dna La scoperta della doppia elica pose fine alla diatriba sul fatto che il DNA fosse la sostanza genetica primaria. Dal momento che tutte le catene di DNA erano in grado di formare doppie eliche, l'essenza della loro specificità genetica doveva per forza risiedere nelle sequenze lineari dei loro componenti nucleotidici. Ovvero, in qualità di entità contenenti informazioni, le molecole di DNA dovevano essere considerate delle parole molto lunghe, formate da un alfabeto di quattro lettere (A, G, C e T). Nonostante vi siano solo quattro lettere, il numero di sequenze di DNA possibili (4N dove N è il numero di lettere nella sequenza), è, comunque, straordinariamente grande, anche per le molecole di DNA più piccole. Sebbene il DNA portasse l'informazione per disporre gli amminoacidi in sequenza, era abbastanza chiaro che la doppia elica stessa non potesse svolgere il ruolo di stampo per la sintesi proteica. Esperimenti successivi dimostrarono, infatti, che la sintesi proteica poteva avvenire anche in assenza di DNA. In tutte le cellule eucariotiche la sintesi proteica avviene nel citoplasma, che risulta separato dal DNA cromosomico dalla membrana nucleare. Doveva esistere, quindi, una seconda molecola che contenesse sia l'informazione, sia la specificità genetica del DNA e che potesse spostarsi nel citoplasma e svolgere il ruolo di stampo per la sintesi proteica. Si conseguenza si cominciò a considerare con attenzione la seconda classe di acidi nucleici: l'RNA. L'analisi della struttura dell'RNA dimostra che la sua sintesi può avvenire a partire da uno stampo di DNA. Dal punto di vista chimica, esso è molto simile al DNA. L'RNA, infatti, è una molecola lunga e non ramificata, contenente quattro tipi di nucleotidi uniti da legami fosfodiesterici 3'5'. Solo due diversi gruppi chimici lo distinguono dal DNA. Il primo è una modificazione nella componente glucidica, lo zucchero del DNA è il desossiribosio mentre nell'RNA troviamo il ribosio che presenta un gruppo ossidrile -OH in più, la seconda differenza è che l'RNA non contiene timina, ma una pirimidina molto simile: l'uracile. Nonostante queste differenza, i poliribonucleotidi hanno lo stesso la possibilità di formare doppie eliche complementari come il DNA, tuttavia l'RNA si trova nella cellula come molecola a singola elica.

Biologia molecolare

Pagina 12 di 173

Domenico Azarnia Tehran

Sezione Appunti

9. Il dogma centrale nello studio del Dna Nell'autunno del 1953 venne formulata l'ipotesi che il DNA cromosomico funziona da stampo per le molecole di RNA che vengono successivamente trasportate nel citoplasma dove determinano l'ordine degli amminoacidi all'interno delle proteine. Nel 1956, Francis Crick definì questo flusso d'informazione genetica il dogma centrale: Duplicazione DNA Trascrizione RNA Traduzione Proteina Però, per scoprire il modo in cui le proteine vengono sintetizzate si dovette aspettare lo sviluppo di estratti crudi (cell-free), in grado di eseguire tutti i passaggi necessari per la sintesi. Grazie a questo metodo Paul C. Zamecnik e collaboratori scoprirono che gli amminoacidi vengono uniti alle molecole che oggi noi chiamiamo RNA transfer (tRNA) da una classe di enzimi denominati amminoacilsintetasi, prima della loro incorporazione nelle proteine. L'RNA transfer rappresenta circa il 10% di tutto l'RNA cellulare. Oggi sappiamo che ogni tRNA si contiene una sequenza di basi adiacenti (l'anticodone) che si lega in maniera specifica a gruppi di basi contigue (codoni) lungo lo stampo di RNA durante la sintesi proteica. Comunque, circa l'85% dell'RNA cellulare si trova nei ribosomi e dato che il loro numero aumenta notevolmente nelle cellule che hanno un'intensa attività di sintesi proteica, si pensò inizialmente che l'RNA ribosomiale (rRNA) fosse lo stampo per ordinare gli amminoacidi. Tuttavia, grazie all'utilizzo di cellule infettate con il fago T4, si scoprì che lo stampo per ordinare gli amminoacidi è l'RNA messaggero (mRNA), dato che trasporta l'informazione del DNA ai siti ribosomiali per la sintesi proteica. Mentre si scopriva l'RNA messaggero, i biochimici Jerard Hurwitz e Sam B. Weiss isolarono in maniera indipendente il primo degli enzimi in grado di trascrivere l'RNA a partire da uno stampo di DNA. Questi enzimi, chiamati RNA polimerasi, funzionano solo in presenza di DNA, che funge da stampo su cui si formano le catene a singolo filamento di RNA. Nei batteri, lo stesso enzima produce ciascuna delle classi maggiori di RNA (ribosomiale, transfer e messaggero), usando appropriati segmenti di DNA cromosomico stampo.

Biologia molecolare

Pagina 13 di 173

Domenico Azarnia Tehran

Sezione Appunti

10. L'importanza dei legami deboli e forti nelle interazioni fra molecole Le macromolecole che maggiormente interessano i biologi sono le proteine e gli acidi nucleici. Queste sono costituite, rispettivamente, da amminoacidi e nucleotidi. In entrambi i casi, i precursori sono uniti da legami covalenti a formare catene polipeptidiche (le proteine) e polinucleotidiche (gli acidi nucleici). I legami covalenti sono legami forti, stabili, che nei sistemi biologici difficilmente si rompono spontaneamente. Esistono, inoltre, legami più deboli, che sono essenziali per la vita della cellula, in parte perché possono essere formati o eliminati in condizioni fisiologiche. Infatti, i legami deboli mediano le interazioni fra diverse parti della stessa macromolecola, determinandone così la struttura e, quindi, la loro funzione biologica. Perciò, sebbene una proteina sia formata da una catena lineare di amminoacidi covalentemente legati, la sua forma e funzione sono determinate dalla struttura spaziale da essa adottata. Tale struttura è determinata dal gran numero di legami deboli che si formano fra gli amminoacidi. Analogamente anche per i legami non covalenti che tengono unite le due catene nucleotidiche del DNA.

Biologia molecolare

Pagina 14 di 173

Domenico Azarnia Tehran

Sezione Appunti

11. Caratteristiche dei legami chimici Un legame chimico rappresenta una forza d'attrazione che tiene uniti gli atomi. Aggregati atomici di dimensioni definite vengono chiamati molecole. Originariamente si pensava che soltanto i legami covalenti potessero tenere uniti gli atomi per formare le molecole; in seguito, è stato visto che le forze attrattive deboli sono molto importanti per la formazione di complessi costituiti da più macromolecole. Per esempio, le quattro subunità dell'emoglobina sono tenute insieme dall'azione combinata di alcuni legami deboli. Comunque, i legami chimici possono essere definiti in modi diversi. Un'evidente caratteristica del legame è la sua forza. I legami forti non vengono quasi mai distrutti alle temperature fisiologiche. Invece, i legami deboli vengono rotti facilmente ed hanno una vita molto breve se il loro numero è esiguo. Questi legami diventano stabili soltanto quando sono numerosi e disposti in gruppi ordinati. La forza di un legame, inoltre, è inversamente proporzionale alla sua lunghezza, così che due atomi uniti da legami forti sono sempre più vicini degli stessi atomi tenuti insieme da legami deboli. Un'altra importante caratteristica è il numero massimo di legami che un dato atomo può formare. Questo numero è chiamato valenza. L'ossigeno, per esempi, ha una valenza di due e non può formare più di due legami covalenti (questo non vale per i legami di van der Waals, in cui il fattore limitante è puramente sterico). Altre due importanti caratteristiche dei legami sono l'angolo di legame, che è l'angolo che si forma fra due legami convergenti su un singolo atomo, e la libertà di rotazione; i legami covalenti singoli permettono una libera rotazione dei due atomi legati mentre i legami doppi o tripli sono molto rigidi. Comunque, con l'avvento della meccanica quantistica, si specificò che la formazione spontanea del legame fra sue atomi implica sempre il rilascio di parte dell'energia interna, contenuta negli atomi non legati, e la sua conversione in una diversa forma di energia. Più forte è il legame, maggiore è la quantità di energia ceduta durante la sua formazione. La formazione di un legame fra i due atomi A e B può essere descritta come: A + B AB + energia, dove AB rappresenta i due atomi legati. La velocità della reazione è direttamente proporzionale alla frequenza delle collisioni fra A e B. L'unità più frequentemente utilizzata per misurare l'energia è la caloria, ma siccome questa energia di solito è molto grande si utilizzano le kilocalorie per mole (Kcal/mol). Malgrado ciò, l'unione di atomi mediante legami chimici non è permanente. Esistono, infatti, forze capaci di rompere questi legami: l'energia termica è una fra le più importanti. Infatti, più una molecola si muove velocemente (e ciò può essere ottenuto aumentando la temperatura), maggiore è la possibilità che, a causa di una collisione, un legame venga rotto. La rottura di un legame può essere descritta dalla seguente formula: AB + energia A + B. La quantità di energia che deve essere aggiunta per rompere un legame è esattamente pari a quella dissipata nella formazione del legame stesso. Questa equivalenza è in accordo con la prima legge della termodinamica, che afferma che l'energia non può essere né creata né distrutta. Quindi, in conclusione, possiamo dire che ciascun legame è il risultato di un'azione combinata tra forze che formano e forze che rompono i legami stessi. Quando, in un sistema chiuso, si crea un equilibrio, il numero dei legami che si formano è uguale a quello che si rompono nello stesso periodo di tempo. La quantità dei legami che si formano potrà essere ricavata dalla seguente formula: Keq = [AB]/[A]x[B], dove Keq è la costante di equilibrio, e le altre sono concentrazioni.

Biologia molecolare

Pagina 15 di 173

Domenico Azarnia Tehran

Sezione Appunti

12. Il concetto di energia libera Ogni qualvolta viene modificata la quantità di atomi legati, in base ala costante di equilibrio, avviene sempre un cambiamento dei livelli energetici del sistema. Il modo più comunemente usato per esprimere questo cambiamento, dal punto di vista biologico, è attraverso il concetto chimico-fisico di energia libera, rappresenta dal simbolo G, che si definisce come quell'energia in grado di compiere lavoro. La seconda legge della termodinamica asserisce che nelle reazioni spontanee avviene sempre una diminuzione della quantità di energia libera (il valore di G è negativo). Quando si raggiunge l'equilibrio della reazione non si osserva più alcuna variazione di tale energia (G=0). In generale, l'energia libera che si perde per il raggiungimento dell'equilibrio viene trasformata in calore o utilizzata per aumentare l'entropia, ossia la quantità di disordine del sistema. Chiaramente, comunque, più forti sono i legami, e quindi maggiore è la variazione in energia libera (G), che accompagna la loro formazione, più grande è la quantità di atomi presenti in forma legata. Questo concetto è espresso, in modo quantitativo, dalla formula: G = -RTlnKeq o Keq = e-G/RT dove R è la costante universale dei gas, T è la temperatura assoluta, ln è il logaritmo (di Keq) in base e, e Keq è la costante di equilibrio ed e è pari a 2,718.

Biologia molecolare

Pagina 16 di 173

Domenico Azarnia Tehran

Sezione Appunti

13. I legami deboli nei sistemi biologici I legami deboli più rilevanti per i sistemi biologici sono: i legami di van der Waals, i legami idrofobici, i legami idrogeno e quelli ionici. I primi possiedono un energia (da 1 a 2 kcal/mol) solo leggermente superiore all'energia cinetica dei movimenti termici, mentre l'energia dei legami ionici e idrogeno è compresa fra 3 e 7 kcal/mol. Tutte le molecole sono in grado di formare legami di van der Waals, mentre i legami idrogeno e quelli ionici possono essere formati soltanto fra molecole che sono fornite di una carica netta (ioni), o sulle quali la carica non è uniformemente distribuita. Comunque, tutte le interazioni deboli sono basate su attrazioni tra cariche elettriche. La separazione delle cariche può essere permanente o temporanea. Ciò dipende dalle cariche elettriche coinvolte. Per esempio, nella molecola di ossigeno (O:O) i due atomi condivisi hanno una distribuzione simmetrica, così che ciascuno di essi non appare carico. Al contrario, nella molecola d'acqua (H:O:H) non vi è una distribuzione uniforme di cariche, infatti gli elettroni sono condivisi in modo ineguale. Essi sono attratti più fortemente dall'atomo di ossigeno, che, di conseguenza, ha una carica negativa piuttosto elevata, mentre la stessa carica (in questo caso positiva) è posseduta dai due atomi di idrogeno. Questa situazione è definita dipolo elettrico e le molecole con queste caratteristiche sono definite molecole polari. Le molecole non polari, invece, sono quelle che non presentano tale caratteristica, come per esempio il metano, in cui gli atomi di carbonio e idrogeno hanno affinità simili per gli elettroni, quindi non presentano cariche. In generale, i legami di van der Waals sono determinati da forze di attrazione non specifiche, che si creano quando due atomi si avvicinano l'uno all'altro. Essi sono basati sulle fluttuazioni di carica indotte dalla vicinanza reciproca fra molecole diverse, che possono essere sia polari che non polari. Le forze di van der Waals possono essere anche repulsive e si creano quando due molecole sono troppo vicine, in quanto abbiamo la sovrapposizione degli elettroni del guscio più esterno. Un legame idrogeno, invece, si forma tra un atomo di idrogeno donatore, covalentemente legato ad un altro atomo, avente carica positiva ed un atomo di idrogeno accettore, covalentemente legato ad un altro atomo, carico negativamente. Per esempio, gli atomi di idrogeno del gruppo amminico (-NH2) sono attratti dall'ossigeno del gruppo carbonilico (-C=O) carico negativamente. Comunque, il legami idrogeno biologicamente più importanti sono rappresentati da atomi di idrogeno legati ad atomi di ossigeno (O-H) o ad atomi di azoto (N-H). In assenza di molecole d'acqua, circostanti, l'energia dei legami idrogeno è compresa fra 3 e 7 kcal/mol, quindi, pur appartenendo alla categoria dei legami deboli, sono sufficientemente forti, in quanto vi è una notevole differenza di carica fra atomi donatori e accettori. In ogni caso, i legami idrogeno sono più deboli dei legami covalenti, anche se considerevolmente più forti di quelli di van der Waals. In condizioni fisiologiche, le molecole d'acqua esistono come molecole polari H-O-H, formando legami idrogeno molto forti fra gli atomi di idrogeno di una molecola e l'ossigeno di un'altra. In ciascuna molecola d'acqua, l'atomo di ossigeno di una molecola può legarsi a due atomi di idrogeno appartenenti ad altre due molecole, mentre ciascun atomo di idrogeno può legarsi ad un atomo di ossigeno di una molecola adiacente. Questi legami formano un tetraedro, così che, sia in forma liquida che in quella solida (ghiaccio), una singola molecola d'acqua tende ad averne altre quattro vicine. Come abbiamo detto precedentemente, l'energia dei legami idrogeno è molto più elevata di quella delle interazioni di van der

Biologia molecolare

Pagina 17 di 173

Domenico Azarnia Tehran

Sezione Appunti

Waals, così che le molecole formeranno preferenzialmente legami idrogeno. Se, però, proviamo a miscelare l'acqua con un composto che non forma legami idrogeno, come il benzene, le molecole d'acqua e quelle di benzene si separeranno immediatamente: le molecole d'acqua formeranno legami idrogeno mentre quelle di benzene rimarranno associate mediante interazioni di van der Waals. Invece, molecole polari, come il glucosio, che contengono un gran numero di gruppi in grado di formare legami idrogeno, sono solubili in acqua. Infatti, quando queste molecole si inseriscono nel reticolo formato dalle molecole d'acqua, si formano immediatamente legami idrogeno fra le molecole organiche polari e l'acqua stessa. In generale, quindi, la forte tendenza dell'acqua ad escludere i gruppi non polari è indicata come legame idrofobico, anche se non è propriamente corretto in quanto viene più che altro enfatizzata l'assenza di un legame. Mentre le molecole polari si legano all'acqua tramite legami idrofilici.

Biologia molecolare

Pagina 18 di 173

Domenico Azarnia Tehran

Sezione Appunti

14. L'importanza dei legami forti nei sistemi biologici Ogni specifica molecola è caratterizzata da una propria energia libera, che può differire in modo significativo da quella posseduta da un'altra molecola. Questa disparità è data dal fatto che i legami covalenti hanno diverse energie di legame. Per esempio, il legame covalente che si forma tra l'ossigeno e l'idrogeno è significativamente più forte del legame che unisce due atomi di idrogeno e due di ossigeno. Di conseguenza, la formazione di un legame O–H al posto di un legame O–O o di un legame H–H porta al rilascio di energia. Quindi, una molecola formata da legami covalenti deboli possiede una maggiore quantità di energia libera di una costituita dalla presenza di legami forti. Questo ragionamento appare sensato se si considera che un atomo che ha formato un legame molto forte ha già speso, in questo processo, gran parte della propria energia libera. Ne deriva che le migliori fonti di energia sono molecole caratterizzate da legami covalenti deboli termodinamicamente instabili. A questo punto, possiamo definire con il termine energia di attivazione quella che, durante una trasformazione molecolare, deve essere fornita per rompere il vecchio legame covalente. La reazione chimica richiede inizialmente una collisione tra le due molecole che reagiscono, seguita dalla formazione di un complesso molecolare transitorio, che viene definito stato attivato. Nello stato attivato, l'immediata vicinanza delle due molecole rende i legami di entrambe più labili e questo fa sì che l'energia necessaria per rompere un legame sia minore di quella necessaria a rompere il medesimo legame presente su una molecola libera. Di conseguenza, nelle cellule la maggior parte delle reazioni che coinvolgono i legami covalenti è descritta mediante la seguente equazione: (A–B) + (C–D) (A–D) + (C–B) L'espressione dell'azione di massa di questa reazione è: Keq = ([A–D]x[C–B ])/([A–B]x[C–D ]) In questa equazione il valore della Keq dipende dal valore di G secondo l'equazione: G = -RTlnKeq o Keq = e-G/RT Dato che l'energia di attivazione è generalmente tra le 20 e le 30 kcal/mol, gli stati attivati non vengono, in pratica, mai raggiunti alle normali temperature fisiologiche. Se ne deduce che l'alta energia di attivazione costituisce una barriera energetica che impedisce qualunque alterazione spontanea dei legami covalenti presenti nelle cellule. A questo punto, gli enzimi sono molecole assolutamente necessarie per la vita; la loro funzione consiste nell'accelerare la velocità delle reazioni chimiche essenziali per la cellula. In particolare, l'energia di attivazione di specifici riarrangiamenti molecolari viene abbassata dagli enzimi a valori che possono essere raggiunti mediante l'energia cinetica corrispondente al calore prodotto dai movimenti molecolari. La presenza di uno specifico enzima porta all'eliminazione di questa barriera energetica che, altrimenti, impedirebbe la rapida formazione di prodotti, caratterizzati da un contenuto minore di energia libera. Comunque, gli enzimi non influenzano mai l'equilibrio di una reazione; si limitano semplicemente, ad accelerare la velocità con cui l'equilibrio viene raggiunto.

Biologia molecolare

Pagina 19 di 173

Domenico Azarnia Tehran

Sezione Appunti

15. I legami deboli e forti determinano la struttura delle macromolecola: le proteine Le proteine rivestono ruoli molto importanti nel funzionamento di una cellula. Tra le diverse classi di proteine due assumono particolarmente rilievo: una è quella delle proteine catalitiche (enzimi), l'altra è quella delle proteine strutturali. Gli enzimi sono catalizzatori dell'ampia varietà di reazioni chimiche che avvengono nelle cellule. Le proteine strutturali, invece, costituiscono parte integrante di strutture cellulari, quali membrane, pareti o componenti citoplasmatiche. Le proteine, comunque, sono polimeri costituiti da amminoacidi legati covalentemente grazie a legami peptidici. Due amminoacidi legati tra loro costituiscono un dipeptide, tre un tripeptide, e così via. Quando una catena peptidica comprende molti amminoacidi si parla di polipeptide. Una proteina è costituita da uno o più polipeptidi. In generale, nelle proteine naturali si riscontrano comunemente 20 amminoacidi e il corpo umano può sintetizzarli tutti tranne nove. Quest'ultimi devono essere ricavati dalle proteine nella dieta e sono detti amminoacidi essenziali. Tutti gli amminoacidi, comunque, hanno una struttura di base simile: un atomo di carbonio centrale è legato ad un atomo di idrogeno, un gruppo amminico (-NH2) , un gruppo carbossilico (-COOH) e un gruppo di atomi chiamato “R” che è differente in ogni amminoacido. La struttura primaria di un polipeptide si identifica nella successione lineare degli amminoacidi che lo compongono. L'interazione tra i gruppi R dei singoli amminoacidi in un polipeptide costringe la molecola a torcersi e a ripiegarsi nello spazio in maniera specifica. Ciò porta alla formazione di strutture secondarie, come le -eliche e i foglietti . Una volta raggiunto un livello stabile di struttura secondaria, la catena polipeptidica continua a ripiegarsi, tentando di formare una molecola ancora più stabile. Questo processo di ripiegamento (folding) conduce alla struttura terziaria. Le proteine vengono a questo punto raggruppate in due grandi categorie: fibrose e globulari. Le prime sono insolubili in acqua e formano importanti componenti strutturali di cellule e tessuti (il collagene o la cheratina), mentre le seconde sono solubili in acqua e agiscono come trasportatrici dei lipidi insolubili nel sangue legandosi ad essi e rendendoli solubili. Comunque, la struttura terziaria finisce con l'esporre particolari regioni, e/o formare solchi o tasche nella molecola che assumono importanza per l'interazione con altre molecole. Bisogna ricordare che quando una proteina è costituita da due o più polipeptidi, e molte proteine lo sono, si utilizza il termine struttura quaternaria. Così quando una proteine è costituita da subunità identiche si parla di omodimero altrimenti di eterodimero.

Biologia molecolare

Pagina 20 di 173

Domenico Azarnia Tehran

Sezione Appunti

16. Caratteristiche strutturali del DNA La scoperta che il DNA è la più importante molecola nella quale risiedono tutte le informazioni genetiche, ha immediatamente richiamato l'attenzione sulla sua struttura, la cui conoscenza poteva rilevare con quale meccanismo il DNA porta i messaggi genetici che vengono trasmessi nel momento in cui i cromosomi si dividono per produrre due identiche copie di se stessi. La caratteristica più importante del DNA è quella di essere normalmente formato da due catene polinucleotidiche, avvolte l'una all'altra nella forma a doppia elica. Per prima cosa, volendo studiare la struttura del DNA, consideriamo la struttura del nucleotide, il costituente fondamentale di questa macromolecola. Un nucleotide consiste di un fosfato legato ad uno zucchero, il 2'-deossiribosio (in quanto in posizione 2' manca un gruppo ossidrilico e sono presenti due atomi di idrogeno), a cui è attaccata una base. Lo zucchero unito alla sola base forma un nucleoside. Aggiungendo un fosfato (o più di uno) ad un nucleoside, invece, si ottene il nucleotide. Questa molecola è prodotta, quindi, mediante la formazione di un legame glicosidico, fra la base e lo zucchero ed un legame fosfodiesterico fra la base e l'acido fosforico. I nucleotidi sono, a loro volta, legati l'uno all'altro in catene polinucleotidiche per mezzo dell'ossidrile presente in posizione 3' del 2'-deossiribosio di un nucleotide ed il fosfato attaccato al carbonio 5' di un altro nucleotide. Questo è un legame fosfodiestere (o fosfodiesterico) in cui il fosfato fra i due nucleotidi è unito ad uno zucchero esterificato mediante l'ossidrile al 3' ed un secondo zucchero esterificato mediante l'ossidrile in posizione 5'. Il legame fosfodiesterico crea un'impalcatura ripetitiva zucchero-fosfato, che è una caratteristica strutturale del DNA. Al contrario, l'ordine delle basi, lungo la catena polinucleotidica è casuale. Le basi del DNA, invece, appartengono a due differenti categorie: le purine e le pirimidine. Alle purine appartengono l'adenina e la guanina mentre le pirimidine sono la citosina e la timina. Ciascuna base esiste in due conformazioni tautomeriche. Gli atomi di azoto attaccati agli anelli purinici e pirimidinici sono in forma amminica nella maggior parte dei casi e soltanto raramente assumono la conformazione imminica. Allo stesso modo, gli atomi di ossigeno attaccati alla guanina e alla timina, sono nella maggior parte dei casi in forma cheto e solo raramente assumono la configurazione enolica. Comunque, nell'elica l'adenina di una catena è sempre appaiata con la timina che si trova sull'altra catena e, parallelamente, la guanina è sempre appaiata con la citosina. I due filamenti hanno la stessa geometria nel formare l'elica, ma le basi formano le coppie con una polarità opposta. Cioè, la base al terminale 5' di un filamento è appaiata con la base al terminale 3' dell'altro filamento. Si dice che i due filamenti hanno un orientazione antiparallela. Questa orientazione è una conseguenza stereochimica dell'accoppiamento A:T e G:C. In maniera più dettagliata, una coppia G:C possiede tre legami idrogeno, poiché il gruppo esociclico NH2 del C2 della guanina può formare un legame idrogeno con un gruppo carbonilico in posizione C2 della citosina. Allo stesso modo, un legame idrogeno si può formare fra N1 della guanina e N3 della citosina e fra il gruppo carbonilico in C6 della guanina con l'NH2 esociclico in C4 della citosina. I legami idrogeno fra le basi complementari sono una caratteristica fondamentale della doppia elica, contribuendo alla stabilità termodinamica dell'elica ed alla specificità delle coppie di basi.

Biologia molecolare

Pagina 21 di 173

Domenico Azarnia Tehran

Sezione Appunti

17. I bordi del DNA Applicando la regola della direzione delle mani, possiamo vedere che ciascuna delle catene polinucleotidiche della doppia elica gira in senso destrogiro. Immaginiamo la nostra mano destra vicino alla molecola del DNA, tenendo il pollice verso l'alto, parallelo all'asse longitudinale della doppia elica e le dita che seguono i solchi dell'elica. Seguite le direzioni, lungo un filamento dell'elica, indicata dal pollice: così facendo state scorrendo lungo l'elica nella stessa direzione indicata dalla posizione delle dita. Questo non accade utilizzando la mano sinistra. Il risultato del fatto che il DNA è formato da due catene che assumono la forma ad elica è che ci troviamo di fronte ad un lungo polimero che presenta due solchi con dimensioni differenti l'uno rispetto all'altro. Quando moltissime basi si impilano l'una sull'altra, l'angolo meno ampio che si forma fra gli zuccheri da una parte della coppia genera il solco minore, mentre l'angolo più grande presente dall'altra parte della coppia crea il solco maggiore. I bordi di ciascun paio di basi si affacciano nei solchi maggiore e minore creando un sistema di donatori e accettori di legami idrogeno e superfici di van der Waals che permettono di specificare la coppia di basi. I bordi della coppia di A:T presentano nell'ordine i seguenti gruppi chimici nel solco maggiore: un accettore di legami idrogeno (l'N7 dell'adenina), un donatore di legami idrogeno (il gruppo amminico sul C6 dell'adenina), un accettore di legami idrogeno (il gruppo carbonilico sul C4 della timina) e una superficie idrofobica (il gruppo metilico sul C5 della timina). Analogamente, i bordi della coppia di basi G:C mostrano la presenza, nel solco maggiore, dei seguenti gruppi: un accettore di legami idrogeno (l'N7 della guanina), un accettore di legami idrogeno (il gruppo carbonilico sul C6 della guanina), un donatore di legami idrogeno (il gruppo amminico sul C4 della citosina), un idrogeno non polare (l'idrogeno in C5 della citosina). Possiamo, quindi, pensare a queste proprietà come un codice in cui A rappresenta un accettore di legami idrogeno, D un donatore di legami idrogeno, M un gruppo metilico ed H un idrogeno non polare. In questo codice, ADAM posto nel solco maggiore rappresenta una coppia di basi A:T, e AADH sta per una coppia G:C; allo stesso modo MADA rappresenta la coppia T:A mentre HDAA quella G:C. Queste situazioni sono importanti perché permettono alle proteine di riconoscere senza ambiguità specifiche sequenze di DNA senza che sia necessario aprire o rompere la doppia elica. Il solco minore, invece, non è così ricco di informazioni e qualsiasi informazione possa fornire è meno utilizzabile per distinguere le coppie di basi. La piccola dimensione del solco è meno utilizzabile per accogliere i gruppi laterali degli amminoacidi. Le varie coppie tra le basi sono, viste dal solco minore, simili l'una all'altra. In codice abbiamo AHA sia per le coppie A:T che per T:A e ADA sia per G:C che per C:G.

Biologia molecolare

Pagina 22 di 173

Domenico Azarnia Tehran

Sezione Appunti

18. Forme A e B del Dna I primi studi di diffrazione ai raggi X, eseguiti su soluzioni concentrate di DNA, rilevarono due tipi differenti di struttura: le forme B ed A. La forma B, che è osservata quando il DNA si trova in una soluzione ad altro grado di umidità, è quella che più si avvicina alla struttura fisiologica: contiene 10 paia di basi per giro d'elica, ha un ampio solco maggiore e un solco minore più chiuso. La forma A, invece, che si ottiene da una soluzione a più basso contenuto d'acqua, ha 11 paia di basi per giro d'elica; il suo solco maggiore è più stretto rispetto alla forma B mentre quello minore è più aperto. La maggior parte del DNA presente nelle cellule è nella forma B mentre la forma A si trova specialmente in corrispondenza di complessi con proteine. Bisogna ricordare che la forma B, comunque, rappresenta una struttura ideale che differisce per alcune caratteristiche rispetto a quella esistente in natura come ad esempio le 10,5 paia di basi per giro d'elica, e non le 10 osservate in vitro, e la torsione delle coppie di basi purine e pirimidine che possono assumere diverse rotazioni e possono dar luogo a diversi angoli che renderanno irregolare la doppia elica. In DNA inoltre si riscontra anche in forma levogira. Per considerare questa conformazione bisogna considerare il legame glicosidico che lega la base sulla posizione 1' del 2'-deossiribosio. Questo legame può presentarsi in una delle due conformazioni chiamate sin e anti. Nella conformazione destrogira il legame glicosidico è sempre nella posizione anti, mentre nella forma levogira, vi sono delle fondamentali ripetizioni di dinucleotidi purine-pirimidine che presentano il legame glicosidico nella forma anti sui residui pirimidinici e nella forma sin sui residui purinici. È questa forma sin che è responsabile dell'avvolgimento in senso levogiro dell'elica. La forma sin presente sul residuo purinico alternata ad una forma anti-sin determina la caratteristica conformazione a zig-zag del DNA levogiro, detto DNA Z.

Biologia molecolare

Pagina 23 di 173

Domenico Azarnia Tehran

Sezione Appunti

19. La replicazione del DNA Poiché i due filamenti della doppia elica sono tenuti assieme mediante legami (non covalenti) relativamente deboli, possiamo aspettarci che i due filamenti possano dividersi facilmente. Infatti, la struttura della doppia elica suggerisce che la replicazione del DNA possa avvenire appunto in questo modo. I filamenti complementari della doppia elica possono anche essere separati quando una soluzione di DNA viene scaldata sopra la temperatura fisiologica.(vicino a 100 °C) o posta in condizioni di elevato pH: questo processo è conosciuto come denaturazione. Comunque la separazione dei filamenti di DNA è un processo reversibile. Quando la temperatura della soluzione di DNA denaturato viene abbassata lentamente, i singoli filamenti spesso incontrano quelli complementari e riformano una regolare doppia elica. La possibilità di rinaturare filamenti di DNA complementari permette la formazione di molecole ibride artificiali semplicemente abbassando la temperatura di una miscela di DNA denaturato provenienti da forme diverse. Allo stesso modo possiamo formare ibridi mescolando filamenti complementari di DNA e RNA. La denaturazione del DNA, comunque, può essere monitorata misurando l'assorbimento di raggi ultravioletti da parte di una soluzione di DNA. Il DNA ha un massimo di assorbimento alla luce ultravioletta a 260 nm: le basi sono le principali responsabili di questo assorbimento. Quando la temperatura di una soluzione di DNA è portata vicino al punto di ebollizione dell'acqua, la densità ottica, assorbanza, misurata a 260 nm, aumenta in modo considerevole. Questo fenomeno è conosciuto come ipercromicità della molecola del DNA ed è dovuta all'impilamento delle basi che essendo schermate dagli zuccheri-fosfato dell'impalcatura della doppia elica sono meno esposte e quindi assorbono meno luce ultravioletta. Se mettiamo in grafico l'assorbanza in funzione della temperatura, osserviamo che l'aumento della luce assorbita avviene ad una ben determinata temperatura seguendo un andamento sigmoidale. Il punto di flesso di questa curva è il punto di fusione o Tm della molecola. Come il ghiaccio, il DNA fonde e va incontro ad una transizione che lo porta da una struttura a doppia elica altamente ordinata ad una struttura molto meno ordinata: il singolo filamento. La temperatura di fusione è caratteristica per ciascun DNA ed è largamente determinata dal contenuto di G:C e dalla forza ionica della soluzione. Più alta è la percentuale di coppie di basi G:C (e quindi più basso il contenuto in A:T) più alta è la temperatura di fusione, in quanto le coppie G:C contengono tre legami idrogeno, mentre A:T solo due. Allo stesso modo, maggiore è la concentrazione salina della soluzione, più alta è la temperatura a cui il DNA denatura. In quanto ad alta forza ionica, le cariche negative, portate dai gruppi fosforici del DNA, sono protette dai cationi e ciò permette di stabilizzare la doppia elica. Viceversa a bassa forza ionica le cariche negative non sono protette e quindi la doppia elica risulta più instabile.

Biologia molecolare

Pagina 24 di 173

Domenico Azarnia Tehran

Sezione Appunti

20. La topologia del DNA Nelle molecole lineari di DNA, poiché le terminazioni sono libere, il numero di avvolgimenti di un filamento attorno all'altro filamento può essere variato mediante la rotazione reciproca. Ma se le estremità della molecola sono legate covalentemente l'una all'altra a formare una struttura circolare, il numero di volte che un filamento gira attorno all'altro filamento non può cambiare. Questo DNA circolare covalentemente chiuso viene indicato come una struttura topologicamente definita. Anche le molecole di DNA lineari presenti nei cromosomi eucariotici sono sottoposte a costrizioni topologiche per via dell'estrema lunghezza della molecola che viene ridotta attraverso la formazione della cromatina e l'interazione con altri componenti cellulari. Se torniamo a considerare le proprietà topologiche dei DNA circolari covalentemente chiusi (cccDNA), possiamo definire con il termine linking number, o numero di legame topologico, il numero di volte che un filamento deve essere passato attraverso l'altro filamento affinché le due catene possano separarsi l'una dall'altra. Questo parametro, il linking number è la somma di due componenti geometriche, il twist (avvolgimento) ed il writhe (superavvolgimento). Il primo è semplicemente il numero di volte che un filamento gira intorno all'altro filamento. Se consideriamo un cccDNA con struttura planare, cioè che giace su un piano, il linking number è uguale al twist. In questo caso il numero di twist può essere facilmente determinato contando il numero di volta che i due filamenti si incrociano su se stessi. Il modo in cui i due filamenti si incrociano (twist) in una doppia elica destrogira è definito positivo: in questo caso il linking number avrà un valore positivo. Però i cccDNA normalmente non hanno una conformazione planare, ma presentano generalmente delle tensioni torsionali che impongono all'asse longitudinale della doppia elica di incrociarsi su se stessa, a volte anche ripetutamente, determinando così una struttura tridimensionale. Questo incrocio viene definito writhe. Quest'ultimo può presentarsi in due forme diverse: una, la così detta interwound o writhe plectonemico, in cui l'asse longitudinale della doppia elica è avvolto su se stesso; l'altra forma è un toroide o spirale in cui l'asse longitudinale è avvolto come attorno ad un cilindro e normalmente si ha quando il DNA si avvolge attorno ad una proteina. Quindi, il numero di writhe (Wr) rappresenta il numero di incroci dell'asse longitudinale su se stesso e/o il numero di spirali nel cccDNA. Esiste una sola limitazione: la somma del numero di twist (Tw) e del numero di writhe (Wr) deve essere sempre uguale al linking number (Lk): Lk = Tw + Wr. Ad esempio, se consideriamo un cccDNA privo di superavvolgimenti (che abbiamo definito rilassato) il suo twist corrisponde a quello del DNA in forma B in condizioni fisiologiche (circa 10,5 paia di basi per giro d'elica). Il linking number (Lk) di questo DNA è indicato dal simbolo Lk0. Lk0 per questo DNA è pari al numero delle paia di basi contenute nel DNA diviso 10,5. Per un cccDNA di 10500 paia di basi Lk sarà uguale a +1000 (il segno è positivo poiché il DNA è avvolto in senso destrogiro). Gli eventuali superavvolgimenti presenti su un cccDNA non rilassato, invece, possono essere rimossi con l'enzima Dnasi I, che idrolizza uno, o pochi, legami fosfodiesterici in ciascuna molecola. Una volta che il DNA è stato interrotto, ovvero si forma un nick (per nick si intende l'interruzione di un legame fosfodiesterico su un solo filamento della doppia elica) esso non è più topologicamente costretto e i due filamenti possono liberamente ruotare l'uno rispetto all'altro. Se il nick viene riparato, il cccDNA sarà rilassato ed avrà un Lk uguale a Lk0. La quantità di superavvolgimenti di un cccDNA è come la differenza esistente fra Lk e Lk0: questa differenza viene chiamata differenza linking: lk = Lk – Lk0. Se il lk di un

Biologia molecolare

Pagina 25 di 173

Domenico Azarnia Tehran

Sezione Appunti

cccDNA è diverso da zero la molecola è sottoposta a torsione e quindi si presenta superavvolta, se è minore si zero è superavvolto negativamente se invece è maggiore di zero la molecola è superavvolta positivamente. Poiché, però, lk e Lk0 sono dipendenti dalla lunghezza del DNA, è più semplice esprimere il superavvolgimento della molecola come densità di superelica a cui viene assegnato il simbolo ed è definita come: = lk/Lk0. Le molecole di DNA circolare sia batteriche che eucariotiche sono normalmente superavvolte negativamente con un valore di di circa -0,06. In questo modo, nei DNA superavvolti la separazione dei due filamenti è più favorita piuttosto che nel DNA rilassato. Il DNA nel nucleo delle cellule eucariotiche è compattato in piccole particelle conosciute come nucleosomi in cui la doppia elica è avvolta per circa due giri attorno ad un nucleo proteico. Questo tipo di avvolgimento non è altro, dal punto di vista geometrico, che un toroide o spirale che si avvolge con un andamento levogiro. Il linking number di questi superavvolgimenti può essere cambiato solamente provocando una interruzione dei legami fosfodiesterici di almeno una delle due catene del DNA. Una categoria di enzimi, conosciuti come topoisomerasi, sono in grado di introdurre una rottura del singolo o del doppio filamento del DNA in modo temporaneo. Le topoisomerasi appartengono a due classi principali: le topoisomerasi II permettono di cambiare il numero di legami di due unità per volta determinando una rottura temporanea dei due filamenti del DNA attraverso la quale può passare un tratto di elica integra, prima che il taglio venga risaldato. Le topoisomerasi I, invece, permettono di cambiare il numero di legame di un'unità per volta. Esse producono una rottura a singolo filamento della doppia elica, permettendo in questo modo al filamento integro di passare attraverso la rottura dell'altro prima che il nick venga eliminato. Il taglio della molecola di DNA avviene quando un residuo di tirosina presente nel sito catalitico dell'enzima attacca un legame fosfodiesterico dell'impalcatura della molecola di DNA bersaglio. Questo attacco causa una rottura del DNA in seguito alla formazione di un legame covalente tra la topoisomerasi e un terminale fosfato del nick e la tirosina. L'altra estremità del nick, che termina con un gruppo OH, è tenuta molto saldamente dall'enzima. Il legame fosfo-tirosina conserva l'energia che viene liberata dall'idrolisi del legame fosfodiesterico. Di conseguenza, il DNA può essere risaldato semplicemente tornando indietro nella reazione: il gruppo OH esistente al terminale del nick attacca il legame fosfo-tirosina riformando il legame fosfodiesterico del DNA. In maniera più dettagliata, dopo aver effettuato il taglio, la topoisomerasi è sottoposta ad un grande cambiamento strutturale che crea un'apertura sul filamento tagliato, con l'enzima che si pone a ponte sull'interruzione. Il secondo filamento di DNA non tagliato passa quindi attraverso l'apertura e si lega ad un sito interno simile ad un incavo della proteina. Avvenuto il passaggio, si ha un secondo cambiamento di struttura a carico del complesso topoisomerasi-DNA che porta indietro le estremità del filamento interrotto. La saldatura del filamento avviene, come dicevo prima, con l'intervento del gruppo OH sul legame fosfotirosina. Dopo questa reazione, l'enzima può aprirsi un'ultima volta per rilasciare il DNA. Comunque, sia i procarioti che gli eucarioti posseggono topoisomerasi I e II che sono in grado di rimuovere i superavvolgimenti presenti sulle molecole di DNA. In aggiunta, però, i procarioti posseggono una speciale topoisomerasi II conosciuta come DNA girasi che introduce, invece di rimuovere, superavvolgimenti negativi. La DNA girasi è responsabile del superavvolgimento negativo dei cromosomi dei procarioti. Le molecole di DNA circolari covalentemente chiuso aventi la stessa lunghezza ma linking number differente sono chiamate topoisomeri. Anche se i topoisomeri hanno la stessa grandezza molecolare possono

Biologia molecolare

Pagina 26 di 173

Domenico Azarnia Tehran

Sezione Appunti

essere separati l'uno dall'altro per elettroforesi su gel di agarosio. La base di questa separazione è che più elevato è il numero di writhe più compatta è la struttura del cccDNA. Ma più compattata è la molecola, più veloce è la sua migrazione attraverso la matrice del gel. Di conseguenza, un cccDNA completamente rilassato migra molto più lentamente di un suo topoisomero fortemente superavvolto. Un altro metodo per visualizzare il DNA superavvolto è l'utilizzo dell'etidio, un catione formato da più anelli aromatici che avendo una struttura planare riesce a scivolare e intercalarsi tra le coppie di basi impilate l'una sull'altra del DNA. Poiché esso è fluorescente quando esposto alla luce ultravioletta, l'etidio viene utilizzato come colorante per per visualizzare il DNA. Quando, però, lo ione etidio si intercala fra due coppie di basi, causa al DNA uno srotolamento della doppia elica di 26° riducendo di conseguenza il twist. Quindi, in un DNA circolare diminuendo il twist automaticamente si aumenterà il writhe, poiché il linking number non cambia (Lk = Tw + Wr). In altre parole, all'aggiunta dell'intercalante avremo un DNA più rilassato. Se la quantità di etidio aumenta, il numero di superavvolgimenti potrà raggiungere lo zero; aumentando ancora la quantità di etidio Wr diventerà maggiore di zero ed il DNA conseguentemente diventerà superavvolto positivamente. Naturalmente l'etidio modificherà anche, come ben si può capire, la migrazione elettroforetica.

Biologia molecolare

Pagina 27 di 173

Domenico Azarnia Tehran

Sezione Appunti

21. La struttura dell' RNA L'RNA differisce dal DNA per tre caratteristiche: (1) l'impalcatura fondamentale contiene ribosio invece del 2'-deossiribosio. Il ribosio ha un gruppo ossidrilico in posizione 2'; (2) secondo, l'RNA contiene uracile al posto della timina. L'uracile ha la stessa struttura con un singolo anello aromatico come la timina ma manca del gruppo metilico in posizione 5; (3) terzo, l'RNA è normalmente una singola catena polinucleotidica ed eccetto il caso di alcuni virus, esso non rappresenta il materiale genetico e non viene utilizzato come stampo per la sua propria replicazione, come accade per il DNA: Comunque, nonostante, l'RNA sia un singolo filamento, spesso può presentare dei tratti a doppia elica. Questo dipende dal fatto che questo polimero molto spesso si ripiega su se stesso per formare coppie d basi fra sequenze complementari. Se i due tratti di sequenze complementari si trovano vicine l'una all'altra, l'RNA può assumere una delle varie strutture a stem-loop in cui la parte di polimero non complementare che si trova in mezzo ai due tratti complementari sporge fuori dalla zona a doppia elica, formando struttura a “forcina per capelli”, a “gemma”, ad “ansa semplice” (loop). La stabilità di queste strutture viene in alcuni casi aumentata da speciali proprietà del loop come, per esempio, la presenza della sequenza UUCG. Inoltre, un'ulteriore caratteristica dell'RNA è la sua propensione a formare strutture a doppia elica utilizzando un appaiamento delle basi diverso da quello di Watson e Crick: per esempio, la coppia G:U, tenuta insieme da due legami idrogeno. Questa eccezione permette all'RNA di formare doppie eliche intramolecolari, anche se normalmente non sono molto lunghe. Quindi, non dovendo formare lunghe eliche regolari, l'RNA è libero di ripiegarsi nelle più diverse strutture terziare. Ciò può avvenire poiché l'RNA ha la possibilità di ruotare molto facilmente attorno ai legami fosfodiesterici dei tratti che non formano doppia elica. Un'ultima caratteristica dell'RNA è la sua attività enzimatica. Questi RNA sono conosciuti come ribozimi e posseggono molte delle caratteristiche degli enzimi rappresentati da proteine, come il sito attivo e il sito di legame per il substrato. Uno dei primi ribozimi ad essere scoperto è stata la RNAsi P, una ribonucleasi coinvolta nella formazione dei tRNA a partire da precursori di RNA di grandezza superiore rispetto alla molecola matura. La RNAsi P è composta sia da RNA che da proteine: in questo complesso nucleoproteico, comunque, l'attività catalitica risiede sull'RNA. Infatti, la parte dell'enzima rappresentata dall'RNA è in grado di catalizzare il taglio del tRNA precursore anche in assenza della parte proteica. Altri ribozimi possono catalizzare reazioni di transesterificazione coinvolte nella rimozione di sequenza conosciute come introni da alcuni precursori di mRNA, tRNA e di RNA ribosomiali mediante un processo conosciuto come splicing dell'RNA.

Biologia molecolare

Pagina 28 di 173

Domenico Azarnia Tehran

Sezione Appunti

22. Metodi di solubilizzazione La cellula vivente è un'entità straordinariamente complicata, che produce migliaia di macromolecole e che ospita un genoma che può variare da milioni a miliardi di paia di basi. La comprensione del funzionamento dei processi genetici della cellula richiede approcci sperimentali potenti ed integrati, incluso l'uso di organismi modello adatti, in cui sia possibile fare uso dell'analisi genetica. Tali approcci includono anche metodi per la separazione di singole macromolecole dalle miscele cellulari e la dissezione del genoma in frammenti sufficientemente piccoli da essere manipolati ed analizzati a livello di sequenze di DNA specifiche. Comunque, in generale, ogni molecola, sia essa proteina, acido nucleico o carboidrati, può essere separata dalle altre molecole in base alle differenze di qualche caratteristica fisica. La prima tappa del procedimento di isolamento di una proteina o di qualsiasi altra molecola biologica è quella di portarla in soluzione. In alcuni casi, come per le proteine del siero sanguigno, la natura ha già svolto per noi questo lavoro. La maggior parte delle proteine deve però essere liberata dalle cellule che la contiene. Se la proteina che ci interessa è localizzata nel citoplasma della cellula, la sua liberazione richiede soltanto l'apertura (lisi) della cellula. Il metodo più semplice e meno traumatico per ottenere ciò è quello noto come lisi osmotica, in cui la cellula viene posta in una soluzione ipotonica, cioè in una soluzione in cui la concentrazione totale dei soluti è più bassa di quella presente nella cellula in condizioni fisiologiche. Sotto l'influenza della forza osmotica, l'acqua diffonde nella soluzione intracellulare più concentrata, causando il rigonfiamento e l'esplosione della cellula stessa. Questo metodo è particolarmente idoneo per le cellule di origine animale, ma è inefficace con le cellule che possiedono parete cellulare come i batteri e le cellule vegetali. In questi casi è più efficace l'uso di un enzima come il lisozima che degrada chimicamente la parete cellulare dei batteri. Per altri tipi cellulari, invece, vi è bisogno di una sorta di distruzione meccanica. Questi trattamenti comprendono la macinazione in presenza di sabbia o di allumina, di una pressa oppure di della sonicazione, con cui le cellule vengono rotte dalle vibrazioni ultrasoniche. Una volta che le cellule sono state rotte, il lisato grezzo può essere filtrato o centrifugato per allontanare le parti di cellule ancora intatte, lasciando quindi la proteina che ci interessa nel sopranatante. Se questa proteina è una componente di struttura subcellulare come la membrana o i mitocondri, è possibile ottenere un notevole grado di purificazione della proteina in esame separando per prima cosa la struttura subcellulare da tutto il materiale cellulare. Ciò può essere effettuato mediante la centrifugazione differenziale, un processo un cui il lisato cellulare viene centrifugato ad una velocità che determina la sedimentazione soltanto dei componenti cellulari più densi, seguita da una seconda centrifugazione che sedimenta gli organelli meno densi. Esistono vari tipi di centrifughe ma i più comuni sono ad angolo fisso o quelle basculanti. A questo punto nel caso la proteina sia saldamente legata alla membrana viene solubilizzata, dal componente cellulare purificato mediante detergenti o con solventi organici, come il butanolo e il glicerolo, che solubilizzano i lipidi. Un altro modo per separare le macromolecole in base al loro peso molecolare è quello della stratificazione, in cui il materiale da analizzare viene caricato sopra un gradiente di un sale o di saccarosio. In questo modo, dopo un ciclo di centrifugazione, il campione par arrivare in fondo alla provetta passerà attraverso un gradiente di concentrazione e si stratificherà. Quindi le componenti più pesanti si troveranno in basso e quelle più leggere in alto. Se poi buchiamo il fondo, vedremo uscire prima le componenti con peso molecolare

Biologia molecolare

Pagina 29 di 173

Domenico Azarnia Tehran

Sezione Appunti

maggiore e così via, fino a quelle più leggere. Per esempio, quando vogliamo estrarre del DNA batterico, per prima cosa facciamo crescere i batteri in un brodo di coltura per poi romperle con una lisi, ad esempio, con NaOH. A questo punto per prelevare solo il DNA e separarlo dai contaminanti (RNA e proteine) o utilizziamo molecole come l'RNAsi per degradare l'RNA e altre molecole per le proteine oppure, il metodo più usato, è l'estrazione con fenolo. Il fenolo è un solvente apolare che non essendo solubile in acqua, in provetta va a formare, essendo più denso, una fase in cui le proteine, essendo costituite sia da amminoacidi polari che apolari, si stratificano tra il fenolo e l'acqua, esponendo le parti apolari verso il fenolo e quelle polari verso l'acqua. In questo modo prelevando solo lo strato acquoso avremo solo l'RNA e il DNA. Se, poi, aggiungiamo l'etanolo, il DNA precipita sempre dopo centrifugazione. Aspetteremo che l'etanolo evapora, per avere solo il DNA batterico.

Biologia molecolare

Pagina 30 di 173

Domenico Azarnia Tehran

Sezione Appunti

23. Separazione di proteine Nel 1903, il botanico russo Mikhail Tswett ha descritto la separazione dei pigmenti delle foglie delle piante in soluzione mediante l'uso di assorbenti solidi. Egli chiamo questo processo cromatografia. I moderni metodi di separazione usano tutti procedimenti cromatografici. In tutti questi sistemi, la miscela di sostanze che deve essere frazionata viene disciolta in un fluido liquido o gassoso chiamato fase mobile. La soluzione viene poi percolata attraverso una colonna costituita da una matrice porosa solida che in alcuni tipi di cromatografia può avere un liquido legato a sé, e che viene chiamata fase stazionaria. Le interazioni che si generano tra ogni singolo soluto e la fase stazionaria tendono a ritardare il passaggio del soluto attraverso la matrice solida in un modo che rispecchia le proprietà del soluto stesso. I vari metodi cromatografici vengono classificati sulla base delle proprietà delle loro fasi mobili e stazionarie. Per esempio, nella cromatografia gas-liquido, la fase mobile e stazionaria sono rispettivamente un gas e un liquido, mentre nella cromatografia liquido-liquido esse sono liquidi non-miscibili, uno dei quali è legato ad un supporto solido inerte. I metodi cromatografici possono essere classificati anche sulla base delle interazioni principali che si generano tra la fase stazionaria e le sostanze che devono essere separate. Per esempio, se le forze ritardanti hanno un carattere ionico, la tecnica di separazione viene detta cromatografia a scambio ionico, mentre, se il ritardo è dovuto ad un assorbimento del soluto sulla fase stazionaria, la tecnica viene detta cromatografia per assorbimento.

Biologia molecolare

Pagina 31 di 173

Domenico Azarnia Tehran

Sezione Appunti

24. Cromatografia a scambio ionico Nel processo di scambio ionico, gli ioni che sono legati alla matrice insolubile e chimicamente inerti vengono rimpiazzati reversibilmente dagli ioni presenti nella soluzione: R+A- + BR+B- + AR+ rappresenta uno scambiatore di anioni che può legare sia A- che B-, gli anioni in soluzione. Gli scambiatori cationici hanno un comportamento simile, ma hanno cariche negative e legano reversibilmente cationi. I polianioni ed i policationi si legano quindi rispettivamente a scambiatori di anioni e a scambiatori di cationi. Le proteine e altri polielettroliti (polimeri poliionici) che contengono gruppi carichi, sia positivamente che negativamente, si possono legare a scambiatori di cationi o a scambiatori di anioni a seconda della loro carica netta. L'affinità con cui un dato polielettrolita si lega ad uno scambiatore ionico dipende dalle sue caratteristiche e dalle concentrazioni di altri ioni in soluzione che possono competere con i siti di legame del polielettrolita allo scambiatore. L'affinità di legame del polielettrolita che ha gruppi acidi e basici dipende anche dal pH in quanto la carica di questi gruppi varia con il pH. In questo modo, le proteine che non si legano in queste condizioni allo scambiatore, possono essere allontanata lavando lo scambiatore con il tampone in cui era stata disciolta la miscela di proteine. La proteina da purificare può essere staccata successivamente dallo scambiatore ionico con un tampone avente un pH o una concentrazione salina che riduca l'affinità di legame di questa proteina per lo scambiatore. L'efficienza di questo metodo di purificazione può essere aumentata se lo scambiatore ionico insolubile viene posto in una colonna. Proteine diverse si legano allo scambiatore ionico con affinità diversa. Quando la colonna viene lavata, un processo chiamato eluzione, le proteine con un'affinità relativamente bassa per lo scambiatore ionico si muovono lungo la colonna più velocemente delle proteine che si legano allo scambiatore ionico con un'affinità più elevata. Questo avviene perché l'avanzare di una data proteina lungo la colonna viene ostacolata rispetto al passaggio del solvente dalle interazioni che si generano tra la molecola proteica e lo scambiatore di ioni. Più alta è l'affinità di legame di una proteina per lo scambiatore ionico, più essa viene ritardata sulla colonna. Comunque i processi di purificazione possono essere migliorati se le proteina vengono staccate dalla colonna con il metodo della eluzione con gradienti. In questo modo, la concentrazione salina o il pH della soluzione che attraversa la colonna viene continuamente variata e le diverse proteine che sono legate allo scambiatore ionico vengono eluite sequenzialmente. Questo procedimento porta a separazioni delle proteine migliori di quelle che si possono ottenere con altri metodi più semplici.

Biologia molecolare

Pagina 32 di 173

Domenico Azarnia Tehran

Sezione Appunti

25. Cromatografia su carta La cromatografia su carta ha avuto un ruolo importantissimo nelle analisi biochimiche. Essa viene usata di solito per la separazione di piccole molecole come gli amminoacidi e gli oligopeptidi. Nella cromatografia su carta alcune gocce della soluzione contenente una miscela dei composti che devono essere separati vengono applicate a circa 2 cm dall'estremità di una striscia di carta da filtro. Dopo aver asciugato, quell'estremità della carta viene immersa in una miscela di solventi costituita da componenti acquosi e organici. Il solvente si muove per capillarità lungo la carta per la natura fibrosa della carta stessa. La direzione della migrazione del solvente può essere verso l'alto (cromatografia ascendente) o verso il basso (cromatografia discendente). La componente acquosa del solvente si lega alla cellulosa della carta e quindi forma con essa una fase stazionaria simile ad un gel. La componente organica del solvente continua la sia migrazione formando la fase mobile. La velocità di migrazione delle varie sostanze che devono essere separate dipende dalla loro solubilità relative nella fase stazionaria polare e nella fase mobile non polare. In una singola tappa del processo di separazione, un dato soluto si distribuisce tra la fase mobile e la fase stazionaria sulla base del suo coefficiente di partizione, una costante di equilibrio definita come: Kp = concentrazione nella fase stazionaria / concentrazione nella fase mobile Le molecole vengono quindi separate sulla base della loro polarità; le molecole non polari si muoveranno più velocemente di quelle polari. Dopo che il fronte del solvente ha percorso una certa distanza, il cromatogramma viene tolto dal solvente ed asciugato. A questo punto si analizzano i materiali separati, che se non sono colorati possono essere individuati attraverso alcuni metodi come il marcamento con radioisotopi o materiali fluorescenti. Una miscela complessa, che non viene completamente separata da una singola cromatografia su carta, invece, viene spesso completamente risolta da una cromatografia su carta bidimensionale. In questa tecnica, il cromatogramma viene eseguito come è stato descritto prima, con l'eccezione che il campione viene depositato in un angolo del foglio di carta da filtro e il soluto viene fatto correre parallelamente ad un lato della carta. Dopo aver completato questa fase ed asciugata la carta, il cromatogramma viene ruotato di 90° e ripetuta la corsa cromatografica parallelamente al secondo lato della carta usando un altro sistema di solventi. Poiché ogni composto migra ad una velocità caratteristica in un dato sistema di solventi, la seconda fase cromatografica aumenterà fortemente la separazione della miscela nei suoi componenti.

Biologia molecolare

Pagina 33 di 173

Domenico Azarnia Tehran

Sezione Appunti

26. Cromatografia per gel filtrazione Nella cromatografia per gel filtrazione, detta anche cromatografia ad esclusione molecolare oppure a setaccio molecolare, le molecole vengono separate in base alle loro dimensioni ed alla loro forma. In questa tecnica la fase stazionaria è costituita da sferette di materiale idrato, simile ad una spugna, contente pori che possono essere attraversati soltanto da molecole con certe dimensioni. In questo modo, le molecole con dimensioni troppo grandi saranno escluse dal volume di solvente presente all'interno dei pori. Queste molecole grandi attraverseranno di conseguenza molto rapidamente la colonna, cioè usciranno con un volume di eluzione minore di quello delle molecole che invece entrano nei pori.

Biologia molecolare

Pagina 34 di 173

Domenico Azarnia Tehran

Sezione Appunti

27. Cromatografia per affinità Molte proteine hanno la capacità di legarsi saldamente, ma non covalentemente, a specifiche molecole. Questa proprietà può essere utilizzata per purificare queste proteine mediante la cromatografia per affinità. In questa tecnica, una molecola detta ligande e che si lega specificamente alla proteina da isolare viene attaccata covalentemente ad un supporto poroso ed inerte. Quando una soluzione proteica non pura viene fatta passare attraverso questo materiale cromatografico, la proteina desiderata si lega al ligande immobilizzato, mentre le altre sostanze vengono lavate via dalla colonna dal tampone. La proteina può essere poi recuperata in forma altamente purificata variando le condizioni di eluzione in modo che la proteina venga rilasciata dalla matrice solida. La matrice cromatografica per affinità deve essere chimicamente inerte, avere un'elevata porosità e un gran numero di gruppi funzionali capaci di formare legami covalenti con il ligandi. Tra i pochi materiali di cui disponiamo e che si adattano a questi criteri, l'agarosio, che possiede molti gruppi ossidrilici liberi, è sicuramente il più utilizzato. Anche il ligando deve avere proprietà specifiche come un'elevata affinità per la proteina in grado da immobilizzarla ma non così elevata da impedire il rilascio successivo, che avviene con un eluzione in cui si utilizza un composto che abbia un affinità superiore per il sito di legame che la proteina utilizza per il ligande immobilizzato.

Biologia molecolare

Pagina 35 di 173

Domenico Azarnia Tehran

Sezione Appunti

28. Elettroforesi L'elettroforesi, la migrazione di ioni in un campo elettrico, è largamente usata per la separazione analitica delle molecole biologiche. La legge dell'elettrostatica stabilisce che la forza elettrica, F elettrica, su uno ione di carica q in un campo elettrico di forza E è espressa da: Felettrica = qE La risultante migrazione elettroforetica dello ione attraverso una soluzione viene rallentata da una forza frizionale: Ffrizionale = vf dove v è la velocità di migrazione dello ione ed f è il suo coefficiente frizionale. Quest'ultimo è una misura del freno che la soluzione esercita sul movimento dello ione e dipende dalle sue dimensioni, dalla sua forma e dal suo stato di solvatazione. In un campo elettrico costante, le forze sullo ione di bilanciano: qE = vf e quindi ogni ione si muove con una velocità costante caratteristica. La mobilità elettroforetica, , di uno ione viene definita come: = v/E = q/f Anche la mobilità elettroforetica è caratteristica in ogni ione. In soluzione acquosa, però, i polielettroliti, come le proteine, sono circondati da una nuvola di ioni con carica opposta, che modifica quindi le condizioni dell'ultima equazione che diventa al massimo soltanto un'approssimazione della realtà. Però sempre questa equazione indica che al punto isoelettrico, pI, le molecole hanno una mobilità elettroforetica pari a zero. Inoltre per le proteine e altri polielettroliti che possiedono proprietà acido-basiche, la carica ionica, e quindi la mobilità elettroforetica, è una funzione del pH. L'uso dell'elettroforesi per la separazione delle proteine è stato reso noto nel 1937 dal biochimico svedese Arne Tiselius, che mise a punto l'elettroforesi a fronte mobile. In questa tecnica una soluzione proteica veniva posta in un tubo a forma di U e su entrambe le estremità della soluzione proteica veniva stratificata senza rimescolamenti una soluzione tamponata. Veniva poi applicato un campo elettrico immergendo i suoi elettrodi alle due estremità e facendo passare corrente: le proteine cariche poste nel tubo erano quindi costrette a migrare verso il polo con carica opposta. Per questa tecnica è però necessario un apparato molto ingombrante e quantità di campione molto grandi, per questo l'elettroforesi a fronte mobile è stata soppiantata dall'elettroforesi zonale, una tecnica in cui il campione viene costretto a muoversi in un supporto solido come carta da filtro, cellulosa oppure gel.

Biologia molecolare

Pagina 36 di 173

Domenico Azarnia Tehran

Sezione Appunti

29. Elettroforesi su carta Nell'elettroforesi su carta, il campione viene applicato in un punto della striscia di carta inumidita con la soluzione tampone. L'estremità della striscia di carta vengono immerse in due recipienti separati contenenti il tampone e gli elettrodi. Dopo aver applicato una corrente continua, gli ioni presenti nel tampone migrano verso l'elettrodo con carica opposta ad una velocità caratteristica, formando alla fine bande separate ed omogenee. Dopo aver completato l'elettroforetogramma (sono di solito necessarie alcune ore) la striscia viene asciugata ed i vari componenti del campione vengono rilevati utilizzando gli stessi sistemi di rivelazione che servono per la cromatografia su carta. Una piccolo inconveniente di questa tecnica è l'elevata velocità di diffusione delle piccole molecole come gli amminoacidi ed i piccoli peptidi che limita la loro risoluzione se presenti in miscele complesse. Questa difficoltà può essere superata aumentando il voltaggio nell'elettroforesi su carta ad alto voltaggio, in cui la carta viene mantenuta tra due piatti raffreddati in modo da sottrarre continuamente il calore prodotto dalla corrente ad alto voltaggio. L'elettroforesi su carta e la cromatografia su carta sono in apparenza simili, ma l'elettroforesi su carta separa gli ioni principalmente in base alla loro carica, mentre la cromatografia su carta separa le molecole in base alla loro polarità. I due metodi vengono spesso combinati per generare una tecnica bidimensionale chiamata fingerprinting, in cui il campione viene prima sottoposto ad una separazione cromatografica come la cromatografia bidimensionale e successivamente ad un elettroforesi. Le molecole, quindi, in queste condizioni vengono separate sia in base alla loro carica che alla loro polarità.

Biologia molecolare

Pagina 37 di 173

Domenico Azarnia Tehran

Sezione Appunti

30. Gel elettroforesi La gel elettroforesi è tra i metodi più efficaci e convenienti usati per la separazione di macromolecole. I gel di uso più comune, la poliacrilammide e l'agarosio, hanno pori di dimensioni molecolari il cui diametro può essere scelto a priori. Le separazioni in questi casi si basano quindi sulla gel filtrazione oltre che sulla mobilità elettroforetica delle molecole. I gel in questi tipi di elettroforesi ritardano le molecole di grandi dimensioni rispetto a quelle piccole, l'inverso di quanto avviene nella gel filtrazione, in quanto non c'è spazio con solvente tra i granuli del gel per elettroforesi (che invece esiste tra le sferette del gel nella gel filtrazione). Quindi, mentre le molecole migrano attraverso il gel, il movimento delle molecole più grandi viene rallentato o impedito, separandole da quelle più piccole. Nell'elettroforesi su gel di poliacrilamide (PAGE), un tubo lungo da 3 a 10 cm, in cui è stato fatto polimerizzare il gel, viene sospeso verticalmente tra un recipiente superiore ed uno inferiore contenenti il tampone. Quest'ultimo, che è lo stesso nei recipienti e nel gel, ha di solito un pH (per le proteine circa 9) tale da conferire alle macromolecole una carica negativa e quindi da indurre una migrazione verso l'anodo (+) posto nel recipiente inferiore. Invece, per i gel in lastre (slab gel) i campioni vengono depositati in appositi pozzetti preparati in precedenza sulla sommità del gel. In alternativa, il campione può essere contenuto in una piccola frazione di gel, il gel del campione, i cui pori sono sufficientemente grandi da non impedire il movimento alle macromolecole di qualsiasi dimensione. Viene poi applicata una corrente continua di 300 V per il tempo necessario a separare i componenti macromolecolari in una serie di bande discrete. Queste bande possono essere meglio risolte e diventare più nette con una tecnica nota come elettroforesi a pH discontinuo oppure a disco, che richiede due sistemi di gel e diverse soluzioni tampone. Come sappiamo, quando viene applicata corrente, gli ioni migrano dal tampone nel recipiente superiore nel gel di accumulo e gli ioni presenti nel tampone di questo gel migrano anch'essi davanti a loro. Quando ha luogo questo spostamento, gli ioni del tampone nel recipiente superiore incontrano un pH che è molto più basso del valore della loro pK ed assumono quindi la loro forma scarica (nel caso della glicina la forma zwitteronica) e diventano elettroforeticamente immobili. Tutto ciò determina un aumento localizzato del campo elettrico per questo gli anioni macromolecolari migrano rapidamente fino a che non incontrano gli ioni del tampone del gel di accumulo, dove la loro migrazione tende a rallentare poiché in questa regione non vi è carenza di ioni. Questo effetto fa sì che le macromolecole ioniche si avvicinino al gel per la corsa e si accumulino in bande o dischi molto vicini tra loro, ordinati secondo la loro mobilità. Infine queste bande possono essere evidenziate con vari metodi come diversi coloranti.

Biologia molecolare

Pagina 38 di 173

Domenico Azarnia Tehran

Sezione Appunti

31. Sds-Page I saponi ed i detergenti sono molecole anfipatiche in grado di denaturare le proteine. Il sodio dodecil solfato (SDS), un detergente molto spesso usato nelle preparazioni biochimiche, si lega abbastanza tenacemente alle proteine forzandole ad assumere una forma a bastoncino. La carica negativa che l'SDS porta con sé sulle proteine maschera la loro carica intrinseca e quindi le proteine trattate con SDS tendono ad avere lo stesso rapporto carica/massa e la stessa forma. Di conseguenza, l'elettroforesi di proteine in un gel contenente SDS agisce sulla base delle loro masse per le proprietà di gel filtrazione che esse esprimono. Con la SDS-PAGE è possibile anche stabilire la massa molecolare delle proteine con un accuratezza del 5-10%. La mobilità elettroforetica delle proteine in questo tipo di gel varia in modo lineare con il logaritmo della loro massa molecolare. In pratica, la massa molecolare viene determinata sottoponendo la proteina ad elettroforesi insieme ad alcune proteine standard di cui è noto il peso molecolare. Però, come sappiamo molte proteine possiedono più di una catena polipeptidica. Il trattamento con SDS distrugge le interazioni non covalenti che tengono unite queste subunità. Quindi la SDS-PAGE determina la massa molecolare delle subunità e non quella della proteina intatta, a meno che le subunità non siano unita da ponti disolfuro.

Biologia molecolare

Pagina 39 di 173

Domenico Azarnia Tehran

Sezione Appunti

32. Gli enzimi di restrizione La maggior parte delle molecole di DNA sono molto grandi per essere manipolate, o analizzate, in laboratorio. Per questo, se dobbiamo studiare singoli geni o siti specifici del DNA, le grandi molecole che si trovano nelle cellule devono essere rotte in frammenti gestibili. Ciò si ottiene mediante l'uso di endonucleasi di restrizione. Esse sono nucleasi che tagliano il DNA in siti particolari, riconoscendo sequenze specifiche. Gli enzimi di restrizione usati in biologia molecolare riconoscono brevi sequenze bersaglio (4-8 bp), normalmente palindromiche (ad esempio GAATTC-CTTAAG), e tagliano in posizioni definite all'interno di esse. Prendiamo, ad esempio, in considerazione uno degli enzimi più comunemente usati, EcoRI, così chiamato perché venne scoperto in alcuni ceppi di Escherichia coli, e fu il primo ad essere scoperto in questa specie. Esso riconosce e taglia la sequenza 5'-GAATTC-3'. Questa sequenza esomerica si ritrova mediamente ogni 4 kb. Si consideri, ora, una molecola di DNA lineare con sei copie della sequenza riconosciuta dall'enzima: EcoRI la taglierebbe in sette frammenti, le cui dimensioni dipendono dalla distribuzione dei siti nella sequenza. Si supponga che il DNA tagliato da EcoRI venga sottoposto a elettroforesi su gel: i sette frammenti si separerebbero sulla base delle loro dimensioni. Pertanto, l'enzima di restrizione ha tagliato il DNA in frammenti specifici, ciascuno corrispondente ad una regione particolare della molecola. Se la stessa molecola di DNA venisse tagliata da un enzima di restrizione diverso, che riconosce anch'esso un bersaglio di 6 bp, ma di sequenza differente, la molecola darebbe tagliata in posizioni diverse, generando frammenti di dimensioni differenti. Comunque, gli enzimi di restrizione non si differenziano solo per la specificità e la lunghezza delle sequenze di riconoscimento, ma anche per il tipo di estremità del DNA che essi generano. Alcuni enzimi generano estremità piatte, altri invece, come lo stesso EcoRI, generano estremità sfalsate. Quest'ultime risultano essere complementari tra di loro e vengono dette “appiccicose” (sticky), perché si riuniscono prontamente mediante l'appaiamento delle basi, tra loro, sulla stessa molecola, o su molecole diverse tagliate con lo steso enzima. Questa è una proprietà importante per il clonaggio del DNA. Comunque, gli enzimi di restrizione vengono classificati comunemente in tre classi: 1) gli enzimi di restrizione di tipo I: attività di riconoscimento, metilazione e taglio contenute in un singolo enzima. Taglio anche a 1000 bp di distanza; 2) gli enzimi di restrizione di tipo II: due enzimi distinti per le attività di metilazione e taglio, riconoscono la stessa sequenza palindromica; e 3) gli enzimi di restrizione di tipo III: singolo enzima con due subunità di metilazione e taglio, taglio effettuato a 24-26 bp di distanza. Per capire meglio come funzionano gli enzimi di restrizione basta capire come funziona il loro meccanismo ad esempio nei batteri e nei fagi. Come sappiamo, i batteri hanno un singolo cromosoma, e possono avere diversi plasmidi, in cui si trovano un origine di replicazione e geni utili per la resistenza a qualche antibiotico. I fagi, invece, sono dei parassiti del batterio che sfruttano il meccanismo biosintetico del batterio stesso, per potersi replicare e quindi per produrre progenie fagica. Se costruiamo una colonia batterica di E. coli e successivamente la iniettiamo con particolari fagi, come il fago , otterremo delle placche di lisi, in cui i batteri sono stati uccisi per la produzione della progenie fagica. Gli enzimi di restrizione sono stati scoperti grazie a due ceppi di Escherichia coli: il ceppo B e quello K. Il primo, infettato dal fago , presentava numerose placche di lisi e il fago produceva senza nessun problema la sua progenie. Se però fagi prodotti sul

Biologia molecolare

Pagina 40 di 173

Domenico Azarnia Tehran

Sezione Appunti

ceppo B, venivano utilizzati per infettare il ceppo K, quest'ultimo mostrava una resistenza all'infezione (1 colonia su 10000). A questo punto isolando i fagi sul ceppo K, si vide che era in grado di formare un gran numero di colonie sul ceppo K ma non su quello B. Quindi si pensò che la crescita su un particolare ceppo restringe la sua capacità di infettare. Infatti, se il fago inietta il suo DNA nel batterio, il macchinario biosintetico e gli enzimi di restrizione lo riconoscono tagliandolo, facendo sì che il fago non sia più in grado di riprodursi. Questi enzimi tagliano solo il DNA fagico poiché il DNA batterico è metilato e non può essere riconosciuto. A volte però può risultare metilato anche il DNA fagico (1 colonia su 10000). Comunque, oltre agli enzimi di restrizione, in biologia molecolare vengono utilizzati molti altri enzimi come: le nucleasi, enzimi che tagliano o degradano gli acidi nucleici, le ligasi, enzimi che uniscono molecole di acidi nucleici utilizzando ATP (la reazione opposta degli enzimi di restrizione), le polimerasi, che sintetizzano DNA (o RNA) su stampo di DNA (o RNA) in presenza di un gruppo 3'-OH, le fosfatasi, che rimuovono il gruppo fosfato all’estremità 5' del DNA e le polynucleotide kinase, enzima che inserisce un gruppo fosfato all’estremità 5'-OH di un acido nucleico e viene spesso utilizzato per marcare radioattivamente un'estremità del DNA. I sistemi di marcatura e tutte queste tecniche hanno permesso di analizzare ma anche di creare nuove molecole di DNA. Ad esempio, se tagliamo con EcoRI possiamo unire la molecola originale di DNA (che mancherà di un segmento), oppure due molecole diverse attraverso l'uso di ligasi. Inoltre, se tagliamo un plasmide e una molecola di DNA circolare batterico con lo stesso enzima di restrizione possiamo inserire il gene all'interno del plasmide. A questo punto, per creare grandi quantità del plasmide da noi creato possiamo mettere i batteri in coltura con diversi antibiotici, per far sì che crescano solo i microrganismi contenenti il nostro plasmide, che porterà la resistenza per qualche antibiotico.

Biologia molecolare

Pagina 41 di 173

Domenico Azarnia Tehran

Sezione Appunti

33. Clonaggio del DNA La capacità di costruire molecole di DNA ricombinante e di mantenerle nelle cellule viene detta clonaggio del DNA. Il processo coinvolge un vettore, che fornisce l'informazione per propagare il DNA clonato nella cellula, ed un inserto di DNA, che viene inserito nel vettore e contiene il DNA di interesse. Per costruire molecole di DNA ricombinante sono fondamentali gli enzimi di restrizione, che tagliano il DNA in siti specifici, ed altri enzimi che consentono di unire gli uni agli altri i frammenti di DNA tagliati. Però, una volta che il DNA è tagliato in frammenti dagli enzimi di restrizione deve essere inserito in un vettore per la propagazione. Cioè, il frammento di DNA deve essere inserito in una seconda molecola di DNA (il vettore) per essere replicato in un organismo ospite. I vettori per DNA hanno tre caratteristiche: 1) contengono un'origine di replicazione che permette loro di replicarsi indipendentemente dal cromosoma dell'ospite; 2) contengono un marcatore di selezione che permette alla cellula che contiene in vettore di essere facilmente identificate; e 3) possiedono singoli siti di taglio per enzimi di restrizione. Ciò consente di inserire i frammenti di DNA in posizioni definite all'interno di un vettore altrimenti intatto. I vettori più comuni, che soddisfano le prime due caratteristiche, sono piccole molecole di DNA circolare (circa 3 kb) dette plasmidi. Infatti, queste molecole, associate al cromosoma batterico hanno un'origine di replicazione e possiedono geni marcatori, come ad esempio quelli per la resistenza a particolari antibiotici. Inoltre, in alcuni casi, questi plasmidi possiedono siti unici di restrizione. Però, dopo la loro scoperta, i plasmidi sono stati semplificati e modificati in modo che un tipico vettore plasmidico ora possieda più di 20 siti unici di restrizione in una regione relativamente piccola. Ciò consente di utilizzare una varietà maggiore di enzimi di restrizione per tagliare il DNA bersaglio. Anche i virus e i fagi sono stati modificati in modo da poter essere usati come vettori di clonaggio. A questo punto, e con queste informazioni, supponiamo che un vettore plasmidico contenga un singolo sito di riconoscimento per EcoRI. Il plasmide digerito con l'enzima di restrizione sarà linearizzato. Dato che EcoRI genera estremità che protrudono al 5' e che sono complementari tra loro, le estremità sono in grado di riassociarsi e di dare origine ad una forma circolare del plasmide con due tagli. A questo punto il DNA bersaglio, che vogliamo clonare, viene digerito con lo stesso enzima di restrizione per far sì che abbia le estremità complementari al taglio del plasmide. In seguito, il trattamento del plasmide stesso con l'enzima DNA ligasi, in presenza di ATP, chiude i tagli, rigenerando un plasmide covalentemente chiuso, in cui però troviamo incorporato l'inserto di DNA da noi preso in considerazione. Per procedere con quest'ultimo passaggio, abbiamo bisogno di un eccesso di DNA dell'inserto rispetto al DNA plasmidico, per far sì che la maggior parte dei vettori incorpori l'inserto e venga richiusa. Bisogna ricordare, inoltre, che alcuni vettori non solo permettono l'isolamento e la purificazione di specifici DNA, ma sono anche in grado di dirigere l'espressione di geni all'interno del DNA inserito. Tali plasmidi vengono detti vettori d'espressione e possiedono promotori trascrizionali immediatamente adiacenti al sito di inserzione. In questo modo possiamo vedere l'espressione del tratto di DNA da noi inserito oppure ottenere grandi quantità della proteina prodotta dalla sequenza genica presa in considerazione.

Biologia molecolare

Pagina 42 di 173

Domenico Azarnia Tehran

Sezione Appunti

34. I fagi per lo studio del DNA Altri vettori molto utilizzati per clonare brevi tratti di DNA sono i fagi, in quanto avendo la capacità di duplicarsi tramite i batteri, riescono ad ottenere una progenie fagica molto numerosa che conterrà il tratto di DNA da noi considerato. Inoltre, i batteriofagi si possono purificare in maniera semplice, in quanto dopo centrifugazione rimangono nel sopranatante e le cellule batteriche distrutte nel sedimento. Il DNA fagico all'interno del capside del fago , preso come esempio, è lineare e termina con due estremità coesive, quindi all'interno del batterio facilmente circolarizza. In questo modo il DNA fagico riorganizza l'apparato trascrizionale dei batteri in modo che comincino a produrre DNA a singolo filamento (con il meccanismo del cerchio rotante) che andrà a costituire l'informazione genetica per la nuova progenie fagica. I ricercatori, studiando in maniera dettagliata il genoma del fago hanno visto che è costituito da 49 kb. La testa del fago può contenere fino a 51 kb e per avere una particella fagica vitale il genoma deve essere almeno di 37 kb. Esiste, però, una regione centrale non essenziale per la replicazione e la lisi. Questa regione serve per il ciclo lisogeno in cui il fago non produce molte particelle ma inserisce il proprio genoma nel cromosoma del batterio, e quindi si replica insieme ad esso. Per cui, come si può ben capire, questa regione, detta frammento Stuffer (riempimento), può facilmente essere rimossa e rimpiazzata con il nostro inserto. Alla fine, dunque, avremo un DNA che conterrà in nostro inserto centralmente, mentre al braccio destro e sinistro tutti i geni necessari per la replicazione completa del fago. A questo punto, per far sì che il DNA costruito in questo modo possa inserirsi nella cellula batterica possiamo utilizzare diverse tecniche. Infatti, la trasformazione batterica, ossia l'inserimento di DNA esterno all'interno della cellula batterica, può essere ottenuta mediante shock termico, in cui l'entrata di DNA nelle cellule di E. coli è stimolata da alte concentrazioni di CaCl2, seguite da una breve incubazione a 42 °C, oppure per elettroporazione, un breve impulso elettrico che causa l'apertura temporanea di pori nelle membrane cellulari. In generale, l'efficienza della trasformazione rimane molto bassa, per questo si utilizzano in questi anni dei sistemi di packaging, per impacchettare in vitro il DNA da clonare, in cui di producono tutte le componenti fagiche necessarie per infettare e replicarsi nei batteri. Una volta giunti a questa fase, bisogna trovare e selezionare il clone che ha acquisito il DNA ricombinante. Infatti, siccome l'efficienza di trasformazione è molto bassa, la maggior parte delle colonie non contiene il plasmide, quindi non è ricombinante. Però come abbiamo visto, tra le caratteristiche più comuni dei plasmidi vi è la resistenza agli antibiotici. Quindi, crescendo la progenie fagica in un terreno contenente un particolare antibiotico, sopravviveranno solo i fagi ricombinanti, che quindi mostreranno la resistenza. Però, quando noi leghiamo il plasmide al DNA avremo delle molecole di plasmide che si sono richiuse che non hanno la nostra sequenza oppure altre ricombinanti che, invece, la possiedono. Comunque, entrambe, possiedono la resistenza all'antibiotico. Per questo occorre un ulteriore selezione. A tale scopo si ricorre all'uso della cosiddetta selezione per -complementazione, un particolare fenomeno che riguarda la galattosidasi (-gal) di E. coli e che fu studiato negli anni ’60 da J.Monod. Analizzando dei mutanti che esprimevano forme tronche nella porzione N o C-terminale della -gal, Monod scoprì che due regioni del polipeptide, un dominio N-terminale detto -peptide e la restante parte detta -fragment, anche se espresse separatamente, erano in grado nella cellula di complementare in trans dando luogo all’enzima funzionale. In

Biologia molecolare

Pagina 43 di 173

Domenico Azarnia Tehran

Sezione Appunti

biologia molecolare si sfrutta questo fenomeno molecolare utilizzando un plasmide che dirige la sintesi dell’-peptide e un ceppo ospite di E. coli che è mutato nel gene lacZ ed esprime solo l’-fragment (mutazione lazM15). L’ospite da solo non è quindi in grado di produrre -gal attiva, ma se in esso viene introdotto il plasmide, che produce l’-peptide, avviene l’-complementazione. Utilizzando un particolare analogo del lattosio, l’X-gal, che funge da substrato, è possibile identificare i cloni che esprimono -gal poiché le colonie diventano BLU su un terreno contenente tale substrato. Infatti, quando la molecola dell’X-gal è idrolizzata dalla -gal, viene prodotto 5-bromo-4-cloro-indaco di colore blu. Nei vettori di clonaggio plasmidici la sequenza codificante l’-peptide è stata ingegnerizzata in modo da introdurre dei siti per enzimi di restrizione (MCS) che, pur codificando per amminoacidi aggiuntivi, non perturbano il funzionamento dell’ -peptide stesso. La sequenza s’interrompe e l’-peptide non viene più espresso impedendo che avvenga l’complementazione se in questi siti viene clonato un frammento di DNA estraneo. In questo caso la colorazione dei cloni, su terreno contenente X-gal, è bianca.

Biologia molecolare

Pagina 44 di 173

Domenico Azarnia Tehran

Sezione Appunti

35. Mediante clonaggio si creano librerie di molecole di Dna Una libreria di DNA è una popolazione di vettori identici, ciascuno contenente un inserto diverso di DNA. Per costruire una libreria, il DNA bersaglio (per esempio il DNA genomico umano) viene digerito con un enzima di restrizione che dà inserti della lunghezza media desiderata. Le dimensioni dell'inserto possono variare da meno di 100 paia di basi a più di una megabase. Il DNA tagliato viene quindi mischiato con il vettore appropriato tagliato a sua volta con lo stesso enzima di restrizione, in presenza di ligasi. Ciò produce un'ampia collezione di vettori con diversi inserti di DNA. Quindi, usando DNA da fonti diverse si possono generare vari tipi di librerie. Le più semplici originano da DNA genomico totale tagliato con un enzima di restrizione; queste si chiamano librerie genomiche. Questo tipo di libreria è utile principalmente per generare DNA per il sequenziamento di un genoma. Per arricchire la libreria di sequenze codificanti, si usa una libreria di cDNA. In quest'ultima, invece di usare DNA genomico come materiale di partenza, si usa mRNA che viene convertito in DNA. Il processo che consente questo passaggio è chiamato trascrizione inversa ed è svolta da una DNA polimerasi speciale (la trascrittasi inversa) che può generare DNA da uno stampo di RNA. Le sequenze di mRNA possono essere convertite in DNA copia a doppia elica, detti cDNA (ovvero DNA copia), quando vengono trattate con la trascrittasi inversa. Questi frammenti vengono, quindi, inseriti con la ligasi nei vettori. Come abbiamo detto in precedenza, comunque, esistono vari vettori che possono contenere diverse paia di basi fino ad arrivare a 2000 kb nel caso del vettore YAC. Nel caso di quest'ultimo, però, non abbiamo enzimi che riescono a tagliare porzioni così grandi di DNA, per questo motivo, invece, di effettuare una digestione completa procediamo con una digestione incompleta. In questo modo avremo numerosi frammenti di poche coppie di basi (20 Kb nel caso di Sau3A) ma sovrapposti, che andranno a coprire tutta la regione di DNA che vogliamo clonare. A questo punto, con le metodologie precedentemente illustrate, cloniamo tutti i frammenti tramite il fago e otterremo la nostra genoteca.

Biologia molecolare

Pagina 45 di 173

Domenico Azarnia Tehran

Sezione Appunti

36. L'ibridazione - southern, northern e western blot Il fenomeno dell'ibridazione, ossia la capacità di una molecola di acido nucleico a singolo filamento di formare una doppia elica con un'altra sequenza composta di basi a essa complementari, rappresenta uno dei punti di partenza fondamentali della moderna biologia molecolare. Molti dei geni eucariotici fanno parte di famiglie geniche strettamente correlate. In che modo potremmo determinare il numero dei membri di una particolare famiglia genica? Si comincia utilizzando un enzima di restrizione per tagliare il DNA genomico isolato da un organismo. È meglio utilizzare un enzima di restrizione come EcoRI che riconosce una sequenza di 6 bp come sito di taglio. Questo enzima produrrà migliaia di frammenti di DNA genomico, di dimensioni medie di 4000 bp circa. Successivamente, questi frammenti vengono sottoposti a elettroforesi su gel di agarosio. Il risultato, se le bande vengono visualizzate per colorazione, sarà una striscia composta da migliaia di bande, indistinguibili l'una dall'altra. Eventualmente, si potrà, per questo motivo, far avvenire l'ibridazione tra una sonda radioattiva e queste bande per scoprire quante di queste contengono la sequenza codificante il gene d'interesse. Edward Southern è stato un pioniere di questa tecnica; egli trasferì i frammenti di DNA da un gel di agarosio a un filtro di nitrocellulosa per diffusione. Questo procedimento è stato quindi da allora chiamato Southern blotting. Oggi, il blotting viene frequentemente ottenuto sottoponendo a elettroforesi le bande di DNA fino a farle uscire dal gel per farle approdare al blot. Prima di essere trasferiti, i frammenti di DNA vengono denaturati con una soluzione basica in modo che il risultante DNA a singolo filamento possa legarsi alla nitrocellulosa, dando così il Southern blot. In seguito, il DNA clonato viene marcato aggiungendo DNA polimerasi in presenza di precursori di DNA marcati. Quindi, questa sonda radioattiva viene denaturata e fatta ibridare con il Southern blot. Ovunque la sonda incontrerà sul filtro una sequenza di DNA complementare, si appaierà a essa formando una banda marcata corrispondente al frammento di DNA che contiene il gene d'interesse. Infine, queste bande vengono visualizzate per autoradiografia con una pellicola a raggi X. A questo punto, se dovesse essere visibile una sola banda, l'interpretazione sarebbe relativamente semplice; probabilmente solo un gene possiede una sequenza complementare a quella utilizzata come sonda di cDNA. Se invece, sono presenti più bande, sono probabilmente presenti più geni che contengono la sequenza di interesse, ma potrebbe risultare difficile dire quanti. Per minimizzare questo problema spesso si utilizza una sonda corta ottenuta sempre per restrizione del cDNA. Se, invece, supponiamo di aver clonato un cDNA (un DNA copia di un RNA) di voler sapere quanto attivamente il gene corrispondente (un gene X) sia espresso in un numero differente di tessuti in un organismo Y, si può cominciare raccogliendo RNA da vari tessuti dell'organismo in questione. Poi, si sottopongono questi RNA a una elettroforesi su gel di agarosio e si trasferiscono su un supporto opportuno. Poiché il procedimento simile per il DNA è denominato Southern blot, è venuto naturale chiamare un blot di RNA con il nome di Northern blot (per analogia, un blot di proteine è chiamato Western blot, e si utilizzano anticorpi per legare le proteine ). Successivamente si può ibridare il Northern blot con una sonda di cDNA marcata radioattivamente. Ovunque sul blot esista un mRNA complementare alla sonda avverrà l'ibridazione risultando in bande che si possono visualizzare con una pellicola ai raggi X. Se, accanto agli RNA estratti si fanno correre per elettroforesi anche dei marcatori di RNA di dimensioni note, è possibile determinare le

Biologia molecolare

Pagina 46 di 173

Domenico Azarnia Tehran

Sezione Appunti

dimensioni delle bande di RNA che compaiono in seguito all'ibridazione con sonda radioattiva. Inoltre, il Northern blot fornisce informazioni riguardanti l'abbondanza del trascritto del gene X. Maggiore è la quantità di RNA contenuta nella banda, maggiore sarà la quantità di sonda radioattiva che si appaierà a essa, tanto più scura diventerà la banda ai raggi X.

Biologia molecolare

Pagina 47 di 173

Domenico Azarnia Tehran

Sezione Appunti

37. Cromosomi, cromatina e nucleosoma All'interno della cellula, il DNA è associato con proteine in un complesso chiamato cromosoma. Questa organizzazione generale si ha sia nelle cellule procariotiche che eucariotiche ed anche nei virus. Il compattamento del DNA nei cromosomi è essenziale per alcune importanti funzioni. Il cromosoma è un sistema di condensazione per il DNA che deve essere contenuto nella cellula e che permette di proteggere il DNA stesso da possibili danni. Molecole di DNA completamente nude sono, nella cellula, relativamente instabili. Al contrario, il DNA organizzato nel cromosoma è molto stabile è ciò permette all'informazione contenuta nella molecola di essere correttamente espressa; inoltre soltanto il DNA compattato nel cromosoma può essere trasmesso efficacemente a entrambe le cellule figlie ad ogni evento di divisione cellulare. Comunque, un cromosoma eucariotico è costituito per metà anche da proteine. Nelle cellule eucariotiche, l'associazione del DNA con alcune di queste proteine forma una struttura chiamata cromatina. La maggior parte di queste proteine, gli istoni, sono di piccole dimensioni ed hanno caratteristiche basiche. Sebbene, non sono così abbondanti come gli istoni, esistono altre proteine associate al cromosoma: le proteine non istoniche. Molte di queste proteine legano il DNA e regolano le reazioni di trascrizione, replicazione, riparazione e ricombinazione del DNA. Quindi, la gran parte del compattamento del DNA nelle cellule umane (e in tutte le altre cellule eucariotiche) è il risultato di una regolare associazione del polimero con gli istoni a formare una struttura che viene chiamata nucleosoma. La formazione dei nucleosomi è il primo stadio di un processo che permette al DNA di essere ripiegato in una struttura più compatta che ne riduce la lunghezza lineare di circa 10000 volte. Inoltre, anche se le cellule procariotiche possiedono di norma un genoma più piccolo rispetto a quello degli eucarioti, la necessità di compattare il loro DNA è sostanzialmente la stessa. Come il cromosoma procariotico venga condensato, però, è ancora poco chiaro: i batteri non contengono istoni o nucleosomi, ma piccole proteine basiche che possono avere funzione similare.

Biologia molecolare

Pagina 48 di 173

Domenico Azarnia Tehran

Sezione Appunti

38. La sequenza del cromosoma e la diversità Le cellule procariotiche posseggono un'unica copia completa del/dei cromosoma/i che è organizzato in una struttura chiamata nucleoide. Inoltre i microorganismi frequentemente possono possedere anche uno o più DNA circolari di piccole dimensioni indipendenti chiamati plasmidi. A differenza del DNA cromosomico, i plasmidi non sono normalmente essenziali per la crescita batterica. Normalmente essi portano geni che conferiscono determinate caratteristiche al batterio, come ad esempio la resistenza ad un antibiotico. La maggior parte delle cellule eucariotiche, invece, è diploide, il che vuol dire che contengono due copie di ciascun cromosoma: i cromosomi omologhi. Ogni copia deriva da ciascun genitore. Ma non tutte le cellule negli organismi eucariotici sono diploidi. Una certa quantità di cellule possono essere aploidi o poliploidi. Le cellule aploidi contengono un'unica copia per ciascun cromosoma e sono coinvolte nella riproduzione sessuale (per esempio le uova e gli spermatozoi). Le cellule poliploidi contengono, invece, più di due copie di ogni cromosoma e questo permette la sintesi di una grande quantità di RNA, quindi di proteine. Comunque, la grandezza del genoma (la lunghezza del DNA in un assetto cromosomico aploide) varia sostanzialmente nei diversi organismi modello. Poiché sono necessari un numero molto elevato di geni per dirigere la formazioni di organismi sempre più complessi, non è sorprendente che la grandezza del genoma sia strettamente correlata con la complessità dell'organismo. Quindi avremo che le cellule procariotiche hanno un genoma inferiore alle 10 Mb mentre per gli eucarioti potremmo arrivare alle 100000 Mb. Sebbene vi sia una certa correlazione fra la grandezza del genoma e la complessità dell'organismo ciò non è sempre vero, basti pensare che il genoma del riso è circa 40 volte più piccolo di quello del grano. Queste differenze sono correlate con la densità genica. Una semplice misura della densità genica è la quantità di geni contenuti in una megabase di DNA genomico. Per cui se un organismo contiene 5000 geni ed un genoma di 50 Mb, la densità genica presente in questo organismo è di 100 geni/Mb. Esiste una correlazione inversa fra la complessità dell'organismo e la densità genica; gli organismi meno complessi hanno una più alta densità genica. Per esempio, le densità geniche più alte si riscontrano nei virus che utilizzano addirittura entrambi i filamenti del DNA per codificare geni che in alcuni casi possono essere sovrapposti. Mentre, fra gli eucarioti, c'è una tendenza generale per cui la densità genica diminuisce con l'aumentare della complessità dell'organismo. Esistono due fattori che contribuiscono alla diminuzione della densità genica osservate nelle cellule eucariotiche: l'aumento delle dimensioni dei geni e l'aumento della quantità di DNA esistente fra i geni, ovvero le sequenze intergeniche. I geni sono più lunghi sostanzialmente per due ragioni. Primo, visto il progressivo aumento della complessità degli organismi si verifica un necessario e significativo aumento delle regioni di DNA utilizzate per dirigere e regolare la trascrizione, chiamate sequenze regolative. Secondo, i geni, negli eucarioti, frequentemente sono costituiti da regioni discontinue. Le regioni non codificanti, intersperse all'interno delle sequenze codificanti, chiamate introni, sono rimosse dall'RNA dopo la trascrizione con un processo chiamato splicing dell'RNA. Si è visto, infatti, che la grandezza media di un gene umano è di circa 27 kb mentre la dimensione media di una sequenza codificante (esoni) per una proteina è di circa 1,3 kb. Un semplice calcolo rileva che soltanto i 5% del DNA di un gene è rappresentativo della parte codificante la proteina, il rimanente 95% è fatto da introni. Quindi, come ben si

Biologia molecolare

Pagina 49 di 173

Domenico Azarnia Tehran

Sezione Appunti

può capire, il considerevole aumento della quantità delle sequenze intergeniche negli organismi più complessi è responsabile della diminuzione della densità genica. Più del 60% del genoma umano è formato da sequenze intergeniche e la maggior parte di questo DNA non ha funzioni conosciute. Vi sono due tipi di DNA intergenici: sequenze uniche e sequenze ripetute. Circa un quarto del DNA intergenico è a sequenza unica. Queste regioni comprendono molti relitti apparentemente non funzionali e includono geni mutati, frammenti di geni e pseudogeni. Mentre quasi la metà del genoma umano è composto di sequenze di DNA che sono ripetute molte volte. Ci sono generalmente due classi di DNA ripetuto: DNA microsatellite e DNA altamente ripetuto. Il DNA microsatellite è formato da sequenze molto corte (meno di 13 paia di basi) ripetute in tandem. Le sequenze altamente ripetute, invece, sono molto più grandi rispetto ai microsatelliti. Ciascuna unità di ripetizione è maggiore di 100 paia di basi e in molti casi anche più grande di 1 kb. Inoltre, nei casi più comuni essi formano elementi trasponibili. Questi sono sequenze che possono spostarsi da una parte all'altra del genoma e a volte, lasciare una propria copia nel punto precedente, in modo tale da accumularsi e moltiplicarsi nel genoma. Comunque, sebbene si tende a considerare il DNA ripetuto come un DNA di scarto, il mantenimento nel tempo di queste sequenze per centinaia o migliaia di generazioni suggerisce che il DNA intergenico ha un significato positivo (o conferisce un vantaggio selettivo) per l'organismo ospite. In ogni cromosoma troviamo molte di queste sequenze ripetute. Ad esempio nel centromero troviamo sequenze ripetute fondamentali per l'attacco al fuso mitotico durante la mitosi, come anche nel telomero (TTAGGG), dove queste regioni proteggono le estremità dei cromosomi dalla degradazione.

Biologia molecolare

Pagina 50 di 173

Domenico Azarnia Tehran

Sezione Appunti

39. La mitosi Dopo l'enunciazione delle leggi di Mendel e prima della loro riscoperta furono fatti degli studi per identificare la sede del materiale ereditario all'interno della cellula. Si cominciò, allora, ad ipotizzare che il materiale ereditario risiedesse nel nucleo, infatti si vedeva che le dimensioni del nucleo spermatico e quello della cellula uovo era identico. Dopo successivi studi allora si confermò che nel nucleo sono presenti i cromosomi il cui numero è identico in ciascuna cellula dell'organismo, è una caratteristica di ciascuna specie e rimane costante dopo ciascuna divisione cellulare. Ogni cromosoma, oggi si sa, essere costituito da una molecola di DNA a doppio filamento e da un insieme di proteine. Molte delle cellule eucariotiche contengono due copie di ciascun cromosoma e sono quindi diploidi (caratteristica delle cellule somatiche, ossia delle cellule del corpo di un eucariote), mentre le cellule sessuali, o gameti, contengono una sola copia di ciascun cromosoma e quindi sono detti aploidi. Il numero dei cromosomi si mantiene costante grazie alla mitosi e alla meiosi. La mitosi è un processo di divisione nucleare in cui si producono due nuclei figli che contengono assetti cromosomici geneticamente identici tra di loro ed al nucleo delle cellule che gli ha generati. La mitosi avviene principalmente in cinque fasi: 1. Prima che inizi ciascuna mitosi i cromosomi della cellula madre si sono duplicati nella fase S del ciclo cellulare dove avviene la sintesi del DNA e appunto la duplicazione dei cromosomi (G1, crescita e metabolismoS, detto primaG2, preparazione alla mitosiM, mitosi vera e propria). Il periodo successivo alla fase S corrisponde all'inizio della mitosi e dell'interfase, dove i cromosomi non sono visibili perché troppo lunghi e troppo sottili e in forma rilassata. Come ho detto, però, essi sono già duplicati e questi sono detti cromatidi fratelli e sono uniti all'altezza del centromero. La distribuzione di questi cromatidi viene organizzata e svolta dai microtubuli che fanno parte del citoscheletro. Inoltre, se presenti in copie multiple, i centromeri potrebbero essere tirati in entrambe le direzioni, verso le cellule figlie, provocando una possibile rottura del cromosoma stesso. 2. Nella profase, il secondo stadio della mitosi, i microtubuli si assemblano a formare una struttura complessa detta fuso e i cromosomi iniziano ad accorciarsi e ad ispessirsi, ossia si condensano. Inoltre, molti organelli intracellulari, come il reticolo endoplasmatico e il complesso di Golgi, si frammentano e la membrana nucleare si scompone in numerose piccole vescicole e lo spazio nucleare viene invaso dai microtubuli. Alcuni di questi, si attaccano ai cinetocori, strutture proteiche associate ai centromeri dei cromosomi duplicati. 3. Durante la metafase, i cromosomi duplicati raggiungono una posizione a metà strada tra i poli del fuso. Questo movimento è determinato da cambiamenti della lunghezza dei microtubuli del fuso e dall'azione di proteine motrici generanti forza che funzionano nelle vicinanze dei cinetocori. Grazie a questa attività i cromosomi si dispongono in un singolo piano al centro della cellula detta piastra metafasica e sono visibili al microscopio. 4. Nel successivo stadio, detto anafase, i cromatidi fratelli dei cromosomi duplicati si separano l'uno all'altro grazie all'accorciamento dei microtubuli e alla degradazione delle sostanze che tengono uniti i cromatidi fratelli. Quest'ultimi allora vengono spinti verso i poli opposti della cellula. 5. Nell'ultima fase, detta telofase, i cromosomi di decondensano, si riformano gli organelli e ciascun gruppo

Biologia molecolare

Pagina 51 di 173

Domenico Azarnia Tehran

Sezione Appunti

di cromosomi viene racchiuso in una membrana nucleare. Quando la mitosi è completa le due cellule figlie sono separate dalla formazione di membrane. Questa separazione fisica delle cellule figlie è detta citocinesi. In conclusione possiamo dire quindi che le cellule figlie prodotte dalla divisione di una cellula madre sono geneticamente identiche. Occasionalmente, tuttavia, possono accadere degli errori. Ad esempio, un cromatidio può staccarsi dal fuso mitotico e non essere incorporato in una delle due cellule figlie. Questi eventi causano differenze genetiche tra le cellule figlie.

Biologia molecolare

Pagina 52 di 173

Domenico Azarnia Tehran

Sezione Appunti

40. La meiosi La meiosi è un processo di divisione nucleare in cui si producono quattro gameti aploidi il cui materiale genetico è la metà di quello della cellula che li ha generati. Il processo di meiosi implica due divisioni cellulari e la successione degli eventi è: duplicazione cromosomicaI divisione meioticaII divisione meiotica. I DIVISIONE MEIOTICA Nel momento in cui ha inizio la I divisione meiotica i cromosomi si sono già duplicati, di conseguenza ciascuno di essi è costituito da due cromatidi fratelli. Questa divisione implica 4 fasi: 1. La prima fase è la profase I che a sua volta si divide in cinque stadi ciascuno indicato con una parola greca che sta ad indicare l'aspetto o il comportamento dei cromosomi: la prima fase è il (1) leptodema (“filamento sottile”) durante la quale i cromosomi duplicati si condensano e diventano molto sottili tanto che sono scarsamente visibili al microscopio ottico ma non al microscopio elettronico. La seconda fase è lo (2) zigonema (“filamenti appaiati”) nel quale i cromosomi omologhi entrano in stretto contatto. Questo processo di appaiamento degli omologhi è definito sinapsi. Quest'ultima è accompagnata dalla formazione di una struttura proteica tra i cromosomi appaiati detta complesso sinaptinemale. La terza fase detta (3) pachinema nel quale con il progredire delle sinapsi i cromosomi duplicati continuano a condensarsi riducendo il loro volume e quindi facilmente visibili al microscopio ottico. Ogni coppia è costituita da due omologhi duplicati, ciascuno dei quali è formato da due cromatidi fratelli. Se prendiamo in considerazione questi omologhi, la coppia viene definita di cromosomi bivalenti, mentre se contiamo i filamenti viene definito una tetrade di cromatidi. Durante il pachinema, i cromosomi appaiati possono scambiarsi materiale genetico in un processo detto crossing over. La fase successiva è il (4) diploema (“due filamenti”) durante la quale i cromosomi appaiati si separano lentamente, tuttavia rimangono in stretto contatto nei punti dove è avvenuto il crossing over. Questi punti di contatto sono definiti chiasmi (singolare chiasma, dal greco incrocio). L'attento esame dei chiasmi evidenza che ciascuno di essi coinvolge solo due dei quattro cromatidi della tetrade. Nell'ultima fase della profase I, ossia la (5) diacinesi (“movimento attraverso”) i cromosomi si condensano ulteriormente, la membrana nucleare si frammenta e si forma la struttura del fuso. I microtubuli del fuso si attaccano ai cinetocori dei cromosomi, e quest'ultimi si dispongono in un piano perpendicolare all'asse del fuso e centrale alla cellula. 2. Durante la metafase I, i cromosomi appaiati si orientano verso i poli opposti del fuso. Questa orientazione assicura, che quando la cellula si divide, un membro di ciascuna coppia migrerà verso il polo. 3. Nella fase successiva fase ossia l'anafase I, i cromosomi appaiati si separano definitivamente l'uno dall'altro. Questa separazione è detta disgiunzione cromosomica ed è mediata dal fuso. Quindi i cromosomi non più appaiati ma separati raggiungono i poli opposti. 4. Nell'ultima fase ossia la telofase I, il fuso si disassembla, le cellule figlie sono separate da membrana, i cromosomi si decondensano e si forma un nucleo intorno ai cromosomi in ciascuna delle cellule figlie. II DIVISIONE MEIOTICA Durante la meiosi II, i cromosomi si condensano e si attaccano ad un nuovo fuso (profase II). In seguito, raggiungono la posizione sulla piastra equatoriale della cellula (metafase II) ed i loro centromeri si dividono per consentire ai cromatidi fratelli di migrare verso i poli opposti (anafase II) fenomeno definito

Biologia molecolare

Pagina 53 di 173

Domenico Azarnia Tehran

Sezione Appunti

disgiunzione cromatidica. Durante la telofase II, i cromatidi separati, definiti ora cromosomi, raggiungono i poli ed intorno ad essi si formano i nuclei. Quindi ciascun nucleo figlio contiene un corredo aploide di cromosomi. La meiosi II è quindi molto simile alla mitosi, tuttavia le cellule figlie nella meiosi sono aploidi e il corredo cromosomico non è geneticamente identico a quello della cellula madre.

Biologia molecolare

Pagina 54 di 173

Domenico Azarnia Tehran

Sezione Appunti

41. Il nucleosoma La maggior parte del DNA nelle cellule eucariotiche è impacchettato nei nucleosomi. Il nucleosoma è composto di un core di otto proteine istoniche ed il DNA è avvolto attorno ad esse. Il DNA fra ciascun nucleosoma (il filo fra le perle della collana) è chiamato DNA linker. Mediante assemblaggio in nucleosomi, il DNA viene compattato approssimativamente 6 volte. Ciò è ben lontano dalle 1000-10000 volte (in termini di compattazione) che deve raggiungere il DNA nelle cellule eucariotiche. Ciononostante, questo primo stadio è essenziale per tutti i successivi livelli strutturali necessari per compattare adeguatamente il DNA. Comunque, il DNA più intimamente legato al nucleosoma, il DNA core, è avvolto approssimativamente 1,65 volte attorno all'ottamero istonico (quasi due giri d'elica) in maniera sinistrorsa. Essendo sinistrorso l'avvolgimento è toroidale quindi corrisponde a giri di superelica negativa. Comunque, il DNA del core ha una lunghezza di circa 147 paia di basi ed è una quantità invariabile di tutte le cellule eucariotiche. Invece, la lunghezza del DNA linker esistente fra i nucleosomi è variabile. Tipicamente questa distanza è di 20-60 paia di basi. L'organizzazione in unità nucleosomali è stata evidenziata mediante dei saggi di digestione con endonucleasi (nucleasi micrococcica). Questo enzima digerisce il DNA tagliando preferenzialmente il DNA linker. In questo modo si ottengono si ottengono i singoli nucleosomi. Con una digestione parziale, invece, potremmo ottenere non solo il monomero di nucleosoma ma anche i dimeri e i trimeri. A questo punto, quest'ultimi potranno essere separati su un gradiente di saccarosio ed identificare le varie parti che gli compongono. Se andiamo sempre più avanti con la digestione otterremo, infine, frammenti sempre più piccoli arrivando ad identificare il singolo monomero di DNA con 147 bp. Inoltre, in tutte le cellule esistono zone del DNA che non sono organizzate in nucleosomi (eucromatina). Di norma queste sono regioni di DNA impegnate nell'espressione genica, nella replicazione o nella ricombinazione. Gli istoni sono di gran lunga le proteine più abbondanti associate con il DNA eucariotico. Le celle eucariotiche contengono cinque tipi di istoni: H1, H2A, H2B, H3 e H4. Gli istoni H2A, H2B, H3 e H4 sono gli istoni del core e formano il complesso proteico (core) attorno a cui il DNA si avvolge. L'istone H1, invece, non fa parte del core nucleosomico, ma lega il DNA linker che unisce due nucleosomi adiacenti ed è indicato come l'istone linker. In accordo con il fatto di essere strettamente associati ad una molecola di DNA che è carica negativamente, gli istoni contengono un gran numero di amminoacidi carichi positivamente. Più del 20% dei residui amminoacidici contenuti negli istoni sono di lisina o arginina. Comunque, gli istoni sono formati da una regione conservata che viene chiamata dominio histone-fold. Quest'ultimo è formato da tre regioni elica separati da due tratti curvi non strutturati. In ogni caso l'histone-fold media la formazione testa-coda di specifiche coppie eterodimiche. Gli istoni H3 e H4 formano degli eterodimeri che poi si associano dando origine ad un tetramero in cui sono presenti due H3 e due H4. H2A e H2B invece formano eterodimeri che però non tetramerizzano. L'assemblaggio di un nucleosoma prevede l'associazione ordinata di questi complessi proteici con il DNA. Prima il tetramero H3-H4 lega il DNA, successivamente due dimeri H2A-H2B si uniscono al tetramero per formare il nucleosoma completo. Ciascun istone del core possiede un estensione N-terminale chiamata “coda”. Essa manca di una struttura definita e sporge all'esterno del nucleosoma rendendosi accessibile. Tale accessibilità può essere verificata mediante trattamento del nucleosoma con la proteasi tripsina che digerisce queste estensioni mentre non

Biologia molecolare

Pagina 55 di 173

Domenico Azarnia Tehran

Sezione Appunti

digerisce la regione altamente impacchettata degli histone-fold. Comunque, le code N-terminali esposte non sono richieste per l'associazione del DNA con l'ottamero istonico, infatti il DNA rimane saldamente associato al nucleosoma anche dopo trattamento con proteasi. Invece, le code sono sito di consistenti modificazioni che sono in grado di cambiare la funzione del singolo nucleosoma. Queste modificazioni includono la fosforilazione, l'acetilazione e la metilazione dei residui si serina e lisina. Inoltre, sebbene non perfettamente simmetrico, il nucleosoma ha due assi di simmetria che vengono chiamati diadi. In questa organizzazione, il tetramero H3-H4 e i dimeri H2A-H2B interagiscono con una particolare regione del DNA. Delle 147 bp di DNA nucleosomico, le regioni dell'histone-fold del tetramero H3-H4 interagiscono con le 60 paia di basi centrali. La regione N-terminale di H3, più vicina all'histone-fold, forma una quarta elica che interagisce con le ultime 13 paia di basi di ciascun terminale del DNA. Da sottolineare, anche, che il tetramero H3-H4 occupa una posizione chiave nel nucleosoma legando la parte centrale ad entrambe le estremità del DNA. Invece, ciascuno dei due dimeri H2A-H2B lega circa 30 bp da entrambe le parti delle 60 centrali legate da H3 e H4. Ad una più attenta osservazione ci si rende conto che le basi strutturale e la particolare curvatura nel nucleosoma, sono dovuti principalmente a quattordici distinti siti di contatto, uno per ciascuna volta che il solco minore del DNA fronteggia l'ottamero istonico. L'associazione del DNA con il nucleosoma è mediata da un grande numero di legami idrogeno. La maggior parte di questi legami si instaura fra le proteine e gli atomi di ossigeno dei legami fosfodiesterici, vicino al solco minore del DNA. Inoltre, la struttura del nucleosoma risolta a livello anatomico ha fornito informazioni anche riguardo le code N-terminali degli istoni. Le quattro code degli istoni H2B e H3 emergono fra e dalle due eliche. La loro via d'uscita è formata dai due solchi minori adiacenti, che creano uno spazio fra le due eliche del DNA giusto sufficiente per far passare la catena polipeptidica. In modo analogo emergono dall'altra parte le code di H2B e H3. Un ulteriore caratteristica relativa alla formazione dei nucleosomi è la distorsione che subisce il DNA in queste particolari strutture che è di circa 4,53° per ogni dinucleotide. Per studiare questa caratteristica e quindi il DNA attorno all'ottamero istonico si è utilizzata la tecnica del footprinting con DNasi I. Questo enzima taglia il DNA in maniera differente, in quanto, se è nudo la digestione procede normalmente, invece, in presenza di proteine legate al DNA, questo enzima lo digerisce difficilmente. Si è visto, comunque, che se digeriamo i nucleosomi, la DNasi I riesce a tagliare i solchi minori esposti verso il solvente, in modo tale da poter studiare la periodicità del DNA sul cromosoma. Il profilo che si ottiene sono bande che distano 10,2 bp ( invece delle 10,5 bp di Watson e Crick). Per definire le regioni del nucleosoma, invece, si parla di posizionamento traslazionale per indicare i confini del nucleosoma mentre di posizionamento rotazionale per indicare le basi a contatto con il DNA e quelle esposte al solvente. Il primo parametro ci indica quindi quali sono le parti a contatto con l'istone e quelle invece che non lo sono (DNA linker), quindi questo sta ad indicare anche l'accessibilità che hanno le proteine. Il posizionamento rotazionale, invece, ci fa capire quale faccia del DNA è esposta, ossia quali coppie di basi si trovano all'esterno verso il solvente. Comunque, tutta questa organizzazione è importante per capire che il DNA più accessibile alle proteine è quello non vincolato agli istoni ed esposto al solvente. Il tassello mancante a questo punto era relativo alla disposizione delle coppie di basi sul DNA. Un esperimento effettuato da Satchwell, Drew e Travers sugli eritrociti di pollo, che sono nucleati, a permesso di definire questa caratteristica. In laboratorio i nuclei vennero trattati

Biologia molecolare

Pagina 56 di 173

Domenico Azarnia Tehran

Sezione Appunti

con MNasi per ottenere singoli nucleosomi di 147 bp. Questo DNA successivamente venne clonato all'interno di plasmidi e sequenziato. Grazie all'utilizzo di 177 diverse sequenze, si è visto che vi era una sequenza non casuale. L'andamento delle coppie di basi risulta essere sinusoidale, le coppie di basi AT si trovano a contatto con gli istoni mentre GC all'esterno, esposte al solvente. Quindi il punto in cui il DNA agisce con gli istoni è ricco in AT mentre nella parte esterna in GC. Altre caratteristiche trovate sono che alcune sequenze tendono ad essere escluse dai nucleosomi, come cinque adenine consecutive, che vanno quindi a formare il DNA linker. Quindi, in generale, possiamo dire che l'ottamero degli istoni riconosce caratteristiche conformazionali del DNA, ovvero la capacità di una data sequenza di DNA di distorcersi attorno all'ottamero a formare 1,65 giri di superelica. Questa proprietà del DNA, che possiamo chiamare flessibilità, è dipendente dalla sequenza in quanto le coppie di basi nelle loro interazioni non sono perfettamente planari ma formano spesso degli angoli, energicamente più favoriti (curvandosi). Nel 1995, Polach e Windom ipotizzarono che il nucleosoma fosse una struttura dinamica, in cui il DNA si svolge e si riavvolge consentendo alle proteine di riconoscere il proprio sito di legame, Questa ipotesi venne saggiata mediante digestione con enzimi di restrizione. Questi scienziati, quindi, si resero conto che il DNA si apre e si richiude permettendo il legame degli enzimi (nucleosome breathing: respirazione nucleosomale). Questo meccanismo è stato definitivamente approvato con un altro esperimento, applicando una tecnica detta FRET (trasferimento di energia di risonanza tramite fluorescenza) e con l'utilizzo di due molecole fluorescenti A e D. La molecola fluorescente A viene eccitata alla lunghezza d’onda dei fotoni emessi da D. Se D e A sono vicini, A intercetterà l’emissione di D ed emetterà fluorescenza a una diversa lunghezza d’onda, inibendo l’emissione di P. Se la distanza tra D e A supera R (in genere tra 3 e 7 nm), A non verrà eccitato e si avrà emissione da P. Quindi, come ben si può capire, questa metodologia viene utilizzata per capire se due punti di una molecola sono vicini o lontani. Per il nucleosoma, il donatore (D) fu posizionato all'inizio del DNA e A in un altro punto. Quindi se il cromosoma non si apre, questi due punti risulteranno vicini altrimenti no. Si vide, che effettivamente il DNA si srotola per permettere l'accesso alle proteine.

Biologia molecolare

Pagina 57 di 173

Domenico Azarnia Tehran

Sezione Appunti

42. Strutture di ordine superiore della cromatina Una volta che i nucleosomi si sono formati, il passaggio successivo che permette di determinare un ulteriore impacchettamento del DNA è il legame dell'istone H1. Come gli istoni del core, H1 è una piccola proteina con carica netta positiva. Esso interagisce con il DNA linker costringendo il DNA ad una maggiore adesione all'ottamero istonico. Comunque, l'istone H1 ha la non comune proprietà di legare due distinte regioni del DNA duplex: la prima è il DNA linker che fiancheggia il nucleosoma, il secondo sito è nella parte mediana delle 147 bp associate all'ottamero istonico. Tenendo queste due regioni del DNA riavvicinate, il legame di H1 aumenta la lunghezza del DNA arrotolato strettamente attorno all'ottamero istonico. Il legame di H1 stabilizza, quindi, una struttura cromatinica di ordine superiore. In vitro, ad alta concentrazione salina, l'aggiunta dell'istone H1 determina una struttura avente una sezione trasversale di 30 nm: la fibra da 30 nm. Questa struttura, visibile anche in vivo, rappresenta il successivo livello strutturale necessario per condensare il DNA. Esistono due modelli strutturali che possono spiegare la fibra di 30 nm: nel primo, detto a solenoide, il DNA è organizzato in nucleosomi a formare una superelica contenente approssimativamente sei nucleosomi per giro; nel secondo, invece, detto a zig-zag, i nucleosomi si dispongono appunto a zig-zag, sempre in aggiunta dell'istone H1. Bisogna, inoltre, ricordare che gli istoni del core mancanti delle code Nterminali sono incapaci di formare la fibra da 30 nm, in quanto le code stabilizzano l'ottamero e quindi i successivi livelli di compattamento. La condensazione del DNA nei nucleosomi e la formazione della fibra da 30 nm permettono una compattazione del DNA approssimativamente di 40 volte. Questo grado di compattazione è, però, ancora insufficiente per alloggiare 1-2 metri di DNA dentro un nucleo avente approssimativamente un diametro di 10-5 metri. Si rendono quindi necessarie altre strutture. Sebbene la natura di quest'ultime non sia ancora ben chiarita è stato proposto un modello molto condiviso: cioè quello in cui la fibra da 30 nm forma delle anse contenenti 40-90 kb di DNA. Queste anse sono bloccate alla loro base da una struttura proteica indicata come scafflod nucleare. Le proteine che fanno parte di quest'ultima struttura proteica sono principalmente la topoisomerasi II e le proteine SMC che sono componenti chiave del meccanismo di condensazione che porta alla formazione dei cromosomi dopo la replicazione del DNA. Infine, bisogna dire, che gli istoni del core sono fra le proteine eucariotiche più conservate nell'evoluzione per cui i nucleosomi formati da queste proteine sono molto simili a tutti gli eucariotici. Ma ci sono alcune varianti istoniche che possono rimpiazzare uno dei quattro istoni standard. Ad esempio, CENP-A, è associata ai nucleosomi che includono il DNA centromerico. In questa regione del cromosoma, CENP-A sostituisce l'istone H3. In questa sede la coda più lunga di CENP-A, in confronto ad H3, permette di generare nuovi siti di legame per altre componenti proteiche del cinetocore.

Biologia molecolare

Pagina 58 di 173

Domenico Azarnia Tehran

Sezione Appunti

43. Regolazione della struttura della cromatina La natura dinamica del legame del DNA al core ottamerico è importante, poiché molte proteine che legano il DNA preferiscono di gran lunga farlo sul DNA nudo. Queste proteine, infatti, possono riconoscere il sito specifico di legame solamente quando viene lasciato libero dagli istoni, cioè quando tale sito è contenuto nel DNA linker o comunque privo di nucleosomi. Si è visto, che di solito, l'accessibilità al DNA decresce andando verso il diad axis (diadi). La stabilità dell'interazione dell'ottamero istonico con il DNA è influenzata da grossi complessi proteici chiamati complessi di rimodellamento nucleosomico. Questi complessi multiproteici facilitano i cambiamenti della posizione dei nucleosomi o dell'interazione fra il DNA e l'ottamero utilizzando l'energia proveniente dall'idrolisi di ATP. Questi cambiamenti possono avvenire in tre modi: 1) per scivolamento dell'ottamero istonico lungo il DNA, 2) per trasferimento dell'ottamero istonico da un tratto del DNA ad un altro, o 3) per rimodellamento del nucleosoma in modo tale da permettere un maggiore accesso al DNA. In dettaglio, lo scivolamento è già una caratteristica intrinseca del nucleosoma, mentre durante il rimodellamento vi sono dei veri e propri complessi ATPdipendenti. Questi complessi agiscono come delle leve, legandosi e trascinando, per 10-15 bp, il DNA in una direzione rendendolo più accessibile. Naturalmente lo spostamento si propaga in tutto il DNA. Sempre per quanto riguarda la regolazione, dobbiamo dire che quando gli istoni vengono isolati dalle cellule, le loro code N-terminali (come anche le teste C-terminali) si presentano modificate per l'aggiunta di una varietà di piccole molecole. Le lisine sono frequentemente modificate con l'aggiunta di gruppi acetilici o metilici e le serine sono soggette a modificazioni per l'aggiunta di gruppi fosforici. Tipicamente, i nucleosomi acetilati sono associati con regioni dei nucleosomi che sono trascrizionalmente attivi, mentre nucleosomi deacetilati sono associati a zone del cromosoma trascrizionalmente represse. A differenza dell'acetilazione, la metilazione della coda N-terminale degli istoni è associata sia a fenomeni di repressione che di attivazione della cromatina in funzione dell'amminoacido che viene modificato. La fosforilazione della coda N-terminale dell'istone H3, invece, è comunemente osservata nella cromatina altamente condensata dei cromosomi mitotici. Per questi motivi, è stato proposto che queste modificazioni formino un codice che può essere letto dalle proteine coinvolte nell'espressione genica. Come possono le modificazione degli istoni alterare la funzione cromosomica? Un ovvio cambiamento è che l'acetilazione e la fosforilazione determinano la riduzione delle cariche positive delle code istoniche; l'acetilazione della lisina neutralizza le sue cariche positive. Questa perdita di cariche positive riduce l'affinità delle code per l'impalcatura longitudinale del DNA che si presenta carico negativamente per la presenza dei residui fosforici. Inoltre, la modificazione delle code istoniche ha, anche, un effetto diretto sulla funzione del nucleosoma permettendo la formazione di siti di legame per proteine regolative. Specifici domini strutturali chiamati bromodomini e cromodomini mediano queste interazioni. Il bromodominio è presente in proteine che interagiscono con le code acetilate degli istoni, mentre proteine contenenti il cromodominio interagiscono con le code metilate degli istoni. Molte delle proteine che contengono il bromodominio posseggono attività acetil trasferasica e agiscono specificatamente sulle code istoniche. Questi complessi possono facilitare il mantenimento e la creazione di cromatina acetilata. L'associazione delle proteine contenenti il cromodominio con enzimi in grado di metilare specificatamente le code degli istoni suggerisce, invece, una loro funzione nel

Biologia molecolare

Pagina 59 di 173

Domenico Azarnia Tehran

Sezione Appunti

mantenimento della metilazione dei nucleosomi.

Biologia molecolare

Pagina 60 di 173

Domenico Azarnia Tehran

Sezione Appunti

44. La replicazione del DNA Quando fu scoperta la struttura della doppia elica del DNA, la caratteristica che colpì i biologi fu la complementarietà delle basi fra le catene polinucleotidiche. Apparve immediatamente chiaro che questa struttura potesse essere utilizzata come base per la replicazione. Infatti, fu la natura complementare dei due filamenti che portò molti biologi ad accettare le conclusioni di Oswald T. Avery che sosteneva che il depositario dell'informazione genetica fosse il DNA e non le proteine. Tuttavia, tutt'oggi, la replicazione anche della più semplice molecola di DNA, è una reazione molto complessa che coinvolge molti enzimi: tanto complessa da non essere stata ancora del tutto chiarita. Inoltre, la replicazione deve essere un meccanismo particolarmente fine per permettere il minor numero di mutazioni, ma anche regolato, per far si che il genoma di una determinata cellula si duplichi una sola volta per divisione cellulare.

Biologia molecolare

Pagina 61 di 173

Domenico Azarnia Tehran

Sezione Appunti

45. La chimica della sintesi del DNA Perché la sintesi del DNA possa avvenire sono necessari due substrati. Primo, sono richiesti i quattro deossinucleosidi trifosfati: dGTP, dCTP, dATP e dTTP. I nucleosidi trifosfati hanno tre gruppi fosforici che sono attaccati al 2'-deossiribosio tramite un legame ossidrilico al 5'-C dello zucchero. Il gruppo fosforico più interno (cioè più prossimale al deossiribosio) viene indicato come fosfato mentre quello intermedio ed il più distale sono rispettivamente i fosfati e . Il secondo importante substrato necessario per la sintesi del DNA è un particolare complesso formato da DNA a singolo e a doppio filamento chiamato complesso innesco:stampo (primer-template). Come suggerisce il nome stesso, questo complesso è formato da due componenti: lo stampo è costituito da DNA a singolo filamento che dirige l'aggiunta, alla catena neosintetizzata, dei deossinucleotidi complementari. L'innesco, invece, è complementare allo stampo, ma molto più corto e deve presentare, alla sua terminazione, un gruppo 3'-OH. Questo terminale verrà allungato man mano che i nucleotidi verranno aggiunti, quindi in direzione 5'3'. Comunque, la chimica della sintesi del DNA richiede che la nuova catena cresca allungando il terminale 3' dell'innesco. Questa è una caratteristica universale che riguarda sia la sintesi del DNA che quella dell'RNA. Il legame fosfodiesterico, per aggiungere nucleotidi, si forma mediante una reazione di sostituzione nucleofila (SN2) in cui il gruppo ossidrilico al terminale 3' dell'innesco si attacca al gruppo -fosfato del nucleoside trifosfato che deve essere polimerizzato. La molecola che viene rilasciata durante la reazione è un gruppo pirofosfato formato dai fosfati e del nucleotide. Il filamento stampo, in questa reazione, determina quale dei quattro nucleosidi trifosfati debba essere aggiunto alla catena di neosintesi. Il nucleoside trifosfato che risulta complementare a quello del filamento stampo è altamente favorito e quindi legato all'innesco.

Biologia molecolare

Pagina 62 di 173

Domenico Azarnia Tehran

Sezione Appunti

46. Il meccanismo d'azione della DNA polimerasi La sintesi del DNA è catalizzata da un enzima chiamato DNA polimerasi. A differenza della maggior parte degli enzimi, che posseggono un sito dedicato per ogni singola reazione, la DNA polimerasi utilizza un unico sito attivo per catalizzare l'aggiunta di tutti e quattro i deossinucleosidi trifosfati. La DNA polimerasi possiede questa flessibilità catalitica che permette di tener conto della identica geometria che caratterizza le coppie di basi A:T e G:C. Quindi, questo enzima, controlla la capacità de nucleotide che deve essere polimerizzato di formare le coppie aventi un ingombro sterico identico come lo sono quelle A:T o G:C piuttosto che verificare la correttezza del nucleotide che entra nel sito attivo. Soltanto quando si forma una corretta coppia di basi il 3'-OH dell'innesco ed il fosfato in del nucleotide che deve essere polimerizzato si trovano in una posizione ottimale per la formazione del legame fosfodiesterico. Le DNA polimerasi, inoltre, mostrano un'impressionante abilità nel distinguere fra ribo- e deossinucleotidi trifosfati. Nonostante i ribonucleotidi siano, nella cellula, approssimativamente dieci volte più concentrati dei deossi-, essi sono incorporati ad una velocità che è 1000 volte più bassa. Questa discriminazione è mediata da un esclusione di carattere sterico che coinvolge il sito attivo della polimerasi. Infatti, nella DNA polimerasi, il sito di legame al nucleotide è troppo piccolo per permettere la presenza di un 2'-OH sul nucleotide che deve essere polimerizzato. Una spiegazione molecolare di come la DNA polimerasi catalizzi la sintesi del DNA emerge dagli studi della struttura atomica di varie DNA polimerasi mentre legano il complesso innesco:stampo. Queste strutture rilevano che il DNA substrato si pone in un grande spazio che assomiglia ad una mano destra parzialmente chiusa. Per analogia i tre domini che formano la polimerasi vengono chiamati: pollice, dita e palmo. Il palmo è composto da un foglietto e contiene gli elementi principali del sito catalitico. In particolare, questa regione della DNA polimerasi lega due ioni bivalenti (di norma Mg2+ o Zn2+) che modificano dal punto di vista chimico l'ambiente attorno alle basi appaiate e il 2'-OH dell'innesco. Infatti, uno ione metallico riduce l'affinità del 3'-OH per il suo idrogeno, generando un 3'-O- necessario per l'attacco nucleofilico del fosfato in del nucleotide che deve essere polimerizzato. Il secondo ione stabilizza, invece, il pirofosfato prodotto durante la reazione, schermando anche le cariche negative del dNTP . In aggiunta del suo ruolo catalitico, il palmo controlla anche l'accuratezza dell'appaiamento delle basi che sono appena state polimerizzate. Infatti, questa regione della polimerasi forma con le coppie di basi numerosi legami idrogeno. Appaiamenti scorretti abbassano drasticamente la velocità di polimerizzazione. La ridotta velocità di catalisi, unita ad una ridotta affinità per il DNA neosintetizzato, permette il rilascio dell'innesco:stampo da parte del sito attivo polimerizzante della DNA polimerasi ed il legame ad un sito con attività nucleasica con funzioni di lettore e correttore di bozze. Le dita sono anch'esse importanti per la catalisi. Infatti, alcuni residui amminoacidici localizzati all'interno delle dita legano i dNTP (deossinucleotiditrifosfato) che devono essere polimerizzati. Inoltre, una volta che si è formato un corretto appaiamento, le dita si muovono per racchiudere e trattenere il dNTP. Le dita entrano in contatto anche con la regione dello stampo piegando di circa 90° il legame fosfodiesterico che si trova immediatamente dopo il sito catalitico. Questa curvatura, permette di esporre, al sito attivo, soltanto la prima base dello stampo che si trova dopo l'innesco. Questa conformazione dello stampo elimina qualsiasi confusione nella scelta del nucleotide che deve essere

Biologia molecolare

Pagina 63 di 173

Domenico Azarnia Tehran

Sezione Appunti

polimerizzato. Al contrario delle dita e del palmo, il pollice, invece, non è direttamente coinvolto nella catalisi. Questo serve a due scopi: primo, mantiene in corretta posizione l'innesco ed il sito attivo; secondo, stabilizza il complesso fra la DNA polimerasi ed il substrato. Questa associazione contribuisce ad aumentare la capacità della DNA polimerasi nell'aggiungere molti nucleotidi tutte le volte che si lega al complesso innesco:stampo. Comunque, la catalisi mediata dalla DNA polimerasi è un evento rapido. Le DNA polimerasi sono capaci di polimerizzare circa 1000 nucleotidi al secondo. La velocità di sintesi è principalmente dovuta alla natura processiva dell'enzima. La processività è una caratteristica degli enzimi che hanno come substrato dei polimeri. Nel caso della DNA polimerasi, il grado di processività viene definito come il numero medio di nucleotidi polimerizzati dall'enzima nell'unità di tempo. Ogni DNA polimerasi è caratterizzata da una propria processività che può variare da pochi nucleotidi a più di 50000 basi aggiunte ogni volta che l'enzima di poggia sullo stampo. La polimerizzazione viene di molto aumentata una volta che l'enzima è riuscito a legarsi al complesso innesco:stampo, di fatto questo è l'evento che può limitare l'efficienza della DNA polimerasi. Un ulteriore aumento della processività è reso possibile dall'interazione della polimerasi con una proteina sliding clamp che ha funzione di trascinare la polimerasi stessa. Questa proteina ha una struttura ad anello e, quando legata, circonda il DNA. Una certa limitazione della precisione della DNA polimerasi è data dalla occasionale (1 volta ogni 105) trasformazioni di una base in una forma tautomerica errata (iminica o enolica). Queste forme alternative delle basi determinano degli errori che necessariamente devono essere rimossi. La possibilità di correzione del DNA neosintetizzato è mediata dalla presenza di nucleasi che rimuovono le basi scorrette. Questo tipo di nucleasi è stato inizialmente identificato come attività associata alla stessa DNA polimerasi ed è conosciuto con il nome di esonucleasi correttore di bozze (proofreading exonuclease). Questo tipo di esonucleasi è capace di demolire il DNA a partire dal terminale 3' OH, cioè dal punto in cui la nuova catena di DNA si sta allungando. (Le nucleasi che idrolizzano il DNA a partire da un'estremità della molecola vengono dette esonucleasi; le nucleasi che invece tagliano all'interno il filamento di DNA sono chiamate endonucleasi). La rimozione dei nucleotidi errati è facilitata dalla ridotta capacità dell'enzima stesso di aggiungere successivi nucleotidi ad una coppia di basi che non rispetta il principio di complementarietà, in quanto gli errori alterano la geometria del 3'-OH che serve per continuare la sintesi. Quindi quando viene aggiunto un nucleotide non corretto diminuisce la velocità di polimerizzazione, mentre aumenta quella di correzione dell'errore da parte dell'attività esonucleasica. Comunque, la correzione degli errori non richiede l'allontanamento del DNA dalla tasca catalitica, in quanto la coppia di basi errata scivola dal sito attivo della DNA polimerasi e si avvicina al sito che contiene l'attività esonucleasica. Bisogna, inoltre ricordare che l'esonucleasi correttore di bozze agisce in direzione 5'3', la stessa della replicazione, in quanto, la direzione opposta porterebbe, dopo l'eliminazione del nucleotide errato ad un terminale che possiede un solo fosfato e quindi non ha energia necessaria per legare successivamente il nucleotide corretto. Comunque, questo meccanismo di correzione abbassa la presenza di errori a uno ogni 107. Ulteriori processi di riparazione faranno abbassare questo numero.

Biologia molecolare

Pagina 64 di 173

Domenico Azarnia Tehran

Sezione Appunti

47. La forca replicativa Nella cellula, entrambi i filamenti della doppia elica vengono replicati contemporaneamente. Perché avvenga ciò è necessaria la separazione dei due filamenti della doppia elica in modo tale da creare due catene di DNA stampo a singolo filamento, grazie a enzimi denominati DNA elicasi. Questi enzimi si legano e si spostano lungo il singolo filamento di DNA utilizzando l'energia fornita dall'idrolisi di nucleotidi trifosfato: di solito ATP. Di solito le DNA elicasi che agiscono a questo livello sono proteine esameriche che assumono una conformazione ad anello circondando uno dei due filamenti. Ciascuna elicasi si sposta lungo il DNA in una direzione definita e possono avere una polarità sia 5'3' che 3'5'. Dopo il passaggio della DNA elicasi, il singolo filamento generato non può riappaiarsi con il filamento complementare in quanto deve essere usato come stampo per la sintesi della nuova catena di DNA. Per stabilizzare le catene separate esistono delle proteine: le SSB (single stranded binding protein), che rapidamente si legano ad un singolo filamento. La presenza di una SSB facilita il legame di un'altra SSB sul tratto di DNA adiacente, agendo in maniera cooperativa. Questo legame cooperativo assicura che il singolo filamento, una volta creato dal passaggio dell'elicasi, venga rapidamente ricoperto dalle SSB. Bisogna, inoltre, specificare che nel momento in cui i due filamenti vengono separati, a valle della forca replicativa si formano dei superavvolgimenti positivi. Questo accumulo di superavvolgimenti è il risultato dell'attività della DNA elicasi che elimina i legami idrogeno fra le catene complementari. Queste supereliche vengono rimosse dalle DNA topoisomerasi che agiscono sul DNA a valle del sito di replicazione. Questi enzimi riescono a compiere questa attività tagliando o uno o entrambi i filamenti del DNA senza distaccarsi dal substrato e passando l'altro filamento attraverso la rottura e successivamente richiudendo il filamento interrotto. Comunque, man mano che avviene la sintesi, il punto che si trova tra i due filamenti separati e la doppia elica che ancora non ha subito il processo di divisione è conosciuto come forca replicativa ed è il punto dove vengono sintetizzate le nuove catene di DNA. Però, la natura antiparallela della doppia elica crea una complicanza per la replicazione simultanea dei due stampi alla forca replicativa. Poiché il DNA è sintetizzato aggiungendo nucleotidi al terminale 3', soltanto uno dei filamenti stampo può essere replicato seguendo in modo continuo la progressione della forca replicativa. Su questo filamento stampo, la polimerasi semplicemente segue la forca replicativa e il DNA neosintetizzato è conosciuto con il nome di leading strand (filamento continuo). La sintesi del DNA, che ha come stampo l'altro filamento, è più problematica. Questo stampo impone alla DNA polimerasi di muoversi in direzione opposta rispetto alla direzione di espansione della forca replicativa. Il DNA neosintetizzato su questo stampo è conosciuto come lagging strand (filamento ritardato). In quest'ultimo filamento, ogni qual volta si crea dello stampo di lunghezza adeguata, inizia la sintesi di DNA fino a raggiungere il terminale 5' del precedente tratto di DNA già sintetizzato. I risultanti frammenti di nuova sintesi vengono chiamati frammenti di Okazaki e possono variare in lunghezza dai 1000 ai 2000 nucleotidi nei batteri e dai 100 ai 400 nucleotidi negli eucarioti. Subito dopo essere stati sintetizzati questi frammenti vengono uniti covalentemente l'uno all'altro per creare un filamento continuo di DNA. Comunque, in entrambi i filamenti, tutte le DNA polimerasi richiedono un innesco che presenti un OH sul 3' dello zucchero, infatti questi enzimi non possono iniziare la sintesi di DNA de novo. Per questo la cellula utilizza la primasi, un RNA polimerasi specializzata che permette la formazione di corti (5-10 nucleotidi)

Biologia molecolare

Pagina 65 di 173

Domenico Azarnia Tehran

Sezione Appunti

RNA primer (innesco) che vengono sintetizzati utilizzando come stampo DNA a singolo filamento. Questi RNA primer sono successivamente allungati dalla DNA polimerasi e utilizzati per la sintesi in quanto le DNA polimerasi sono in grado di iniziale la sintesi usando sia inneschi di RNA che di DNA. Bisogna, però, ricordare che mentre il filamento continuo richiede un unico RNA primer, la sintesi discontinua sul filamento discontinuo è possibile a patto che venga sintetizzato un RNA primer ogni frammento di Okazaki. In generale, oltre che con la primasi, l'innesco può essere fornito da un nick, ossia un taglio su un filamento del DNA che rilascia un'estremità 3'-OH, oppure da alcune proteine che possono fornire la stessa estremità libera. Affinché la replicazione del DNA sia completa, gli RNA primer utilizzati per la sintesi devono essere eliminati e rimpiazzati con deossiribonucleotidi. Per questo motivo interviene un enzima chiamato RNAsi H che riconosce e rimuove la maggior parte di ciascun primer. Questo enzima idrolizza specificatamente l'RNA appaiato con catene di DNA (l'H sta a significate ibrido, Hybrid RNA:DNA). La rimozione dell'RNA primer lascia nel DNA uno spazio a singolo filamento (gap) che è un substrato ideale per la DNA polimerasi: un complesso innesco:stampo. La DNA polimerasi riempie questi gap fino a che non si ricostruisce un doppio filamento, formando così un DNA completo eccetto per l'interruzione di un legame fosfodiesterico fra il terminale 3'-OH e quello 5' del fosfato sul filamento riparato. Questa interruzione (nick) può essere eliminata da un enzima: la DNA ligasi, che utilizza ATP per creare il legame fosfodiesterico.

Biologia molecolare

Pagina 66 di 173

Domenico Azarnia Tehran

Sezione Appunti

48. La specializzazione delle DNA polimerasi Per un efficiente e accurata reazione di replicazione del DNA bisogna che nella cellula vi siano DNA polimerasi diverse e specializzate. Per esempio, E. coli ha almeno cinque DNA polimerasi diverse che sono distinguibili per le loro attività enzimatiche, composizione in subunità, e numero di molecole per cellule. La DNA polimerasi III (DNA pol III) è il principale enzima coinvolto nella replicazione del DNA mentre la DNA polimerasi I (DNA pol I) è specializzata nella rimozione degli RNA primer che vengono utilizzati per iniziare la sintesi di DNA. Comunque, entrambi gli enzimi, per essere molto precisi durante il processo, portano associata un'attività esonucleasica che permette la correzione di eventuali errori. Le tre restanti DNA polimerasi di E. coli sono specializzate per la riparazione del DNA e mancano di questa attività esonucleasica. Anche gli eucarioti posseggono più DNA polimerasi: una tipica cellula eucariotica ne possiede più di 15. Di queste, tre sono essenziali per la duplicazione del genoma: DNA pol , DNA pol e DNA pol /primasi. Quest'ultima è specificatamente coinvolta nell'iniziare le nuove catene e consiste di una proteina formata da quattro subunità: a due di queste è associata l'attività polimerasica, mentre le altre due hanno attività primasica. A causa della relativa lentezza di questo enzima, esso è rapidamente rimpiazzato dalle polimerasi altamente processive e . Il processo che porta a questo rimpiazzo è detto switching delle polimerasi. In generale, l'aumento di processività della DNA polimerasi alla forca replicativa dipende dalla sua associazione con proteine chiamate DNA sliding clamp (“pinza scorrevole”). Queste proteine sono composte da più subunità uguali fra loro che determinano, nel loro complesso, una forma a “ciambella” o “pinza”. Questa proteina scivola lungo il DNA senza mai dissociarsi da esso, mantenendo fortemente la DNA polimerasi posizionata alla forca replicativa. In questo modo la proteina circonda il doppio filamento neosintetizzato e tiene in posizione la polimerasi associata con il substrato innesco:stampo.

Biologia molecolare

Pagina 67 di 173

Domenico Azarnia Tehran

Sezione Appunti

49. La sintesi del DNA a livello della forca replicativa A livello della forca replicativa i filamenti leading e lagging sono sintetizzati simultaneamente. Questo porta all'importante vantaggio di limitare la quantità di DNA a singolo filamento presente nelle cellule durante la replicazione. Quindi, per coordinare la replicazione di entrambi i filamenti, molte DNA polimerasi lavorano in corrispondenza della forca replicativa. Per esempio, in E. coli, l'azione coordinate di queste polimerasi è facilitata dal legame fisico che le tiene unite in un grande complesso multiproteico chiamato DNA pol III oloenzima. Oloenzima è un nome generico per indicare un complesso multiproteico in cui una proteina che possiede attività catalitica (core) è associata a componenti addizionali che aumentano e regolano la sua funzione. La DNA pol III oloenzima include due copie dell'enzima DNA pol III core ed una copia di un complesso formato da cinque proteine , che si lega ad entrambi le copie della DNA pol III core. Esiste il cosiddetto modello a trombone che ci spiega come tutti gli enzimi e le proteine agiscono a livello della forca replicativa. La DNA elicasi si muove, alla forca replicativa di E. coli, sullo stampo del filamento lagging, in direzione 5'3'. La DNA pol III oloenzima interagisce con la DNA elicasi grazie al fattore , che interagisce con entrambi le polimerasi. Una DNA pol III core sintetizza il filamento leading mentre l'altra sintetizza la catena lagging. Le SSB coprono le regioni di DNA a singolo filamento. Periodicamente, la DNA primasi si associa con la elicasi e sintetizza un nuovo innesco sulla catena discontinua. Quando la DNA polimerasi sul filamento lagging completa un frammento di Okazaki viene rilasciata dalla proteina sliding clamp e dal DNA. Quindi, il filamento lagging su cui si è appena formato un innesco diventa un punto di attrazione per il posizionatore della sliding clamp sul complesso innesco:stampo. Quest'ultimo con associata la proteina sliding clamp lega la DNA polimerasi che inizia la polimerizzazione di un nuovo frammento di Okazaki. Comunque, tutto il complesso delle proteine che lavorano nella forca replicativa viene chiamato replisoma.

Biologia molecolare

Pagina 68 di 173

Domenico Azarnia Tehran

Sezione Appunti

50. La fase di inizio della replicazione La fase iniziale della formazione della forca replicativa richiede la separazione dei due filamenti del DNA in modo tale che possano fornire uno stampo per la sintesi dei primer e del DNA. Sebbene questa separazione sia semplice all'estremità terminali dei cromosomi, la sintesi del DNA generalmente inizia in una o più regioni interne, questo vale anche per i cromosomi circolari dei batteri che non hanno estremità. Gli specifici siti dove il DNA si apre e dove inizia la sintesi vengono chiamati origini di replicazione. A seconda degli organismi ci possono essere da una a migliaia di queste origini. Nel 1963, Francois Jacob, Sydney Brenner e Jacques Cuzin proposero un modello per spiegare gli eventi che permettono l'inizio della replicazione nei batteri. Essi definirono tutto il DNA sintetizzato, a partire da un'unica origine, come replicone. Per esempio, poiché l'unico cromosoma di E. coli ha un'unica origine di replicazione, l'intero cromosoma è un replicone. Al contrario, multiple origini di replicazione frazionano il singolo cromosoma eucariotico, in altrettanti repliconi: uno per origine. Il modello del replicone contempla due componenti che controllano l'inizio della replicazione: il replicatore e l'iniziatore. Il replicatore è definito come l'intero set di sequenze nucleotidiche agenti in cis sufficiente per dirigere l'inizio della replicazione. L'iniziatore, invece, è una proteina che riconosce in modo specifico un elemento del DNA che si trova nel replicatore, e attiva l'inizio della replicazione. Comunque, le sequenze di DNA che rappresentano il replicatore condividono due caratteristiche comuni. In primo luogo, esse includono un sito di legame per la proteina iniziatrice, per secondo, esse includono tratti ricchi di AT che si aprono molto facilmente anche se non spontaneamente. In E. coli il replicatore necessario per la replicazione del cromosoma è chiamato oriC. Una sequenza di 9 paia di basi, ripetuta cinque volte, è il sito di legame per l'iniziatore: la proteina DnaA. Un'altra sequenza di 13 bp, ripetuta tre volte è il sito dove la doppia elica inizia a dividersi per formare il singolo filamento. I replicatori trovati negli eucarioti multicellulari, invece, non sono stati ancora identificati con certezza.

Biologia molecolare

Pagina 69 di 173

Domenico Azarnia Tehran

Sezione Appunti

51. Selezione delle origini e attivazione operata dell'iniziatore Le proteine iniziatore svolgono la loro funzione durante la fase di inizio della replicazione. In primo luogo, queste proteine legano specifiche sequenze di DNA all'interno del replicatore; secondo, una volta legate al DNA, esse deformano o aprono la doppia elica in una regione del DNA adiacente al loro sito di legame; terzo, queste proteine interagiscono con fattori addizionali richiesti per l'inizio della replicazione. Per esempio in E. coli, la proteina DnaA, lega gli elementi di 9 bp ripetuti presenti in oriC, e la sua funzione viene regolata dalla presenza di ATP. Nelle cellule eucariotiche, invece, l'iniziatore è una proteina complessa esamerica chiamata ORC, origin recognition complex. La funzione di ORC è stata ben studiata nelle cellule di lievito, dove si è visto che riconosce una sequenza chiamata elemento-A e successivamente, tramite sempre idrolisi dell'ATP, riesce a richiamate tutto il macchinario necessario per la replicazione. Una volta che l'iniziatore si è legato al replicatore, gli altri processi coinvolti nell'inizio della replicazione sono largamente guidati da interazioni proteina-proteina e proteina-DNA, eventi che sono sequenza indipendenti. Infatti, dopo che l'iniziatore (DnaA) si è legato a oriC ed ha separato la doppia elica, la combinazione di DNA a singolo filamento con la proteina DnaA richiama un complesso formato da due fattori: la DNA elicasi (DnaB), ed il posizionatore della elicasi (DnaC). La DNA elicasi è mantenuta, inizialmente, in uno stato inattivo per poi attivarsi quando viene rilasciato il suo posizionatore e procede scorrendo in direzione 5'3'. Le interazioni proteina-proteina fra la elicasi e gli altri componenti della forca replicativa, permettono l'assemblaggio del resto del complesso replicativo. La elicasi, infatti, richiama la DNA primasi verso l'origine di replicazione: ciò permette la sintesi di un RNA primer su ciascun filamento stampo. La DNA pol III oloenzima è reclutata all'origine mediante interazioni con la giunzione innesco:stampo e la elicasi. Una volta che l'oloenzima si è posizionato le sliding clamp sono assemblate sul primer e le DNA polimerasi che sintetizzano le catene leading iniziano a lavorare. Man mano che, per opera della elicasi, si crea del nuovo singolo filamento, esso viene ricoperto dalle SSB e la DNA primasi può sintetizzare sul filamento lagging, il primo primer. L'inizio della replicazione negli eucarioti, invece, richiede due eventi che devono avvenire in tempi prestabiliti durante il ciclo cellulare: la selezione del replicatore e l'attivazione dell'origine. La selezione del replicatore è il processo che permette di identificare le sequenze che dirigeranno l'inizio della replicazione ed avviene nella fase G1 (e precede la fase S, dove deve avvenire la replicazione). Questo processo porta all'assemblaggio di un complesso multiproteico su ciascun replicatore del genoma. (Di solito i replicatori risultano essere metilati). L'attivazione dell'origine avviene solamente dopo che le cellule sono entrate in fase S e quando il complesso proteico associato al replicatore inizia a separare i due filamenti di DNA, e ad avviare il reclutamento della DNA polimerasi. La selezione del replicatore è mediata dalla formazione di un complesso pre-replicativo (pre-RC). Quest'ultimo è formato da quattro proteine separate che si assemblano su ciascun replicatore. Il primo stadio nella formazione del pre-RC è il riconoscimento del replicatore da parte dell'iniziatore ORC. Una volta che avviene questo si legano due posizionatori delle elicasi (Cdc6 e Cdt1). Questo complesso recluta infine l'elicasi. Il pre-RC viene definitivamente attivato da due proteine chinasi (Cdk e Ddk) nella fase S. Queste proteine fosforilano pre-RC e permettono l'avvio della replicazione e quindi il reclutamento di tutte le DNA polimerasi. Le proteine chinasi sono molto importanti in quanto

Biologia molecolare

Pagina 70 di 173

Domenico Azarnia Tehran

Sezione Appunti

controllano l'attività di migliaia di origini di replicazione per far si che vengano attivate una sola volta in ciascun ciclo. Infatti, si è visto, che Cdk gioca un doppio ruolo, grazie alla presenza di diverse concentrazioni nelle varie fasi del ciclo cellulare: da una parte attiva il pre-RC fosforilandolo, dall'altra inibisce la formazione dei nuovi pre-RC.

Biologia molecolare

Pagina 71 di 173

Domenico Azarnia Tehran

Sezione Appunti

52. La terminazione della replicazione Il completamento della replicazione del DNA richiede una specifica serie di eventi. Questi sono diversi a seconda se i cromosomi sono circolari o lineari. Infatti, dopo la replicazione di un cromosoma circolare, le risultanti molecole figlie rimangono legate assieme come due anelli di una catena. Per segregare quindi questi due cromosomi nelle cellule figlie, troviamo l'attività della topoisomerasi II. Questi enzimi hanno la capacità di tagliare una doppia elica e far passare un secondo doppio filamento attraverso l'interruzione fatta precedentemente. Questa reazione permetta la decatenazione dei due cromosomi neosintetizzati. Per quanto riguarda invece i cromosomi lineari, una volta avvenuta la replicazione si riscontrano problemi nella replicazione delle parti terminali dei cromosomi lineari nella catena lagging. Infatti, in questa catena discontinua non appena il complesso raggiunge la parte terminale del cromosoma, la primasi non ha più spazio sufficiente per sintetizzare un nuovo innesco. Ciò determina una replicazione incompleta ed una regione, al terminale 3', a singolo filamento. Quando questo tratto di DNA viene ad essere replicato nel ciclo successivo, uno dei due filamenti sarà accorciato e quindi verrà a mancare tutta quella parte di DNA che non era stata replicata nel ciclo precedente. Comunque, le cellule risolvono il problema della replicazione dei terminali in una varietà di modi. Una prima soluzione è quella di usare come primer, una proteina al posto di un RNA almeno per l'ultimo frammento di Okazaki su ciascun estremità del cromosoma. In questo caso la proteina fornisce un OH che possa rimpiazzare il 3'-OH normalmente fornito dall'RNA primer. La maggior parte delle cellule eucariotiche, però, si avvale di una soluzione completamente diversa. Come abbiamo visto in precedenza, le estremità dei cromosomi eucariotici vengono denominate telomeri e sono generalmente formate da sequenze ripetute ricche di TG (5'-TTAGGG-3'). Sebbene molte di queste ripetizioni siano a doppio filamento, il 3' di ciascun cromosoma si estende oltre il 5' formano un tratto di DNA a singolo filamento che può essere utilizzato come origine di replicazione per risolvere il problema. Questa regione recluta un particolare enzima chiamato telomerasi, formato da una parte proteica e una parte di RNA. Come tutte le altre polimerasi, la telomerasi agisce allungando il terminale 3' del suo substrato. Ma a differenza della maggior parte delle DNA polimerasi, la telomerasi non necessita di uno stampo esogeno che indirizzi la polimerizzazione dei nuovi nucleotidi, in quanto la componente ad RNA funziona come stampo endogeno.

Biologia molecolare

Pagina 72 di 173

Domenico Azarnia Tehran

Sezione Appunti

53. La mutabilità e la riparazione del DNA Un basso tasso di mutazione è requisito essenziale perché il materiale genetico venga trasmesso in maniera corretta da una generazione all'altra. Infatti, un'alta frequenza di mutazione a livello della linea germinale distruggerebbe la specie, mentre, a livello delle cellule somatiche, annienterebbe il singolo individuo. D'altro canto, se il materiale genetico venisse ad essere trasmesso con assoluta fedeltà, verrebbe a mancare quella variabilità genetica necessaria all'evoluzione; una situazione incompatibile con la comparsa di nuove specie, inclusa quella umana. La vita e la biodiversità dipendono, quindi, da un giusto equilibrio tra l'insorgenza di nuove mutazioni e la capacità di ripararle. Comunque, l'inaccuratezza della replicazione del DNA e il danno chimico rappresentano le due principali fonti di danno al genoma. Per quel che concerne gli errori di replicazione, essi derivano principalmente dalla tautomerizzazione, fenomeno che rappresenta un limite nell'accuratezza dell'appaiamento delle vasi durante la sintesi del DNA. Il macchinario enzimatico deputato alla replicazione tenta di correggere l'incorporazione di nucleotidi sbagliati attraverso un meccanismo di correzione di bozze, ma a volta alcuni di essi sfuggono al controllo. Riguardo al danno chimico, il DNA è una molecola organica complessa e fragile, dotata di una limitata flessibilità, che non solo va incontro a danni spontanei, quali per esempio la perdita di basi, ma viene anche aggredita da sostanze chimiche naturali e non, o da radiazioni, capaci di rompere lo scheletro della molecola o di alterarne le basi. L'inserzione di elementi a DNA, noti come trasposoni, rappresenta la terza importante fonte di mutazioni. Tutte queste mutazioni potrebbero alterare la sequenza codificante o le regioni regolative di un gene.

Biologia molecolare

Pagina 73 di 173

Domenico Azarnia Tehran

Sezione Appunti

54. Gli errori di replicazione e la loro riparazione Con mutazioni di intende praticamente ogni possibile cambiamento nella sequenza del DNA. Le più semplici mutazioni sono date dal cambiamento di una base con un'altra e ne esistono di due tipi. Le transizioni consistono in sostituzioni di pirimidine con pirimidine, o purine con purine, quali per esempio un cambiamento da T a G o A e da A a C o T. Altre mutazioni semplici consistono nell'inserimento o nella delezione di un singolo nucleotide o di un piccolo gruppo di nucleotidi. Le mutazioni a carico di un solo nucleotide sono dette mutazioni puntiformi. Altre mutazioni, quali lunghe inserzioni o delezioni e grossi riarrangiamenti della struttura cromosomica, causano dei cambiamenti più drastici del DNA. In media la frequenza con cui una nuova mutazione insorge spontaneamente in un qualunque sito del cromosoma ha un valore compreso tra 10-6 e 10-11, per ciclo di replicazione, anche se vi sono alcuni siti del cromosoma detti “punti caldi” caratterizzati da una più elevata frequenza di mutazione. Uno di questi siti sono le sequenza note come DNA satellite, costituite da brevi ripetizioni del dinucleotide CA. Il macchinario replicativo ha delle difficoltà nel copiare in modo accurato queste ripetizioni, e spesso va incontro a fenomeni che causano l'allungamento o la riduzione del numero di ripetizioni (polimorfismo nella popolazione, usato come marcatore fisico). Comunque, come abbiamo già visto, l'apparato replicativo è caratterizzato da un'elevata accuratezza, grazie ad un sistema di correzione di bozze, dato dall'attività esonucleasica 3'5' del replisoma, capace di rimuovere i nucleotidi incorporati in maniera scorretta. Questa attività di correzione di bozze aumenta la fedeltà della replicazione di un fattore 100. L'esonucleasi non è, comunque, infallibile ed alcuni nucleotidi, erroneamente incorporati, sfuggono al controllo portando ad un errore di appaiamento tra il filamento neosintetizzato e lo stampo. A questo punto, in un secondo ciclo di replicazione, il nucleotide scorrettamente incorporato, farà parte del filamento stampo e porterà all'incorporazione nel filamento di nuova sintesi di un nucleotide complementare, fissando quindi la mutazione. Per fortuna esiste un sistema capace di riconoscere i mismatch e di ripararli. Il sistema di riparazione dei mismatch o mismatch repair (MMR), che aumenta la correttezza della sintesi del DNA di due o tre fattori di grandezza, è il principale responsabile della replicazione del DNA. Questo sistema di riparazione deve affrontare due problemi: deve analizzare l'intero genoma alla ricerca di errori nell'appaiamento delle basi e ripararli velocemente. Inoltre, lo stesso sistema deve sostituire il nucleotide sbagliato, nel nucleotide di neosintesi, e non quello corretto, presente sull'elica parentale. Si è visto, che i E. coli, la prima fase dell'MMR è costituita dal riconoscimento dei substrati da parte della proteina MutS, in forma di omodimero, grazie alla lieve distorsione che provocano gli appaiamenti errati. Il legame di MutS al substrato è stimolato da un secondo omodimero MutL, la cui funzione è probabilmente quella di molecular matchmaker in grado di accoppiare il riconoscimento del danno da parte di MutS con la tappa successiva in cui interviene l'endonucleasi MutH, un enzima che taglia il filamento nelle immediate vicinanze dell'appaiamento errato. A partire dal punto di incisione, l'elica di DNA viene srotolata dalla DNA elicasi II fino al punto dov'è situato il mismatch, e il filamento che lo contiene viene quindi degradato da esonucleasi a singolo filamento in grado di agire sia con direzionalità 5'3' (RecJ e ExoVII), quindi dal taglio in 5' fino all'errore verso il 3', che 3'5' (ExoI e ExoX, esonucleasi I e X), quindi dal taglio in 3' all'errore che si trova al 5'.. Infine la DNA polimerasi III, in presenza delle proteine SSB (Single Strand Binding), colma la discontinuità formatasi e la

Biologia molecolare

Pagina 74 di 173

Domenico Azarnia Tehran

Sezione Appunti

DNA ligasi salda definitivamente il filamento riparato. Ma come fa il sistema di riparazione di E. coli a riconoscere quali dei due nucleotidi scorrettamente appaiati deve sostituire? La Dam metilasi metila i residui di A su entrambi i filamento della sequenza 5'-GATC-3'. Questa sequenza è ampiamente rappresentata lungo l'intero genoma e quando una forca di replicazione passa sulla sequenza GATC, metilata su entrambi i filamenti, le molecole DNA figlie, a doppio filamento, risultano emimetilate. Perciò per alcuni minuti, fino a quando la Dam metilasi raggiunge e modifica il filamento di neosintesi, la doppia elica di DNA figlia è metilata solamente sul filamento che funge da stampo. Il filamento di nuova sintesi risulta quindi marcato (in quanto privo di gruppo metilico) e riconoscibile come filamento da riparare. Nelle cellule eucariotiche, invece, sono stati identificati due complessi in grado di riconoscere gli errori della replicazione, MutS e MutS. Sia l'uno che l'altro contengono MSH2, che interagisce con MSH6 in MutS e con MSH3 in MutS. Dati in vitro indicano che MutS, il complesso più abbondante nelle cellule umane, riconosce preferenzialmente gli appaiamenti errati delle basi, mentre MutS sembra specificamente coinvolto nel riconoscimento di anse extra-elica maggiori di due nucleotidi. È stato ipotizzato inoltre che l'interazione di hMutS e di altre proteine permetta di utilizzare i frammenti di Okazaki quale segnale di discriminazione tra l'elica parentale ed elica di nuova sintesi. Le interazioni potrebbero quindi favorire il distacco del complesso replicativo del filamento neosintetizzato, la degradazione nucleotidica a partire dall'estremità 3'-OH libera e il reclutamento dei fattori necessari per la sintesi riparativa. Comunque, nell'uomo l'inattivazione del MMR è associata con il cancro ereditario del colon di tipo non poliposico (Hereditary Non Polyposis Colon Cancer, HNPCC), i cui affetti sviluppano tumori ad un età relativamente giovane (40-50 anni). In famiglie affette da questo tumore si osserva anche un eccesso di tumori dell'ovaio, dello stomaco e della vescicola e si è visto che la maggior parte dei pazienti presenta mutazioni germinali in eterozigosi nei geni hMLH1 e hMSH2. Questi dati suggeriscono che l'inattivazione di questi due geni abolisca completamente il MMR, mentre difetti nelle altre proteine del MMR ne causino un difetto parziale.

Biologia molecolare

Pagina 75 di 173

Domenico Azarnia Tehran

Sezione Appunti

55. I danni al DNA Le mutazioni insorgono non solo in seguito ad errori nella replicazione ma anche in seguito a fenomeni di danno al DNA. Alcuni di questi danni sono causati da fattori ambientali, quali le radiazioni e le così dette sostanze mutagene, ovvero da quei componenti chimici che aumentano la frequenza d'insorgenza delle mutazioni. D'altro canto anche l'acqua può provocare delle mutazioni spontanee al DNA. Il danno idrolitico più frequente e più importante consiste nella deamminazione della citosina portando alla formazione di uracile, una base che normalmente si ritrova nel DNA. L'uracile si appaia con l'adenina, e quindi durante la replicazione, nel filamento di neosintesi è introdotta questa base, al posto della G che si sarebbe appaiata con la C. Anche l'adenina e la guanina vanno incontro a questo processo, la prima viene convertita in ipoxantina, che forma legami idrogeno con la citosina e non con la timina, mentre la seconda è trasformata, invece, in xantina, che continua ad appaiarsi con la citosina, anche se mediante la formazione di due soli legami idrogeno. La guanina va anche incontro a depurinazione, in seguito all'idrolisi spontanea del legame Nglicosidico; questa trasformazione porta nel DNA ad un sito senza base. Inoltre, nel DNA dei vertebrati, abbonda al posto della citosina, la 5-metil citosina, il prodotto dell'attività di un enzima, noto come DNAmetiltransferasi. Questa base modificata è di importanza fondamentale nei processi di silenziamento dell'espressione genica. La deamminazione della 5-metilcitosina genera la timina che, ovviamente, non viene riconosciuta come una base anormale e, di conseguenza, in seguito a replicazione del DNA, viene fissata come transizione da C a T. In accordo con ciò, nel DNA dei vertebrati, le C metilate rappresentano dei punti suscettibili a frequenti mutazioni. Comunque, il DNA può essere danneggiato anche dall'alchilazione, l'ossidazione e l'irradiazione. Nell'alchilazione, gruppi metilici o etilici vengono trasferiti sui siti reattivi delle basi e sui fosfati dello scheletro del DNA. Ad esempio, uno dei siti suscettibili all'alchilazione è l'ossigeno dell'atomo di carbonio 6 della guanina. Il prodotto di questa metilazione, l'O6metilguanina, spesso si appaia con la timina, portando, quando il DNA danneggiato viene replicato, alla sostituzione della coppia di basi G:C con la coppia A:T. Il DNA viene attaccato anche da forme di ossigeno reattive, come per esempio l'O2-, l'H2O2 e l'OH. Questi potenti agenti ossidanti sono generati dalle radiazioni ionizzanti e dagli agenti chimici che generano radicali liberi. L'ossidazione della guanina, per esempio, porta alla formazione di oxoG. Quest'ultimo addotto è altamente mutageno perché si può appaiare sia con l'adenina che con la citosina. Un altro tipo di danno delle basi è dato dalla luce ultravioletta. Le radiazioni con una lunghezza d'onda di circa 260 nm sono fortemente assorbite dalle basi; ne deriva la fusione fotochimica di due pirimidine che occupano posizioni adiacenti sulla stessa catena polinucleotidica. Nel caso di due timine, questa fusione è detta dimero di timina, una forma molecolare che consiste in un anello ciclobutanico generato dai legami tra gli atomi di carbonio 5 e 6 delle timine adiacenti. Queste basi dimerizzate sono incapaci di formare legami idrogeno con le basi complementari e portano la DNA polimerasi ad arrestarsi durante la replicazione. Infine, le radiazioni gamma ed i raggi X (radiazioni ionizzanti) sono particolarmente pericolose perché producono nel DNA delle rotture a doppio filamento, difficili da riparare. Le mutazioni sono dovute anche all'azione di composti che sostituiscono le basi normali (analoghi delle

Biologia molecolare

Pagina 76 di 173

Domenico Azarnia Tehran

Sezione Appunti

basi) o che si infilano tra le basi (agenti intercalanti) portando ad errori replicativi. Gli analoghi delle basi sono abbastanza simili alle basi da essere assunti dalla cellula e incorporati nel DNA durante la replicazione, ma, a causa delle differenze strutturali, gli analoghi si appaiano in modo non accurato e portano a frequenti errori di replicazioni. Ad esempio il 5-bromouracile, un analogo della timina, può appaiarsi con la guanina. Gli agenti intercalanti, invece, sono delle molecole piatte capaci di legarsi alla struttura egualmente piatta delle basi puriniche o pirimidiniche del DNA nello stesso modo con cui le basi si legano o s'impilano l'una sull'altra nella doppia elica. Gli agenti intercalanti, come la proflavina, l'acridina e l'etidio, sono di solito associati a delezioni o inserzioni di una coppia di basi, o perfino di qualche coppia di basi.

Biologia molecolare

Pagina 77 di 173

Domenico Azarnia Tehran

Sezione Appunti

56. La riparazione del DNA danneggiato Per evitare gli effetti avversi del permanere di un danno nel DNA le cellule hanno sviluppato nel corso dell'evoluzione un intricato sistema di risposte atte a salvaguardare l'integrità del genoma. I meccanismi di riparazione propriamente detti ripristinano la corretta sequenza del DNA senza introdurre errori (error-free). Altri sistemi, definiti meccanismi di tolleranza, non rimuovono il danno ma assicurano la sopravvivenza cellulare anche se talvolta introducono nuovi errori (error-prone). I principali meccanismi di riparazione sono: la riparazione per excisione di nucleotidi, la riparazione per excisione di basi, la riparazione per ricombinazione, che viene utilizzata quando entrambi i filamenti di DNA sono danneggiati o quando il DNA è rotto, e la riparazione degli appaiamenti errati delle basi del DNA. Alcuni danni, invece, possono essere rimossi direttamente per reversione della modificazione chimica che li ha generati. Tra i sistemi di reversione diretta del danno troviamo la fotoriattivazione dei dimeri di pirimidina (CPD), uno dei principali danni indotti sul DNA dai raggi ultravioletti (UV), e la trasmetilazione, un processo che attua la rimozione diretta del danno indotto dagli agenti alchilanti a livello delle guanine presenti nel DNA e che ha un ruolo importante nella prevenzione della cancerogenesi.

Biologia molecolare

Pagina 78 di 173

Domenico Azarnia Tehran

Sezione Appunti

57. Riparazione diretta del danno al DNA I dimeri di pirimidina (CPD), uno dei danni principali indotti sul DNA dai raggi UV, possono fotorevertire spontaneamente a lunghezze d'onda comprese tra i 200 e i 300 nm (fotoriattivazione non enzimatica) o essere monomerizzati ad opera della DNA fotoliasi (fotoriattivazione enzimatica), un enzima che si lega al dimero, e in presenza di energia luminosa con lunghezze d'onda comprese tra 300 e 500 nm, catalizza una reazione che rompe l'anello di ciclobutano che unisce le due pirimidine. La fotoriattivazione enzimatica è un sistema efficiente e accurato che è stato descritto sia nei procarioti che negli eucarioti ma è assente nei mammiferi placentati. Per questo, è attualmente considerata un meccanismo di riparazione che non ha alcun significato biologico nelle cellule umane. Comunque tutte le fotoliasi sono associate a due cromofori: il flavina adenina dinucleotide ridotto (FADH2) e una pterina. La DNA fotoliasi è in grado di legare il DNA interagendo con una regione di 6-7 nucleotidi attorno al dimero. La formazione del complesso enzimasubstrato avviene anche in assenza di luce, che è invece necessaria per innescare la reazione enzimatica: la luce viene infatti assorbita dalla pterina, che si eccita e trasferisce energia al cromoforo flavinico che, eccitandosi a sua volta, torna stabile cedendo un elettrone al dimero. Si forma così un anione del dimero che è instabile e monomerizza rompendo l'anello del ciclobutano che unisce le due pirimidine. La transmetilazione, invece, è un processo che rimuove l'O6-metilG, una lesione altamente citotossica e mutagena indotta dall'esposizione a cancerogeni metilanti e a farmaci chemioterapici. L'O6-metilG permette alla guanina di appaiarsi sia con la citosina che con la timina. Nell'uomo l'attività che rimuove l'O6-metilG è codificata dal gene O6-metil-guanina-DNA metiltrasferasi (MGMT). MGMT ripara la O6-metilG attraverso un processo molto veloce e error-free che coinvolge una singola reazione (il trasferimento del gruppo metilico della O6-metilguanina a un residuo di cisteina della proteina stessa) durante la quale la MGMT si inattiva. La MGMT non è quindi un enzima catalitico nel senso usuale del termine e viene definito enzima suicida, dal momento che la proteina è consumata dal suo stesso substrato. Ciò implica che la riparazione si esaurisce quando la proteina MGMT disponibile viene consumata.

Biologia molecolare

Pagina 79 di 173

Domenico Azarnia Tehran

Sezione Appunti

58. La riparazione per escissione di basi Il BER (Base Excision Repair) è un processo deputato alla rimozione delle basi del DNA modificate in seguito ad eventi di deamminazione idrolitica, ossidazione e alchilazione. Questo tipo di danno può derivare da meccanismi endogeni quali il normale metabolismo cellulare o formarsi in seguito ad esposizione a cancerogeni ambientali o farmaci chemioterapici. Il BER interviene inoltre nella riparazione dei siti apurinici/apimiridinici (siti AP), che si formano per perdita spontanea delle basi. Infine, il BER è in grado di operare a livello delle rotture a singola elica del DNA causate dall'esposizione ai raggi X. L'evento chiave del meccanismo molecolare del BER è l'idrolisi del legame N-glicosidico tra la base alterata e il desossiribosio che determina il rilascio della base stessa. Questa reazione è caratterizzata da una classe di enzimi detti DNA glicosilasi, con diversa specificità di substrato. Nell'uomo sono state sino ad oggi identificate otto DNA glicosilasi, di cui quattro coinvolte nella correzione della citosina deamminata (uracile) e dei prodotti di deamminazione della 5-metilcitosina. La presenza nel genoma di uracile derivato da citosina deamminata crea dei mismatch U:G che, in assenza di riparazione, alla successiva replicazione originano transizioni G:CA:T. Comunque il meccanismo catalitico è molto simile nelle varie DNA glicosilasi eucariotiche e consiste nella diffusione facilitata dell'enzima lungo il solco minore del DNA fino al riconoscimento di una base sospetta. L'enzima a questo punto si lega al DNA e lo distorce comprimendo lo scheletro del filamento contenente la lesione; estroflette quindi la base per inserirla in una propria tasca specifica per il riconoscimento ed opera il taglio del legami glicosidico tra la base alterata e il desossiribosio. La glicosilasi può quindi rimanere legata al sito AP fino a quando non interviene una AP endonucleasi (AP endo), l'enzima che opera la tappa successiva del BER. Nella tappa successiva, infatti, i siti AP generati vengono riconosciuti da una AP endo. La HAP1 è la AP endo più abbondante che incide il sito AP al 5' del fosfodeossiribosio e genera un gruppo 3'-OH che verrà utilizzato dalla polimerasi per inserire il nucleotide corretto. La riparazione via BER, a questo punto, è completata attraverso due diverse modalità, definite short-patch e long-patch. Il BER short-patch sostituisce la base danneggiata con risintesi di un solo nucleotide, mentre il BER long-patch porta alla rimozione (grazie ad una proteina con attività sia endo- che esonucleasica, FEN1) e risintesi di un frammento di lunghezza variabile dai 2 ai 10 nucleotidi. La polimerasi nel BER short-pach è la DNA polimerasi , che tramite il suo dominio C-terminale interagisce con l'estremità 3'-OH e inserisce un solo nucleotide, mentre nel BER long-patch troviamo le polimerasi e .

Biologia molecolare

Pagina 80 di 173

Domenico Azarnia Tehran

Sezione Appunti

59. La riparazione per escissione di nucleotidi Il NER (Nucleotide Excision Repair) è un sistema di riparazione del DNA generale e versatile in quanto è stato identificato sia nei procarioti che negli eucarioti ed è in grado di rimuovere un'ampia gamma di danni, correlati alla capacità di determinare una distorsione notevole della molecola di DNA: I substrati biologicamente più rilevanti del NER sono i dimeri di pirimidina (CPD) e i (6-4) fotoprodotti, ossia le lesioni principali indotte sul DNA dai raggi UV. Altre lesioni rimosse dal NER sono gli addotti ingombranti, indotti dall'esposizione ad idrocarburi aromatici e i legami crociati inter- e intra-elica indotti da agenti antitumorali. Comunque in tutti gli organismi il NER si atta attraverso cinque tappe fondamentali: 1) riconoscimento del danno; 2) denaturazione locale del DNA e incisione del tratto danneggiato ad entrambi i lati della lesione; 3) excisione dell'oligonucleotide contenente il danno; 4) sintesi riparativa; 5) legame del tratto neosintetizzato alla molecola di DNA. Esistono, inoltre, due diverse modalità di intervento definite rispettivamente: riparazione accoppiata alla trascrizione ( Transcription Coupled Repair, TCR) e riparazione del genoma globale (Global Genome Repair, GGR), che differiscono sostanzialmente per le modalità e le attività coinvolte nella prima tappa del processo, ossia il riconoscimento del danno. In E. coli, la riparazione delle regioni silenti del genoma attuata dal GGR richiede l'intervento di quattro proteine. Le prime tappe del processo, durante le quali il danno viene riconosciuto ed inciso, sono attuate da un unico complesso enzimatico, detto complesso excinucleasico UvrABC, composto da tre distinte subunità. In presenza di ATP, due molecole di UvrA dimerizzano e interagiscono con una molecola di UvrB. Il complesso UvrA2B è in grado di legarsi al DNA e di riconoscere cambiamenti strutturali dovuti alla presenza di un danno. A questo punto, UvrB apre un tratto di cinque coppie di basi attorno alla lesione, favorendo il rilascio di A2. Da qui, la proteina UvrC si lega al complesso di preincisione e insieme al UvrB-DNA attua due incisioni sul filamento danneggiato. Si ha, in questo modo, il rilascio di un frammento contenente 12-13 basi a singolo filamento, che contiene anche il danno, ad opera della proteina UvrD o DNA elicasi II, che si lega in 5' vicino al sito di incisione e precede in direzione 5'3' separando i due filamenti di DNA. La discontinuità risultante è contemporaneamente colmata dalla DNA polimerasi I che risintetizza il tratto mancante usando come stampo l'elica integra. Infine la DNA ligasi salda il tratto di nuova sintesi alla molecola di DNA. Nel TCR di E.coli, invece, è coinvolta una proteina detta Transcription Repair Coupling Factor (TRCF) che si lega al complesso della RNA polimerasi, bloccata dalla presenza di un danno sull'elica trascritta, e determina il rilascio del complesso stesso e del trascritto incompleto del DNA. Contemporaneamente TRCF, grazie alla sua affinità di legame per UvrA, richiama al sito danneggiato il complesso UrvA2B da cui tutto procede come nel caso precedentemente descritto della GGR sempre in E.coli. Il NER negli eucarioti, invece, opera attraverso le stesse tappe descritte per i procarioti, ma è caratterizzato da una maggiore complessità sia a livello biochimico che molecolare. Uno strumento di indagine sui meccanismi di questo sistema di riparazione sono stati i mutanti difettivi nel NER rappresentati dalle cellule di pazienti affetti da xeroderma pigmentosum (XP), della sindrome di Cockayne (CS) e dalla tricotiodistrofia (TTD). Il quadro che ne risulta è quello di un sistema estremamente complesso: sono infatti almeno trenta le proteine la cui azione coordinata è necessaria per portare a termine l'intero processo. Il primo fattore a intervenire nel GGR è l'eterodimero formato dai prodotti del gene XPC (mutato nei pazienti affetti da XP) e hHR23B. Il

Biologia molecolare

Pagina 81 di 173

Domenico Azarnia Tehran

Sezione Appunti

complesso XPC-hHR23B si lega al DNA danneggiato e, denaturando localmente un tratto di 8-10 nucleotidi, ne determina una modificazione conformazionale che richiama gli altri fattori dell'apparato riparativo. Una volta attuato il riconoscimento del danno, grazie all'attività coordinata di molteplici proteine che vanno sotto il nome di Replication Protein A, si forma una struttura definita complesso aperto. Quindi si apre una regione di circa 10-20 nucleotidi attorno al danno grazie alle attività DNA elicasiche, di due subunità XPB e XPD, in direzione 3'5' e 5'3'. A questo punto, la proteina XPG si posiziona al 3' del danno interagendo con TFIIH, una delle Replication Protein A. L'apertura del tratto è stabilizzata da XPA e RPA che aumentano l'affinità di legame col DNA e verificano la specificità del substrato. A questo punto XPG attua la prima incisione al 3' del danno e successivamente il complesso ERCC1-XPF, opera la seconda incisione al 5' della lesione. Si forma così un oligonucleotide di 25-30 nucleotidi che viene rimosso presumibilmente ancora legato ad uno o più componenti del complesso riparativo, mentre la regione a singola elica viene protetta da RPA. Successivamente la DNA polimerasi o risintetizza la sequenza excisa a partire da sito di incisione 5' della lesione, utilizzando come stampo l'elica complementare integra. Nella riparazione accoppiata alla trascrizione (TCR), invece, abbiamo la presenza di tutte le proteine implicate nella GGR, ad eccezione del complesso XPC-hHR23B. In questo contesto infatti è l'RNA polimerasi bloccata a livello del danno che determina nella struttura del DNA un'alterazione sufficiente per il reclutamento delle attività che operano nelle fasi successive al riconoscimento del danno. Nel TCR sono inoltre coinvolte in modo specifico le proteine CSA e CSB, la cui inattivazione è responsabile della sindrome di Cockayne.

Biologia molecolare

Pagina 82 di 173

Domenico Azarnia Tehran

Sezione Appunti

60. Riparazione del DNA tramite ricombinazione Nelle cellule eucariotiche sono presenti due sistemi di ricombinazione deputati alla riparazione delle rottura a doppia elica (Double Strand Breaks, DSB), un danno indotto da radiazioni ionizzanti, radicali liberi e mutageni chimici. La presenza di una rottura a doppia elica innesca una complessa cascata di eventi finalizzati al blocco del ciclo cellulare e al reclutamento di fattori di riparazione. Uno degli iniziatori del processo è il prodotto del gene ATM, una chinasi che mediante p53 riesce ad arrestare il ciclo cellulare in G1 e causa la fosforilazione dell'istone H2AX nel dominio di DNA vicino alla rottura a doppia elica. La riparazione quindi può avvenire con due diverse modalità: la ricombinazione omologa (Homologous Recombination, HR) e la ricombinazione non omologa (Non Homologous End Joining, giunzioni delle estremità non omologhe, NHEJ). Questi due meccanismi competono l'uno con l'altro, ma si è visto che nelle fasi S e G2 del ciclo cellulare prevale in genere la ricombinazione omologa mentre nella fase G1 la ricombinazione non omologa. Nell'ambito della HR si ha prima il processamento delle estremità generate dalla rottura a doppia elica ad opera del complesso RAD50-MRE11-NBS1, la cui attività esonucleasica porta alla comparsa di estremità 3' a singolo filamento. A questo punto, la proteina RPA promuove il reclutamento a livello di questi tratti di altre proteine che polimerizzano sul filamento di DNA formando strutture nucleoproteiche capaci di ricercare le regioni omologhe con cui appaiarsi. Una volta accaduto questo, RAD51 catalizza lo scambio tra il filamento di DNA e la stessa sequenza presente nella molecola omologa di DNA a doppia elica che viene usata come stampo per ripristinare l'integrità del DNA tramite sintesi della regione mancante. Il tratto neosintetizzato può svolgersi dall'elica omologa e tornare ad appaiarsi con il filamento che conteneva l'altra rottura generata dal DSB. Comunque, mentre l'HR è una modalità di riparazione che sostanzialmente non introduce errori in quanto usa l'informazione genetica contenuta nel cromatidio fratello o nel cromosoma omologo a quello danneggiato, il NHEJ è un processo che può causare delezioni più o meno estese, e quindi indurre mutazioni nel genoma, in quanto lega direttamente le estremità dei due filamenti, talvolta dopo parziale degradazione. Nell'ambito del HHEJ, i DSB sono riconosciuti dall'eterodimero Ku80-Ku70 che reclutando la proteina DNA-PKcs favoriscono la segnalazione del danno. Le estremità generate dal danno vengono infine saldate dal complesso XRCC4/DNA ligasi IV. La mancata o errata riparazione dei DSB può causare perdita di cromosomi, traslocazioni, delezioni e in genere favorire la cancerogenesi. Tra le diverse patologie ad eredità autosomica recessiva sono associate a difetti nella riparazione dei DSB: l'atassia telangiectasia (AT), l'atassia telangiectasia-like (AT-LD) e la sindrome di Nijemegen, che sono rispettivamente dovute a mutazioni nei geni ATM, MRE11 e NBS1. Queste malattie sono tutte caratterizzate da predisposizione allo sviluppo di tumori, in particolare linfomi, elevata sensibilità alle radiazioni ionizzanti, immunodeficienza e instabilità cromosomica.

Biologia molecolare

Pagina 83 di 173

Domenico Azarnia Tehran

Sezione Appunti

61. La ricombinazione omologa a livello molecolare Tutto il DNA è ricombinante. Lo scopo generale dello scambio genetico è quello di mescolare e riarrangiare continuamente i cromosomi ma soprattutto durante la meiosi, quando i cromosomi omologhi si appaiano prima della prima divisione nucleare. Infatti, è proprio durante questo appaiamento che avviene lo scambio di materiale genetico tra i cromosomi. Questo scambio, classicamente chiamato crossing over, è uno dei risultati della ricombinazione omologa, che porta allo scambio fisico di sequenze di DNA tra i cromosomi. La frequenza di crossing over tra due geni sullo stesso cromosoma dipende dalla distanza fisica fra questi due geni; maggiore è la distanza, maggiore è la frequenza di scambio. A volte però l'ordine dei geni cambia: per esempio, segmenti di DNA mobili, detti trasposoni, occasionalmente “saltano” tra i cromosomi e promuovono dei riarrangiamenti del DNA, cambiando in questo modo l'organizzazione dei cromosomi. Comunque, la ricombinazione omologa è un processo cellulare di fondamentale importanza, catalizzato da enzimi la cui sintesi ed attività è finemente regolata. Oltre che a fornire una fonte di variabilità genetica, la ricombinazione permette alle cellule di recuperare sequenze perse in seguito a danni al DNA, rimpiazzando la regione danneggiata con un filamento integro ottenuto dal cromosoma omologo. La ricombinazione fornisce anche un meccanismo per far ripartire le forche replicative bloccate o danneggiate e altri tipi speciali di ricombinazione regolano l'espressione di alcuni geni, per esempio, cambiando specifici segmenti cromosomici, geni altrimenti silenti si vengono a trovare in regioni dove sono espressi.

Biologia molecolare

Pagina 84 di 173

Domenico Azarnia Tehran

Sezione Appunti

62. I diversi modelli per la ricombinazione omologa Parecchi anni fa, eleganti esperimenti, condotti utilizzando l'incorporazione di isotopi pesanti nel DNA, permisero di avere la prima visione molecolare del processo della ricombinazione omologa. Infatti, lo stesso approccio che utilizzarono Meselson e Stahl per dimostrare la semiconservatività della replicazione del DNA, portò a scoprire che, al contrario, la ricombinazione è conservativa ed è caratterizzata dalla diretta rottura e riunione di molecole di DNA. Con il passare degli anni sono stati proposti diversi modelli per spiegare questo meccanismo e tutti condividono i seguenti passaggi chiave: 1.Allineamento di due molecole di DNA omologhe. Per omologhe intendiamo due sequenze di DNA identiche, o quasi identiche, per una regione di almeno un centinaio di basi; 2.Introduzione di rotture nel DNA. Le rotture possono coinvolgere un solo filamento o entrambi i filamenti della doppia elica; 3.Formazione, tra le due molecole di DNA che ricombinano, di una corta regione di appaiamento tra le basi. Questo appaiamento si verifica quando una regione di DNA a singolo filamento, che deriva da una molecola parentale, si appaia con il filamento complementare, appartenente alla molecola omologa. In questo caso si parla d'invasione del filamento. A questo punto, le due molecole di DNA sono connesse tra di loro in una struttura a croce detta giunzione di Holliday; 4.Movimento della giunzione di Holliday, che può scorrere lungo il DNA mediante la continua fusione e formazione di appaiamenti tra le basi. Questo processo è chiamato migrazione del chiasma; 5.Taglio della giunzione di Holliday che porta alla formazione di due molecole di DNA separate che hanno terminato lo scambio genetico. Questo processo è noto come risoluzione. Il modello di Holliday rappresenta un modello per la ricombinazione omologa semplice e storicamente importante, sebbene oggi sappiamo che la ricombinazione prevede neosintesi del DNA, evento del tutto assente in questo modello. Comunque nel rappresentare questo processo è utile allineare le due molecole di DNA omologhe che sebbene pressoché identiche, presentano diversi alleli dello stesso gene (A/a, B/b, C/c), particolarmente utili per comprendere questo processo. La ricombinazione inizia con l'introduzione di una rottura a singolo filamento (nick) su ogni molecola di DNA, in un'identica posizione. I filamenti di DNA vicini al sito dell'incisione possono quindi venire staccati dai loro filamenti complementari, rendendo questi filamenti liberi di invadere ed appaiarsi con la doppia elica omologa. L'invasione del filamento porta alla giunzione di Holliday, l'intermedio chiave della ricombinazione. Quest'ultima può ora scorrere lungo il DNA per migrazione del chiasma ed è proprio questa migrazione ad aumentare la lunghezza del DNA che viene scambiata. Se le due molecole di DNA non sono identiche ma, per esempio, hanno alcune piccole differenze di sequenza, come per due alleli dello stesso gene, la migrazione del chiasma attraverso queste regioni di non perfetta complementarietà conduce alla formazione di molecole di DNA che presentano uno o più mismatch. Queste regioni del DNA vengono dette eteroduplex e la riparazione di questi errati appaiamenti può avere importanti conseguenze. Per terminare l'evento di ricombinazione è necessario risolvere la giunzione di Holliday e questo avviene tagliando i filamenti di DNA vicino al chiasma. La risoluzione può avvenire in due diversi orientamenti e, quindi, originare due tipi diversi di prodotti. Infatti, un taglio può essere fatto sui due filamenti di DNA che non sono stati rotti all'inizio della reazione. Se questi

Biologia molecolare

Pagina 85 di 173

Domenico Azarnia Tehran

Sezione Appunti

sono i due filamenti che vengono tagliati e poi uniti covalentemente, le molecole di DNA che derivano da questo evento vengono chiamati prodotti di ricombinazione “uniti” (splice) e questo perché le due doppie eliche originali sono ora unite in maniera tale che porzioni appartenenti a molecole di DNA parentale diverse sono covalentemente unita da una regione a doppio filamento ibrida. Quindi, la formazione di questi prodotti d'unione porta al riassortimento dei geni adiacenti al sito di ricombinazione. Perciò questo tipo di molecola ricombinante viene anche detta prodotto del crossing over. Al contrario, il secondo tipo di taglio possibile per risolvere la giunzione di Holliday avviene sui due filamenti di DNA che erano stati rotti per iniziare la ricombinazione. Dopo la risoluzione e l'unione covalente dei filamenti a livello di questi siti, le molecole di DNA prodotte contengono una regione o “patch” di DNA ibrido. Per questo motivo queste molecole sono chiamate prodotti patch. In essi la ricombinazione non porta al riassortimento dei geni che fiancheggiano il punto del taglio e, pertanto, queste molecole vengono anche chiamate prodotti del non incrocio (non crossing-over). La ricombinazione omologa spesso ,però, può iniziare da delle rotture a doppio filamento presenti nel DNA, che possono essere anche letali per i batteri. Un modello comune che descrive questo tipo di scambio genetico è il sistema di riparazione delle rotture a doppio filamento. Anche questo modello parte dall'allineamento dei cromosomi omologhi ma l'evento scatenante è l'introduzione di una rottura a doppio filamento in una delle due molecole di DNA. L'altra doppia elica rimane intatta. Questo modello risulta essere più promettente rispetto a quello di Holliday, in quanto le rotture a doppio filamento avvengono piuttosto frequentemente. Comunque, una volta introdotta la rottura a doppio filamento, una nucleasi degrada progressivamente la molecola di DNA rotta producendo delle regioni a singolo filamento, note come code di DNA a singolo filamento, che terminano con l'estremità 3'. Il passaggio successivo consiste nell'invasione del DNA omologo ed intatto da parte delle code di DNA a singolo filamento. A questo punti, il filamento che invade si appaia con il proprio filamento complementare sull'altra molecola di DNA. Inoltre, dal momento che i filamenti che invadono terminano con un estremità 3', possono servire da primer per la sintesi di nuovo DNA. L'allungamento di queste estremità, compiuto utilizzando come stampo il filamento complementare della doppia elica omologa, riforma quelle regioni di DNA che erano state distrutte dalla nucleasi. A questo punto, le due giunzioni di Holliday che si ritrovano negli intermedi di ricombinazione e che sono state generate con questo modello si muovono per migrazione del chiasma e, infine, vengono risolte per terminare la ricombinazione. Ancora una volta, a seconda di quali filamenti vengono tagliati nella risoluzione, i prodotti finali contengono o non contengono i geni riassortiti nelle regioni fiancheggianti il sito di ricombinazione.

Biologia molecolare

Pagina 86 di 173

Domenico Azarnia Tehran

Sezione Appunti

63. Gli apparati proteici per la ricombinazione omologa Tutti gli organismi viventi codificano per degli enzimi che catalizzano i passaggi biochimici della ricombinazione. Per alcuni di questi passaggi i membri di famiglie di proteine omologhe adempiono alla stessa funzione in tutti gli essere viventi; per altri, nei diversi organismi intervengono distinte classi di proteine che, comunque, portano allo stesso prodotto finale. La maggior parte delle nostre conoscenze sul meccanismo della ricombinazione deriva dagli studi effettuati su E. coli ed il suo fago, in cui il principale sistema di riparazione delle rotture a doppio filamento (DSB) è noto come il sistema RecBCD. Come abbiamo visto, le molecole di DNA con delle estensioni o code a singolo filamento sono il substrato preferenziale per iniziare lo scambio dei filamenti tra regioni omologhe. L'enzima RecBCD è composto da tre subunità e possiede sia un'attività DNA elicasica che una nucleasica, tutte queste funzioni sono controllate da specifici elementi di sequenza noti come siti chi. Si lega alle molecole di DNA sulle rotture a doppio filamento e scorre lungo il DNA usando l'energia dell'idrolisi dell'ATP. Come risultato della sua attività il DNA è svolto. In dettaglio, RecBCD entra sul DNA a livello della rottura a doppio filamento e si muove lungo il DNA, svolgendo le eliche. Le subunità RecB e RecD sono entrambi due DNA elicasi, ovvero, degli enzimi che usano l'idrolisi dell'ATP per fondere gli appaiamenti tra le basi. Spesso, mentre svolge il DNA, l'attività nucleasica di RecBCD taglia entrambi i filamenti, distruggendo la doppia elica. Quando incontra la sequenza chi, l'attività nucleasica viene modificata. Infatti, RecBCD non idrolizza più il DNA con polarità 3'5' mentre viene digerito più velocemente l'altro filamento di DNA, quello con polarità 5'3'. Come risultato di questo cambiamento di attività, una molecola di DNA a doppio filamento viene trasformata in una con una coda al 3' a singolo filamento, terminante con la sequenza chi. Questa struttura è ideale per l'associazione immediata di RecA. Infatti, l'interazione diretta di RecBCD con RecA promuove l'assemblaggio di quest'ultima sull'estremità a singolo filamento assicurandone il legame al posto delle SSB (le proteine che legano il DNA a singolo filamento). Comunque, i siti chi aumentano la frequenza di ricombinazione di circa dieci volte e questo aumento è più pronunciato proprio nelle regioni adiacenti al sito mentre diminuisce gradualmente con la distanza. Inoltre, la capacità dei siti chi di regolare l'attività nucleasica di RecBCD aiuta anche le cellule batteriche a proteggersi dal DNA estraneo, che può entrare attraverso un infezione fagica o un evento di coniugazione. La sequenza chi di otto nucleotidi (GCTGGTGG) è altamente rappresentata nel genoma di E. coli, per questo se un DNA di E. coli entra nello stesso batterio verrà immediatamente processato da RecBCD, così da formare un estremità 3' a singolo filamento. Viceversa, il DNA di un'altra specie non avrà un'alta frequenza di siti chi e l'azione di RecBCD, su questo DNA, porterà ad un estesa degradazione, invece che all'attivazione per ricombinazione. RecA è la proteina centrale delle ricombinazione omologa. È il membro fondatore di una famiglia di enzimi chiamati proteine che scambiano il filamento. Queste proteine catalizzano l'appaiamento tra le molecole di DNA omologhe; un'attività che implica sia la ricerca di sequenze equivalenti tra due molecole, che la formazione su di esse di regioni di appaiamento. La forma attiva di RecA è un filamento nucleoproteico enorme e di dimensioni variabili: sono piuttosto frequenti filamenti che contengono approssimativamente 100 subunità di RecA e 300 nucleotidi di DNA. In seguito al legame con RecA, la lunghezza di una molecola di DNA aumenta di circa 1,5 volte. Infatti, per formare un filamento, le subunità di RecA si legano

Biologia molecolare

Pagina 87 di 173

Domenico Azarnia Tehran

Sezione Appunti

in modo cooperativo al DNA. Il legame di RecA ed il suo assemblaggio avvengono molto più rapidamente su un DNA a singolo filamento che su di una doppia elica, a dimostrazione della necessità di regioni di DNA a singola elica come substrati per lo scambio dei filamenti. Questo complesso RecA-ssDNA è la forma attiva che partecipa alla ricerca della regione di omologia, nella quale RecA deve “cercare” una complementarietà tra le coppie di basi del DNA nel filamento e una nuova molecola di DNA. Questa ricerca di omologia è promossa da RecA perché la sua struttura nucleoproteica è caratterizzata da due distinti siti di legame al DNA: un sito primario (legato alla prima molecola di DNA) ed un sito secondario. Quest'ultimo può essere occupato da una molecola a doppio filamento, il cui legame è veloce, debole, transitorio e indipendente dalla sequenza. In questo modo il filamento RecA può legare enormi pezzi di DNA ed analizzare rapidamente se in essi siano presenti delle sequenze omologhe. Come fa il filamento RecA ad avvertire la presenza di omologia di sequenza è ancora un meccanismo non conosciuto ma si è visto che il DNA legato al sito secondario viene temporaneamente aperto e valutato per la complementarietà con il DNA a singolo filamento presente nel sito primario. Inoltre, un'identità di sequenza di solamente 15 paia di basi fornisce al filamento RecA il segnale che l'omologia è stata trovata, e, quindi si attiva lo scambio del filamento. A questo punto, RecA promuove la formazione di un complesso stabile tra queste due molecole di DNA. Questa struttura a tre filamenti, legata da RecA, è detta molecola giunta ed, in genere, contiene parecchie centinaia di paia di basi del DNA ibrido. Quindi, il filamento di DNA nel sito di legame primario si appaia con il suo complementare appartenente al duplex legato al sito secondario. Lo scambio del filamento richiede quindi la rottura di una serie di appaiamenti e la formazione di una nuova serie del tutto identica. Bisogna ricordare che proteine che effettuano lo scambio del filamento della stessa famiglia di RecA sono presenti in tutte le forme vivente. Tra queste le più caratterizzate sono Rad51 e Dmc1 negli eucarioti. Una volta terminato il passaggio dell'invasione del filamento, le due molecole di DNA, coinvolte nella ricombinazione, sono unite da un punto di incrocio, noto come giunzione di Holliday. A questo punto, una proteina detta RuvA riconosce la struttura della giunzione a prescindere dalla sequenza e recluta la proteine RuvB, un'ATPasi esamerica simile alle elicasi coinvolte nella replicazione del DNA. Quest'ultima fornisce l'energia necessaria a scambiare gli appaiamenti tra le basi così da permettere il movimento del chiasma. I modelli strutturali dei complessi RuvAB sulla giunzione di Holliday mostrano come un tetramero di RuvA cooperi con due esameri di RuvB per rafforzare questo processo di scambio. Nell'ultima parte del processo di ricombinazione, ossia la risoluzione delle giunzione di Holliday, interviene, nei batteri, RuvC, un endonucleasi capace di tagliare le giunzioni di DNA formate da RecA interagendo con altre due proteine RuvA e RuvB. La risoluzione mediata da RuvC avviene quando quest'ultima riconosce la giunzione di Holliday ed incide specificatamente due dei filamenti di DNA omologo, con la stessa polarità. Questo taglio porta a delle molecole di DNA che terminano con i gruppi 5' P e 3' OH, che possono essere unite da una DNA ligasi. A seconda di quale coppia di filamenti sia stata tagliata da RuvC, i prodotti di ricombinazione, una volta uniti dalla ligasi, saranno del tipo “splice” (scambio) o del tipo “patch” (del non scambio). Comunque, nonostante RuvC riconosca una struttura, piuttosto che una specifica sequenza, essa taglia il DNA solamente dopo la seconda T dei siti caratterizzati dalla sequenza consenso 5'A/T-T-T-G/C. Nel DNA queste sequenze ricorrono una volta ogni 64 nucleotidi.

Biologia molecolare

Pagina 88 di 173

Domenico Azarnia Tehran

Sezione Appunti

64. La ricombinazione omologa negli eucarioti Come per i batteri, anche negli eucarioti la ricombinazione omologa serve a riparare il DNA e a recuperare delle forche di replicazione bloccate, tuttavia ha anche delle funzioni aggiuntive. Innanzitutto, la ricombinazione omologa è fondamentale per la meiosi, in quanto è necessaria per un corretto appaiamento dei cromosomi e, quindi, per il mantenimento dell'integrità genomica. Inoltre, proprio questa ricombinazione ridistribuisce i geni tra i cromosomi parentali, garantendo una certa variabilità nella composizione genica tramandata alla generazione successiva. Come sappiamo, la meiosi è caratterizzata da due eventi di divisione nucleare, che portano ad una riduzione della quantità di DNA cellulare, dal normale contenuto diploide (2N) a quello presente nei gameti (1N). Prima della divisione, le cellule contengono due copie di ogni cromosoma (gli omologhi), ciascuna delle quali è stata ereditata dai due genitori. Durante la fase S, i cromosomi vengono replicati dando un contenuto totale in DNA pari a 4N. I prodotti della replicazione, i cromatidi fratelli, restano uniti. In seguito per prepararsi alla prima divisione nucleare, questi cromosomi omologhi duplicati si devono appaiare ed allineare nel centro della cellula. La ricombinazione omologa è richiesta proprio per l'appaiamento degli omologhi. In assenza di ricombinazione, molto spesso i cromosomi non si allineano in maniera corretta per la prima divisione meiotica, e questo porta ad un'elevata frequenza di perdita dei cromosomi (non-disgiunzione). Comunque si definisce ricombinazione meiotica la ricombinazione omologa che avviene durante la meiosi, precisamente nella prima profase meiotica. Il programma di sviluppo che permette alle cellule di completare con successo la meiosi prevede l'attivazione dell'espressione di molti geni che nelle normali condizioni di crescita non sono richiesti. Uno di questi è SPO11 che codifica per una proteina che, per iniziale la ricombinazione meiotica, introduce nel DNA cromosomico delle rotture a doppio filamento. La proteina Spo11, infatti, taglia in DNA in molti punti con poca selettività di sequenza ma con grande specificità temporale. Infatti questi tagli avvengono proprio nel momento in cui i cromosomi omologhi duplicati iniziano ad appaiarsi. In generale, i tagli effettuati da Spo11 si trovano in prossimità di regioni cromosomiche non strettamente associate ai nucleosomi che quindi vengono usati come siti chi. A questo punto, per effettuare il taglio, la catena laterale di una specifica tirosina della proteina Spo11 attacca la catena fosfodiesterica, quindi si viene a formare un complesso Spo11-DNA. Successivamente due subunità della proteina tagliano il DNA a distanza di due nucleotidi per formare una rottura a doppio filamento sfalsata. Le estremità 5' del DNA a livello del sito di taglio di Spo11 rimangono legate covalentemente all'enzima e costituiscono i siti iniziali di processamento del DNA, necessari per formare le code di DNA a singolo filamento, richieste per assemblare le proteine simili a RecA e per iniziare l'invasione del filamento. A questo punto interviene il complesso enzimatico MRX, che svolge le stesse funzioni di RecBCD dei batteri. Infatti, anche questo complesso è una DNA nucleasi formata da più subunità: Mre11, Rad50 e Xrs2. Il processamento del DNA sulla rottura avviene, dunque, esclusivamente sul filamento che termina con un'estremità 5'. I filamenti che terminano con l'estremità 3' non vengono degradati. Questa reazione di processamento del DNA è detta accorciamento dal 5' al 3'. Tale accorciamento dipende da MRX e porta alla formazione di lunghe code, spesso di una o più kilobasi, a singolo filamento con l'estremità 3'. Si pensa che il complesso MRX rimuova anche il DNA legato a Spo11.

Biologia molecolare

Pagina 89 di 173

Domenico Azarnia Tehran

Sezione Appunti

Gli eucarioti codificano per due omologhi ben caratterizzati della proteina batterica RecA: Rad51 e Dmc1. Entrambe le proteine svolgono una funzione nella ricombinazione meiotica. Mentre Rad51 è largamente espressa nelle cellule che si dividono sia meioticamente che mitoticamente, Dmc1 è espressa solo nelle cellule che entrano in meiosi. Inoltre, la ricombinazione mediata da Dmc1 avviene preferenzialmente tra cromatidi omologhi non fratelli, piuttosto che tra fratelli.

Biologia molecolare

Pagina 90 di 173

Domenico Azarnia Tehran

Sezione Appunti

65. Il cambio del gruppo di compatibilità Oltre a promuovere l'appaiamento del DNA, la sua riparazione e lo scambio genetico, la ricombinazione omologa può anche servire a scambiare sequenze di DNA, in specifici punti del cromosoma. Questo tipo di ricombinazione, a volte, viene usata per regolare l'espressione genica. Per esempio, la ricombinazione controlla il gruppo di compatibilità (mating type) del lievito S. cerevisiae, scambiando i geni del mating type in una posizione precisa del genoma trascrizionalmente attiva. S. cerevisiae, è un eucariote unicellulare, che può trovarsi sotto forma di tre diversi tipi cellulari. Le cellule di S. cerevisiae, aploidi possono essere di due gruppi di compatibilità diversi, a o . Quando una cellula a ed una si incontrano, possono incrociarsi producendo una cellula diploide a/. Questa cellula può quindi andare in meiosi producendo due cellule aploidi a e due cellule aploidi . I geni dei gruppi di compatibilità codificano per dei fattori trascrizionali che controllano l'espressione di specifici geni bersaglio, i cui prodotti definiscono ogni tipo cellulare. In ogni tipo cellulare i geni del gruppo di compatibilità espressi sono quelli presenti nella cellula a livello del locus del mating type (il locus MAT). Di conseguenza nelle cellule a, il gene a1 si trova nel locus MAT, mentre nelle cellule , cono presenti 1 e 2. Nelle cellule diploidi, invece, sono espressi entrambi i geni che controllano il gruppo di compatibilità. Però, oltre ai geni a e presenti, in ogni cellula, a livello del locus MAT, altrove nel genoma, c'è un'altra copia (non espressa) di questi geni. Queste copie, aggiuntive e silenti, si trovano in corrispondenza dei loci detti HMR e HML. Questi loci sono perciò noti come cassette silenti. La loro funzione è quella di rappresentare un “magazzino” d'informazione genetica, che può essere usata per cambiare ad una cellula il gruppo di compatibilità, attraverso la ricombinazione omologa. Il cambio del gruppo di compatibilità inizia con l'introduzione di una rottura a doppio filamento a livello del locus MAT. Una nucleasi speciale, detta endonucleasi HO, compie questa reazione riconoscendo sequenze specifiche presenti solo nel locus MAT. Il taglio di HO introduce una rottura sfalsata nel cromosoma e non rimane legato ai filamenti tagliati, come succedeva per Spo11. L'accorciamento 5'3' del DNA, a livello del sito di taglio di HO, avviene con lo stesso meccanismo usato nella ricombinazione meiotica. Di conseguenza, questa idrolisi dipende dal complesso della proteina MRX ed è specifica per questi filamenti che terminano con un'estremità 5'. Comunque, lo scambio del gruppo di compatibilità è unidirezionale; l'informazione di sequenza (e non il segmento di DNA) viene spostata sul locus MAT, da HMR e HML, ma l'informazione non “va” mai nell'altra direzione. Comunque, sebbene il meccanismo di riparazione dei DSB possa rendere ragione della ricombinazione che scambia il gruppo di compatibilità, non si assiste mai alla formazione dei prodotti della ricombinazione del tipo “crossover”. Per spiegare la conversione genica, senza il crossing over, è stato proposto un nuovo modello detto ibridazione del filamento dipendente dalla sintesi (synthesis-dependent strand annealing, SDSA). L'evento iniziale, come descritto precedentemente, è dato dall'introduzione di una rottura a doppio filamento sul sito di ricombinazione. Dopo l'invasione del filamento, l'estremità 3' che ha invaso, funge da innesco per iniziare la nuova sintesi del DNA. Quindi, al contrario di quanto accade nel meccanismo di riparazione dei DSB, su questo sito viene assemblata una forca replicativa completa. A differenza della normale replicazione, tuttavia i filamenti di nuova sintesi sono allontanati dallo stampo. Ne consegue che un nuovo segmento di DNA a doppio filamento viene sintetizzato, unito al sito che era stato originariamente tagliato da HO, e accorciato da MRX. Questo nuovo

Biologia molecolare

Pagina 91 di 173

Domenico Azarnia Tehran

Sezione Appunti

segmento di DNA ha la stessa sequenza del segmento usato come stampo (HMRa nella figura). Per porre fine alla ricombinazione è necessario che l'altro “vecchio” filamento presente sul sito MAT (l'estremità 3' non tagliata da MRX) sia rimosso. Quindi il DNA di neosintesi sostituisce l'informazione originariamente presente. Questo meccanismo spiega, quindi, come un evento di conversione genica possa avvenire in assenza di una giunzione di Holliday.

Biologia molecolare

Pagina 92 di 173

Domenico Azarnia Tehran

Sezione Appunti

66. La ricombinazione sito-specifica e la trasposizione Il DNA è una molecola molto stabile e la sua replicazione, riparazione e ricombinazione omologa avvengono con grande fedeltà. Questi processi servono a garantire che il genoma sia mantenuto pressoché identico attraverso le generazioni. D'altro canto è anche importante che esistano meccanismi genetici capaci di riarrangiare la sequenza di DNA, portando, in questo modo, ad una struttura genomica più dinamica. Esistono due classi di ricombinazione genetica: la ricombinazione conservativa sito-specifica (conservative site-specific recombination, CSSR) e la ricombinazione per trasposizione (in genere detta trasposizione) che nel loro insieme sono responsabili di molti riarrangiamenti del DNA. La prima avviene tra due definiti elementi di DNA, mentre la trasposizione è un evento di ricombinazione tra sequenze specifiche e siti del DNA non specifici e rappresenta la principale fonte di mutazione spontanea. I due tipi di ricombinazione genetica, comunque, hanno in comune alcune fondamentali caratteristiche molecolare. Delle proteine, note come ricombinasi, riconoscono le specifiche sequenze di DNA dove deve avvenire la ricombinazione. Le ricombinasi avvicinano ed uniscono questi specifici siti in un complesso nucleoproteico, detto complesso sinaptico. All'interno di quest'ultimo, la ricombinasi catalizza il taglio e la riunione delle molecole dell'acido nucleico provocando o un'inversione del tratto di DNA o il suo movimento verso un nuovo sito.

Biologia molecolare

Pagina 93 di 173

Domenico Azarnia Tehran

Sezione Appunti

67. La ricombinazione conservativa sito-specifica Nella ricombinazione conservativa sito-specifica (CSSR), il segmento di DNA che viene spostato porta sul sito dello scambio genico degli specifici elementi, costituiti da corte sequenze, detti siti di ricombinazione. Un tipico esempio di questo tipo di ricombinazione è dato dall'integrazione del genoma del fago nel cromosoma batterico. Durante l'integrazione di questo fago, la ricombinazione avviene sempre esattamente sulla stessa sequenza nucleotidica all'interno di due siti di ricombinazione, uno sul DNA fagico e l'altro su quello batterico. I siti di ricombinazione portano due tipi di elementi di sequenza: quelli specificamente legati dalla ricombinasi e le sequenze dove avviene il taglio del DNA e la riunione. Comunque, la CSSR può dare origine a tre diversi tipi di riarrangiamento del DNA: (1) l'inserzione di un segmento di DNA in un sito specifico (come avviene durante l'integrazione del fago ); (2) la delezione di un tratto di DNA; (3) l'inversione di un pezzo di doppia elica. Se la ricombinasi porta ad un'inserzione, a una delezione o a una inversione dipende dall'organizzazione dei siti di riconoscimento per la ricombinazione sulla molecola o le molecole di DNA che partecipano all'evento, per questo è utile analizzarli in dettaglio. Ciascun sito di ricombinazione è costituito da un paio di sequenze di riconoscimento della ricombinasi, organizzate in modo simmetrico. Queste sequenze di riconoscimento fiancheggiano una corta sequenza centrale asimmetrica, nota come regione di scambio, dove avviene il taglio e la riunione del DNA. Dal momento che la regione del crossing over è asimmetrica, un sito di ricombinazione ha sempre una polarità definita. L'orientamento dei due siti presenti su una sola molecola di DNA può essere del tipo ripetizione invertita o ripetizione diretta. La ricombinazione tra un paio di siti invertiti inverte il pezzo di DNA tra di essi compreso; al contrario, la ricombinazione che avviene con il medesimo meccanismo tra due siti organizzati in modo diretto (non invertiti) provoca la delezione del tratto di DNA incluso. Infine, si ha un inserzione quando due siti di ricombinazione presenti su due molecole diverse sono uniti per lo scambio. Ci sono due famiglie di ricombinasi per le reazioni conservative sito-specifiche: le ricombinasi in serina e le ricombinasi in tirosina. Per entrambe le famiglie, il meccanismo fondamentale consiste nella formazione, durante il taglio del DNA, di un intermedio covalente proteina-DNA. Per la ricombinasi in serina è la catena laterale di un residuo di serina situata nel sito attivo della proteina attacca uno specifico legame fosfodiesterico presente sul sito di ricombinazione, mentre per la ricombinasi in tirosina è la catena laterale di una tirosina, presente nel sito attivo, che attacca e poi unisce covalentemente il DNA. Comunque, in entrambi i casi, l'intermedio covalente proteina-DNA conserva l'energia del legame fosfodiesterico idrolizzato per far sì che i filamenti di DNA possono essere riuniti, invertendo il processo di taglio. In questa reazione inversa, un gruppo OH del DNA interrotto attacca il legame covalente che unisce la proteina al DNA. Questo processo richiude covalentemente la rottura della doppia elica e libera una molecola di ricombinasi. La CSSR avviene sempre tra due siti di ricombinazione. Come abbiamo visto precedentemente, questi siti possono essere sulla stessa molecola di DNA (per l'inversione e la delezione), o su due molecole diverse (per l'integrazione). Ogni sito di ricombinazione è costituito da una doppia elica di DNA, per questo per dare origine al DNA riarrangiato, si deve avere la rottura di quattro singoli filamenti di DNA (due per ogni

Biologia molecolare

Pagina 94 di 173

Domenico Azarnia Tehran

Sezione Appunti

duplex) e, quindi, la riunione con un diverso filamento partner. Una molecola di ricombinasi attua tutte queste reazioni di taglio formando un tetramero (quattro subunità, una per ogni filamento. La differenza tra le due famiglie di ricombinasi sta nel fatto che mentre quelle in serina tagliano ed uniscono tutti e quattro i filamenti di DNA, quelle in tirosina, dapprima tagliano ed uniscono due filamenti di DNA e, solo dopo, tagliano ed uniscono gli altri due filamenti. Il meccanismo della ricombinazione sito-specifica è meglio compreso per le ricombinasi in tirosina. Un ottimo esempio è fornito dalla struttura della ricombinasi Cre. Questa è un enzima codificato dal fago P1, che serve a linearizzare il genoma virale durante l'infezione. I siti di ricombinazione del DNA, su cui Cre agisce, sono detti siti lox. Le strutture Cre-lox mostrano che la ricombinazione richiede quattro subunità di Cre, ciascuna delle quali è legata ad un sito di legame sulla molecole di DNA substrato. Generalmente la conformazione del DNA è una struttura planare cruciforme con ogni “braccio” di questa giunzione legato da una subunità Cre. Cre esiste in due diverse conformazioni, 1 e 2, con due subunità ciascuna. Solo una di queste conformazioni può tagliare e riunire il DNA. Quindi, solo una coppia di subunità ala volta è in una conformazione attiva. Con il procedere della reazione cambia la coppia di subunità nella conformazione attiva. Questo scambio è critico per il controllo della progressione della ricombinazione e garantisce che il meccanismo di scambio avvenga in modo sequenziale, “un filamento alla volta”.

Biologia molecolare

Pagina 95 di 173

Domenico Azarnia Tehran

Sezione Appunti

68. Funzioni biologiche della ricombinazione sito-specifica Le cellule e i virus fanno uso della ricombinazione conservativa sito-specifica per una grande varietà di funzioni biologiche. In alcuni casi inseriscono il proprio DNA nel cromosoma ospite. In altri casi, la ricombinazione sito-specifica è usata per alterare l'espressione genica o per aiutare a mantenere l'integrità strutturale di molecole di DNA circolare durante la replicazione del DNA, la ricombinazione omologa e la divisione cellulare. Comunque, il confronto di diversi sistemi di ricombinazione sito-specifica mostra alcune caratteristiche generali. Tutte le reazioni dipendono strettamente dall'assemblaggio delle ricombinasi sul DNA e dall'avvicinamento dei due siti di ricombinazione. Per alcune reazioni questo assemblaggio è estremamente facile in quanto richiede solamente la ricombinasi e le sue sequenze di riconoscimento sul DNA, mentre altre reazioni richiedono proteine accessorie. Quest'ultime, dette proteine architettoniche, legano specifiche sequenze di DNA, curvando la doppia elica, quindi stimolando la ricombinazione. Le stesse proteine possono anche controllare la direzione della ricombinazione, per esempio assicurando che avvenga l'integrazione di un segmento di DNA e non la reazione inversa, ossia la sua escissione. Quando il batteriofago infetta un batterio, una serie di eventi regolativi porta o all'instaurarsi di uno stato lisogenico quiescente o alla moltiplicazione fagica, in un processo detto crescita litica. Nel primo stato si deve avere l'integrazione del DNA fagico nel cromosoma ospite, e allo stesso modo, nella crescita litica, pre replicarsi il fago deve escindere il proprio DNA dal cromosoma ospite. In dettaglio, per l'integrazione, l'integrasi di (Int) catalizza la ricombinazione tra due siti specifici, noti come siti di attacco, o att. Il sito attP si trova sul DNA fagico ed il sito attB sul cromosoma batterico. int è una ricombinasi in tirosina, e il meccanismo di scambio del filamento è analogo a quello descritto per la proteina Cre. Al contrario però di quest'ultima, l'integrazione di richiede l'utilizzo di proteine accessorie che aiutano ad assemblare il complesso proteina-DNA. Importante, inoltre, per la regolazione dell'integrazione di è l'organizzazione altamente simmetrica dei siti attP e attB. Entrambi sono caratterizzati da un core centrale (lungo circa 30 bp), che consiste in due siti di legame per Int e dalla regione del crossing over dove avviene lo scambio. Mentre attB consiste solo di questo core centrale, attP è molto più lungo (240 bp) ed è caratterizzato da molti altri siti di legame per proteine che si estendono in entrambi i “bracci”. Int è, invece, una proteina anomala, perché contiene due domini responsabili del legame sequenza-specifico al DNA: uno di questi si lega ai siti di riconoscimento presenti sulle braccia e l'altro a quelli presenti sulle regioni core. Comunque, l'integrazione richiede attB, attP e Int e una proteina architettonica chiamata fattore d'integrazione dell'ospite (integration host factor, IHF). Quest'ultimo è una proteina che lega il DNA del fago in maniera sequenza specifica, capace di determinare sulla doppia elica una curvatura. La funzione del fattore di integrazione dell'ospite è di avvicinare i siti per Int, presenti sulle braccia, a quelli presenti sul core centrale. Quando la ricombinazione ha termina, il genoma fagico circolare è stabilmente integrato nel cromosoma ospite. Come risultato, sulle giunzioni tra le sequenze del fago e quelle dell'ospite si sono formati due nuovi siti ibridi. Questi siti sono detti attL (left, sinistra) e attR (right, destra). Entrambi i siti contengono la regione core, ma le due braccia sono ora separati. Per la ricombinazione di escissione, invece, è essenziale un'altra proteina architettonica detta Xis (da excise) che si lega a specifiche sequenze di DNA e introduce una curvatura nella doppia elica, proprio come IHF. Xis riconosce due motivi di sequenza presenti su di un braccio di attR. Il

Biologia molecolare

Pagina 96 di 173

Domenico Azarnia Tehran

Sezione Appunti

legame a questi siti introduce una grande curvatura e insieme, Xis, Int e IHF stimolano l'escissione attraverso la formazione di un complesso nucleoproteico attivo su attR. Questo complesso può ora interagire produttivamente con le proteine assemblate su attL, permettendo la ricombinazione. Bisogna infine ricordare che, oltre a stimolare l'escissione (la ricombinazione tra attL e attR), il legame di Xis al DNA inibisce anche l'integrazione (la ricombinazione tra attP e attB). La doppia attività di Xis, come cofattore di stimolazione dell'escissione e inibitore dell'integrazione, assicura che il genoma del fago sia separato, e resti separato, dal cromosoma batterico quando Xis è presente. Nella Salmonella, invece, la ricombinasi Hin inverte un segmento di cromosoma batterico per permettere l'espressione di due set di geni alternativi. Queste reazioni in genere servono a “pre-adattare” una parte della popolazione ad un rapido cambiamento ambientale, nel caso dell'inversione Hin, la ricombinazione permette al batterio di evitare il sistema immunitario dell'ospite. I geni controllati dal processo d'inversione codificano per due forme diverse di flagellina (dette H1 e H2) che è la componente proteica del filamento flagellare. I flagelli come sappiamo sono strutture utili alla mobilità ma anche, molto spesso, motivi riconosciuti dal sistema immunitario. La regione cromosomica invertita d Hin è di circa 1000 bp ed è fiancheggiata da specifici siti per la ricombinazione detti hixL (sulla sinistra) e hixR (sulla destra). Queste sequenze hanno un orientamento invertito una rispetto all'altra. Hin è una ricombinasi in serina che induce l'inversione usando lo stesso meccanismo di base precedentemente descritto per gli enzimi di questa famiglia. Il segmento invertibile contiene il gene che codifica per Hin, così come il promotore, che in un orientamento è posto in modo tale da permettere l'espressione dei geni posizionati al di fuori del segmento invertibile. Quindi, quando il segmento invertibile è nell'orientamento “acceso”, questi geni, adiacenti, sono espressi; al contrario, quando il segmento è girato nell'orientamento “spento”, i geni non possono essere trascritti perché privi del promotore. I due geni sotto il controllo del promotore “che gira” sono fljB, che codifica per la flagellina H2, e fljA, che codifica per un repressore trascrizionale del gene per la flagellina H1. Perciò, nell'orientamento “acceso” sono espressi la flagellina H2 ed il repressore di H1. Queste cellule hanno sulla loro superficie esclusivamente flagelli del tipo H2. Nell'orientamento “spento”, invece, sono sono sintetizzati né H2 né il repressore di H1 e, quindi, si ha la presenza di flagelli del tipo H1. Hin per ricombinare richiede, oltre ai siti hix, una sequenza aggiuntiva. Questa corta sequenza è un enhancer che aumenta la frequenza di ricombinazione. Come gli enhancer che amplificano i livelli trascrizionali, tale sequenza può funzionare anche quando si trova piuttosto lontana dai siti di ricombinazione, ma comunque, necessita sempre di una proteina batterica detta Fis (da factor for inversion stimulation). Come l'IHS, anche Fis è una proteina che curva il DNA in una posizione specifica e media delle interazioni proteina-proteina con Hin, importanti per attuare la ricombinazione. Quando Fis attiva Hin, i tre siti di DNA (hixL, hixR e l'enhancer) vengono avvicinati grazie al superavvolgimento negativo del DNA, che stabilizza l'associazione di questi tre siti lontani (complesso dell'invertosoma). In questo modo può avvenire la ricombinazione solamente tra i siti hix che si trovano sulla stessa molecola di DNA.

Biologia molecolare

Pagina 97 di 173

Domenico Azarnia Tehran

Sezione Appunti

69. La trasposizione di DNA La trasposizione è una forma specifica di ricombinazione genetica che sposta alcuni elementi genetici da un sito ad un altro. Questi elementi genetici mobili sono detti elementi trasponibili o trasposoni. Lo spostamento avviene mediante un evento di ricombinazione tra sequenze di DNA poste alle estremità dell'elemento trasponibile ed una presente sul DNA della cellula ospite. Questo spostamento può avvenire con o senza la duplicazione dell'elemento, e talvolta, la reazione di ricombinazione passa attraverso un intermedio transitorio ad RNA. Generalmente, quando gli elementi trasponibili si muovono, mostrano una scarsa selettività nella scelta di sequenza del sito d'inserzione. Il risultato è che i trasposoni si possono inserire all'interno dei geni, spesso distruggendone completamente la funzione. Si possono anche inserire nelle regioni regolative di un gene; in questo caso, la loro presenza può cambiare la modalità di espressione del gene stesso. Per questo motivo gli elementi trasponibili rappresentano, per alcuni organismi, come l'uomo e il mais (in cui sequenze simili ali trasposoni rappresentano quasi il 50% del genoma), la principale fonte di mutazione. Comunque, i trasposoni, in funzione della loro generale organizzazione e del meccanismo di trasposizione, possono essere classificati in tre famiglie: 1) Trasposoni a DNA, che rimangono a DNA per tutto il ciclo ricombinativo e si muovono usando i meccanismi di taglio e riunione dei filamenti di DNA in maniera analoga agli elementi che si muovono per ricombinazione conservativa sito-specifica; 2) Retrotrasposoni simili ai virus, detti anche LTR (long terminal repeat, lunghe sequenze terminali ripetute); 3) Retrotrasposoni poli-A, detti anche retrotrasposoni non virali. Entrambi i tipi di retrotrasposoni si spostano in una nuova posizione sul DNA mediante un intermedio a RNA. Inoltre, bisogna dire che i trasposoni a DNA si trovano soprattutto nei batteri mentre i retrotrasposoni negli organismi eucarioti. LA TRASPOSIZIONE A DNA AVVIENE CON UN MECCANISMO TAGLIA E INCOLLA I trasposoni a DNA portano sia delle sequenze di DNA che servono come siti per la ricombinazione, sia i geni che codificano per proteine che partecipano alla ricombinazione. I siti per la ricombinazione si trovano alle due estremità dell'elemento e sono organizzati come sequenze ripetute e invertite, che variano in lunghezza da 25 al alcune centinaia di paia di basi; questi tratti portano, anche, le sequenze di riconoscimento della ricombinasi. In genere, le ricombinasi responsabili della trasposizione sono dette trasposasi (o, talvolta, integrasi). Le sequenze di DNA immediatamente fiancheggianti il trasposone hanno un breve segmento (lungo da 2 a 20 bp) di sequenza duplicata. Questi segmenti sono organizzati come ripetizioni dirette, dette duplicazioni del sito bersaglio, e si formano nel processo di ricombinazione. Comunque, i trasposoni a DNA che hanno un paio di estremità invertite e ripetute e un gene per la trasposasi hanno tutto ciò che serge per promuovere la propria trasposizione. Questi elementi sono detti trasposoni autonomi. Ma i genomi contengono anche segmenti di DNA mobili molto più semplici, detti trasposoni non autonomi, che contengono solo le estremità ripetute e invertite, quindi possono solo trasporsi in una cellula. Se questa però è dotata di un trasposone autonomo, codificante per una trasposasi, possono integrarsi nel genoma. La più semplice reazione di trasposizione è il movimento di un trasposone a DNA mediante un

Biologia molecolare

Pagina 98 di 173

Domenico Azarnia Tehran

Sezione Appunti

meccanismo non replicativo. Questo modo di ricombinare prevede l'escissione del trasposone dalla sua posizione iniziale, nel DNA ospite, seguita dall'integrazione del trasposone escisso in un nuovo dito di DNA. Per questo motivo si parla di trasposizione taglia e incolla. Per iniziare la ricombinazione, la trasposasi si lega all'estremità ripetute ed invertite del trasposone. L'enzima, una volta che ha riconosciuto queste sequenze, avvicina le due estremità del trasposone dando luogo ad un complesso nucleoproteico stabile, detto complesso sinaptico o traspososoma. Il compito di quest'ultimo è quello di assicurare che le reazioni di taglio e di riunione del DNA, necessarie allo spostamento del trasposone, avvengano contemporaneamente alle due estremità dell'elemento a DNA. Inoltre, durante la ricombinazione, protegge le estremità del DNA dagli enzimi cellulari. Il passaggio successivo consiste nell'escissione del trasposone dalla sua originaria posizione del genoma. Per fare ciò, le subunità della trasposasi all'interno del traspososoma iniziano con il tagliare un filamento ad ogni estremità del trasposone. L'enzima tagli il DNA in modo che la sequenza del trasposone termini, ad ogni estremità dell'elemento, con dei gruppi 3' OH liberi. Per terminare la reazione di escissione, anche il secondo filamento ad ogni estremità dell'elemento a DNA deve essere tagliato. I diversi trasposoni usano diversi meccanismi per tagliare questi secondi filamenti. Dopo l'escissione, l'estremità 3' OH del trasposone a DNA, attaccano i legami fosfodiesterici sulla doppia elica, nel sito di nuova inserzione. Questo segmento di DNA è chiamato DNA bersaglio. Il risultato di questo attacco consiste nel legame covalente tra il trasposone e il DNA nel sito bersaglio. In ogni reazione di unione, nel DNA bersaglio viene anche prodotta un'incisione (nick). Mentre la reazione di saldatura avviene mediante un unico passaggio di transesterificazione, noto come trasferimento del filamento di DNA. Vale la pena osservare che in quest'ultimo passaggio il DNA bersaglio è tagliato, originando delle estremità 3' OH, che fungono da primer nella sintesi di riparazione. Il riempimento di queste interruzioni porta alla duplicazione del sito bersaglio che fiancheggia i trasposoni. Quindi, la lunghezza della duplicazione indica quanto fossero distanti i due siti attaccati sui due filamenti del DNA bersaglio durante il trasferimento del secondo filamento. Una volta avvenuta la sintesi di riparazione delle interruzioni, è necessaria una DNA ligasi che saldi i filamenti di DNA. Nel sito della “vecchia” inserzione, invece, si viene a creare una rottura a doppio filamento che è riparata per mezzo della ricombinazione omologa.

Biologia molecolare

Pagina 99 di 173

Domenico Azarnia Tehran

Sezione Appunti

70. La trasposizione a DNA mediante meccanismo replicativo e Tn10 Alcuni trasposoni a DNA, però, su muovono con un meccanismo noto come trasposizione replicativa, i cui l'elemento di DNA viene replicato ogni ciclo di trasposizione. Il primo passaggio di questa trasposizione consiste nell'assemblaggio della trasposasi su entrambe le estremità del trasposone a costituire un traspososoma. Il passaggio successivo consiste nel tagliare le estremità del trasposone, in una reazione catalizzata dalla trasposasi all'interno del traspososoma. Questo taglio libera le due estremità 3' OH sulla sequenza del trasposone. Al contrario della trasposizione del tipo taglia e incolla, in questo passaggio, non si ha l'escissione del trasposone dalle sequenze dell'ospite. Le estremità 3' OH del trasposone vengono quindi unite al sito bersaglio dalla reazione di trasferimento del filamento. In questo meccanismo, però, l'intermedio che si viene a formare con il trasferimento del filamento è una molecola di DNA con una doppia ramificazione. In questo intermedio le estremità 3' del trasposone sono unite covalentemente al nuovo sito bersaglio, mentre le estremità 5' del trasposone restano unite al vecchio DNA fiancheggiante. Le due braccia di DNA sull'intermedio hanno una struttura di una forca replicativa. Dopo il trasferimento del filamento, le proteine replicative della cellula ospite si possono assemblare su queste forche e l'estremità 3' OH sul sito bersaglio di DNA tagliato serve da innesco per la sintesi di DNA. Questa reazione di replicazione genera due copie del trasposone, ciascuna delle quali è fiancheggiata da una breve ripetizione diretta del sito bersaglio. Un esempio, più dettagliato per la trasposizione replicativa ci è dato dal trasposone batterico Tn10. Questo è un elemento compatto di 9 kb che contiene un gene per la propria trasposasi ed i geni che conferiscono la resistenza all'antibiotico tetraciclina. Tn10 è organizzato in tre moduli funzionali (questa struttura è comune ad alti trasposoni detti trasposoni compositi). I due elementi più esterni detti IS10L e IS10R sono dei minitrasposoni (IS sta per sequence insertion, inserzione di sequenza). IS10R codifica per il gene della trasposasi. Tn10 limita il proprio numero di copie all'interno di una cellula con delle strategie che riducono la frequenza di trasposizione. Un meccanismo consiste nell'usare un RNA antisenso per controllare l'espressione del gene della trasposasi. Vicino all'estremità IS10R si trovano due promotori che dirigono la sintesi dell'RNA da parte della RNA polimerasi della cellula ospite. Il promotore che dirige la sintesi dell'RNA verso l'interno (detto PIN) è responsabile dell'espressione del gene della trasposasi, mentre il promotore che dirige la trascrizione verso l'esterno (POUT) serve a regolare l'espressione della trasposasi, mediante un RNA antisenso. Gli RNA sintetizzati da entrambi i promotori si sovrappongono e quindi possono formare dei legami idrogeno tra queste regioni di sovrapposizione. Questo appaiamento impedisce ai ribosomi di legarsi al trascritto che deriva dal promotore PIN, impedendo, quindi, la sintesi della trasposasi. In questo modo, le cellule con un numero di copie più alto di Tn10 trascriveranno per una maggiore quantità di RNA antisenso, che, quindi, limiterà l'espressione del gene della trasposasi. Bisogna, infine, ricordare che la trasposizione di Tn10 è accoppiata alla replicazione del DNA cellulare. Come sappiamo che i batteri, come E. coli, metilano il proprio DNA sui siti GATC. Questa metilazione avviene dopo la replicazione del DNA, in modo tale che i siti GATC siano emimetilati per pochi minuti fra il passaggio della forca replicativa e il riconoscimento di queste sequenze da parte della metilasi. E proprio durante questo breve periodo, quando il DNA di Tn10 è emimetilato, che ha luogo la trasposizione. Questo

Biologia molecolare

Pagina 100 di 173

Domenico Azarnia Tehran

Sezione Appunti

accoppiamento della trascrizione è dovuto alla presenza di due siti GATC nella sequenza del trasposone che aumentano l'affinità di legame per l'RNA polimerasi che esprime efficacemente il gene per la trasposasi.

Biologia molecolare

Pagina 101 di 173

Domenico Azarnia Tehran

Sezione Appunti

71. I retrotrasposoni simili ai virus Anche i retrotrasposoni simili ai virus e i retrovirus contengono, come siti per il legame e l'azione della ricombinasi, delle sequenze terminali ripetute e invertite. Le ripetizioni terminali invertite sono immerse all'interno di sequenze ripetute lunghe; L’RNA retrovirale ha alle estremità delle ripetizioni dirette di 10-80 nt, dette R. All’estremità 5’, a valle di R, c’è la regione U5 di 80-100 nt, il cui nome indica che è unica per l’estremità 5’. All’estremità 3’, a monte di R, c’è la regione U3 di 170-1350 nt, il cui nome indica che è unica per l’estremità 3’Nella forma a DNA del virus le 3 regioni U3, R, U5 sono presenti come ripetizioni dirette a entrambe le estremità, e prendono il nome di LTR (lunghe sequenze terminali ripetute, long terminal repeat). I retrotrasposoni simili ai virus codificano per due proteine necessarie per la loro mobilità: l'integrasi (la trasposasi) e la trascrittasi inversa. La trascrittasi inversa (reverse transcriptase, RT) è un tipo speciale di DNA polimerasi capace di usare uno stampo ad RNA per sintetizzare DNA. Questo enzima è necessario perché per la reazione di trasposizione è richiesto un intermedio a RNA. La differenza tra i retrotrasposoni e i retrovirus sta nel fatto che i primi possono solo spostarsi in nuove posizioni nella cellula, ma non possono mai lasciare quella cellula, mentre i retrovirus ospita ed infetta una nuova cellula. Un ciclo di trasposizione inizia con la trascrizione della sequenza di DNA di un retrotrasposone in RNA da parte di una RNA polimerasi cellulare. La sintesi inizia dal primo nucleotide della sequenza R di sinistra e termina oltre la LTR di destra. L’RNA viene poi modificato mediante degradazione fino al termine della sequenza R di destra e aggiunta di poli(A). Quindi, la trascrizione inizia su un promotore posto su un LTR e prosegue attraverso l'elemento per portare alla formazione di una copia ad RNA, quasi completa, dall'elemento a DNA. L'RNA viene quasi retrotrascritto, portando ad una molecola di DNA a doppio filamento, detta cDNA (per DNA copiato), libera da ogni sequenza fiancheggiante dell'ospite. L’innesco per la trascrittasi inversa è dato da un tRNA della cellula. Un tratto di 18 basi al 3’ del tRNA si appaia a un sito a circa 100-200 basi dall’estremità 5’ dell’RNA virale (PBS, primer binding site). La sintesi produce un breve tratto di DNA comprendente le regioni U5 e R. L’RNasi H collegata all’enzima degrada il tratto a RNA dell’ibrido RNADNA. Il DNA U5-R si appaia alla estremità R rimasta dell’RNA e viene esteso dalla trascrittasi inversa. L’RNasi H degrada l’RNA. Resta un tratto polipurinico (PPT) a monte di U3 che funge da primer per la sintesi di U3, R, U5, e PBS. Il tRNA dell’ibrido RNA-DNA viene degradato e le due sequenze PBS si appaiano. Le due estremità 3’ vengono estese e si ha come risultato un DNA retrovirale fiancheggiato da due LTR. L’integrazione richiede l’intervento dell’enzima integrasi, che genera estremità 5’-protruding sia nel DNA retrovirale sia nel sito bersaglio. Quindi, per la ricombinazione in un nuovo sito di DNA, è proprio il cDNA che viene riconosciuto da un'integrasi. Quest'ultima si assembla all'estremità del cDNA per poi eliminare alcuni nucleotidi da ciascuna estremità 3'. A questo punto, con una reazione di trasferimento del filamento, l'integrasi stessa catalizza l'inserimento delle estremità 3' tagliata nel sito bersaglio del genoma della cellula ospite. Il sito bersaglio, come già detto, può avere praticamente qualsiasi sequenza e per portare a termine la ricombinazione le proteine della riparazione della cellula ospite riempiono l'interruzione che si è venuta a formare sul sito bersaglio.

Biologia molecolare

Pagina 102 di 173

Domenico Azarnia Tehran

Sezione Appunti

72. I retrotrasposoni poli-a assomigliano ai geni I retrotrasposoni poli-A non hanno le ripetizioni terminali invertite presenti in tutti gli altri tipi di trasposoni. Al contrario, le due estremità dell'elemento sono caratterizzate da sequenze diverse. Un'estremità è detta 5' URT (per untraslated region, regione non tradotta), mentre l'altra ha una zona chiamata 3' UTR, seguita da una serie di paia di basi del tipo A-T, la così detta sequenza poli-A. Questi elementi sono anche fiancheggiati da corte duplicazioni del sito bersaglio. I retrotrasposoni portano due geni, noti come ORF1 e ORF2. Il primo codifica per una proteina che lega l'RNA, mentre ORF2 per un fattore caratterizzato da un'attività sia di trascrittasi inversa che endonucleasica. Comunque, i retrotrasposoni poli-A, quali, per esempio, gli elementi LINE (circa il 20% del genoma) e SINE umani, si muovono per mezzo di un intermedio a RNA ma usano un meccanismo diverso da quello usato dagli elementi simili ai virus. Questo meccanismo è chiamato trascrizione inversa innescata dal sito bersaglio. Il primo passaggio consiste nella trascrizione da parte di una RNA polimerasi cellulare dell'elemento a DNA integrato. In questo caso anche se il promotore è nascosto nel 5' UTR, la sintesi dell'RNA può partire dal primo nucleotide del trasposone. L'RNA neosintetizzato viene trasportato nel citoplasma e tradotto producendo le due proteine ORF1 e ORF2 che rimangono associate al trascritto che le ha codificate. Il complesso ribonucleico, quindi, rientra nel nucleo dove si associa al DNA cellulare. A questo punto, l'endonucleasi inizia la reazione di integrazione introducendo un taglio nel DNA cromosomico. Le sequenze ricche di T costituiscono dei siti preferenziali di taglio. La presenza di queste T sul sito di taglio permette al DNA di appaiarsi con la coda poli-A dell'elemento a RNA. L'estremità 3'-OH che si è venuta a formare nella reazione d'incisione del DNA, serve come innesco per la retrotrascrizione dell'elemento a RNA. I passaggi finali della trasposizione, anche se non ancora ben compresi, includono la sintesi del secondo filamento di cDNA, la riparazione della rottura nel sito d'inserzione ed una reazione di ligasi utile a saldare i filamenti di DNA.

Biologia molecolare

Pagina 103 di 173

Domenico Azarnia Tehran

Sezione Appunti

73. Footprinting con la DNasi I Il footprinting con la DNasi permette di identificare quale porzione di una sequenza, per esempio di un promotore, contiene elementi di controllo legati da fattori di trascrizione o più in generale da proteine. Se un frammento di DNA è legato da una proteina, la regione di legame è protetta dal trattamento con la nucleasi DNasi I, che taglia tutti i legami fosfodiesterici tranne quelli protetti dalla proteina legata. Quindi, per iniziare, il frammento di DNA da saggiare è marcato ad una estremità. A questo punto, viene mescolato alla proteina da saggiare (o a un estratto nucleare se la proteina non è stata ancora purificata). Si effettua un trattamento con la DNasi I in condizioni limitanti (bassa quantità di enzima) in modo che ciascuna molecola del frammento di DNA venga tagliata una sola volta. Successivamente, viene rimossa la proteina, si esegue una elettroforesi su gel di poliacrilammide ad alta risoluzione (bisogna separare frammenti che differiscono per una sola base) e si visualizzano i frammenti marcati. Come controllo si carica lo stesso frammento sottoposto a digestione con DNasi, in assenza dell’estratto nucleare (o della proteina). Si ottengono tante bande quante sono le basi del frammento. La regione protetta dalla proteina alla DNasi I appare come un “gap” nel pattern di bande, ossia si ha la scomparsa graduale delle bande nella regione del footprint, dove è avvenuta la protezione del DNA dipendente dalla concentrazione della proteina aggiunta. Un metodo per amplificare particolari frammenti di DNA, diverso dal clonaggio e dalla propagazione nell'organismo ospite, invece, è la reazione a catena della polimerasi (polymerase chain reaction, PCR). La PCR sfrutta la reazione di sintesi in vitro del DNA, reazione catalizzata dalla DNA polimerasi. Questo enzima richiede per il suo funzionamento uno stampo (template), rappresentato da un filamento di DNA a cui deve trovarsi appaiato un primer (corto oligodeossinucleotide), che funge da innesco fornendo un 3' OH libero, e la presenza di deossinucleosidi 5’-trifosfato (dNTPs). La reazione di PCR si basa sull’uso di due primer di lunghezza pari a 18-20 nucleotidi, che sono disegnati in modo da essere esattamente complementari alle corrispondenti sequenze fiancheggianti il tratto di DNA da amplificare. I due primer sono diretti in direzione opposta ma convergente e definiscono le estremità del futuro prodotto dell’amplificazione. L’attività della DNA polimerasi determinerà la sintesi di nuovi filamenti a partire da ciascun primer. La reazione è divisa in tre stadi, ciascuno condotto ad una temperatura diversa. La prima tappa è la denaturazione che viene effettuata a temperatura di 94°C per separare i due filamenti della molecola stampo. Sono infatti i primer che, nella seconda tappa della PCR (annealing) appaiandosi ai filamenti denaturati, determinano il punto di innesco della sintesi di DNA. La reazione di annealing avviene a temperatura inferiore a quella di denaturazione in modo da consentire ai primer di appaiarsi alle sequenze complementari. La temperatura di annealing è un parametro variabile e critico nel determinare la specificità della PCR (vedi disegno dei primer e scelta della temperatura di annealing). Di norma questa temperatura è compresa tra 50-60°C. La tappa successiva (polimerizzazione o estensione) è condotta a 72°C, temperatura ottimale per la DNA polimerasi del batterio termofilo Thermus aquaticus (Taq DNA polimerasi), enzima che viene usato nella maggior parte delle applicazioni. Questa tappa dura in funzione della lunghezza del tratto da sintetizzare (la Taq DNA polimerasi in media sintetizza 1kb/min). Prima dell’isolamento delle DNA polimerasi termostabili si usava la DNA polimerasi I di E.coli che però si inattivava ad ogni tappa di denaturazione e doveva quindi essere aggiunta alla miscela di reazione ad ogni ciclo. L’isolamento delle DNA polimerasi da batteri termofili ha

Biologia molecolare

Pagina 104 di 173

Domenico Azarnia Tehran

Sezione Appunti

consentito di automatizzare la reazione che adesso viene effettuata tramite speciali strumenti detti termociclatori (thermo-cyclers). Il ciclo di denaturazione-appaiamento-estensione è ripetuto 20-30 volte in modo tale da ottenere una grande amplificazione del DNA compreso nella regione di appaiamento dei due primer. I primi prodotti discreti di PCR si formano a partire dal terzo ciclo e si accumulano con un andamento di tipo esponenziale. Comunque, i fattori più importanti per la riuscita della PCR sono la scelta dei primers e la temperatura di annealing, se quest'ultima è troppo alta i primers non si appaiano, se invece, è troppo bassa si avranno degli appaiamenti indesiderati. I primers, invece, dovrebbero avere la stessa Tm, non essere complementari tra loro e non dare luogo a strutture secondarie stabili. Il saggio di ritardo di mobilità elettroforetica, detto anche EMSA (Electrophoretic Mobility Shift Assay), si basa sulla diversa mobilità elettroforetica che un frammento di DNA presenta quando è complessato con una proteina. Infatti, un frammento di DNA migra in un campo elettrico, con una velocità che dipende dalla sua lunghezza. Se al frammento di DNA è legata una proteina, la sua mobilità elettroforetica diminuisce. Questo può essere facilmente identificato comparando la mobilità con quella del campione di controllo a cui non è stata aggiunta la proteina. Per questo, all'inizio della tecnica, il frammento da analizzare è marcato terminalmente ed è incubato con un estratto di proteine nucleari. Si procede, quindi, all'elettroforesi su poliacrilammide mentre nel pozzetto adiacente è caricato lo stesso frammento a cui non è stato aggiunto l’estratto nucleare. Dopo la corsa il gel viene essiccato e poi sottoposto ad autoradiografia. Se una proteina presente nell’estratto nucleare lega il frammento, il complesso DNA-proteina ha una mobilità elettroforetica ritardata rispetto a campione di controllo. L'immunoprecipitazione della cromatina (ChIP), infine, è un metodo ampiamente usato per identificare le proteine specifiche connesse con una regione del genoma, o al contrario, per identificare le regioni del genoma connesso con le proteine specifiche. Queste proteine possono essere isoforme degli istoni modificati ad un amminoacido particolare o ad altre proteine associate alla cromatina. Quando viene utilizzato con gli anticorpi che riconoscono le modifiche dell'istone, il ChIP può essere usato "per misurare" la quantità della modifica. Un esempio è la misura della quantità di acetilazione dell'istone H3 connessa con una regione specifica del promotore del gene nelle varie circostanze che potrebbero alterare l'espressione del gene. Gli istoni non sono le uniche che possano essere studiate usando questa tecnica. Gran parte dell'interesse recente è focalizzato anche nell'analisi della distribuzione dei fattori di trascrizione. L'utilizzo del ChIP prevede che le cellule siano inizialmente fissate con formaldeide per effettuare il cross-linking del DNA e poi la cromatina viene raccolta dalle cellule e sottoposta ad un processo di immunoselezione, che richiede l'uso degli anticorpi specifici (il cross-linking in vivo con formaldeide lega covalentemente le proteine al DNA con cui interagiscono. Le cellule vengono lisate e il DNA viene rotto in frammenti di 200-300 bp mediante sonicazione. L'immunoprecipitazione (IP) con un anticorpo (AB) specifico per la proteina di interesse consente la separazione del DNA legato dal resto del genoma. Il cross-linking può essere rimosso mediante riscaldamento, e il DNA identificato mediante PCR). Tutte le sequenze del DNA unite con cross-linking alla proteina di interesse coprecipiteranno come componente del complesso della cromatina. Dopo l' immunoselezione dei frammenti di cromatina e purificazione di quelli associati a DNA, la rivelazione delle sequenze di DNA specifiche viene svolta. Se il DNA che sarà rilevato è associato alla modifica dell'istone o della proteina che è esaminata, la rappresentazione relativa di quella sequenza del DNA sarà aumentata (o sarà arricchita)

Biologia molecolare

Pagina 105 di 173

Domenico Azarnia Tehran

Sezione Appunti

tramite il processo di immunoprecipitazione. Solitamente una PCR standard è effettuata per identificare la sequenza del DNA (il gene o la regione del genoma) connessa con la proteina di interesse.

Biologia molecolare

Pagina 106 di 173

Domenico Azarnia Tehran

Sezione Appunti

74. I meccanismi della trascrizione del DNA Fino a questo punto, abbiamo considerato il mantenimento del genoma, cioè, come il materiale genetico è organizzato, protetto e replicato. Ora ci occupiamo invece di come il materiale genetico è espressi, cioè, di come la sequenza di basi del DNA dirige la produzione degli RNA e delle proteine attraverso: la trascrizione (produce un RNA a singolo filamento identico a uno dei filamenti del DNA duplex. Le tre principali classi di RNA sono RNA messaggero - mRNA, RNA transfer - tRNA, RNA ribosomale - rRNA), la maturazione dell'RNA e la traduzione (converte la sequenza nucleotidica di un mRNA nella sequenza di amminoacidi che costituisce una proteina). La trascrizione è, sia chimicamente che enzimaticamente, molto simile alla replicazione del DNA, infatti entrambi i processi utilizzano enzimi che sintetizzano una nuova catena di acidi nucleici complementare al filamento stampo di DNA, ma vi sono rilevanti differenze: 1) la nuova catena è costituita da ribonucleotidi anziché deossiribonucleotidi; 2) l'RNA polimerasi (l'enzima che catalizza la sintesi dell'RNA) non ha bisogno di un primer, difatti può iniziare la trascrizione ex novo; 3) l'RNA prodotto non rimane accoppiato alle basi dello stampo di DNA bensì, l'enzima stacca la catena ribonucleotidica per far sì che l'RNA sintetizzato possa essere tradotto nel suo prodotto proteico; 4) la trascrizione è meno precisa della replicazione (viene commesso un errore ogni 10000 nucleotidi aggiunti, rispetto a uno ogni 10000000 della replicazione), in quanto non vi sono meccanismi di correzione. Comunque, la scelta della regione da trascrivere non è casuale: ciascuna regione contiene uno o più geni e ci sono delle sequenze di DNA che dirigono l'avvio della trascrizione all'inizio di ciascuna regione ed altre alla fine che la fanno terminare.

Biologia molecolare

Pagina 107 di 173

Domenico Azarnia Tehran

Sezione Appunti

75. Le RNA polimerasi e il ciclo della trascrizione L'RNA polimerasi svolge essenzialmente la stessa funzione in tutte le cellule dai batteri all'uomo. In dettaglio, i batteri hanno una sola RNA polimerasi, mentre le cellule eucariotiche ne hanno tre: la RNA polimerasi I, II e III. La Pol II è l'enzima più studiato ed è anche la polimerasi responsabile della trascrizione nella maggior parte dei geni che codificano per proteine. La Pol I e la Pol III sono, invece, coinvolte nella trascrizione di geni che codificano rispettivamente per rRNA, la Pol I, e tRNA, alcuni piccoli RNA nucleari (small nuclear RNA) e gli rRNA 5S, la Pol II. Comunque, il nucleo enzimatico o enzima core della RNA polimerasi batterica è da solo in grado di sintetizzare l'RNA ed è composto da due copie della subunità , e da una copia delle subunità , ' e . In generale, la forma di ciascun enzima assomiglia alla chela di un granchio. Le due pinze della chela sono costituite principalmente dalle subunità maggiori di ciascun enzima ( e ' per quello batterico, RPB1 e RPB2 per quello eucariotico). Il sito attivo è costituito da alcune regioni di entrambe queste subunità, si trova alla base delle pinze, all'interno di una regione chiamata “solco centrale attivo”. Questo sito è in grado di legare due ioni Mg2+, e questo ben si adatta con il meccanismo catalitico a cationi bivalenti per l'aggiunta dei nucleotidi, proposto per tutti i tipi di polimerasi. Comunque, la trascrizione inizia quando l'RNA polimerasi si lega ad una regione speciale, il promotore, all'inizio del gene. Il promotore circonda la prima coppia di basi che è trascritta in RNA, il punto di inizio, da cui l'RNA polimerasi si sposta lungo lo stampo, sintetizzando RNA, fino a raggiungere un terminatore. Questa azione definisce un'unità di trascrizione che si estende dal promotore al terminatore. Le sequenze che precedono il punto d'inizio dono descritte come sequenze a monte, mentre quelle che lo seguono (all'interno della sequenza trascritta) sono sequenze a valle. Le sequenze sono scritte convenzionalmente in modo che la trascrizione proceda da sinistra a destra, il che corrisponde a scrivere l'mRNA nella solita direzione 5'3'. Inoltre, le posizioni delle basi sono numerate in entrambe le direzioni a partire dal punto d'inizio, a cui si assegna il valore +1; i numeri positivi crescono andando verso valle. Alla base che si trova prima del punto d'inizio viene assegnato il valore -1 e i numeri negativi aumentano verso monte (a nessuna base si assegna 0). Il prodotto immediato della trascrizione si chiama trascritto primario e consiste di un RNA che si estende dal promotore al terminatore ma è molto instabile. Nei procarioti viene degradato rapidamente (mRNA) o tagliato per formare prodotti maturi (rRNA e tRNA), mentre negli eucarioti è modificato alle estremità (mRNA) e/o tagliato per formare prodotti maturi (tutti gli RNA). Per trascrivere un gene, l'RNA polimerasi procede attraverso una serie di passaggi ben definiti che sono raggruppati in tre fasi: inizio, allungamento e terminazione. Nella prima fase l'RNA polimerasi si lega ad una sequenza di DNA, il promotore, quindi comincia la trascrizione in direzione 5'3', le basi si disappaiano e si produce una “bolla” di DNA a singolo filamento. Diversamente dalla replicazione, però, solo uno dei due filamenti di DNA funge da stampo. Durante l'allungamento, invece, si ha un cambio conformazionale che porta l'RNA polimerasi ad ancorarsi ancora più saldamente allo stampo del DNA, dopo aver sintetizzato un piccolo frammento di RNA. Inoltre, questo enzima, svolge il DNA di fronte a se stesso e lo riavvolge dietro, stacca la catena di RNA dallo stampo di DNA mentre si muove lungo il filamento, e in più funziona da correttore di bozze. Una volta che la polimerasi ha trascritto il gene, o i geni, in tuta la sua lunghezza, deve fermarsi e rilasciare l'RNA prodotto. Questo passaggio è chiamato terminazione. In alcune cellule vi sono

Biologia molecolare

Pagina 108 di 173

Domenico Azarnia Tehran

Sezione Appunti

sequenze specifiche e ben caratterizzate che innescano la terminazione. In maniera più dettagliata, la prima fase, ossia l'inizio può essere divisa in una serie di passaggi definiti. Il primo passaggio è il legame iniziale della polimerasi al promotore per formare quello che viene chiamato complesso chiuso. In questa forma, il DNA rimane a doppia elica e l'enzima è legato ad una sola faccia dell'elica. Nel secondo passaggio dell'inizio, il complesso chiuso subisce una transizione verso un complesso aperto, in cui le catene di DNA si separano per circa 14 basi attorno al punto di inizio formando la bolla di trascrizione. Bisogna ricordare, che l'incorporazione dei primi dieci ribonucleotidi è un processo piuttosto inefficiente e in questo stadio l'enzima spesso rilascia dei piccoli trascritti e poi inizia di nuovo la sintesi (inizio abortivo). Una volta che l'enzima ha superato i dieci nucleotidi si dice che è evaso dal promotore. A questo punto si è formato un complesso ternario stabile, contenente l'enzima, il DNA e l'RNA.

Biologia molecolare

Pagina 109 di 173

Domenico Azarnia Tehran

Sezione Appunti

76. Il ciclo della trascrizione nei batteri Il core della RNA polimerasi batterica è in grado, in linea di principio, di iniziare la trascrizione in qualsiasi punto della molecola di DNA. Nelle cellule, però, la polimerasi inizia la trascrizione solo dai promotori. È l'aggiunta di un fattore d'inizio, chiamato , che converte l'enzima core nella forma che è in grado di iniziare solo dai promotori. Questa forma completa dell'enzima è chiamata RNA polimerasi oloenzima. Nel caso di E.coli, il fattore predominante è chiamato 70 che riconosce promotori con le seguenti caratteristiche: due sequenze conservate, ciascuna di sei nucleotidi, separate da un frammento non specifico di 17-19 nucleotidi. Le due sequenze specifiche sono centrate rispettivamente a circa 10 e 35 paia di basi a monte del sito in cui inizia la sintesi dell'RNA. Queste sequenze sono chiamate regioni o elementi -35 (minus 35) e -10 (minus 10). La funzione della sequenza -35 è quella di fornire il segnale per il riconoscimento da parte della RNA polimerasi, mentre la sequenza -10 permette al complesso di convertirsi dalla forma chiusa a quella aperta. Potremmo quindi considerare la sequenza -35 come un “dominio di riconoscimento” e la sequenza -10 come un “dominio di svolgimento” del promotore. Sebbene la maggior parte dei promotori 70 contengano le regioni -35 e -10, le sequenze non sono identiche. Infatti, confrontando i diversi promotori, è possibile derivare una sequenza consenso che rappresenta le regioni -10 e -35 più comuni, separate dallo spaziatore ottimale (17 paia di basi). Comunque, i promotori con la sequenza più vicina a quella consenso sono generalmente più “forti” di quelli con sequenze divergenti. Inoltre, in alcuni promotori forti, ad esempio quelli che dirigono l'espressione dei geni per gli rRNA, si trova un elemento addizionale di DNA che lega la RNA polimerasi. Si chiama UP-element (elemento UP) ed aumenta il legame della polimerasi, in quanto fornisce un'ulteriore interazione specifica tra l'enzima e il DNA. Un'altra classe di promotori 70 non ha la regione -35, però possiede il così detto elemento -10 esteso. Il fattore 70 può essere suddiviso in quattro regioni denominate 1-4. Le regioni che riconoscono gli elementi -10 e -35 del promotore sono rispettivamente la regione 2 e 4. Due eliche all'interno della regione 4 formano un dominio comune di legame al DNA, chiamato elica-giro-elica. Una di queste eliche si inserisce nel solco maggiore e interagisce con le basi della regione -35; l'altra elica si posiziona sulla sommità del solco ed entra in contatto con l'ossatura del DNA. Anche la regione -10 è riconosciuta da un' elica. In questo caso però, l'interazione è molto meno caratterizzata e più complessa in quanto è proprio su questo elemento che avviene l'inizio della separazione del DNA durante la transizione tra complesso chiuso a quello aperto. Per questo motivo l'elica che è coinvolta nel riconoscimento della regione -10 contiene parecchi amminoacidi aromatici essenziali, che possono stabilizzare il DNA aperto. Contrariamente, agli altri elementi del promotore, l'elemento UP non viene riconosciuto da , ma da un dominio carbossiterminale della subunità , chiamato CTD, che è unito all'NTD tramite una connessione flessibile. Bisogna ricordare che oltre al fattore sigma, per rispondere a cambiamenti generali dell'ambiente, E.coli usa fattori sigma alternativi che prendono il nome o dal peso molecolare del prodotto o dal gene. Il fattore generale responsabile della trascrizione della maggior parte dei geni in condizioni normali è 70, mentre i fattori alternativi S, 32, E e 54 sono attivi in risposta a cambiamenti ambientali. Il legame iniziale tra l'RNA polimerasi e il promotore nel complesso chiuso lascia il DNA nella forma a doppia elica. Lo stadio successivo dell'inizio richiede che l'enzima sia legato in maniera più salda con il

Biologia molecolare

Pagina 110 di 173

Domenico Azarnia Tehran

Sezione Appunti

promotore, nel complesso aperto. La transizione dal complesso chiuso a quello aperto comporta dei cambi strutturali nell'enzima e l'apertura della doppia elica del DNA per liberare il filamento stampo da quello non stampo. Questa separazione avviene tra la posizione -11 e +3 rispetto al sito di inizio della trascrizione. Nel caso della polimerasi batterica non vi è bisogno dell'idrolisi dell'ATP ma è un cambio conformazionale spontaneo (isomerizzazione). Per avere un'idea dei cambi strutturali che accompagnano l'isomerizzazione, dobbiamo esaminare la struttura dell'oloenzima più in dettaglio. Come abbiamo detto, un canale corre tra le pinze dell'enzima a forma di chela di granchio. Il sito attivo dell'enzima, che è composto da regioni in entrambe le subunità e ', si trova alla base delle pinze, all'interno del “solco centrale attivo”. Ci sono cinque canali nell'enzima. Il canale d'ingresso NTP-uptake, permette l'entrata dei ribonucleotidi verso il centro attivo. Il canale di uscita dell'RNA (RNA-exit) consente alla catena di RNA di lasciare l'enzima mentre è sintetizzato durante l'allungamento. I tre canali rimanenti permettono l'ingresso e l'uscita del DNA dall'enzima: il DNA a valle (ossia quello che si trova davanti l'enzima e che deve essere trascritto) entra nel solco centrale attivo nella forma a doppia elica, attraverso il canale del DNA a valle (DNA downstream). All'interno del solco centrale attivo, le catene di DNA si separano dalla posizione +3. Il filamento non stampo esce dal solco centrale attivo attraverso il canale NT (non template) e si sposta lungo la superficie dell'enzima. Il filamento stampo, invece, segue un cammino lungo il solco centrale attivo ed esce tramite il canale T (template). La doppia elica si riforma in posizione -11 nel DNA a monte, cioè dietro l'enzima. In seguito all'isomerizzazione dal complesso chiuso a quello aperto, si possono osservare due importanti cambiamenti strutturali dell'enzima: 1) le pinze anteriori si chiudono fermamente sul DNA a valle e 2) c'è uno spostamento consistente della regione N-terminale di che permette l'accesso del DNA nel sito attivo. Come abbiamo detto precedentemente, inoltre, il fattore sigma è coinvolto soltanto nell'inizio della trascrizione e non è presente quando si conclude l'inizio abortivo e la sintesi di RNA è iniziata con successo. Quando viene rilasciato dal nucleo dell'enzima, il fattore sigma diventa immediatamente disponibile per essere usato da un altro nucleo dell'enzima. Quest'ultimo ha un elevata affinità intrinseca per il DNA, che è aumentata dalla presenza di RNA nascente, ma la sua affinità per i siti di legame debole è troppo alta per permettere all'enzima di distinguere in modo efficiente i promotori dalle altre sequenze. Riducendo la stabilità dei complessi deboli, sigma permette al processo di avvenire molto più rapidamente e, stabilizzando l'associazione a livello dei siti di legame forte, il fattore spinge irreversibilmente la reazione verso la formazione di complessi aperti. Quando l'enzima rilascia sigma, ritorna ad un'affinità generale per tutto il DNA, indipendentemente dalla sequenza, adatta a continuare la trascrizione. Bisogna ricordare, che tutte le RNA polimerasi sono comunque debolmente al DNA. L'importanza della separazione dei filamenti del DNA nella reazione di inizio è evidenziata dagli effetti sul superavvolgimento. Infatti, sia le RNA polimerasi procariotiche che eucariotiche possono iniziare la trascrizione in vitro quando lo stampo è superavvolto, presumibilmente perché la struttura superavvolta richiede meno energia per la fusione iniziale del DNA nel complesso d'inizio. Inoltre il superavvolgimento viene anche continuamente coinvolto nella trascrizione. Man mano che la RNA polimerasi trascrive il DNA si ha avvolgimento e svolgimento. Infatti, man mano che si spinge in avanti lungo la doppia elica, la RNA polimerasi genera superavvolgimento positivi (DNA avvolto più strettamente) davanti a sé e lascia

Biologia molecolare

Pagina 111 di 173

Domenico Azarnia Tehran

Sezione Appunti

superavvolgimenti negativi (DNA parzialmente svolto) dietro di sé. La trascrizione ha perciò un effetto significativo sulla struttura locale del DNA. Come risultato, gli enzimi girasi (che introduce superavvolgimenti negativi) e topoisomerasi I (che rimuove superavvolgimenti negativi) sono necessari per rettificare la situazione rispettivamente davanti e dietro la polimerasi. La trascrizione vera e propria, comunque, dall'RNA polimerasi che può iniziare una nuova catena di RNA su uno stampo di DNA e perciò non ha bisogno di un primer. Questa non facile impresa richiede che il ribonucleotide d'inizio venga portato nel sito attivo e tenuto saldamente legato allo stampo, mentre l'NTP successivo venga presentato nel corretto assetto affinché avvenga la reazione di polimerizzazione. Una volta che il ribonucleotide di inizio è entrato nel solco centrale attivo e comincia la sintesi di RNA, segue un periodo chiamato inizio abortivo. In questa fase, l'enzima sintetizza delle molecole di RNA corte, lunghe circa 10 nucleotidi o meno. Anziché essere allungati ulteriormente, questi trascritti vengono rilasciati dalla polimerasi e l'enzima, senza dissociarsi dallo stampo, inizia di nuovo la sintesi. Non è ancora chiaro il motivo di questo inizio abortivo ma si pensa che affinché si possa generare un RNA più lungo di 10 nucleotidi, una regione di che si trova all'inizio ad occupare il canale di uscita dell'RNA deve essere spostata per permettere successivamente l'allungamento. A questo punto, all'apertura del solco centrale attivo, le due catene di DNA si separano e seguono diversi cammini passando dall'enzima, prima di uscire lungo i rispettivi canali e si riassociano in doppia elica dietro la polimerasi che sta allungando. I ribonucleotidi entrano nel sito attivo per i loro canali e vengono aggiunti alla catena di RNA sotto la giuda del filamento stampo di DNA. Solamente otto o nove nucleotidi della catena di RNA rimangono accoppiati allo stampo in ogni determinato momento: il resto della catena di RNA si stacca e viene portata fuori dall'enzima attraverso il canale di uscita dell'RNA. La formazione del legame fosfodiesterico avviene per attacco idrofilico del gruppo 3' OH dell’ultimo nucleotide della catena sul gruppo fosfato a del NTP in entrata, con rilascio di una molecola di pirofosfato. Inoltre, l'RNA polimerasi svolge due funzioni specifiche di correzione. La prima è chiamata editing pirofosfolitico, in cui l'enzima usa il suo sito attivo per catalizzare la rimozione di un ribonucleotide errato tramite la reincorporazione di PPi, e quindi incorporare un altro ribonucleotide corretto al suo posto, e l'editing idrolitico, in cui la polimerasi torna indietro di uno o più nucleotidi e taglia l'RNA prodotto, rimuovendo le sequenze che contengono errori, per poi ripartire (quindi può fare una pausa).

Una volta che l'RNA polimerasi a iniziato la trascrizione, l'enzima si muove lungo lo stampo, sintetizzando RNA, fino a incontrare la sequenza di un terminatore. A questo punto l'enzima smette di aggiungere nucleotidi alla catena di RNA in crescita, rilascia il prodotto completato e si dissocia dallo stampo di DNA. Nei batteri i terminatori sono di due tipi: Rho-indipendenti e Rho-dipendenti. Il primo tipo fa terminare la polimerasi senza il coinvolgimento di altri fattori. Il secondo tipo, invece, ha bisogno di una proteina addizionale, chiamata Rho, per indurre la terminazione. Comunque, i terminatori Rho-indipendenti, detti anche terminatori intrinseci, sono costituiti di due elementi: una sequenza invertita (palindromica) corta (circa 20 nt), cui segue un piccolo segmento di circa otto coppie di basi A-T. Quando la polimerasi trascrive questo elemento invertito, l'RNA risultante può formare una struttura a cappio (stem-loop), detta anche

Biologia molecolare

Pagina 112 di 173

Domenico Azarnia Tehran

Sezione Appunti

“forcina”, grazie all'appaiamento intramolecolare di basi. Si pensa che la forcina provochi la terminazione attraverso la rottura del complesso di allungamento. Questa rottura avviene perché viene aperto a forza il canale di uscita dell'RNA nell'RNA polimerasi, oppure, secondo un altro modello, perché si interrompono le interazioni tra l'RNA e lo stampo. La forcina funziona da terminatore in maniera efficiente solo quando è seguita da un segmento di coppie di basi A:U. I terminatori Rho-dipendenti, invece, hanno degli elementi di RNA molto meno caratterizzati e perciò hanno bisogno dell'aiuto fornito dal fattore Rho. Quest'ultimo, è una proteina a forma di anello, costituita da sei subunità identiche, si lega all'RNA a singola elica appena questo esce dalla polimerasi. La proteina, oltre ad un attività elicasica, ha anche una attività ATPasica: una volte legata al trascritto, usa l'energia derivata dall'idrolisi dell'ATP per staccare l'RNA dallo stampo e dalla polimerasi. Inoltre, Rho ha una certa specificità nella sequenza a cui si lega. Questi siti ottimali consistono in una serie di 40 nucleotidi che non formano una struttura secondaria (cioè rimangono a singola elica) e contengono anche un buon numero di residui in C.

Biologia molecolare

Pagina 113 di 173

Domenico Azarnia Tehran

Sezione Appunti

77. La trascrizione negli eucarioti Gli eucarioti, al contrario dei batteri in cui troviamo una sola polimerasi, durante la trascrizione utilizzano tre diverse polimerasi, che trascrivono ciascuna una classe diversa di geni: • La RNA polimerasi I trascrive l'rRNA. Essa è localizzata nel nucleolo ed è responsabile della sintesi del 50-70% dell’RNA totale; • La RNA polimerasi II trascrive l'mRNA. Essa è localizzata nel nucleoplasma e sintetizza il 20-40% dell’RNA totale; • La RNA polimerasi III trascrive il tRNA e altri piccoli RNA. Essa è localizzata nel nucleoplasma e sintetizza il 10% circa dell’RNA totale. Inoltre, mentre i batteri hanno bisogno di un solo fattore addizionale d'inizio (), nelle cellule eucariotiche sono richiesti numerosi fattori d'inizio addizionali. Questi fattori sono chiamati fattori generali di trascrizione (GTF). In vitro per una trascrizione efficiente basano questi fattori generali assieme alla Pol II, mentre, in vivo, essendo il DNA organizzato in nucleosomi, sono richiesti altri fattori, incluso il complesso così detto mediatore, proteine regolatrici che legano il DNA e spesso, anche degli enzimi che modificano la cromatina. In dettaglio, un promotore base eucariotico è lungo in genere circa 40 coppie di basi e si estende a monte o a valle del sito d'inizio della trascrizione. Il promotore, di norma, è costituito da quattro elementi: l'elemento riconosciuto da TFIIB (BRE), l'elemento TATA (TATA box), l'iniziatore (Inr) e l'elemento a valle (DPE, downstream promoter element). Di fatto, un promotore contiene solo due o tre di questi quattro elementi. Oltre (e principalmente a monte) al promotore prossimale, ci sono altre sequenze importanti per una trascrizione efficiente in vivo. Questi elementi costituiscono le sequenze regolatrici e sono raggruppate in diverse categorie. Queste sequenze includono: elementi del promotore prossimale, sequenze attivatrici a monte (UAS, upstream activating sequences), enhancer e una serie di elementi repressori chiamati silenziatori (silencer), elementi di confine ed isolatori. Tutte queste sequenze di DNA legano delle proteine regolatrici (attivatori e repressori) che aiutano o inibiscono la trascrizione del promotore base. I fattori generali di trascrizione hanno, tutti insieme, la stessa funzione di , quindi aiutano la polimerasi a legarsi al promotore e a separare il DNA, nonché a lasciare il promotore e a passare alla fase di allungamento. Il gruppo completo dei fattori di trascrizione e della polimerasi, legati assieme al promotore e pronti per l'inizio, viene chiamato complesso pre-inizio. La formazione di questo complesso inizia dall'elemento TATA box (circa 30 bp a monte del sito di inizio della trascrizione), riconosciuto dal fattore generale di trascrizione chiamato TFIID (la nomenclatura “TFII” caratterizza il fattore di trascrizione per la Pol II, distinguendo i diversi fattori con lettere A, B, etc.). Come molti dei fattori generali di trascrizione, anche TFIID è, di fatto, un complesso di molte subunità. Il componente di TFIID che lega la TATA box del DNA è chiamato TBP (TATA binding protein). Le altre subunità del complesso sono dette TAF, per TBD associated factors, e si legano agli elementi del promotore, come ad esempio, l'elemento iniziatore (Inr) e l'elemento a valle del promotore (DPE). In seguito al legame con il DNA, TBP distorce, con un angolo di circa 80°, la sequenza TATA in maniera molto marcata, riconoscendo una regione estesa del foglietto per il riconoscimento del solco minore della TATA box. Questo fornisce una piattaforma piatta per il reclutamento degli altri fattori e della polimerasi stessa sul promotore. In vitro, queste proteine si associano al promotore

Biologia molecolare

Pagina 114 di 173

Domenico Azarnia Tehran

Sezione Appunti

nel seguente ordine: TFIIA, TFIIB, TFIIF assieme alla polimerasi, e in seguito, TFIIE e TFIIH, che si legano a monte della Pol II. La formazione del complesso pre-inizio, contenente questi componenti, è seguita dalla dissociazione dei due filamenti del promotore. Contrariamente a ciò che succede nei batteri, la dissociazione dei filamenti del promotore negli eucarioti, richiede l'idrolisi dell'ATP ed è mediata da TFIIH, che agisce nel dominio C-terminale della Pol II, quello più grande, detto CTD, costituito nell'uomo da una serie di ripetizioni della sequenza Tyr-Ser-Pro-Thr-Ser-Pro-Ser. È infatti l'attività elicasica di questo fattore che stimola l'apertura del DNA del promotore. Successivamente, proprio come abbiamo visto nei batteri, segue un periodo di inizio abortivo, prima che la polimerasi lasci il promotore ed entri nella fase di allungamento. Infine, negli eucarioti, l'evasione del promotore, prevede un passaggio che non avviene nei batteri, e cioè la fosforilazione della polimerasi nella sua coda. L'aggiunta di questi fosfati aiuta la polimerasi a liberarsi dei fattori generali di trascrizione utilizzati per l'inizio e che l'enzima lascia indietro appena evade il promotore. Inoltre, la regolazione dello stato di fosforilazione del CTD controlla anche i passaggi successivi, quelli che riguardano la maturazione dell'RNA. Per avere dei livelli di trascrizione elevati e regolati, in vivo, come abbaiamo già detto, occorrono il complesso mediatore, proteine trascrizionali regolatrici e, in molti casi, enzimi che modificano i nucleosomi. Le proteine trascrizionali regolatrici, chiamate attivatori, aiutano il reclutamento della polimerasi al promotore e ne stabilizzano il legame. Spesso, l'interazione avviene con il complesso mediatore. Il mediatore è associato con la coda CTD della subunità maggiore della polimerasi attraverso una superficie di legame, mentre presenta altre superfici per l'interazione con gli attivatori legati al DNA. In dettaglio, diversi attivatori interagiscono con diverse subunità del mediatore per portare la polimerasi su geni differenti. Inoltre, il mediatore favorisce l'inizio tramite la regolazione della CTD chinasi di TFIIH. Comunque, sia il mediatore di lievito, sia quello umano, contengono più di 20 subunità, delle quali almeno 7 hanno una omologia di sequenza significativa tra i due organismi. Una volta che la polimerasi ha iniziato la trascrizione, si passa alla fase di allungamento. Questa transizione prevede che la Pol II si liberi della maggior parte dei suoi fattori di inizio, quali, ad esempio, i fattori generali di trascrizione e il mediatore. Al loro posto viene reclutato un altro gruppo di fattori. Alcuni di questi (tipo TFIIS e hSPT5) sono fattori di allungamento. Così come per i fattori di inizio, gli enzimi coinvolti in tutti questi processi sono reclutati dalla coda C-terminale della subunità maggiore della Pol II, il CTD. In questo caso, però, questi nuovi fattori preferiscono la forma fosforilata del CTD. Quindi, la fosforilazione del CTD provoca uno scambio tra i fattori di inizio e quelli necessari per l'allungamento e la maturazione dell'RNA. Si crede che vi siano diverse proteine in grado di stimolare l'allungamento della Pol II. Una di queste, la chinasi P-TEFb, viene reclutata sulla polimerasi dagli attivatori trascrizionali, e fosforila la serina in posizione 2 sul CTD. Questo porta all'attivazione di altre proteine, hSPT5 e TFIIS, due fattori di allungamento. Quest'ultimo stimola il decorso generale dell'allungamento riducendo il tempo di fermata della polimerasi, in quanto quest'ultima è spesso rallentata, e, inoltre, contribuisce alla correzione da pare della polimerasi, aiutandola a rimuovere le basi errate. Una volta trascritto, l'RNA eucariotico deve subire una maturazione prima di essere esportato dal nucleo e

Biologia molecolare

Pagina 115 di 173

Domenico Azarnia Tehran

Sezione Appunti

poi tradotto. Gli eventi di maturazione sono i seguenti: rivestimento (capping) dell'estremità 5' dell'RNA, splicing e poliadenilazione dell'estremità 3' dell'RNA. Quello più complesso è lo splicing, il processo mediante il quale gli introni non codificanti vengono rimossi dall'RNA per generare l'mRNA maturo. Il capping, invece, prevede l'aggiunta di una base guanina modificata all'estremità 5' dell'RNA. Di fatto è una guanina metilata e viene aggiunta al trascritto di RNA attraverso un legame 5'-5' insolito che coinvolge tre fosfati. Abbiano tre passaggi: nel primo passaggio, un gruppo fosfato viene rimosso dal 5' del trascritto. Poi viene aggiunto il GTP. Nel passaggio finale, il nucleotide viene modificato tramite l'aggiunta di un gruppo metile. L'RNA subisce il capping quando è lungo 20-40 nucleotidi, quando, cioè, il ciclo di trascrizione è al punto di transizione tra la fase di inizio e quella di allungamento. Dopo il capping, la defosforilazione della serina 5 all'interno del CTD della Pol II provoca la dissociazione del macchinario del capping, e un'ulteriore fosforilazione (della serina 2) porta al reclutamento del macchinario necessario per lo splicing dell'RNA. Successivamente, una volta che la polimerasi ha raggiunto la fine di un gene, incontra delle sequenze specifiche che, dopo essere trascritte nell'RNA, innescano il trasferimento degli enzimi di poliadenilazione sull'RNA, provocando tre eventi: il taglio del messaggero, l'aggiunta di molti residui adeninici alla sua estremità 3' (poli-A) e, conseguentemente, il termine della trascrizione da parte della polimerasi. Il processo avviene in questo modo, due complessi proteici sono portati dal CTD appena la polimerasi si avvicina alla fine del gene: CPSF (cleavage and polyadenylation specificity factor) e CstF (cleavage stimulation factor). Una volta che quest'ultimi sono legati all'RNA, vengono reclutate altre proteine che, di fatto, provocano il taglio dell'RNA e poi la poliadenilazione. Quest'ultima è mediata da un enzima chiamato poli-A polimerasi, e aggiunge circa 200 adenine all'estremità 3' dell'RNA, prodotto dopo il taglio. Questo enzima utilizza l'ATP come precursore e aggiunge i nucleotidi usando la stessa chimica dell'RNA polimerasi, però lo fa senza uno stampo. L'RNA polimerasi I, come abbiamo detto, invece, trascrive soltanto i geni per l'RNA ribosomiale a partire da un singolo tipo di promotore. Quest'ultimo consiste di due regioni separate. Il nucleo del promotore circonda il punto di inizio, da -45 a +20, ed è sufficiente per l'inizio della trascrizione. L'efficienza del promotore è però aumentata di molto dall'elemento a monte del promotore (UPE) che si estende da -180 a 107. Queste due regioni sono ricche di G:C e identiche per l'85%. Il fattore UBF1 si lega su UPE e recluta SL1. Quest'ultima consiste di 4 proteine, tra cui TBP, comune per l'inizio della trascrizione anche per le Pol II e III. Per quanto riguarda la RNA polimerasi III, invece, i suoi promotori si dividono in due classi generali che sono riconosciuti in modo diverso da gruppi diversi di fattori. I promotori per i geni dell'RNA 5S e dei tRNA sono interni e si trovano a valle dal punto di inizio. Mentre, i promotori per i geni degli snRNA (small nuclear RNA) si trovano a monte del punto di inizio, nella posizione più convenzionale degli altri promotori. Per l'RNA polimerasi III esistono due tipi di promotori interni, ciascuno dei quali contiene una struttura bipartita, in cui due brevi elementi di sequenza sono separati da una sequenza variabile. Il tipo I consiste di una sequenza boxA separata una una sequenza boxC e il tipo 2 consiste di una sequenza boxA separata da una sequenza boxB. I promotori di tipo 3, invece, hanno tre elementi di sequenza posti tutti a monte del punto d'inizio. Comunque, i promotori interni di tipo II richiedono il legame del fattore di assemblaggio

Biologia molecolare

Pagina 116 di 173

Domenico Azarnia Tehran

Sezione Appunti

TFIIIC, che recluta il fattore TFIIIB. Quindi TFIIIC si stacca, mentre TFIIIB rimane legato vicino alla sequenza d’inizio ed è necessario e sufficiente per permettere il legame della RNA polimerasi III. TFIIIB contiene TBP. Mentre, i promotori interni di tipo 1 richiedono il legame dei fattori di assemblaggio TFIIIA e TFIIIC, che reclutano il fattore TFIIIB.

Biologia molecolare

Pagina 117 di 173

Domenico Azarnia Tehran

Sezione Appunti

78. Lo splicing DELL'RNA La sequenza codificante di un gene è una serie di codoni a tre nucleotidi che specificano a sequenza lineare degli amminoacidi del suo prodotto polipeptidico. Per le maggior parte dei batteri e dei fagi, la sequenza codificante è continua: il codone per un amminoacido è immediatamente adiacente al codone per l'amminoacido successivo. Ma non è sempre così per i geni degli eucarioti in cui la sequenza codificante è interrotta periodicamente da sequenze non codificanti. Le sequenze codificanti sono chiamate esoni, mentre quelle interposte sono dette introni. Le dimensioni e il numero di queste sequenza varia enormemente. Comunque, spesso gli introni (possono arrivare fino a 800 kb) sono più lunghi degli esoni (150 nt) che separano. Sia per i procarioti che per gli eucarioti, i geni sono trascritti in una singola copia di RNA, quindi il trascritto primario contiene sia esoni che introni. Il macchinario della sintesi proteica, però, è in grado di tradurre solo gli RNA messaggeri che contengono segmenti continui di codoni, quindi non ha modo di identificare ed evitare un blocco di sequenze non codificanti; per questo, gli introni vengono rimossi dai premRNA attraverso un processo chiamato splicing dell'RNA. Questo processo converte il pre-mRNA in un messaggero maturo e deve essere molto preciso per evitare la perdita o l'aggiunta anche di un singolo nucleotide nei punti in cui gli esoni vengono uniti. Inoltre, alcuni pre-mRNA possono essere tagliati (spliced) in modi diversi, generando così degli mRNA alternativi. Ad esempio, possono essere escisse diverse combinazioni di introni. Questo fenomeno è detto splicing alternativo e, grazie a questa strategia, un gene può generare più di un prodotto polipeptidico.

Biologia molecolare

Pagina 118 di 173

Domenico Azarnia Tehran

Sezione Appunti

79. La chimica dello splicing dell'RNA I confini tra gli esoni e gli introni sono marcati da sequenze nucleotidiche specifiche all'interno del premRNA. Queste sequenze specificano dove avverrà lo splicing e sono dette sito di splicing 5', in quanto sono posizionate al limite all'estremità 5' dell'introne. Il confine introne-esone all'estremità 3' dell'introne è marcato, invece, dal sito di splicing 3'. Comunque, per lo splicing è richiesta una terza sequenza chiamata punto di ramificazione, che si trova all'interno dell'introne, di solito vicino alla sua estremità 3' ed è seguita da un segmento di polipirimidine. Chimicamente, il meccanismo di splicing avviene tramite due reazioni successive di transesterificazione, in cui alcuni legami fosfodiesterici all'interno del pre-mRNA vengono rotti ed altri nuovi vengono formati. La prima reazione è iniziata dal 2' OH della A conservata al punto di ramificazione. Questo gruppo agisce attraverso un attacco nucleofilo del gruppo fosfato della G conservata nel sito di splicing 5'. Conseguentemente, il legame fosfodiesterico tra lo zucchero e il fosfato alla giunzione tra l'introne e l'esone viene tagliato e l'estremità 5' libera dell'introne viene unita alla A del punto di ramificazione. Da notare che l'esone 5' viene rilasciato nella prima reazione di transesterificazione. Nella seconda reazione, l'esone 5' (o più precisamente l'OH al 3' appena liberato dall'esone 5') cambia ruolo e diventa un nucleofilo che attacca il gruppo fosfato al sito di splicing 3'. Questa seconda reazione ha due conseguenze: unisce gli esoni 5' e 3' e libera l'introne che funge da gruppo uscente ed ha forma di un cappio. In generale, si è visto che vi è la rottura e la formazione di due legami fosfodiesterici, quindi non vi è bisogno di energia per la chimica di questo processo. Tuttavia è necessaria una grande quantità di ATP per il corretto assemblaggio e funzionamento del macchinario di splicing. Infine, bisogna dire che la reazione procede sempre in avanti per due motivi: 1) si aumenta l'entropia dividendo la singola molecola di premRNA in due molecole, ovvero l'mRNA e l'esone a cappio, e 2) l'introne liberato viene subito degradato e perciò non è più disponibile per la reazione inversa. Comunque, nella descrizione della chimica dello splicing abbiamo visto come il sito di splicing 5' venga unito al sito di splicing al 3' dell'esone immediatamente successivo. Questo però non sempre accade. In quanto, nello splicing alternativo, alcuni esoni possono essere saltati e un dato esone può essere unito ad un altro esone molto più a valle. In altri casi, due esoni provenienti da due molecole di RNA distinte possono essere uniti tramite un processo chiamato splicing in trans (molto comune nei nematodi).

Biologia molecolare

Pagina 119 di 173

Domenico Azarnia Tehran

Sezione Appunti

80. Il macchinario dello spliceosoma e le vie dello splicing Le reazioni di transesterificazione appena descritte sono mediate da un'enorme “macchina” molecolare chiamata spliceosoma. Questo complesso è costituito da circa 150 proteine e 5 RNA e ha dimensioni simili a quelle di un ribosoma. Gli RNA riconoscono le sequenze ai confini introne-esone e molto probabilmente partecipano essi stessi alla catalisi della reazione di splicing. I cinque RNA (U1, U2, U4, U5 e U6) sono nel loro insieme chiamati piccoli RNA nucleari (snRNA, small nuclear RNA). Ciascuno di questi RNA è lungo dai 100 ai 300 nucleotidi e si complessa con diverse proteine. Questi complessi RNA-proteine sono detti piccoli ribonucleoproteine nucleari (snRNP, small nuclear ribonuclear protein). Le snRNP rivestono tre ruoli nello splicing: riconoscono il sito di splicing 5' e il punto di ramificazione; portano questi siti vicini quando occorre e catalizzano il taglio e la giunzione dell'RNA. All'inizio del processo di splicing, il sito di splicing 5' viene riconosciuto dalla snRNP U1 (attraverso l'appaiamento delle basi del suo snRNA e del pre-mRNA). Una delle subunità di U2AF si lega al segmento polipirimidinico, mentre l'altra si lega al sito di splicing 3'. La prima subunità interagisce con BBP e aiuta questa proteina a legarsi al punto di ramificazione. A questo punto, la snRNP U2 si lega al punto di ramificazione, con l'aiuto di U2AF, e spiazza BBP. Questo arrangiamento è chiamato complessa A. L'appaiamento di basi tra l'snRNA U2 e il punto di ramificazione è tale che il residuo di A dal punto di ramificazione venga spinto fuori dal segmento risultante a doppia elica di RNA e formi una protuberanza a singolo nucleotide. Questa A diventa così non accoppiata e disponibile per la reazione con il sito di splicing 5'. Successivamente, le snRNP U4 e U6, assieme alla snRNP U5, si uniscono al complesso. Queste tre snRNP assieme sono dette tripla snRNP U4/U6*U5, in cui le snRNP U4 e U6 sono tenute assieme dall'accoppiamento complementare delle basi dei loro corrispettivi snRNA, mentre la snRNP U5 è legata in maniera più lassa attraverso interazioni proteina-proteina. Con l'ingresso della tripla snRNP il complesso A diventa complesso B. Nel passaggio successivo, U1 lascia il complesso e U6 lo rimpiazza al sito di splicing 5'. Il riarrangiamento successivo innesca la catalisi ed avviene nel modo seguente: U4 viene rilasciato dal complesso permettendo a U6 di interagire con U2. Questo riarrangiamento chiamato complesso C produce il sito attivo, permettendo all'RNA substrato di posizionarsi correttamente. Infatti, la formazione del sito attivo mette in prossimità il sito di splicing 5' del pre-mRNA e il punto di ramificazione, facilitando la prima reazione di transesterificazione. La seconda reazione, tra i siti splicing 5' e 3', è supportata dalla snRNP U5, che aiuta ad avvicinare i due esoni. Finora abbiamo considerato solo lo splicing del pre-mRNA nucleare, mediato dallo spliceosoma, comune in tutti gli eucarioti. Me vi sono anche gli introni self-splicing del gruppo I e gruppo II, introni in grado di autorimuoversi dagli RNA, in una provetta, in assenza di proteine o di altre molecole di RNA. Nel caso degli introni del gruppo II, la chimica dello splicing, quindi le due reazioni di transesterificazione, e gli intermedi di RNA prodotti sono gli stessi di quelli per i pre-mRNA nucleari. Gli introni del gruppo I, invece, subiscono uno splicing secondo un percorso diverso. Anziché un residuo di A nel punto di ramificazione, utilizzano un nucleotide o nucleoside G libero. Questa G è legata dall'RNA e il suo gruppo 3' OH viene presentato al sito di splicing 5'. Lo stesso tipo di transesterificazione che porta alla formazione del cappio negli esempi precedenti, qui unisce la G all'estremità 5' dell'introne. La seconda reazione ora procede come

Biologia molecolare

Pagina 120 di 173

Domenico Azarnia Tehran

Sezione Appunti

negli esempi precedenti: l'estremità 3' libera dell'esone attacca il sito di splicing 3'. Questo unisce i due esoni e rilascia l'introne, questa volta in forma libera invece che a cappio. Un gene umano medio contiene otto o nove esoni e può essere tagliato in tre forme alternative, vi sono però altri geni di altri organismi, come ad esempio Drosophila, in cui abbiamo 38000 modi alternativi (ma anche nell'uomo vi sono geni contenenti 363 esoni). Inoltre l'esone medio è lungo solo 150 nucleotidi, mentre la lunghezza media degli introni è di circa 3000 nucleotidi, di conseguenza, gli esoni devono essere identificati all'interno di un oceano di sequenze introniche. Per questi e altri motivi, il riconoscimento del sito di splicing prevede due tipi di errori: 1) in primo luogo, il sito di splicing può essere saltato, ad esempio un dato sito di splicing 5' può appaiarsi con quelli al 3' al di là di quello corretto, o 2) in secondo luogo, altri siti con una sequenza simile a quella di splicing corretta possono essere riconosciuti erroneamente. Per questo motivo vi sono due modi con cui l'accuratezza della selezione di siti di splicing può essere mantenuta. Per primo, l'RNA polimerasi II, mentre trascrive, trasporta diverse proteine che sono coinvolte nello splicing. Quando si incontra un sito di splicing 5', lungo la molecola di RNA appena sintetizzata, queste proteine vengono trasferite dalla coda C-terminale della polimerasi sull'RNA stesso. Una volta posizionati, i componenti sul sito 5' aspettano di interagire con i componenti che si legano al sito di splicing 3' successivo, pronto per essere trascritto. In questo modo, il sito corretto di splicing 3' può essere riconosciuto prima che gli altri siti competitori a valle vengano trascritti. Il secondo meccanismo di protezione contro l'utilizzo di siti non corretti è il fatto che vengono riconosciuti preferenzialmente i siti di splicing vicini agli esoni (quindi quelli che sono probabilmente i più legittimi). Le proteine chiamate SR si legano alle sequenze collocate all'interno degli esoni dette enhancer di splicing esonico (exonic splicing enhancer, ESE). Le proteine SR, legate a questi siti, interagiscono con alcuni componenti del macchinario di splicing, reclutandoli nei siti di splicing vicini. In questo modo, il macchinario di splicing si lega in maniera più efficiente in questi siti di splicing rispetto a quando non faccia in quelli non corretti, lontano dagli esoni.

Biologia molecolare

Pagina 121 di 173

Domenico Azarnia Tehran

Sezione Appunti

81. Lo splicing alternativo Molti geni negli eucarioti superiori codificano per RNA che possono essere tagliati in modi diversi (persino migliaia come in Drosophila) per generare due o più RNA differenti e, di conseguenza, diversi prodotti proteici in un processo detto appunto splicing alternativo. Difatti, oltre alla scelta di esoni alternativi, alcuni esoni possono essere estesi ed altri addirittura saltati (di proposito). Inoltre, alcuni introni possono essere mantenuti, anziché eliminati, e dar luogo perciò a prodotti proteici ancora differenti. Di conseguenza, si può dire che lo splicing alternativo può essere sia costitutivo, sia regolato. Nel primo caso, più di un prodotto viene sempre generato dal gene trascritto. Nel caso dello splicing regolato, forme diverse vengono generate in momenti diversi, in diverse condizioni o in diversi tipi cellulari o tessuti. Comunque, le proteine che regolano lo splicing si legano a dei siti specifici chiamati enhancer o silenziatori di splicing esonici o intronici (exonic – intronic – splicing enhancers o silencers, ESE o ISE – ESS o ISS). I primi incrementano mentre i secondi reprimono lo splicing sui siti di splicing vicini. Abbiamo già incontrato gli enhancer e le proteine SR che si legano ad essi, portando il macchinario di splicing su diversi siti. Perciò, la presenza o l'attività di una data proteina SR può determinare quale sito particolare di splicing venga utilizzato in un determinato tipo cellulare o in un particolare momento dello sviluppo. La maggior parte dei silenziatori, invece, vengono riconosciuti dai membri della famiglia delle ribonucleoproteine nucleari eterogenee (hnRNP, heterogeneous nuclear ribonucleoprotein). Quest'ultime legano l'RNA ma non hanno nessun dominio che riesca a far reclutare il macchinario di splicing e quindi impediscono l'utilizzo di siti specifici di splicing. Un altro repressore dell' splicing di mammifero è la proteina hnRNP, che blocca il legame del macchinario di splicing attraverso il suo legame con la regione polipirimidinica. In generale, si considera lo splicing alternativo come un modo per produrre proteine diverse da un singolo gene. Queste proteine diverse sono chiamate isoforme. Possono avere funzioni simili, funzioni distinte e persino funzioni antagoniste. Ma anche alcuni geni che codificano per una sola proteina funzionante subiscono uno splicing alternativo. In questi casi, questo meccanismo viene usato semplicemente per spegnere o accendere l'espressione del gene. Infatti, lo splicing alternativo, in quest'ultimo caso determina se l'esone con il codone di stop venga incorporato nell'mRNA e, di conseguenza, se il gene venga espresso o no. La seconda maniera in cui lo splicing alternativo viene usato per l'accensione o lo spegnimento di un gene è attraverso la regolazione dell'utilizzo di un introne, il quale, se mantenuto nell'mRNA, impedisce all'mRNA stesso di essere esportato dal nucleo e perciò tradotto.

Biologia molecolare

Pagina 122 di 173

Domenico Azarnia Tehran

Sezione Appunti

82. Il rimescolamento degli esoni Come abbiamo già visto, tutti gli eucarioti hanno gli introni, ma nei batteri, questi elementi sono estremamente rari, quasi inesistenti. Vi sono due possibili spiegazioni per questa situazione. La prima, nel modello chiamato il modello degli introni precoci, è che gli introni esistevano in tutti gli organismi, ma nei batteri sono andati perduti per ottimizzare i loro genomi in risposta alla pressione selettiva di aumentare la velocità di replicazione cromosomica e della divisione cellulare. La seconda spiegazione è che gli introni non siano mai esistiti nei batteri, ma siano comparsi più avanti nell'evoluzione. Secondo questo modello, chiamato il modello degli introni tardivi, gli introni furono inseriti nei geni che non ne avevano, forse attraverso un meccanismo simile a quello dei trasposoni. Un chiaro vantaggio nella presenza di introni, è che la loro presenta e la necessità di rimuoverli, consente lo splicing alternativo e, perciò, la possibilità di generare prodotti proteici multipli da un singolo gene. Ma su scala più grande, un altro vantaggio sta nel fatto di avere la sequenza codificante dei geni divisa su più esoni permette la creazione di nuovi geni attraverso il rimescolamento degli esoni.

Biologia molecolare

Pagina 123 di 173

Domenico Azarnia Tehran

Sezione Appunti

83. L'editing dell'RNA L'editing dell'RNA, come lo splicing, può cambiare la sequenza di un RNA dopo che è stato trascritto. Perciò, la proteina prodotta dalla traduzione è diversa da quella predetta dalla sequenza del gene. Vi sono due meccanismi che mediano l'editing: la deamminazione sito-specifica e l'inserzione o delezione di un'uridina diretta dagli RNA guida. In una forma di deamminazione sito-specifica, un determinato residuo di cisteina all'interno di un mRNA viene convertito in un'uridina attraverso una deamminazione. Di fatto, per una data specie di mRNA, questo processo avviene solo in certi tessuti o in certi tipi cellulari in maniera regolata. In un altra forma di deamminazione è la deamminazione dell'adenosina. Questa reazione, catalizzata dall'enzima ADAR (adenosina deamminasi che agisce sull'RNA) produce inosina che si appaia con la citosina alterando la sequenza della proteina codificata dall'mRNA. Quindi, un evento singolo di editing provoca il cambio di un singolo amminoacido della proteina che può alterare diverse funzioni, come la permeabilità a particolari ioni. Un'altra forma di editing è l'aggiunta di U in regioni specifiche dell'RNA. Queste regioni poli-U sono aggiunte dagli RNA guida (gRNA) che presentano regioni àncora per legarsi agli mRNA e regioni specifiche che riconoscono le sequenze di mRNA dove aggiungere le U.

Biologia molecolare

Pagina 124 di 173

Domenico Azarnia Tehran

Sezione Appunti

84. Sintesi proteica: la traduzione Il processo noto con il termine traduzione indica il meccanismo con il quale l'informazione genetica contenuta nella sequenza nucleotidica dell'RNA messaggero (mRNA) venga usata per generare le sequenze amminoacidiche delle proteine. Questo processo è uno dei più conservati tra tutti gli organismi e uno di quelli che richiede il maggior dispendio energetico da parte della cellula. Nelle cellule batteriche in rapida crescita circa l'80% del bilancio energetico della cellula ed il 50% del suo peso secco sono dedicati alla sintesi proteica. Infatti l sintesi di una singola proteina richiede l'azione coordinata di oltre 100 proteine ed RNA. Un pioniere in questo ambito fu Francis H. Crick che nel 1955 postulò che gli amminoacidi si dovessero associare ad una molecola adattatrice particolare, che fosse in grado di interagire e riconoscere le unità codificanti di tre nucleotidi dell'mRNA (triplette), prima di essere incorporati nei polipeptidi. Crick immaginò che l'adattatore fosse una molecola di RNA, dato che doveva riconoscere il codice mediante le regole di appaiamento di Watson e Crick. Solo più tardi si scoprì, una classe di molecole di RNA, che rappresentavano il 15% di tutto l'RNA cellulare, l'RNA transfer (tRNA) e definitivamente che il macchinario responsabile della traduzione del linguaggio dell'RNA messaggero nel linguaggio delle proteine è composto da quattro componenti principali: mRNA, tRNA, amminoacil-tRNA sintetasi e ribosoma. Insieme, queste componenti svolgono il compito di tradurre un codice scritto in un alfabeto di quattro basi in un secondo codice scritto nel linguaggio dei 20 amminoacidi. L'mRNA fornisce l'informazione che deve essere interpretata dal macchinario traduzionale e costituisce lo stampo per la traduzione. La regione dell'mRNA che codifica per la proteina è formata da una serie ordinata di elementi composti da tre nucleotidi l'uno chiamati codoni che specificano l'ordine degli amminoacidi. Il tRNA, invece, costituisce l'interfaccia fisica tra gli amminoacidi che vengono aggiunti alla catena polipeptidica nascente e i codoni dell'mRNA. Enzimi denominati amminoacil-tRNA sintetasi accoppiano gli amminoacidi con specifici tRNA che riconoscono il codone appropriato. E, infine, il ribosoma, un notevole apparato composto sia da RNA che da proteine, che coordina il corretto riconoscimento dell'mRNA da parte di ciascun tRNA e catalizza la formazione le legame peptidico tra la catena nascente e gli amminoacidi associati agli specifici tRNA.

Biologia molecolare

Pagina 125 di 173

Domenico Azarnia Tehran

Sezione Appunti

85. Funzioni dell'RNA messaggero Come abbiamo detto, l'informazione per la sintesi delle proteine si trova sotto forma di codoni formati da tre nucleotidi e ciascun codone codifica per un singolo amminoacido specifico. La regione (o le regioni) di ciascun mRNA che codifica per la proteina è costituita da una fila di codoni contigui, che non si sovrappongono, detta open-reading frame (fase di lettura aperta), comunemente nota come ORF. Ciascun ORF specifica una singola proteina e ha inizio e termine in prossimità di siti interni all'mRNA. La traduzione inizia all'estremità 5' dell'open-reading frame e procede, un codone alla volta, verso l'estremità 3'. Il primo e l'ultimo codone di un ORF sono noti come codoni di inizio (start) e di termine (stop) rispettivamente. Nei batteri, il codone di inizio, normalmente, è 5'-AUG-3', ma vengono anche usati il codone GUG e, talvolta, UUG. Le cellule eucariotiche, invece, usano sempre il codone 5'-AUG-3' come codone d'inizio. Esso ha due importanti funzioni: la prima è quella di codificare per il primo amminoacido incorporato nella catena polipeptidica nascente, la seconda, invece, è quella di definire il reading frame dei codoni successivi. I tre codoni di termine ( 5'-UAG-3', UGA e UAA) specificano la fine dell'open-reading frame e segnano la fine della sintesi del polipeptide. In generale, comunque, il numero di ORF per ciascun mRNA è diverso tra eucarioti e procarioti. Gli mRNA eucariotici contengono quasi sempre un solo ORF q pertanto sono detti mRNA monocistronici, mentre gli mRNA degli eucarioti contengono spesso due o più ORF, e pertanto possono codificare per più catene polipeptidiche e sono detti mRNA policistronici. Comunque, affinché avvenga la traduzione, è necessario che il ribosoma venga reclutato sull'mRNA. Per facilitare il legame da parte di un ribosoma, molte ORF procariotici contengono una breve sequenza, a monte (dalla parte 5') del codone d'inizio, detta sito di legame per il ribosoma (RBS, ribosome binding site). Questo elemento è anche detto sequenza di Shine-Dalgarno, dal nome degli scienziati che lo scoprirono. Il sito di legame per il ribosoma, normalmente localizzato da tre a nove basi al 5' del codone di inizio, è complementare ad una sequenza localizzata vicino alla regione 3' di uno degli RNA componenti del ribosoma, l'RNA ribosomiale (rRNA) 16S. Il sito di legame del ribosoma si associa base per base con questo RNA, determinando l'allineamento del ribosoma con l'inizio dell'open-reading frame. La parte centrale di questa regione dell'RNA 16 S contene la sequenza 5'-CCUCCU-3'. Gli mRNA eucariotici, invece, reclutano i ribosomi mediante una modificazione chimica specifica, detta 5' cap, localizzata all'estremità 5' del messaggero. Il 5' cap, come abbiamo visto nel capitolo della trascrizione, è costituito da una guanina metilata e una volta legato all'mRNA, il ribosoma si sposta in direzione 5'3' con un processo detto scanning (ispezione della sequenza) fino ad incontrare il codone d'inizio 5'-AUG-3'. Altre due caratteristiche dell'mRNA eucariotico dei mammiferi, che favoriscono la traduzione e ne aumentano l'efficienza, sono: 1) la presenza di una base purinica a monte del codone di inizio e di una guanina immediatamente a valle (5'-G/ANNAUGG-3') e 2) la presenza di una coda di poli-A all'estremità 3' dell'mRNA, che promuove un riciclaggio efficiente dei ribosomi.

Biologia molecolare

Pagina 126 di 173

Domenico Azarnia Tehran

Sezione Appunti

86. RNA transfer La “traduzione” dell'informazione contenuta nella sequenza di nucleotidi (sotto forma di codoni) in amminoacidi è l'essenza della sintesi proteica. Questa operazione viene svolta da molecole di tRNA che agiscono da adattatori tra i codoni e gli amminoacidi che essi stessi individuano. Esistono molte varianti di molecole di tRNA, ma a ciascuna è legato un amminoacido specifico e ciascuna riconosce un particolare codone, o codoni, dell'mRNA. I tRNA sono lunghi da 75 a 95 ribonucleotidi e tutti hanno caratteristiche in comune. In primo luogo, tutti i tRNA hanno un'estremità 3' che termina con la sequenza 5'-CCA-3', in cui viene legato lo specifico amminoacido dall'enzima amminoacil-tRNA sintetasi. Un altro aspetto dei tRNA è la presenza di numerosi basi insolite nella struttura primaria che derivano da modificazioni enzimatiche post-trascrizionali, come per esempio la pseudouridina (U), la diidrouridina (D), l'ipoxantina, la timina e la metilguanina. Tali basi non sono essenziali per la funzione del tRNA, ma le cellule che non le possiedono hanno una velocità di crescita ridotta. Ciò suggerisce che le basi modificate migliorano la funzione del tRNA. Comunque, tutte le molecole di tRNA mostrano una tipica alternanza di regioni a singola e a doppia elica (struttura secondaria) che può essere assimilata alla struttura di un trifoglio. Le caratteristiche principali di questa struttura sono: uno stelo accettore, tre strutture stelo-ansa, denominate ansa U, ansa D ed ansa dell'anticodone, e una quarta ansa variabile. Lo stelo accettore è così denominato perché è il sito di aggancio dell'amminoacido ed è formato dall'accoppiamento della regione 5' terminale e di quella 3' terminale (5'CCA-3') della molecola di tRNA. L'ansa U è definita tale per la presenza della base U nell'ansa. La base modificata fa spesso parte della sequenza 5'-TUCG-3'. L'ansa D deve il suo nome alla tipica presenza di diidrouridine nella struttura. L'ansa dell'anticodone che contiene l'anticodone, un elemento “decodificante” di tre nucleotidi, in grado di riconoscere il codone mediante l'appaiamento di basi con l'mRNA e, infine, l'ansa variabile che ha una lunghezza tra le 3 alle 21 basi e quindi si parla di tRNA di classe 1, se quest'ultima ansa è lunga solo 3-5 basi, mentre di tRNA di classe 2, se è composta da 13-21 basi. La cristallografia ai raggi X mostra una struttura terziaria dei tRNA a forma di “L”, in cui, l'estremità dello stelo accettore si trova a capo della molecola, mentre l'ansa dell'anticodone al capo opposto. Questa struttura tridimensionale è stabilizzata da legami idrogeno tra le basi, che sono generalmente non convenzionali (non del tipo Watson-Crik), e da interazioni tra le basi e lo scheletro zucchero-fosfato.

Biologia molecolare

Pagina 127 di 173

Domenico Azarnia Tehran

Sezione Appunti

87. Il legame degli amminoacidi al tRNA Le molecole di tRNA cui è attaccato un amminoacido sono dette cariche, mentre i tRNA privi di amminoacido sono detti scarichi. Il caricamento richiede la formazione di un legame acilico tra il gruppo carbossile dell'amminoacido ed il gruppo 2' o 3' dell'adenosina che protrude dallo stelo accettore. Questo legame acilico è considerato ad alta energia, perché la sua idrolisi, quindi la rottura del legame, causa una variazione elevata di energia libera che viene, successivamente, utilizzata nella formazione del legame peptidico, che lega tra loro gli amminoacidi. Comunque, tutte le amminoacil-tRNA sintetasi attaccano un amminoacido ad un tRNA in due passaggi. Il primo è l'adenililazione, in cui l'amminoacido reagisce con l'ATP e diventa adenilato, con il contemporaneo rilascio di pirofosfato. Il secondo passaggio è il caricamento del tRNA, in cui l'amminoacido adenilato, che rimane strettamente legato alla sintetasi, reagisce con il tRNA. Il risultato netto di questa reazione è il trasferimento dell'amminoacido all'estremità 3' del tRNA attraverso il gruppo idrossilico in posizione 2' (se agisce una tRNA sintetasi della classe I) o 3' (se agisce una tRNA sintetasi della classe II) ed il simultaneo rilascio di AMP. In questo modo, ciascuno dei 20 amminoacidi viene legato all'appropriato tRNA da una singola tRNA sintetasi specifica. Dato che la maggior parte degli amminoacidi è specificata da più di un codone, non è infrequente che una sintetasi riconosca e carichi più di un tRNA (noti come tRNA isoaccettori). I determinanti della specificità sono raggruppati sul tRNA in due siti distanti tra loro: lo stelo accettore e l'ansa dell'anticodone. Entrambe queste parti vengono spesso riconosciute dalle amminoacil-tRNA sintetasi, per contribuire a discriminare i diversi amminoacidi, anche se lo stelo accettore è sicuramente quello con la maggiore importante anche perché, come sappiamo, un singolo amminoacido può essere prodotto dal riconoscimento di diversi codoni. Quindi, il compito che le amminoacil-tRNA sintetasi devono affrontare nel selezionare l'amminoacido appropriato è forse ancora più impegnativo del riconoscere il tRNA corretto. Il motivo è dato dalle piccole dimensioni degli amminoacidi e, talvolta, dalla loro somiglianza. Nonostante ciò la frequenza di errori nel caricamento è molto bassa; generalmente soltanto 1 su 1000 tRNA viene caricato con un amminoacido errato. In alcuni casi è facile capire come tale accuratezza venga ottenuta, come nel caso della cisteina e del triptofano che hanno dimensioni, forme e gruppi chimici sostanzialmente diversi. In altri casi, invece come per l'isoleucina e la valina, che differiscono solo per un gruppo metilico, è più difficile. La valil-tRNA sintetasi è in grado di escludere, a causa dell'ingombro sterico, l'isoleucina dal suo sito catalitico, perché quest'ultima è più grande. Per contro, la valina dovrebbe facilmente inserirsi nel sito catalitico dell'isoleuciltRNA sintetasi. Per questo motivo, l'isoleucil-tRNA sintetasi possiede, in prossimità del sito catalitico (per l'adenililazione), un sito di “correzione” (costituito da un profondo solco dell'enzima), che permette di rettificare il prodotto della reazione di adenililazione. L'AMP-valina può essere contenuta in questo sito, nel quale viene idrolizzata e rilasciata in forma di valina e AMP liberi. La molecola di AMP-isoleucina, invece, è troppo grande per entrare nel sito di correzione e, pertanto, non è soggetta ad idrolisi. Tutti questi controlli sono dovuti al fatto che una volta che il tRNA è stato caricato non viene fatto nessun controllo ulteriore. In altre parole, il ribosoma accetta “a scatola chiusa” qualsiasi tRNA carico che sia in grado di formare un'appropriata interazione codone-anticodone, che esso porti o meno l'amminoacido corretto. Un esperimento biochimico dimostra il fatto che il ribosoma riconosce il tRNA, ma non l'amminoacido che esso

Biologia molecolare

Pagina 128 di 173

Domenico Azarnia Tehran

Sezione Appunti

porta. Consideriamo, per esempio, il tRNA carico cistenil-tRNACys (si ricordi che il prefisso indica l'amminoacido, mentre l'apice identifica il tRNA). La cisteina legata al cistenil-tRNACys può essere convertita in alanina per riduzione chimica, a dare alanil-tRNACys. Quando viene aggiunto ad un estratto crudo in grado di compiere la sintesi proteica, la molecola di alanil-tRNACys introdurrà un'alanina in corrispondenza dei codoni che specificano la cisteina.

Biologia molecolare

Pagina 129 di 173

Domenico Azarnia Tehran

Sezione Appunti

88. Il ribosoma Il ribosoma è l'apparato macromolecolare che dirige la sintesi proteica. Esso è composto da almeno tre molecole di RNA, lunghe fino a tre kilobasi, e da più di 50 proteine diverse, per una massa totale di oltre 2,5 megadalton. Paragonandola alla velocità di replicazione del DNA, che è di circa 200-1000 nucleotidi al secondo, la traduzione avviene ad una velocità di circa 2-20 amminoacidi al secondo. Nei procarioti, i macchinari per la trascrizione e la traduzione sono localizzati nello stesso compartimento cellulare. Il ribosoma, quindi, può iniziare la traduzione non appena l'RNA spunta dall'RNA polimerasi. Malgrado sia lento rispetto alla sintesi di DNA nei procarioti, il ribosoma è in grado di reggere la velocità dell'apparato trascrizionale. Infatti, la velocità tipica di 20 amminoacidi al secondo della traduzione procariotica corrisponde alla traduzione di 60 nucleotidi (20 codoni) di mRNA al secondo. La degradazione degli mRNA batterici, invece, comincia entro 1 minuto dall'inizio della trascrizione e i tre processi, trascrizione, traduzione e degradazione avvengono tutti in direzione 5'3'. Negli eucarioti, invece, la traduzione è completamente separata dalla trascrizione. Infatti, questi eventi si verificano in compartimenti separati della cellula: la trascrizione avviene nel nucleo, mentre la traduzione nel citoplasma. Non essendo accoppiata alla trascrizione, quindi, la traduzione eucariotica procede in maniera meno frenetica alla velocità di 2-4 amminoacidi. Comunque, come dicevamo, il ribosoma è composto da RNA e proteine, assemblati a formare due subunità distinte: una grande ed una piccola. La subunità maggiore contiene il centro peptidiltransferasico, responsabile della formazione dei legami peptidici. Mentre, la subunità minore contiene il centro di decifrazione, in cui i tRNA carichi leggono i codoni dell'mRNA. Per convenzione queste due subunità sono state denominate utilizzando un numero, in base alla velocità di sedimentazione, quando sono sottoposte alla forza centrifuga. L'unità usata per misurare la velocità di sedimentazione è lo Svendberg (più alto è il valore di S maggiore è la velocità di sedimentazione), dal nome dell'inventore dell'ultracentrifuga. In questo modo, nei batteri la subunità maggiore ha una velocità di sedimentazione di 50 unità Svedberg ed è quindi nota come la subunità 50S (che contiene rRNA 5S, rRNA 23S e 34 proteine), mentre la subunità minore è chiamata subunità 30S (che contiene rRNA 16S e 21 proteine). Ci si riferisce al ribosoma procariotico intatto come 70S, che non è la somma delle due subunità, in quanto la velocità di sedimentazione non dipende solo dal peso molecolare ma anche dalla forma. Il ribosoma eucariotico è un po' più grande ed è composto da subunità 60S (che contiene rRNA che contiene rRNA 5,8S, rRNA 5S e rRNA28S e 49 proteine) e 40S (che contiene rRNA 18 S e 33 proteine) che, insieme, formano un ribosoma 80S. Come per il caricamento dei tRNA, anche il ribosoma durante la sintesi proteica può fare due tipi di errori. Può causare un frameshift saltando una base quando legge l'mRNA (circa 10-5), oppure, potrebbe permettere ad un amminoacil-tRNA non corretto di appaiarsi con un codone, portando all'incorporazione di un amminoacido sbagliato. Questo è probabilmente l'errore più comune nella sintesi delle proteine, circa 5x10-4. Il ciclo in cui le subunità del ribosoma si associano tra loro e con l'mRNA, traducono l'mRNA bersaglio e, quindi, si dissociano dopo la sintesi proteica è noto come ciclo ribosomiale. In breve, la traduzione inizia quando l'mRNA e il tRNA iniziatore si legano ad una subunità minore ribosomiale libera. Questo complesso recluta, in seguito, la subunità maggiore a formare un ribosoma intatto, con l'mRNA inserito tra le due

Biologia molecolare

Pagina 130 di 173

Domenico Azarnia Tehran

Sezione Appunti

subunità. La sintesi proteica inizia al passo successivo, partendo dal codone di inizio all'estremità 5' del messaggio e procedendo verso l'estremità 3' dell'mRNA. A man mano che il ribosoma si sposta di codone in codone, i tRNA carichi si inseriscono uno dopo l'altro, e ciascun nuovo amminoacido viene aggiunto all'estremità C-terminale della catena polipeptidica nascente (spesso detta sintesi in direzione da N-terminale a C-terminale). Quando il ribosoma incontra un codone di termine, la catena polipeptidica completa viene rilasciata, e la subunità maggiore e minore si separano dall'mRNA e sono disponibili per legare una nuova molecola di RNA messaggero. Comunque, nonostante il ribosoma sia in grado di sintetizzare un singolo polipeptide alla volta, ciascun mRNA può essere tradotto simultaneamente da più ribosomi. Un mRNA associato a più ribosomi è detto poliribosoma o polisoma. Questa capacità di più ribosomi di tradurre un singolo mRNA spiega la limitata quantità di mRNA nella cellula, circa dall'1 al 5% dell'RNA totale. Come detto in precedenza, il ribosoma catalizza una sola reazione chimica: la formazione del legame peptidico. Questa reazione avviene tra il residuo amminoacidico all'estremità carbossi-terminale del polipeptide nascente e l'amminoacido che deve essere aggiunto alla catena. Sia il polipeptide nascente che il nuovo amminoacido sono associati al tRNA, quindi i due substrati sono denominati amminoacil-tRNA, che porta l'amminoacido da aggiungere, e un peptidil-tRNA che porta la catena polipeptidica nascente. Questo posizionamento permette al gruppo amminico dell'amminoacil-tRNA di attaccare il gruppo carbonilico dell'amminoacido all'estremità C-terminale del peptidil-tRNA, formando un nuovo legame peptidico. Per questo motivo, la reazione di formazione di un nuovo legame peptidico viene detta reazione peptidiltransferasica. È interessante notare che la formazione del legame peptidico avviene senza la contemporanea idrolisi di un nucleoside trifosfato, questo perché la formazione di questo legame è accompagnata dalla rottura del legame acilico ad alta energia che unisce la catena polipeptidica nascente al tRNA. Per portare a termine la reazione peptidil-transferasica, il ribosoma deve essere in grado di legare almeno due tRNA contemporaneamente. Infatti il ribosoma contiene tre siti di legame per il tRNA, chiamati siti A, P ed E. Il sito A è il sito di legame per il tRNA amminoacilato (l'amminoacil-tRNA), il sito P è quello di legame del peptidil-tRNA, mentre il sito E è il sito di legame per il tRNA che viene rilasciato in seguito al trasferimento della catena polipeptidica nascente all'amminoacil-tRNA. Ciascun sito di legame per il tRNA si forma all'interfaccia tra la subunità maggiore e quella minore del ribosoma. In tal modo, i tRNA legati possono coprire la distanza tra il sito della peptidil-transferasi della subunità maggiore ed il sito di decifrazione della subunità minore.

Biologia molecolare

Pagina 131 di 173

Domenico Azarnia Tehran

Sezione Appunti

89. Sintesi proteica: inizio della traduzione La sintesi delle proteine si divide in tre stadi: 1) l'inizio comprende le reazioni che precedono la formazione del legame peptidico fra i primi due amminoacidi della proteina e richiede che il ribosoma si leghi all'mRNA formando un complesso d'inizio che contiene il primo ammionoacil-tRNA, questo è un passaggio piuttosto lento e di solito determina la velocità con cui è tradotto l'mRNA; 2) l'allungamento che comprende tutte le reazioni che vanno dalla sintesi del primo legame peptidico all'aggiunta dell'ultimo amminoacido; 3) la terminazione che comprende i passaggi necessari per il rilascio della catena polipeptidica completata e la concomitante dissociazione del ribosoma dall'mRNA. Comunque, affinché la sintesi abbia inizio devono accadere tre cose: 1) il ribosoma si deve associare all'mRNA, 2) un tRNA carico si deve posizionare nel sito P del ribosoma e 3) il ribosoma si deve posizionare correttamente sul codone d'inizio. Nei procarioti l'associazione della subunità minore con l'mRNA è mediata dall'accoppiamento di basi tra il sito di legame al ribosoma e l'rRNA 16S. Per i siti di legame al ribosoma posizionati in modo ideale, la subunità minore si localizza sull'mRNA in modo tale che il codone di inizio si trovi nel sito P al momento dell'associazione della subunità maggiore. A questo punto, un tRNA carico entra direttamente nel sito P. Questo evento necessita di un tRNA speciale, noto come tRNA iniziatore che accoppia le proprie basi con quelle del codone di inizio, di solito AUG o GUG che vengono letti rispettivamente dai tRNA per la metionina (tRNAMet) e per la valina (tRNAVal). Né la metionina né la valina si attaccano al tRNA iniziatore. Esso è caricato, però, con una forma modificata della metionina (N-formil metionina) che possiede un gruppo formilico attaccato alla porzione ammino-terminale. Il tRNA iniziatore carico viene perciò detto fMettRNAifMet (questo avviene anche negli eucarioti). Sebbene la subunità minore (30S) sia coinvolta nell'inizio, no è di per sé competente per svolgere le reazioni di attacco dell'mRNA e del tRNA, ma richiede ulteriori proteine chiamate fattori di inizio (initiation factors, IF). Questi fattori si trovano soltanto nelle subunità 30S e vengono rilasciati quando si assembla con la subunità 50S. I batteri usano tre fattori di inizio chiamati IF-1, IF-2 e IF-3, necessari per l'ingresso sia di mRNA che di tRNA nel complesso di inizio. IF-3 è necessario perché la subunità 30S si leghi in modo specifico ai siti di inizio sull'mRNA e impedisce l'assemblaggio con la subunità maggiore, quindi controlla l'equilibrio fra i diversi stadi dei ribosomi. IF-2 lega un tRNA iniziatore speciale e ne controlla l'ingresso nel ribosoma, mentre, IF-1 si lega alle subunità 30S soltanto come parte del complesso di inizio completo. Si lega al sito A e impedisce l'ingresso dell'amminoacil-tRNA e la sua posizione può anche impedire alla subunità 50S di legarsi per costituite il ribosoma completo. Quando tutti e tre i fattori di inizio sono legati, la subunità minore è pronta a legare sia l'mRNA che il tRNA iniziatore. Questi due RNA si legano indipendentemente l'uno dall'altro e in ordine casuale. L'ultimo passaggio del processo d'inizio prevede l'associazione della subunità maggiore con la formazione del complesso d'inizio 70S. Quando le basi del codone di inizio e quelle dell'fMet-tRNAifMet si accoppiano, la subunità minore cambia conformazione portando al rilascio di IF3, quindi la subunità maggiore è libera di legarsi. Questo legame stimola l'attività GTPasica di IF2 che provoca il rilascio degli altri due fattori di inizio, ossia lo stesso IF2 e IF1. Quindi avremo soltanto il ribosoma legato all'mRNA e il tRNAi. L'inizio della traduzione negli eucarioti è molto simile a quella dei procarioti. Entrambi usano un codone

Biologia molecolare

Pagina 132 di 173

Domenico Azarnia Tehran

Sezione Appunti

d'inizio ed un tRNA specifico e i fattori d'inizio formano un complesso con la subunità minore, ma adottano un metodo di riconoscimento dell'mRNA e del codone d'inizio sostanzialmente diverso. Infatti, negli eucarioti al momento del reclutamento all'estremità 5' dell'mRNA dotata di cap, la subunità minore è già associata al tRNa iniziatore. Essa può “leggere in sequenza” l'mRNA in direzione 5'3', fino a raggiungere il primo 5'-AUG-3', che viene riconosciuto come codone d'inizio. In tal modo, nella maggior parte dei casi, solo il primo AUG, negli eucarioti, può essere usato come sito d'inizio della traduzione. Infatti, la maggior parte degli mRNA eucariotico è monocistronico, quindi il riconoscimento di un codone di inizio interno non è possibile o necessario. Comunque, al termine di un ciclo di traduzione, il ribosoma eucariotico si dissocia nelle subunità maggiore e minore, mediante l'opera di fattori, chiamati eIF3 ed eIF1A, analoghi ai fattori di inizio procariotici IF3 ed IF1. Due proteine in grado di legare GTP, eIF2 ed eIF5B, mediano il reclutamento del tRNA iniziatore carico. Negli eucarioti, questo tRNA è caricato con metionina, non N-formil metionina, ed è noto come Met-tRNAiMet. Successivamente, il fattore eIF5B-GTP, analogo a IF2-GTP, si lega alla subunità minore e serve a reclutare un complesso formato da eIF2-GTP e il tRNA iniziatore alla subunità minore. Insieme queste due proteine in grado di legare GTP posizionano il tRNA iniziatore nel futuro sito P della subunità minore, dando origine alla formazione del complesso di pre-inizio 43S. A questo punto, il riconoscimento dell'mRNA avviene mediante l'individuazione del cap al 5'. Questo riconoscimento è mediato da una proteina formata da tre subunità, chiamata eIF4F. Questo complesso viene legato, a sua volta, da eIF4B che attiva una RNA elicasi in una delle subunità di eIF4F. L'elicasi disfa tutte le strutture secondarie che si possono essere formate all'estremità dell'mRNA, in modo tale che la struttura risulti lineare per poter legare la subunità minore. A questo punto, l'mRNA è legato da eIF4FB e recluta il complesso di pre-inizio 43S dove si posiziona. Successivamente, la subunità minore ed i fattori ad essa associati, una volta assemblati all'estremità 5'dell'mRNA si spostano lungo quest'ultimo in direzione 5'3' per cercare il primo codone di inizio. Quest'ultimo viene riconosciuto mediante l'accoppiamento delle basi tra l'anticodone del tRNA iniziatore e il codone d'inizio (ecco perché è essenziale che la subunità minore si leghi prima al tRNA iniziatore e poi all'mRNA). Il corretto appaiamento delle basi promuove il rilascio di eIF2 ed eIF3, permettendo alla subunità maggiore di legarsi a quella minore. A questo punto, come avviene nei procarioti, la costituzione di un ribosoma completo porta al rilascio dei fattori rimanenti. Il risultato di questi eventi è il posizionamento del Met-tRNAiMet nel sito P del risultante complesso di inizio 80S. Bisogna, comunque, ricordare che oltre a legarsi all'estremità 5' dell'mRNA, i fattori di inizio sono associati all'estremità 3' dell'mRNA per mezzo della coda poli-A. Questa associazione è mediata dall'interazione tra eIF4F e la proteina di legame al poli-A che riveste la coda di poli-A. Il risultato di tutto questo è il mantenimento dell'mRNA in una configurazione circolare.

Biologia molecolare

Pagina 133 di 173

Domenico Azarnia Tehran

Sezione Appunti

90. Sintesi proteica: allungamento durante la traduzione La sintesi dei polipeptidi può iniziare quando il ribosoma è assemblato con il tRNA iniziatore carico nel sito P. Ci sono tre eventi chiave che devono avvenire affinché ogni amminoacido venga aggiunto correttamente: 1) l'amminoacil-tRNA corretto deve essere caricato nel sito A, come determinato dal codone presente nel sito, 2) si deve formare un legame peptidico tra l'amminoacil-tRNA nel sito P e 3) il risultante peptidiltRNA, presente nel sito A, ed il codone a esso associato devono essere traslocati al sito P, in modo tale che il ribosoma sia pronto per un altro ciclo di riconoscimento di codoni e di formazione del legame peptidico. Due proteine ausiliare, note come fattori di allungamento, controllano questi eventi. Questo meccanismo di allungamento è altamente conservato tra le cellule procariotiche ed eucariotiche. All'inizio di questa fase, gli amminoacil-tRNA non si legano al ribosoma da soli. Essi vengono “scortati” sul ribosoma dal fattore di allungamento (elongation factor) EF-Tu. Una volta che il tRNA è caricato con un amminoacido, questo fattore si lega all'estremità 3' del tRNA, mascherando l'amminoacido associato evitando la formazione del legame peptidico. A questo punto EF-Tu lega e idrolizza il GTP e l'amminoacil-tRNA viene rilasciato. Bisogna ricordare che l'attività GTPasica di EF-Tu è attivata da un dominio posto nella subunità maggiore, noto come centro di legame del fattore. Successivamente, un altro fattore, EF-Ts, media la rigenerazione della forma usata, EF-Tu-GDP, nella forma attiva, EF-Tu-GTP, costituendo una sorta di continuo riciclo. Il fattore di errore della traduzione è compreso tra 10-3 e 10-4. Cioè, solo 1 su 1000 amminoacidi incorporati nella proteina è sbagliato. Il meccanismo base per la selezione dell'amminoacil-tRNA corretto è l'appaiamento tra il tRNA carico e il codone presente nel sito A del ribosoma. Malgrado ciò potrebbero avvenire degli appaiamenti errati. A questo punto vi sono tre diversi meccanismi che contribuiscono all'incorporazione dell'amminoacil-tRNA corretto: 1) un primo meccanismo che contribuisce alla fedeltà di riconoscimento del codone coinvolge due residui di adenina adiacenti che si trovano nella componente dell'rRNA 16S della subunità minore e che formano un interazione forte con l'ansa minore di ciascuna coppia di basi, che si è formata in modo corretto tra l'anticodone e le prime due basi del codone; 2) un secondo meccanismo coinvolge l'attività GTPasica di EF-Tu. Infatti il rilascio di EF-Tu dal tRNA richiede l'idrolisi di GTP, la quale è molto sensibile al corretto accoppiamento codone-anticodone; 3) un terzo meccanismo è una specie di correzione di bozze che avviene dopo il rilascio di EF-Tu. Infatti per partecipare in modo produttivo alla reazione della peptidil-transferasi, il tRNA deve ruotare all'interno del sito della peptidil-transferasi della subunità maggiore, in un processo detto accomodamento. I tRNA che non sono appaiati correttamente spessi si dissociano dal ribosoma durante questo processo, poiché non vi è abbastanza tensione per sostenere questo sforzo. Comunque, una volta che il corretto tRNA carico è posizionato nel sito A ed è ruotato nel sito della peptidiltransferasi, avviene la formazione del legame peptidico. Questa reazione è catalizzata dall'RNA, specificatamente dall'rRNA 23S della subunità maggiore. Quindi la peptidil-transferasi è completamente formata da RNA, ossia è un ribozima, cioè un enzima composto da RNA (vedi sopra per meccanismo di formazione del legame peptidico). A questo punto, una volta che è avvenuta la reazione della peptidiltransferasi, il tRNA nel sito P (non più attaccato ad un amminoacido) viene deacetilato e la catena polipeptidica nascente viene agganciata al tRNA nel sito A. Affinché avvenga un nuovo ciclo di

Biologia molecolare

Pagina 134 di 173

Domenico Azarnia Tehran

Sezione Appunti

allungamento della catena polipeptidica, il tRNA nel sito P deve spostarsi nel sito E ed il tRNA nel sito A deve spostarsi nel sito P. Contemporaneamente, l'mRNA deve spostarsi di tre nucleotidi per esporre il codone successivo. Questi movimenti all'interno del ribosoma avvengono in maniera coordinata in un processo definito traslocazione. Una volta che la catena peptidica nascente è stata trasferita al tRNA nel sito A, l'estremità 3' di questo tRNA si sposta nel sito P della subunità maggiore. Al contrario, l'estremità dell'anticodone del tRNA nel sito A rimane in questa posizione. Analogamente il tRNA nel sito P, ora deacetilato, viene spostato nel sito E della subunità maggiore, ma rimane nel sito P di quella minore. Il completamento della traslocazione necessita dell'intervento di un secondo fattore di allungamento, detto EFG, che può legarsi al ribosoma solamente quando è associato al GTP e imita la struttura tridimensionale dell'amminoacil-tRNA. Dopo la reazione della peptidil-transferasi, il cambio di posizione del tRNA del sito A espone un sito di legame per EF-G nella zona del sito A sulla subunità maggiore. Nel legarsi, il complesso EF-G-GTP crea dei contatti con il centro di legame del fattore sulla subunità maggiore, che, a sua volta, stimola l'idrolisi dl GTP. Questa causa una variazione conformazionale del complesso EF-G-GDP, permettendogli di insinuarsi nella subunità minore e provocare la traslocazione del tRNA nel sito A. Quando la traslocazione è completata, la risultate struttura ribosomiale ha una bassa affinità per EF-G-GDP e quindi viene rilasciato. Insieme, questi eventi portano alla traslocazione del tRNA dal sito A al sito P, di quello nel sito P al sito E e al movimento dell'mRNA di esattamente tre paia di basi.

Biologia molecolare

Pagina 135 di 173

Domenico Azarnia Tehran

Sezione Appunti

91. Sintesi proteica: conclusione della traduzione Il ciclo del ribosoma continua fino a quando uno dei tre codoni di stop entra nel sito A. Questi codoni vengono riconosciuti da proteine dette fattori di rilascio (release factors, RF), che attivano l'idrolisi del polipeptide dal peptidil-tRNA. Esistono due classi di fattori di rilascio. I fattori della classe I riconoscono i codoni di stop e innescano l'idrolisi della catena peptidica dal tRNA nel sito P. I procarioti possiedono due fattori di rilascio di classi I, detti RF1, che riconosce il codone di stop UAG, e RF2 che riconosce UGA. Mentre il terzo codone di stop, UAA, viene riconosciuto da entrambi. Negli eucarioti, invece, è presente un solo fattore di rilascio di classe I detto eRF1, che riconosce tutti e tre i codoni di stop e presenta una molecola d'acqua per idrolizzare il peptidil-tRNA. I fattori di rilascio di classe II stimolano la dissociazione dei fattori di classe I dai ribosomi, in seguito al rilascio della catena polipeptidica. I procarioti e gli eucarioti possiedono solamente un fattore di classe II, chiamato RF3 ed eRF3. Anche questi fattori, come EF-G ed EF-Tu, sono regolati da GTP. Comunque, tutti i fattori di classe I hanno in comune una sequenza di tre amminoacidi (glicina, glicina, glutammina, GGQ), situate in prossimità del centro peptidil-transferasico, che è essenziale per il rilascio del polipeptide. Inoltre, sempre questi fattori simulano un tRNA dal punto di vista funzionale, ma non strutturale, essendo anche dotati di un peptide anticodone che interagisce con il codone di stop e, come dicevamo prima, di un motivo GGQ che si inserisce nel sito della peptidil-transferasi. Comunque, una volta che il fattore di rilascio di classe I ha innescato l'idrolisi del legame del peptidil-tRNA, esso deve essere rimosso dal ribosoma. Ciò si ottiene per mezzo del fattore di rilascio di classe II, RF3 (oppure eRF3). Questa proteina ha una maggiore affinità per GDP che per GTP. Quindi in prevalenza troviamo la forma RF3-GDP. Quando abbiamo la liberazione del polipeptide attuata dal fattore di rilascio di classe I, si stimola lo scambio tra GDP e GTP su RF3. Questo porta ad un interazione di RF3-GTP ad alta affinità con il ribosoma, che induce l'allontanamento del fattore di classe I. Alla fine del ciclo di traduzione, abbiamo un processo noto come riciclaggio del ribosoma. Nelle cellule procariotiche, un fattore noto come fattore di riciclaggio del ribosoma (ribosome recycling factor, RRF), che simula un tRNA posizionandosi al sito A, agisce insieme ad EF-G e IF3 per riciclare il ribosoma.

Biologia molecolare

Pagina 136 di 173

Domenico Azarnia Tehran

Sezione Appunti

92. Il codice genetico La sequenza di un filamento codificante di DNA, letta nella direzione da 5' a 3', consiste di triplette di nucleotidi (codoni) che corrispondono alla sequenza degli amminoacidi di una proteina letta dall'Nterminale al C-terminale. Esistono 64 codoni (ognuno dei 4 nucleotidi possibili può occupare una qualunque delle tre posizioni del codone, producendo 43 = 64 possibili sequenze tri- nucleotidiche). Ognuno di questi codoni ha un significato specifico nella sintesi proteica: 61 codoni rappresentano amminoacidi, mentre 3 codoni provocano la terminazione della sintesi proteica. Quindi, poiché vi sono più codoni (61) che amminoacidi (20), quasi tutti gli amminoacidi sono rappresentati da più di un codone (un fenomeno detto degenerazione), con l'unica eccezione della metionina e del triptofano. I codoni che hanno lo stesso significato sono chiamati sinonimi. Poiché il codice genetico è in realtà letto sull'mRNA, di solito è descritto in termini delle quattro basi presenti sull'RNA: U, C, A e G. I codoni che rappresentano lo stesso amminoacido o amminoacidi correlati tendono ad avere una sequenza simile e spesso la base della terza posizione di un codone non è significativa perché i quattro codoni che differiscono soltanto nella terza base rappresentano lo stesso amminoacido. Questa ridotta specificità a livello dell'ultima posizione è nota come degenerazione della terza base. Lo schema di degenerazione della terza base mostra che in quasi tutti i casi o la terza base è irrilevante o viene fatta una distinzione soltanto fra purine e pirimidine. Ci sono otto famiglie di codoni in cui tutti e quattro i codoni che hanno in comune le prime due basi hanno lo stesso significato, così che la terza base non ha alcun ruolo nella specificazione dell'amminoacido. Ci sono sette coppie di codoni in cui il significato è lo stesso purché la terza base sia occupata da una pirimidina e ci sono cinque coppie di codoni in cui una purina qualunque può essere presente senza modificare l'amminoacido codificato. Inoltre, esistono solo tre casi in cui la base in terza posizione conferisce un unico significato: AUG (metionina), UGG (triptofano), UGA (terminazione). Spesso un singolo tRNA può riconoscere più di un codone, il che significa che la base nella prima posizione dell'anticodone deve essere capace di appaiarsi a basi alternative nella terza posizione corrispondente del codone. L'appaiamento delle basi a questa posizione non può essere limitata dalla solita regola G-C e A-U. Le regole che governano gli schemi di riconoscimento sono compendiate nell'ipotesi del tentennamento (o vacillamento, wobbling), che prevede appaiamenti normali (A-U, G-C) per le prime due posizioni del codone, e possibilità di appaiamenti di altro tipo per la terza posizione. Infine, bisogna aggiungere, che gli amminoacidi più utilizzati nella sintesi proteica non sono necessariamente quelli con maggior numero di codoni e perciò non sembra che il codice genetico sia stato ottimizzato per quanto riguarda l'utilizzo degli amminoacidi.

Biologia molecolare

Pagina 137 di 173

Domenico Azarnia Tehran

Sezione Appunti

93. I tRNA contengono basi modificate L'RNA transfer è l'unico fra gli acidi nucleici a contenere basi “insolite”. Una base insolita è una purina o una pirimidina diverse dalle solite A, G, C e U usate per sintetizzare gli RNA ed è prodotta per modificazione di una delle quattro basi dopo l'incorporazione nella catena poliribonucleotidica. Nel tRNA si osserva una vasta gamma di queste modificazioni, che vanno dalla semplice metilazione ad un'estesa ristrutturazione dell'anello purinico, che possono riguardare tutte le parti della molecola di tRNA. Si è visto che esistono più di 50 tipi diversi di base modificate catalizzate da moltissimi enzimi differenti. L'effetto più diretto di queste modificazioni si osserva nell'anticodone, in cui il cambiamento di sequenza influenza la capacità di appaiarsi con il codone, determinando così il significato del tRNA. Infatti, quando le basi dell'anticodone sono modificate, diventano possibili ulteriori schemi di appaiamento oltre a quelli predetti dall'appaiamento regolare e da quello tentennante. Ad esempio, la inosina (I) che è spesso presente nella prima posizione dell'anticodone può appaiarsi con tre basi U, C e A, invece, la 2-tiouridina permette alla base di continuare ad appaiarsi con A, ma le impedisce l'appaiamento tentennante con G. Queste ed altre relazioni di appaiamento portano al concetto generale che vi sono più modi di costruire una serie di tRNA capace di riconoscere tutti i 61 codoni che rappresentano amminoacidi.

Biologia molecolare

Pagina 138 di 173

Domenico Azarnia Tehran

Sezione Appunti

94. Esistono alterazioni sporadiche del codice universale L'universalità del codice genetico è sorprendente, ma esistono alcune eccezioni che tendono ad interessare i codoni coinvolti nell'inizio o nella terminazione e sono dovute alla produzione (o all'assenza) di tRNA che rappresentano certi codoni. Quasi tutti i cambiamenti che permettono ad un codone di rappresentare un amminoacido interessano i codoni di termine. Ad esempio alcuni protozoi leggono UAA e UAG come glutammina invece che come segnali di termine, in altri UAA è usato come codone di termine e UAG non è presente. Comunque, l'acquisizione di una funzione codificante da parte di un codone di termine richiede due tipi di cambiamenti: un tRNA deve maturare in modo da riconoscere il codone e il fattore di rilascio di classe I deve mutare in modo da non provocare terminazione a livello di questo codone. L'altro tipo comune di cambiamento è la perdita del tRNA che risponde ad un codone, così che il codone non specifica più nessun amminoacido. Eccezioni al codice genetico universale si trovano anche nei mitocondri di parecchie specie. Il cambiamento più antico è stato l'impiego di UGA per codificare triptofano, che è comune a tutti i mitocondri (non vegetali). Alcuni di questi cambiamenti rendono il codice più semplice sostituendo due codoni che avevano significati diversi con una coppia che ha un solo significato. Coppie di questo tipo comprendono, ad esempio, UGG e UGA, entrambi per il triptofano invece che uno per il triptofano e l'altro di termine. Tutto questi cambiamenti sono potuti avvenire nei mitocondri in quanto sintetizzano soltanto un piccolo numero di proteine (circa 10), e quindi il problema dell'effetto distruttivo dovuto ai cambiamenti di significato è molto meno grave. Per questo motivo il numero minimo di tRNA secondo la ipotesi del vacillamento è 31 ma nei mitocondri di mammifero se ne trovano solo 22, in seguito a una ipersemplificazione dell’appaiamento codone-anticodone, e ad alcuni cambiamenti di codice di lettura. Inoltre, bisogna aggiungere, che in singoli geni si verificano cambiamenti specifici nella lettura del codice. La specificità di questi cambiamenti implica che la lettura di un codone particolare sia influenzata dalle basi circostanti, quindi che il riconoscimento di un codone dipenda dal contesto. Un esempio notevole è l'incorporazione dell'amminoacido modificato selenocisteina, a livello di certi codoni UGA all'interno di geni che codificano selenoproteine, che catalizzano reazioni di ossido-riduzione, sia nei procarioti che negli eucarioti. Il codone UGA interno è letto da un seleno-Cys-tRNA. Questa reazione insolita è determinata dalla struttura secondaria locale dell'mRNA, in particolare dalla presenza di un'ansa a forcina a valle dell'UGA (questo è il contesto particolare).

Biologia molecolare

Pagina 139 di 173

Domenico Azarnia Tehran

Sezione Appunti

95. Mutazioni soppressore possono trovarsi nello stesso gene o in geni diversi Un'alterazione che cambia un codone specifico per un amminoacido in un codone specifico per un altro amminoacido viene detta mutazione missenso. La conseguenza è che un gene che porta questo tipo di mutazione produrrà una proteina in cui un singolo amminoacido è stato sostituito da un altro (anemia falciforme). Un effetto più drastico si ha quando l'alterazione causa la comparsa di un codone di stop, e viene detta mutazione nonsenso o mutazione di stop. Quindi in seguito a questo tipo di mutazione, verrà rilasciato un polipeptide incompleto, dovuto alla terminazione prematura della traduzione. Il terzo tipo di mutazione è la mutazione frameshift. Queste mutazioni sono inserzioni o delezioni di una o di un numero ridotto di coppie di basi che alterano il frame di lettura non solo nel sito di inserzione o di delezione ma dell'intero messaggio a valle. Comunque, spesso gli effetti di una mutazione dannosa possono essere invertiti da una seconda mutazione. Alcune di queste mutazioni aggiuntive sono facili da comprendere, dato che si tratta di semplici mutazioni di reversione (o all'indietro), che riportano una sequenza nucleotidica alterata alla sua forma originale. Più difficili da capire sono le mutazioni che avvengono in diverse posizioni del cromosoma e che sopprimono un cambiamento, dovuto ad una mutazione nel sito A, producendo un'ulteriore mutazione nel sito B. Queste mutazioni soppressore (suppressor) si dividono in due categorie: quelle che avvengono nello stesso gene della mutazione originale, ma in un sito diverso del gene (soppressione intragenica), e quelle che avvengono in un altro gene (soppressione intergenica). Prendiamo in considerazione una soppressione intragenica per un caso di mutazione frameshift. Una delezione nella sequenza nucleotidica codificante può dare come risultato una catena polipeptidica incompleta e/o inattiva. L'effetto di questa delezione può essere annullato da una seconda mutazione, un'inserzione nella sequenza codificante. Questa inserzione ha come risultato la produzione di una catena polipeptidica completa, che, però, contiene la sostituzione di due amminoacidi. A seconda del cambio nella sequenza, la proteina potrà avere attività parziale o completa. I geni soppressori, dunque, non agiscono cambiando la sequenza nucleotidica di un gene mutato. Invece, essi cambiano il modo in cui viene letto l'mRNA. Uno degli esempi più conosciuti di mutazione soppressore è rappresentato dalla mutazione dei geni per i tRNA, che sopprimono gli effetti di mutazioni nonsenso nei geni che codificano per proteine. In E. coli sono noti geni soppressori per ciascuno dei tre codoni di stop. Essi riconoscono un codone di stop come se fosse il segnale per un amminoacido specifico. Esistono, per esempio, tre geni ben caratterizzati che sopprimono il codone UAG. Un gene soppressore inserisce una serina, un altro una glutammina ed un terzo una tirosina nella posizione nonsenso. In ciascuno dei tre mutanti soppressori di UAG, l'anticodone di una specie di tRNA, specifico per uno di questi amminoacidi, è stato alterato. In generale, in una cellula normale una mutazione nonsenso è riconosciuta soltanto da un fattore di rilascio che termina la sintesi della proteina, ma la mutazione soppressore crea un amminoacil-tRNA che può riconoscere il codone di termine e inserire un amminoacido, permettendo alla sintesi proteica di continuare oltre al sito della mutazione nonsenso. Le mutazioni missenso ,invece, può essere soppressa dall'inserzione dell'amminoacido originale o di qualche altro amminoacido che è accettabile per la proteina.

Biologia molecolare

Pagina 140 di 173

Domenico Azarnia Tehran

Sezione Appunti

96. I principi della regolazione genica trascrizionale Esistono meccanismi che regolano l'espressione genica, ovvero, meccanismi che aumentano o diminuiscono l'espressione di uno specifico gene una volta che viene a cambiare la richiesta del suo prodotto. Ci sono due stadi in cui l'espressione di un gene può essere regolata. Il più comune è l'inizio di trascrizione ma vi sono anche passaggi successivi a quest'ultimo come l'antiterminazione della trascrizione e la regolazione della traduzione. I geni sono spesso controllati da segnali extracellulari: nel caso dei batteri, si tratta tipicamente delle molecole presenti nel mezzo di crescita. Questi segnali vengono comunicati ai geni da proteine regolative, che possono essere di due tipi: i regolatori positivi, o attivatori e quelli negativi, o repressori. In genere questi regolatori sono delle proteine che legano il DNA, capaci di riconoscere specifiche sequenze sui geni che controllano, o nelle loro vicinanze. Un attivatore aumenta la trascrizione del gene regolato; mentre, i repressori diminuiscono o aboliscono quella trascrizione. Come abbiamo visto, inizialmente, la RNA polimerasi si lega al promotore in un complesso chiuso (in cui i due filamenti di DNA restano appaiati). Il complesso promotore-polimerasi, quindi, subisce una transizione a complesso aperto in cui il DNA a livello del sito d'inizio di trascrizione è svolto e la polimerasi è posizionata in maniera tale da iniziare la trascrizione. A questo passaggio segue quello di rilascio del promotore in cui l'enzima lascia il promotore ed inizia a trascrivere. In assenza di proteine regolatrici, l'RNA polimerasi si lega debolmente a molti promotori. Questo porta ad un basso livello di espressione costitutiva, detto livello basale. In questo caso è il legame dell'RNA polimerasi a costituire il passaggio limitante. Per controllare l'espressione di un simile promotore, un repressore ha solo bisogno di legarsi ad un sito che si sovrappone alla regione legata dalla polimerasi. In questo modo il repressore blocca il legame dell'RNA polimerasi al promotore, impedendo la trascrizione. Il sito sul DNA su cui si lega un repressore è detto operatore. Per attivare la trascrizione a partire da questo promotore, invece, un attivatore deve soltanto aiutare la polimerasi a legarvisi. Per questo, l'attivatore usa una regione per legare un sito sul DNA vicino al promotore; con una diversa superficie, contemporaneamente, interagisce con l'RNA polimerasi, portando l'enzima sul promotore. Questo meccanismo spesso definito come reclutamento è un esempio del legame cooperativo delle proteine al DNA. Una volta posizionato, l'enzima isomerizza spontaneamente nel complesso aperto, e la trascrizione inizia. Non tutti i promotori però sono caratterizzati dallo stesso passaggio limitante. Se prendiamo in considerazione, ad esempio, un promotore opposto al precedente, ovvero un promotore su di cui si lega stabilmente l'RNA polimerasi senza bisogno di alcun aiuto che però non riesce a trasformarsi spontaneamente in un complesso aperto, su questo promotore un attivatore deve stimolare la transizione tra complesso chiuso ad aperto, perché proprio in questa transizione risiede il passaggio limitante. Gli attivatori che stimolano questo tipo di promotore lavorano inducendo un cambiamento conformazionale o nell'RNA polimerasi o sul DNA. Questo meccanismo è un esempio di allosteria. Fino ad ora abbiamo visto proteine, sia soppressori che attivatori che agiscono su siti vicini. D'altro canto alcune proteine interagiscono tra loro anche quando sono legate a siti piuttosto lontani sul DNA. Per permettere questa interazione, il DNA compreso tra questi siti di interazione si estroflette formando un'ansa

Biologia molecolare

Pagina 141 di 173

Domenico Azarnia Tehran

Sezione Appunti

e portando i suddetti siti uno vicino all'altro. Un modo per aiutare due siti distanti di avvicinarsi (e quindi permettere la formazione di un'ansa) consiste nel legame di altre proteine a sequenze comprese tra i due siti in questione. Nei batteri esistono dei casi in cui una proteina si lega tra il sito di legame di un attivatore ed il promotore, aiutando l'attivatore ad interagire con l'RNA polimerasi, mediante l'induzione di una curvatura sul DNA, per questi sono detti fattori “architettonici”, utili anche nella ricombinazione sito-specifica, come abbiamo visto. Inoltre, le sequenze coinvolte nella regolazione trascrizionale sono distinguibili in trans-agenti e cis-agenti. Una sequenza genica il cui prodotto diffonde e va ad agire in un’altra regione genica viene definita transagente. Una sequenza che, invece, non viene convertita in altra forma, ma agisce esclusivamente come sequenza di DNA e influenza solo il DNA fisicamente contiguo è detta cis-agente. Comunque, i sistemi di controllo possono essere suddivisi in positivo e negativo e sono definiti dalla risposta dell'operone quando non è presente una proteina regolatrice. Le caratteristiche dei due sistemi sono speculari. I geni sotto controllo negativo sono espressi a meno che non siano spenti da un repressone. Di solito un repressore proteico si lega al DNA per impedire all'RNA polimerasi d iniziare la trascrizione o si lega all'mRNA per impedire a un ribosoma di iniziare la traduzione. L'espressione dei geni sotto controllo positivo, invece, è possibile soltanto quando è presente una proteina regolatrice attiva. In questo controllo, la proteina interagisce con il DNA e la RNA polimerasi per facilitare l'evento di inizio (come ad esempio l'uso dei fattori sigma). Un regolatore positivo che corrisponde ad una piccola molecola si chiama di solito attivatore.

Biologia molecolare

Pagina 142 di 173

Domenico Azarnia Tehran

Sezione Appunti

97. La regolazione dell'inizio di trascrizione: alcuni esempi nei batteri I tre geni lac, lacZ, lacY e lacA sono adiacenti uno all'altro nel genoma di E.coli, sono implicati nel metabolismo del lattosio e nel loro insieme sono definiti operone lac (operone: è un'unità di regolazione ed espressione genica composta da geni strutturali e da elementi di controllo nel DNA, che vengono riconosciuti dal prodotto di un gene regolatore). Il promotore lac, posizionato all'estremità 5' di lacZ, dirige la trascrizione di tutti e tre i geni in un unico mRNA (detto messaggio policistronico perché comprende più di un gene). Questo mRNA viene tradotto in tre prodotti proteici. Il gene lacZ codifica per l'enzima -galattosidasi che scinde lo zucchero lattosio in galattosio e glucosio, usati dalle cellule come fonte di energia. Il gene lacY codifica per la permeasi del lattosio, una proteina che si inserisce nella membrana cellulare e trasporta il lattosio nella cellula. Il gene lacA, invece, codifica per la tiogalattoside transacetilasi, che libera la cellula dai tiogalattosidi tossici che vengono anch'essi importati da lacY. Questi geni sono espressi ad un livello elevato solo quando il lattosio è disponibile, mentre non è presente il glucosio, che rappresenta la fonte energetica preferenziale. I batteri devono rispondere rapidamente ai cambiamenti del loro ambiente. Infatti, fluttuazioni nel rifornimento di sostanze nutrienti possono verificarsi in ogni momento e la sopravvivenza dipende dalla capacità di passare dal metabolismo di un substrato ad un altro. La sintesi si enzimi in risposta alla comparsa di un substrato specifico si chiama induzione. Questo tipo di regolazione è molto diffuso nei batteri e si trova anche negli eucarioti unicellulari, come i lieviti. Ad esempio, quando si fanno crescere cellule di E. coli in assenza di un -galattoside, non c'è bisogno di -galattosidasi e i batteri contengono pochissime molecole dell'enzima, diciamo 5. Quando si aggiunge un substrato adatto, l'attività enzimatica compare molto rapidamente e nel giro di 2-3 minuti è presente una certa quantità di enzima che sale rapidamente a circa 5000 molecole per batterio. Se il substrato viene rimosso dal mezzo, la sintesi dell'enzima si blocca con la stessa rapidità con cui era stata indotta. Il controllo della trascrizione di lac risponde molto rapidamente all'induttore. Infatti, in assenza di induttore, l'operone è trascritto, come dicevamo, ad un livello basale molto basso, ma la trascrizione è stimolata non appena si aggiunge l'induttore e la quantità di mRNA lac aumenta rapidamente ad un livello indotto che riflette un equilibrio fra sintesi e degradazione dell'mRNA. Comunque, due proteine regolative sono coinvolte in questo processo: una è un attivatore detto CAP, l'altra un repressore chiamato repressore Lac. Quest'ultimo è codificato dal gene lacI, posizionato vicino agli altri geni lac, ma trascritto a partire da un proprio promotore, invece, CAP viene codificato da un altro gene che si trova altrove sul cromosoma batterico, dunque non associato ai geni lac. Comunque, entrambi queste proteine si legano al DNA ad uno specifico sito o al promotore lac o nelle sue vicinanze, e rispondono a segnali ambientali. In particolare CAP trasmette la presenza di glucosio, mentre il repressore Lac trasmette il segnale del lattosio. Questo sistema regolativo lavora nel seguente modo: il repressore Lac può legare il DNA e reprimere la trascrizione solo in assenza del lattosio; in presenza di questo zucchero, invece, il repressore è inattivo ed i geni de-repressi (espressi). CAP può legare il DNA e inattivare i geni lac solo in assenza di glucosio. L'effetto combinato di questi due regolatori, quindi, è che i geni siano espressi a livelli elevati solo quando il lattosio è presente e il glucosio assente.

Biologia molecolare

Pagina 143 di 173

Domenico Azarnia Tehran

Sezione Appunti

Il sito legato dal repressore Lac si chiama operatore lac, è una sequenza di 21 bp ed ha un doppio asse di simmetria ed è riconosciuta da due subunità del repressore Lac, ciascuna delle quali si lega ad una delle metà. L'operatore lac si sovrappone al promotore e, quindi, il repressore legato all'operatore impedisce fisicamente all'RNA polimerasi di legarsi al promotore ed iniziare la sintesi di RNA. La proteina CAP, invece, si lega come dimero ad un sito di lunghezza simile a quella dell'operatore lac, ma con sequenza diversa. Questo sito si trova a circa 60 bp a monte dell'inizio della trascrizione. Quando l'attivatore CAP si lega a questo sito, favorisce il legame della polimerasi al promotore sia interagendo con essa che reclutandola sul promotore. Questo legame cooperativo stabilizza il legame dell'enzima al promotore. Diversi esperimenti supportano questo modello secondo cui CAP attiva i geni lac mediante un semplice reclutamento della RNA polimerasi. Sono state isolate delle versioni mutanti di CAP che legano il DNA ma non attivano la trascrizione. Questi mutanti sono caratterizzati da sostituzioni amminoacidiche nel dominio C-terminale (CTD) della subunità dell'RNA polimerasi. Come abbiamo visto, questo dominio è unito al dominio N-terminale (NTD) di mediante una giunzione flessibile. L'NTD risiede nella porzione interna dell'enzima, mentre l'CTD si estende all'esterno e lega (quando presente) l'elemento UP del promotore. Sul promotore lac, dove non c'è un elemento UP, CTD si lega invece al CAP ed al DNA adiacente. La proteina CAP e il repressore Lac legano il DNA per mezzo di un comune motivo strutturale. In un tipico caso, la proteina si lega come omodimero ad un sito che corrisponde (o è simile) ad una ripetizione invertita. Ogni monomero lega una metà del sito, con l'asse di simmetria del dimero che giace sopa a quella del sito di legame. Il riconoscimento delle specifiche sequenze di DNA è mediato da una struttura secondaria conservata, nota come elica-giro-elica. Questo dominio consta di due -eliche, una delle quali, l'elica di riconoscimento, s'insinua nel solco maggiore del DNA. I contatti presi tra le catene laterali degli amminoacidi che protrudono dall'elica di riconoscimento e le parti più esterne delle basi possono essere mediati da legami idrogeno diretti, legami idrogeno indiretti o forze di van der Waals. La seconda elica del dominio elica-giro-elica, invece, attraversa il solco maggiore e prende contatto con lo scheletro del DNA, assicurando, in questo modo, una corretta presentazione dell'elica di riconoscimento e, nello stesso tempo, aggiungendo energia di legame all'interazione proteina-DNA nel suo complesso. Questa descrizione è di fatto valida non solo per CAP e il repressore Lac, ma anche per molti altri regolatori batterici, tra i quali il repressore del fago e le proteine Cro. Comunque, il repressore Lac si lega come tetramero e non come dimero. Ciò nonostante ogni operatore è contattato da solo due di queste subunità- Infatti, gli altri due monomeri del tetramero possono legare uno degli altri due operatori lac, posizionati, rispettivamente, 400 bp a valle e 90 bp a monte dell'operatore principali. In questi casi, il DNA compreso tra i due siti forma un loop per consentire la reazione. Come abbiamo detto, il componente che risponde all'induttore nel sistema lacZYA è il repressore codificato da lacI, repressore Lac. Lo stato di questo repressore determina se il promotore deve essere acceso o spento. Infatti, in assenza di un induttore, i geni non sono trascritti, perché il repressore è in forma attiva legata all'operatore. Mentre, quando si aggiunge un induttore, il repressore è convertito in una forma inattiva che si stacca dall'operatore. Quindi la trascrizione inizia a livello del promotore e procede attraverso i geni fino ad un terminatore posto oltre l'estremità 3' di lacA. Le caratteristiche cruciali del circuito di controllo si trovano nella duplice proprietà del repressore: può impedire a trascrizione e può riconoscere il piccolo induttore. Il

Biologia molecolare

Pagina 144 di 173

Domenico Azarnia Tehran

Sezione Appunti

repressore ha due siti di legame, uno per l'operatore e uno per l'induttore. Quando l'induttore si lega al suo sito, modifica la conformazione della proteina in modo tale da influenzare l'attività del sito di legame all'operatore. Questa induzione svolge una regolazione coordinata: tutti i geni sono espressi (o non espressi) all'unisono. In dettaglio, l’induttore agisce legandosi al repressore e causando il suo distacco dall’operatore. L’induttore può essere il substrato stesso o un suo derivato (nel caso dell’operone lac un induttore è l’allolattosio, un isomero del lattosio), ma anche altre molecole possono funzionare da induttore. Infatti, quando il lattosio entra nelle cellule, viene convertito in allolattosio. Ed è proprio questo che controlla il repressore Lac. L'allolattosio si lega al repressore Lac e induce un cambiamento nella conformazione della proteina. In assenza di allolattosio, il repressore è presente in una forma capace di legare il proprio sito di riconoscimento sul DNA, e quindi di mantenere i geni lac spenti. Una volta che l'allolattosio ha cambiato la forma del repressore, la proteina non può più legare il DNA e quindi i geni lac non sono più repressi. Un meccanismo simile regola l'attività della proteina CAP (detta anche CRP). Il glucosio abbassa la concentrazione intracellulare di una piccola molecola, il cAMP. Quest'ultimo è l'effettore allosterico del CAP: la proteina CAP solo quando è complessata con il cAMP adotta una conformazione in grado di legare il DNA. Quindi, CAP lega il DNA e attiva i geni lac solo quando i livelli di glucosio sono bassi (e quelli di cAMP alti). La porzione del CAP che lega l'effettore, il cAMP, è diversa da quella che lega il DNA. Infatti, il CAP si lega ad una regione del DNA di circa 22 bp con due pentameri di riconoscimento non ugualmente conservati. Comunque, CAP influenza l’espressione di più di 100 geni in E. coli. Il sito di legame di CAP si trova in punti diversi rispetto al sito d’inizio della trascrizione. In gal è a -41, mentre in lac è a -61. La dipendenza da CAP è correlata all’efficienza intrinseca del promotore. Nessun promotore CAP dipendente ha una buona sequenza -35 e spesso neanche una buona sequenza -10. Infine, bisogna dire che, i componenti del circuito regolatore dell'operone si dividono in due classi e possono essere identificati in base a mutazioni che influenzano l'espressione di tutti i geni strutturale e mappano al di fuori di essi. Il promotore e l'operatore sono identificati come bersagli delle proteine regolatrici (rispettivamente RNA polimerasi e repressore) in base a mutazioni cis-agenti e il locus lacI è identificato come il gene che codifica per il repressore proteico in base a mutazioni che eliminano il prodotto transagente. L'operatore è stato identificato in origine in base a mutazioni costitutive (che non rispondono più alla regolazione), denotate Oc, le cui proprietà distintive hanno fornito la prima prova di un elemento che funziona senza essere rappresentato in un prodotto diffusibile. I geni strutturali contigui a una mutazione Oc sono espressi costitutivamente perché la mutazione cambia l'operatore in modo che il repressore non può più legarvisi e non può, quindi, impedire alla RNA polimerasi di iniziare la trascrizione. Quindi i mutanti Oc sono cis-agenti perché controllano un sito fisicamente continuo. Una trascrizione costitutiva è causata anche da mutazioni del tipo lacI-, che sono causate da perdita di funzione. Quando il repressore è inattivo o assente, la trascrizione può iniziare a livello del promotore. Quindi i mutanti lacI- esprimono i geni strutturali in continuazione (costitutivamente), indipendentemente dalla presenza o dall'assenza dell'induttore, perché il repressore è inattivo. Bisogna ricordarsi che è la subunità della RNA polimerasi che riconosce le sequenze di un promotore. L'RNA polimerasi contenente la subunità 70 riconosce il promotore lac, precedentemente discusso, così come la maggior parte degli altri promotori di E.coli. Questo batterio però codifica per molte altre subunità

Biologia molecolare

Pagina 145 di 173

Domenico Azarnia Tehran

Sezione Appunti

che, in alcune circostanze, si possono sostituire a 70, dirigendo la RNA polimerasi su promotori alternativi. Uno di questi fattori alternativi è dato dal fattore inducibile al calore, 32, che aumenta quando le cellule di E. coli vengono sottoposte ad uno shock termico e permette la trascrizione di geni che proteggono la cellula da questo cambiamento ambientale. Talvolta una serie di alternativi permette un particolare programma di espressione genica. Nel batterio B. subtilis ne troviamo due tipici esempi. Il batteriofago SPO1 infetta questo batterio e lì cresce secondo il ciclo litico a dare la progenie fagica. Questo processo richiede che il fago esprima i propri geni in modo estremamente controllato. Tale controllo è imposto dalla polimerasi per mezzo di una serie di fattori alternativi. In seguito all'infezione, la RNA polimerasi batterica, contenente 70, riconosce i così detti promotori fagici precoci che codificano per delle proteine necessarie nei primi momenti dell'infezione. Uno di questi geni, chiamato gene 28, codifica per un fattore alternativo. Quest'ultimo prende il posto del fattore batterico e dirige la polimerasi su una seconda serie di promotori del genoma fagico, quelli associati ai geni chiamati “intermedi”. A sua volta uno di questi codifica il fattore necessario ai geni virali “tardivi”. Sebbene la maggior parte degli attivatori lavori per reclutamento, vi sono alcune eccezioni. NtrC e MerR rappresentano due esempi di attivatori che non funzionano tramite reclutamento, ma per mezzo di meccanismi di allosteria. Gli attivatori che lavorano per mezzo di reclutamento non fanno altro che portare una forma attiva di RNA polimerasi sul promotore. Nel caso degli attivatori che funzionano per mezzo di meccanismi allosterici, la polimerasi inizialmente lega il promotore in un complesso inattivo. Per stimolare la trascrizione, l'attivatore induce nel complesso un cambiamento conformazionale. NtrC controlla l'espressione di geni coinvolti nel metabolismo dell'azoto, come il gene glnA. Su questo gene, l'RNA polimerasi è pre-legata al promotore, in un complesso chiuso stabile. L'attivatore NtrC induce un cambiamento conformazionale nell'enzima, inducendo la transizione a complesso aperto. Come per il CAP, NtrC possiede due domini distinti per l'attivazione e il legame al DNA e lega il DNA solo in presenza di uno specifico segnale, in questo caso bassi livelli di azoto. NtrC viene fosforilato da una chinasi subendo un cambiamento conformazionale che espone il dominio di legame al DNA dell'attivatore. Una volta attivo, NtrC lega quattro siti a monte del promotore e interagisce direttamente con il fattore 54 presente nella RNA polimerasi. Per permettere questa interazione è necessaria la formazione di un loop del DNA compreso tra i siti di legame dell'attivatore ed il promotore. Lo stesso NtrC, a questo punto, dotato di un'attività ATPasica, fornisce l'energia necessaria per il cambiamento conformazionale dell'RNA polimerasi in complesso attivo ed aperto, che porta l'enzima a trascrivere. MerR, invece, controlla un gene denominato merT, che codifica per un enzima che rende le cellule resistenti agli effetti tossici del mercurio. Come NtrC, MerR induce un cambiamento conformazionale che porta alla formazione del complesso aperto. In questo caso, però, l'effetto allosterico dell'attivatore viene esercitato sul DNA invece che sull'RNA polimerasi. In dettaglio, MerR attiva il gene merT quando, in presenza di mercurio, si lega ad una sola sequenza di riconoscimento situata tra le regioni -10 e -35 del promotore merT, e opposta al sito di legame per l'RNA polimerasi che quindi può legarsi. Siccome gli elementi -10 e -35 sono sono caratterizzati da un'ottimale distanza e non sono allineati vengono ruotati e si ritrovano esposti su facce diverse della doppia elica. Inoltre, il legame di MerR (in assenza di mercurio) blocca il promotore nella conformazione sfavorevole: la polimerasi si può legare, ma non in modo da poter iniziare la trascrizione.

Biologia molecolare

Pagina 146 di 173

Domenico Azarnia Tehran

Sezione Appunti

Quando, invece, la proteina MerR lega il mercurio, subisce un cambiamento conformazionale che induce il DNA del centro del promotore a ruotare. Questa distorsione riporta le regioni -10 e -35 in una disposizione in qualche modo simile a quella trovata nei promotori riconosciuti da 70 e induce la trascrizione. Un altro operone molto importante in E. coli è l'operone araBAD, il cui promotore è attivato in presenza di arabinosio e in assenza di glucosio, e dirige l'espressione dei geni che codificano per gli enzimi necessari al metabolismo dell'arabinosio. In questo caso due attivatori lavorano insieme: AraC e CAP. Quando l'arabinosio è presente, AraC si lega a questo zucchero e adotta una configurazione che gli permette di legarsi come dimero sul DNA, su due mezzi siti adiacenti, araI1 e araI2. Subito a monte di questi siti c'è un sito CAP: quando il glucosio non è presente, CAP si lega in questa posizione e aiuta l'attivazione. In assenza di arabinosio, i geni araBAD non sono espressi. Questo avviene perché quando non è legato all'arabinosio AraC assume una diversa conformazione e lega il DNA in modo diverso: un monomero lega ancora il sito araI1, mentre l'altro monomero lega un mezzo sito più distante, detto araO2. Dal momento che questi due mezzi siti sono distanti 149 bp, il DNA compreso forma un ansa, e quindi non si verifica alcuna attivazione.

Biologia molecolare

Pagina 147 di 173

Domenico Azarnia Tehran

Sezione Appunti

98. Esempi di regolazione genica in passaggi successivi all'inizio di trascrizione Alcuni fagi hanno soltanto una strategia di sopravvivenza e, quando infettano un ospite suscettibile, ne sovvertono le funzioni allo scopo di produrre un grande numero di particelle fagiche figlie. Come risultato di questa infezione litica, il batterio ospite muore. Nel tipico ciclo litico, il DNA del fago (o l'RNA) entra nell'ospite batterico, i suoi geni sono trascritti in ordine stabilito, il materiale genetico del fago viene replicato e si producono i componenti proteici della particella fagica. Alla fine l'ospite batterico viene distrutto (lisato) per rilasciare le particelle figlie. Altri fagi hanno, invece, una doppia vita e sono capaci di perpetuarsi usando lo stesso tipo di ciclo litico come strategia per produrre il numero più alto di copie del fago nel minor tempo possibile, ma hanno anche una forma alternativa di esistenza, in cui il genoma del fago è presente nel batterio in una forma latente nota come profago. Questa forma di propagazione si chiama lisogenia. In un batterio lisogeno, il profago è inserito (integrato) nel genoma batterico e viene ereditato nello stesso modo dei geni batterici. In virtù della presenza di un profago, un batterio lisogeno ha un'immunità contro l'infezione di ulteriori particelle fagiche dello stesso tipo. Fra il modo litico e quello lisogeno avvengono transizioni che dipendono dalle condizioni di infezione e dai genotipi del fago e del batterio. Infatti, un profago può essere liberato dalle restrizioni della lisogenia dal processo chiamato induzione. Per prima cosa il fago è rilasciato dal cromosoma batterico per escissione e quindi il DNA libero procede attraverso la via litica. Comunque, la lisogenia è mantenuta dall'interazione di un repressore fagico con un operatore, mentre il ciclo litico richiede una cascata di controlli trascrizionali. La transizione fra i due stili di vita è compiuta stabilendo una repressione (da ciclo litico a lisogenia) o rilasciando un repressore (induzione da fago lisogeno a fago litico). Un altro tipo di esistenza all'interno dei batteri è rappresentato dai plasmidi, che sono unità autonome che esistono nella cellula come genomi extracromosomici. I plasmidi sono molecole circolari di DNA che si autoreplicano e sono mantenute nella cellula in un numero stabile e caratteristico. Alcuni plasmidi hanno anch'essi stili di vita alternativi e possono esistere nello stato autonomo o possono inserirsi nel cromosoma batterico e diventare dunque episomi. In generale, il fago comprende geni la cui funzione è quella di assicurare la replicazione del suo DNA all'interno dell'ospite. Lo sviluppo litico si svolge in una via in cui i geni del fago sono espressi in un ordine particolare, che assicura che la quantità appropriata di ogni componente sia presente nel numero giusto. Il ciclo si si può dividere in due parti generali: 1) l'infezione precoce descrive il periodo dell'ingresso del DNA all'inizio della sua replicazione e 2) l'infezione tardiva che definisce il periodo dall'inizio della replicazione al passaggio finale della lisi della cellula batterica per rilasciare le particelle fagiche figlie. Quindi, la fase precoce è dedicata alla produzione di enzimi coinvolti nella riproduzione del DNA, che comprendono quelli che riguardano la sintesi, la ricombinazione e talvolta la modificazione del DNA. Mentre, durante la fase tardiva vengono sintetizzati i componenti proteici della particella fagica. Comunque, il ciclo litico è sotto controllo positivo e ciascun gruppo di geni del fago può essere espresso soltanto quando viene dato un segnale appropriato dando luogo ad una cascata trascrizionale. Il primo stadio di espressione genica comporta l''espressione, grazie alla RNA polimerasi dell'ospite, di pochi geni i cui promotori sono indistinguibili da quelli dei geni dell'ospite. Il nome di questa classe di geni dipende dal fago, ma nella

Biologia molecolare

Pagina 148 di 173

Domenico Azarnia Tehran

Sezione Appunti

maggior parte dei casi sono noti come geni precoci. Nel fago lambda, hanno il nome di precoci immediati. Indipendentemente dal nome, uno di questi geni codifica sempre per una proteina necessaria per la trascrizione della classe successiva di geni (questa è la loro funzione principale). Questa seconda classe di geni prende nomi diversi come precoce ritardata o intermedia e la sua espressione inizia di solito non appena diventa disponibile la proteina regolatrice codificata dai geni precoci, e codificano per enzimi necessari per la replicazione del DNA fagico. Quando inizia la replicazione del DNA del fago, è giunto, invece, il momento di esprimere i geni tardivi, la cui trascrizione a questo stadio è di solito regolata dalla presenza di un ulteriore gene regolatore nella serie precedente di geni, e codificano per le componenti proteiche del fago. Questo fattore può essere un fattore antiterminazione (come nel fago lambda) o può essere un fattore sigma. Come abbiamo visto, a tutti gli stadi di espressione del fago, uno o più geni attivi sono regolatori necessari per lo stadio successivo. Il regolatore può prendere la forma di una nuova RNA polimerasi, di un fattore sigma che modifica la specificità dell'RNA polimerasi dell'ospite, o di un fattore antiterminazione che permette alla polimerasi di leggere un nuovo gruppo di geni. Nei primi due casi, quindi di una nuova polimerasi e odi un fattore sigma, la caratteristica critica che distingue la nuova serie di geni è il loro possesso di promotori diversi da quelli riconosciuti in origine dall'RNA polimerasi dell'ospite. L'antiterminazione, invece, fornisce ai fagi un meccanismo alternativo per controllare il passaggio dei geni precoci allo stadio successivo di espressione genica. L'uso dell'antiterminazione dipende da una disposizione particolare dei geni. I geni precoci, infatti, si trovano adiacenti ai geni che devono essere espressi nello stadio successivo, ma ne sono separati da siti terminatori. Se viene impedita la terminazione a livello di questi siti, la polimerasi legge attraverso i terminatori continuando nei geni che si trovano sull'altro lato. Quindi nell'antiterminazione, gli stessi promotori continuano a essere riconosciuti dalla RNA polimerasi e i nuovi geni sono espressi semplicemente estendendo la catena di RNA per formare molecole che contengono all'estremità 5' le sequenze dei geni precoci e all'estremità 3' le sequenze dei nuovi geni. Uno dei circuiti a cascata più intricati è utilizzato dal fago lambda. In realtà, la cascata per lo sviluppo litico è di per sé lineare, con due regolatori, ma il circuito per il ciclo litico è intrecciato con il circuito che stabilisce la lisogenia. Il DNA del fago è caratterizzato da un genoma di 50 kb, quindi circa 50 geni, e quando entra in una cellula ospite, la via litica e quella lisogena iniziano nello stesso modo. Entrambe richiedono l'espressione dei geni precoci immediati e precoci ritardati, ma poi divergono: lo sviluppo litico prosegue se vengono espressi i geni tardivi, mentre si instaura lisogenia se si stabilisce la sintesi del repressore. In fago ha soltanto due geni precoci immediati, trascritti dall'RNA polimerasi dell'ospite: 1) N codifica per un fattore antiterminazione la cui azione a livello di particolari siti permetta alla trascrizione di procedere nei geni precoci ritardati, mentre, 2) cro ha due funzioni: impedisce la sintesi del repressore (un'azione necessaria se deve procedere il ciclo litico) e spegne l'espressione dei geni precoci immediati (che non sono necessari successivamente nel ciclo litico). I geni precoci ritardati, invece, comprendono due geni di replicazione, sette geni di ricombinazione e tre regolatori. I regolatori hanno funzioni opposte. La coppia cII-cIII di regolatori è necessaria per stabilire la sintesi del repressore, mentre, il regolatore Q è un fattore antiterminazione che permette alla RNA polimerasi dell'ospite di trascrivere i geni tardivi. Quindi, possiamo dire, che alcuni geni precoci ritardati sono responsabili della lisogenia e altri del ciclo litico. In dettaglio,

Biologia molecolare

Pagina 149 di 173

Domenico Azarnia Tehran

Sezione Appunti

dobbiamo dire che, la regione interessata quindi contiene due geni (cI e cro) e tre promotori (PR, PL e PRM). Tutti gli altri geni fagici si trovano all'esterno di questa regione e sono trascritti direttamente da PR e PL (rispettivamente, il promotore di destra e quello di sinistra). PRM (il promotore per il mantenimento del repressore) trascrive soltanto il gene cI. I promotori PR e PL sono forti e costitutivi, ovvero legano con efficienza l'RNA polimerasi e permettono la trascrizione senza l'ausilio di un attivatore. PRM, invece, è un promotore debole che permette un'efficiente trascrizione solamente quando un attivatore è legato subito a monte. Quindi possiamo dire che si ha crescita litica quando i promotori PR e PL rimangono accesi, mentre quello PRM è spento. Al contrario, la crescita lisogenica è dovuta allo spegnimento di PR e PL e l'accensione di PRM. Come abbiamo detto, il gene cI codifica il repressore di , una proteina con due domini uniti da una regione flessibile. Il dominio N-terminale contiene la regione di legame al DNA (il dominio elica-giro-elica). Come per la maggior parte delle proteine che legano il DNA, il repressore di si lega come dimero; i siti principali per la dimerizzazione si trovano nei domini C-terminali. Un singolo dominio riconosce una sequenza di DNA di 17 bp ed ogni monomero riconosce mezzo-sito, esattamente come per il sistema lac. Comunque, nonostante il suo nome, il repressore di può sia attivare che reprimere la trascrizione. Quando funziona da repressore si lega ai siti che si sovrappongono al promotore escludendo l'RNA polimerasi. Invece, come attivatore funziona, come CAP, per reclutamento. Sia il repressore di che Cro (comunque anch'essa un repressore), quindi le due proteine regolatrici che abbiamo incontrato, possono legarsi a uno di sei diversi operatori. Ciascuna di queste proteine riconosce tali siti con diversa affinità. Tre siti si trovano nella regione di controllo di sinistra e gli altri tre in quella di destra. In maniera analoga a quelli di sinistra, i tre siti di legame sull'operatore di destra sono chiamati OR1, OR2 e OR3; questi siti sono tra di loro simili in quanto a sequenza ma non identici, e ciascuno di questi, può legare dia un dimero di repressore che uno di Cro. Queste interazioni sono dotate però di diversa affinità. In particolare, è necessaria una concentrazione di repressore dieci volte maggiore per legare OR2 rispetto a OR1. OR3 lega il repressore con la stessa affinità di OR2. Questo legame cooperativo delle proteine regolative viene usato per assicurare che i cambiamenti nei livelli di espressione di un dato gene possano essere notevoli anche in risposta a piccoli cambiamenti nei livelli del segnale che controlla quel gene. Quindi per capire come avviene la crescita litica e quella lisogena possiamo dire che: per la crescita litica un solo dimero di Cro è legato ad OR3; questo sito si sovrappone a PRM e quindi Cro reprime quel promotore. Quindi dal momento che né il repressore né Cro sono legati ad OR1 e OR2, PR lega l'RNA polimerasi e dirige la trascrizione dei geni litici; PL funziona nello stesso modo. Nella lisogenia, PRM è acceso mentre PR e PL sono spenti. Il repressore legato in modo cooperativo ad OR1 e OR2 blocca il legame dell'RNA polimerasi a PR, inibendo la trascrizione di quel promotore. Ma il repressore legato ad OR2 attiva la trascrizione da PRM. Finora abbiamo visto come il repressore e Cro regolano la crescita litica e quella lisogena e come si passi sa una all'altra in seguito ad induzione. Ora ci interesseremo degli eventi immediatamente successivi all'infezione, quelli che principalmente determinano quale strada imbocchi il fago. In questa scelta sono determinanti i prodotti di due altri geni, cII e cIII. Il primo si trova sulla destra di cI ed è trascritto da PR; cIII, mentre, è a sinistra di cI e la sua trascrizione deriva da PL. In dettaglio, CII è un attivatore trascrizionale, si lega ad un sito a monte di un promotore detto PRE (per repressor estabilishment,

Biologia molecolare

Pagina 150 di 173

Domenico Azarnia Tehran

Sezione Appunti

mantenimento del repressore) e stimola la trascrizione del gene cI (il repressore) da quel promotore. Quindi il gene che codifica per il repressore può essere trascritto da due diversi promotori (PR e PRE). Soltanto quando PRE ha portato alla produzione di una sufficiente quantità di repressore, quest'ultimo si può legare ad OR1 e OR2 e promuovere la propria sintesi da PRM. Quindi vediamo come la sintesi del repressore sia iniziata da un promotore (stimolato da un attivatore) per poi essere mantenuta da un altro promotore (controllato dal repressore stesso). Riassumendo, possiamo ora considerare come CII diriga la scelta tra sviluppo litico e lisogeno. In seguito all'infezione, la trascrizione parte immediatamente dai due promotori costitutivi PR e PL. PR guida la sintesi sia di Cro che di CII. L'espressione di Cro favorisce lo sviluppo litico: una volta che la quantità di Cro avrà raggiunto un certo livello, esso legherà OR3 e bloccherà PRM. Dall'altro lato, l'espressione di CII favorisce la crescita lisogenica, promuovendo la trascrizione del gene del repressore. Per l'instaurarsi della lisogenia, il repressore deve, quindi legarsi ad OR1 e OR2 ed attivare PRM prima che Cro possa inibire quel promotore. Ricapitolando, quando il fago infetta una popolazione di cellule batteriche sane ed in crescita vigorosa tende a propagarsi in modo litico, rilasciando la progenie in un ambiente in cui abbondano nuove cellule ospiti. Invece, quando le condizioni di crescita per i batteri sono povere, è più probabile che il fago dia origine a dei lisogeni che si inserisca nell'ospite stabilmente; infatti, probabilmente nelle vicinanze della progenie fagica vi saranno poche cellule da infettare. Queste diverse condizioni di crescita influenzano CII. In E. coli, CII è una proteina molto instabile e viene degradata da una specifica proteasi detta FtsH (HflB), codificata dal gene hfl. Le cellule prive di quest'ultimo gene, in seguito all'infezione di , danno quasi sempre origine a lisogeni: in assenza della proteasi, CII è stabile e dirige la sintesi di una grande quantità di repressore. Invece, se la crescita è buona, FtsH è molto attivo, CII subisce un'efficiente proteolisi, il repressore non viene sintetizzato e il fago tende a crescere in modo litico. In condizioni di scarsa crescita avviene l'opposto: una bassa attività di FtsH, una lenta degradazione di CII, l'accumulo del repressore e la tendenza all'instaurarsi della lisogenia. Nello sviluppo di troviamo altri esempi di regolazione che iniziano con un meccanismo di regolazione trascrizionale positivo chiamato antiterminazione. I due geni precoci immediati N e cro, sono trascritti dall'RNA polimerasi dell'ospite. N è trascritto verso sinistra e cro verso destra ed entrambi i trascritti terminano alla fine del gene. pN è il regolatore che permette di continuare la trascrizione nei geni precoci ritardati ed è un fattore antiterminazione che sopprime l'uso dei terminatori tL e tR. In presenza di pN, la trascrizione continua alla sinistra di N nei geni di ricombinazione e alla destra di cro nei geni di replicazione.

Biologia molecolare

Pagina 151 di 173

Domenico Azarnia Tehran

Sezione Appunti

99. La terminazione dei geni trp di b. subtilis e' controllata dal triptofano e dal tRNATrp Il circuito che controlla la trascrizione attraverso la terminazione può usare mezzi sia diretti che indiretti per rispondere al livello di piccoli prodotti o substrati. In B. subtilis, una proteina chiamata TRAP è attivata dal triptofano a legarsi a una sequenza nel leader del trascritto nascente. TRAP forma un multidimero di 11 subunità, ciascuna delle quali si lega ad un singolo triptofano e a un trinucleotide (GAG o UAG) sull'RNA che è avvolto in un cerchio attorno alla proteina. Il risultato è quello di assicurare la disponibilità delle regioni che sono necessarie per formare la forcina del terminatore. La terminazione della trascrizione impedisce quindi la produzione degli enzimi biosintetici del triptofano. In effetti, TRAP è un terminatore che risponde al livello del triptofano e in assenza di TRAP una struttura secondaria alternativa impedisce la formazione della forcina del terminatore. Ma la proteina TRAP è a sua volta controllata da tRNATrp. Quest'ultimo scarico si lega all'mRNA di una proteina chiamata anti-TRAP, sopprimendo la formazione di una forcina di terminazione nell'mRNA. Il risultato è la sintesi di anti-TRAP, che si lega a TRAP e le impedisce di reprimere l'operatore del triptofano. In seguito a questa serie complessa di eventi, l'assenza di triptofano genera il tRNA scarico, che provoca la sintesi di anti-TRAP, che impedisce la funzione di TRAP, che provoca a sua volta l'espressione dei geni del triptofano. L'espressione dei geni trp di B. subtilis è perciò controllata sia dal triptofano che da tRNATrp. Quando il triptofano è presente, non c'è bisogno che venga sintetizzato e la sintesi degli enzimi della via del triptofano è repressa dall'attivazione di TRAP da parte del triptofano. La presenza di tRNATrp scarico indica che c'è scarsità di triptofano e attiva quindi anti-TRAP accendendo la trascrizione dei geni trp.

Biologia molecolare

Pagina 152 di 173

Domenico Azarnia Tehran

Sezione Appunti

100. L'operone del tTRP di e- coli e' controllato da attenuazione In E. coli si usa un complesso sistema di regolazione, in cui i cambiamenti di struttura secondaria che controllano l'attenuazione sono determinati dalla posizione del ribosoma sull'mRNA. La terminazione richiede che il ribosoma possa tradurre un segmento leader che precede i geni trp nell'mRNA. Quando il ribosoma traduce questa regione leader a livello del terminatore 1 si forma una forcina di terminazione, ma quando il ribosoma non può tradurre il leader la forcina di terminazione non si forma e l'RNA polimerasi trascrive la regione codificante. Questo meccanismo di antiterminazione dipende perciò dall'influenza di circostanze esterne sul movimento del ribosoma nella regione leader. L'operone trp consiste di cinque geni strutturali disposti in una serie contigua, che codificano per i tre enzimi che convertono l'acido corismico in triptofano. La trascrizione inizia in corrispondenza di un promotore all'estremità sinistra del gruppo. Un attenuatore (terminatore intrinseco) si trova fra il promotore e il gene trpE e fornisce una barriera alla terminazione dei geni strutturali. La RNA polimerasi termina a livello dell'attenuatore sia in vivo che in vitro producendo un trascritto di 140 basi. La terminazione a livello dell'attenuatore risponde al livello del triptofano. In presenza di quantità adeguate di questo amminoacido, la terminazione è efficiente, ma in assenza di triptofano l'RNA polimerasi può continuare a trascrivere i geni strutturali. Il meccanismo regolatore è il seguente: quando la cellula esaurisce il triptofano, i ribosomi iniziano la traduzione del peptide leader, ma si fermano quando raggiungono i codoni Trp. La sequenza dell'mRNA indica che questo blocco del ribosoma influenza la terminazione a livello dell'attenuatore. La sequenza leader può essere scritta in strutture appaiate alternative. La capacità del ribosoma di procedere attraverso la regione leader controlla la transizione fra queste struttura, che determinano se l'mRNA può fornire le caratteristiche necessarie per la terminazione. Quando il triptofano è presente, i ribosomi sono in grado di sintetizzare il peptide leader e continuano lungo la sezione del leader dell'mRNA fino al codone UGA che si trova fra le regioni 1 e 2. Procedendo fino a questo punto, i ribosomi si estendono sopra la regione 2 e le impediscono di appaiarsi. Il risultato è che la regione 3 è disponibile a formare coppie di basi con la regione 4 e a generare la forcina del terminatore. In queste condizioni, l'RNA polimerasi termina perciò a livello dell'attenuatore. Quando, invece, non c'è triptofano, i ribosomi si bloccano a livello dei codoni Trp, che fanno parte della regione 1, e quindi questa regione resta sequestrata all'interno del ribosoma e non può appaiarsi con la regione 2. Ciò significa che le regioni 2 e 3 si possono appaiare prima che venga trascritta la regione 4, che è quindi obbligata a restare nella forma a singolo filamento. In assenza della forcina del terminatore, l'RNA polimerasi continua a trascrivere al di là dell'attenuatore.

Biologia molecolare

Pagina 153 di 173

Domenico Azarnia Tehran

Sezione Appunti

101. La regolazione genica negli eucarioti Le differenze fenotipiche che distinguono i vari tipi di cellule negli eucarioti superiori sono dovute in gran parte a differenze dell'espressione di geni che codificano per proteine, cioè quelli trascritti dalla RNA polimerasi II. In linea di principio, l'espressione di questi geni potrebbe essere regolata a livello di parecchi stadi e si possono distinguere almeno cinque punti potenziali di controllo, che formano la serie: 1) attivazione della struttura del gene, 2) inizio della trascrizione, 3) modificazione del trascritto, 4) trasporto nel citoplasma e 5) traduzione dell'mRNA. L'espressione genica negli eucarioti è controllata in gran parte a livello dell'inizio della trascrizione. Per la maggior parte dei geni, questo è il punto principale di controllo della loro espressione e comporta cambiamenti della struttura della cromatina, quindi dei nucleosomi, a livello del promotore, che permettono l'attacco dell'apparato basale di trascrizione (compresa la RNA polimerasi II) al promotore. Come nei batteri, i fattori regolativi che controllano un dato gene si legano a corte sequenze specifiche, ma negli eucarioti questi siti di legame sono molto più numerosi e posizionati anche molto distalmente dal punto di inizio della trascrizione. La zona del genoma dove l'apparato trascrizionale si lega viene indicata con il nome di promotore, mentre i siti di legame specifici sono i siti di legame regolativi. L'intero tratto di DNA dove risiedono i vari siti regolativi è indicato come sequenza regolativa. L'espansione di questa sequenza regolativa è sorprendentemente ampia negli organismi multicellulari, quindi inclusi i mammiferi. Infatti, in questi organismi, le sequenze regolative possono essere localizzate a distanza di migliaia di nucleotidi dal promotore, sia a monte che a valle, e possono essere formate da decine di siti, spesso raggruppati in una categoria di regolatori chiamati enhancer (amplificatori). Quest'ultimi legano i regolatori responsabili dell'attivazione di un gene in un determinato momento e nelle cellule appropriate. Enhancer diversi legano differenti gruppi di regolatori e controllano lo stesso gene a seconda dei segnali che arrivano agli stessi regolatori. Comunque, fra gli enhancer ed il gene regolato ci possono essere altri geni la cui espressione non viene influenzata da quell'enhancer. Inoltre, esistono altre sequenze regolative chiamate insulator (isolatori) che si interpongono fra gli enhancer ed il promotore, bloccando l'attivazione dei promotori da parte dei fattori legati agli enhancer.

Biologia molecolare

Pagina 154 di 173

Domenico Azarnia Tehran

Sezione Appunti

102. Diverse tipologie di fattori di trascrizione L'inizio della trascrizione coinvolge molte interazioni proteina-proteina tra fattori di trascrizione legati al promotore o a un enhancer oltre che tra fattori ed RNA polimerasi. Possiamo dividere i fattori necessari per la trascrizione in parecchie classi: 1) i fattori basali insieme alla RNA polimerasi, si legano al punto di inizio e alla TATA box; 2) gli attivatori sono fattori di trascrizione che riconoscono brevi elementi consenso specifici e si legano a siti sul promotore o sugli enhancer, facendo aumentare l'efficienza con cui l'apparato basale si lega al promotore e quindi la frequenza della trascrizione; 3) i coattivatori, non legano direttamente il DNA, ma forniscono una connessione fra gli attivatori l'apparato basale e funzionano mediante interazioni proteina-proteina, formando ponti fra gli attivatori e l'apparato di trascrizione; 4) alcuni regolatori, come le acetilasi, agiscono producendo cambiamenti alla cromatina. Comunque, gli attivatori e le altre proteine regolatrici richiedono due capacità: riconoscono sequenze bersaglio specifiche poste negli enhancer, nei promotori o in altri elementi regolatori che influenzano un particolare gene bersaglio e dopo essersi legato al DNA, un attivatore esercita la sua funzione legandosi ad altri componenti dell'apparato trascrizionale. Spesso un attivatore ha domini separati che legano il DNA e attivano la trascrizione e ciascun dominio si comporta da modulo separato che funziona in modo indipendente quando è unito a un dominio dell'altro tipo. La geometria dell'intero complesso di trascrizione deve permettere al dominio attivatore di contattare l'apparato basale indipendentemente dalla posizione esatta e dall'orientamento del dominio che lega il DNA. Ad esempio, abbiamo visto che in un tipico attivatore batterico, come CAP, la funzione di legame al DNA e quella di attivazione sono separate. Un esempio per gli eucarioti, invece, ci è dato da Gal4. Questa proteina attiva la trascrizione del gene del galattosio nel lievito S. cerevisiae. Questi geni codificano enzimi che servono per il metabolismo del galattosio. Uno di questi è chiamato GAL1. Gal4 si lega a quattro siti disposti a 275 bp a monte di GAL1, e in presenza di galattosio, la trascrizione di GAL1 viene attivata di 1000 volte. I domini di legame e di attivazione di Gal4 furono individuati mediante due esperimenti. In un primo esperimento, l'espressione di un frammento N-terminale del gene GAL4 (codificante un terzo della proteina) produceva un polipeptide che legava normalmente il DNA ma non attivava la trascrizione, quindi presentava solo il dominio legante il DNA ma non quello attivatore. In un secondo esperimento, venne prodotto un gene ibrido codificante per i tre quarti della regione N-terminale di Gal4 fusa al dominio di legame al DNA del repressore batterico LexA. In questo grado caso la proteina di fusione era in grado di attivare la trascrizione dei geni per il galattosio. Questo esperimento dimostra che l'attivazione non è mediata solamente nella presenza del sito di legame al DNA. Di fatto, questo dominio è necessario per guidare il dominio di attivazione sul promotore. Altri esperimenti furono fatti in diversi organismi modello, ma in tutti questi si dedusse che il dominio del legame al DNA e quello di attivazione sono fisicamente separati. Come abbiamo già visto nella regolazione procariotica, i regolatori si legano come dimeri al DNA bersaglio che normalmente presenta una sequenza simmetrica invertita. Ciascun monomero della proteina inserisce un' elica nel solco maggiore del DNA in corrispondenza di una metà del sito di riconoscimento. Il legame, di norma, non richiede significative alterazioni strutturali sia della proteina che del DNA. La maggior parte

Biologia molecolare

Pagina 155 di 173

Domenico Azarnia Tehran

Sezione Appunti

delle proteine batteriche utilizzavano, per legarsi al DNA, un motivo strutturale noto con il nome di elicagiro-elica (helix-turn-helix). Una delle due eliche (l'elica di riconoscimento) combacia col solco maggiore del DNA e riconosce la specifica sequenza nucleotidica. L'altra elica, invece, prende contatto con gli zuccheri-fosfato del DNA, posizionando l'elica di riconoscimento in modo corretto e aumentando la forza di legame. Le stesse modalità di riconoscimento sono utilizzate nella maggior parte degli eucarioti, seppure con alcune variazioni. Una classe di proteine regolative degli eucarioti presenta l'elica di riconoscimento come parte di una struttura molto simile a un dominio elica-giro-elica; in altre proteine invece il sito di riconoscimento si presenta con una struttura non riscontrabile nei procarioti, quella degli eterodimeri, o anche come monomeri. L'omeodominio consiste di tre eliche, di cui due formano la struttura elica-giroelica. L'elica 3 è quella di riconoscimento al DNA, infatti si inserisce nel solco maggiore. I residui amminoacidici presenti sul lato esterno, invece, prendono contatto specifico con le coppie di basi. Quindi le regioni N-terminali e C-terminali dell'omeodominio sono le principali responsabili del contatto al DNA. È comune che un attivatore abbia una struttura modulare in cui domini diversi sono responsabili dell'attacco al DNA e dell'attivazione della trascrizione e i fattori sono spesso classificati secondo il tipo di dominio che lega il DNA. Di solito un motivo relativamente breve presente in questo dominio è responsabile dell'attacco al DNA.

Biologia molecolare

Pagina 156 di 173

Domenico Azarnia Tehran

Sezione Appunti

103. Vari motivi di legami del DNA 1)Il motivo a dita di zinco (zinc finger) costituisce un dominio che lega il DNA che è stato riconosciuto per la prima volta nel fattore TFIIIA, necessario per la trascrizione dei geni dell'rRNA 5S da parte della RNA polimerasi III. In questi casi, l'atomo di Zn interagisce con i residui di Cys e di His e permette il mantenimento di una struttura contenente un' elica, deputata al legame con il DNA. Anche in questo caso, quindi, il DNA è riconosciuto, nel solco maggiore, da un' elica tenuta in posizione dallo zinc finger. Il dito vero e proprio contiene circa 23 amminoacidici e la regione che collega le dita è di solito di 7-8 amminoacidici. Alcune proteine contengono uno o più di questi domini che possono essere collegati l'uno all'altro testa-coda: ciò permette di aumentare la lunghezza del DNA riconosciuto e conseguentemente aumentare la forza di legame. Nella struttura cristallina del DNA legato ad una proteina con tre dita si vede: la parte C-terminale di ciascun dito forma -eliche che legano il DNA, mentre la parte N-terminale forma un foglietto . I tre tratti di elica si adattano in un giro della scanalatura principale e ognuno di essi (quindi ogni dito) prende due contatti sequenza-specifici con il DNA; 2)I recettori degli steroidi sono definiti come un gruppo da una relazione funzionale: ogni recettore è attivato dal legame di un particolare steroide, o meglio, il fattore proteico è inattivo fino a che non lega un piccolo ligando; in generale, gli ormoni steroidei sono sintetizzati in risposta a una varietà di attività neuroendocrine ed esercitano effetti importanti sulla crescita, sullo sviluppo dei tessuti e sull'omeostasi corporea. Questi composti hanno un meccanismo comune: sono tutte piccole molecole che si legano a un recettore specifico che attiva la trascrizione genica. I recettori steroidei, tiroidei, e per l’acido retinoico hanno un’organizzazione simile. Le regioni N-terminali non sono molto conservate e sono importanti per l’attivazione genica. La regione centrale è coinvolta e nel legame al DNA ed è la più conservata. La regione C-terminale lega l’ormone. La rimozione del dominio C-terminale rende le proteine costituzionalmente attive. I recettori steroidei hanno due dita, con un atomo di zinco che coordina un tetraedro di cisteine. Il dito N-terminale controlla la specificità del legame al DNA; il secondo dito controlla la distanza tra i siti di legame. Una prova diretta che il primo dito lega il DNA è stata ottenuta in un esperimento di “scambio di specificità”, in cui il dito del recettore degli estrogeni è stato deleto e sostituito dalla sequenza del recettore dei glucocorticoidi. La nuova sequenza riconosceva la sequenza GRE (il bersaglio usuale del recettore dei glucocorticoidi) invece di ERE (il bersaglio usuale del recettore di estrogeno), dimostrando che questa regione stabilisce la specificità con cui è riconosciuto il DNA; 3)Il motivo elica-giro-elica classico, di cui abbiamo discusso precedentemente; 4) il motivo anfipatico elica-ansa-elica (HLH, helix-loop-helix) che è stato identificato in alcuni regolatori dello sviluppo e in geni che codificano proteine eucariotiche che legano il DNA. Questo motivo è costituito da un tratto di 40-50 amminoacidi contenente due -eliche anfipatiche separate da una regione di collegamento (l'ansa) di lunghezza variabile. Un'elica anfipatica forma due facce, una che presenta amminoacidi idrofobici e l'altra che presenta amminoacidi carichi. Le proteine di questo gruppo formano sia omodimeri che eterodimeri per mezzo di interazioni tra le facce corrispondenti delle due eliche. La maggior parte delle proteine HLH contiene una regione adiacente al motivo HLH altamente basica e necessaria per l'attacco al DNA (le proteine che non contengono questa regione non possono legare il DNA);

Biologia molecolare

Pagina 157 di 173

Domenico Azarnia Tehran

Sezione Appunti

5) le cerniere di leucina consistono in un tratto di amminoacidi con un residuo di leucina ogni 7 posizioni. Una cerniera di leucina in un polipeptide interagisce con una cerniera di un altro polipeptide per formare un dimero (pinza). Vicino a ciascuna cerniera si trova un tratto di residui carichi positivamente che è coinvolto nell'attacco al DNA. Comunque, l'attività di un attivatore inducibile può essere a sua volta regolata in parecchi modi: 1) un fattore è tessuto-specifico perché è sintetizzato soltanto in un tipo particolare di cellula (questa situazione è tipica di fattori che regolano lo sviluppo); 2) l'attività di un fattore può essere controllata direttamente da una modificazione (come HSTF che è convertito nella forma attiva dalla fosforilazione); 3) un fattore è attivato o inattivato dall'attacco di un ligando; 4) un fattore dimerico può avere partner alternativi, un patner può provocare l'inattività e la sintesi del patner attivo può spostare il patner inattivo; 4) e altri.

Biologia molecolare

Pagina 158 di 173

Domenico Azarnia Tehran

Sezione Appunti

104. Reclutamento di complessi proteici indotto dagli attivatori trascrizionali eucariotici Abbiamo visto che nei batteri, nella maggior parte dei casi, un fattore stimola la trascrizione di un gene legandosi al DNA mediante un dominio strutturale specifico mentre con un altro, appartenente alla stessa proteina, interagisce direttamente con l'RNA polimerasi, posizionando così l'enzima sul gene. Anche gli attivatori eucariotici lavorano in questo modo, ma raramente, se non mai, attraverso un interazione diretta fra l'attivatore e la RNA polimerasi, piuttosto è l'attivatore che recluta la polimerasi indirettamente in due modi. Per prima cosa l'attivatore può interagire con componenti del complesso trascrizionale diverse dalla RNA polimerasi e soltanto successivamente richiamare l'enzima (come nel caso dell'utilizzo di un coattivatore). In secondo luogo gli attivatori possono richiamare proteine che modificano i nucleosomi e che, alternando la struttura della cromatina in vicinanza dei geni, aiutano la polimerasi a legarsi al DNA. Nel primo caso, come abbiamo già visto, il complesso trascrizionale eucariotico contiene, oltre alla RNA polimerasi, numerose altre proteine. Molte di queste sono dei complessi preformati come il Mediatore e il complesso TFIID. Gli attivatori interagiscono con uno o più di questi complessi e li posizionano sui geni. In verità la maggior parte del complesso trascrizionale arriva sul gene come un unico grande complesso detto oloenzima, che contene il Mediatore, l'RNA polimerasi ed alcuni dei fattori generali della trascrizione. Oltre all'attivazione, però bisogna ricordare, che esiste anche la repressione che agisce generalmente a livello della struttura della cromatina. In un caso specifico, la sequenza CAAT, è un bersaglio di regolazione. Due copie di questo elemento si trovano nel promotore di un gene per l'istone H2B che è espresso soltanto durante la spermatogenesi nel ricco di mare. Nelle gonadi di questo organismo, il promotore è legato dai fattori di trascrizione alla TATA box, alle CAAT box e a sequenze ottamero, ma nei tessuti embrionali, l'esclusione del fattore che lega CAAT dal promotore impedisce l'assemblaggio di un complesso di trascrizione. Oltre ai fattori generali di trascrizione, l’espressione genica può essere regolata da fattori che rispondono a stimoli specifici, come possono essere segnali di tessuto-specificità o di risposta agli ormoni. Queste proteine vengono chiamate fattori inducibili, e le loro sequenze di legame sul promotore o sull’enhancer sono detti elementi di risposta. Gli elementi di risposta per un dato fattore possono essere trovati su diversi geni, e un singolo gene può contenere più elementi di regolazione, come è il caso del gene umano per la metallotioneina (MT). Quest'ultimo gene rappresenta un esempio del modo in cui un singolo gene può essere regolato da molti circuiti diversi. La proteina metallotioneina protegge la cellula da concentrazione eccessive di metalli pesanti, legando il metallo e rimuovendolo dalla cellula. L'organizzazione del promotore di un gene MT contiene la TATA box e la GC box, che si trovano come al solito piuttosto vicine al punto di inizio e per il livello basale di espressione sono necessarie anche due elementi di livello basale (BLE, basal level element). TRE, invece, è una sequenza consenso presente in parecchi enhancer, ed è attivata da un attivatore, AP1, e questa interazione è parte dell'espressione costitutiva. La risposta induttiva ai metalli è conferita dalle sequenze multiple MRE che funzionano da elementi del promotore. La presenza di MRE conferisce la capacità di rispondere ai metalli pesanti.

Biologia molecolare

Pagina 159 di 173

Domenico Azarnia Tehran

Sezione Appunti

105. Il controllo della struttura della cromatina: attivazione trascrizionale Oltre al reclutamento diretto dell'apparato trascrizionale, la presenza di proteine che modificano i nucleosomi può essere fondamentale per l'attivazione di geni che sono impacchettati all'interno della cromatina. L'accessibilità al DNA (e quindi la trascrizione) è regolata da tre processi, interconnessi tra di loro, a livello della cromatina: 1) il rimodellamento della cromatina (il nucleosoma cambia conformazione rendendo delle sequenze accessibili), 2) le modificazioni post-traduzionali degli istoni (metilazione, acetilazione, fosforilazione, etc.) e 3) le varianti istoniche. Per quanto riguarda le modificazioni posttraduzionali degli istoni, come sappiamo le code N-terminali degli istoni si presentano modificate per l'aggiunta di una varietà di piccole molecole. Le lisine sono frequentemente modificate con l'aggiunta di gruppi acetilici o metilici e le serine sono soggette a modificazioni per l'aggiunta di gruppi fosforici. Tipicamente, i nucleosomi acetilati sono associati con regioni dei nucleosomi che sono trascrizionalmente attivi, mentre nucleosomi deacetilati sono associati a zone del cromosoma trascrizionalmente represse. A differenza dell'acetilazione, la metilazione della coda N-terminale degli istoni è associata sia con fenomeni di repressione che di attivazione della cromatina in funzione dell'amminoacido che viene modificato. È stato proposto che queste modificazioni formino un codice che può essere letto dalle proteine coinvolte nell'espressione genica; un ovvio cambiamento nelle code istoniche è che l'acetilazione e la fosforilazione determinano la riduzione delle cariche positive delle code istoniche; l'acetilazione della lisina neutralizza le sue cariche positive. Questa perdita di cariche riduce l'affinità delle code per l'impalcatura longitudinale del DNA che si presenta carico negativamente per la presenza dei residui fosforici. Le modificazioni delle code istoniche hanno, anche, un effetto diretto sulla funzione del nucleosoma permettendo la formazione di siti di legame per proteine regolative. Specifici domini strutturali chiamati bromodomini e cromodomini mediano queste interazioni. Il bromodominio è presente in proteine che interagiscono con le code acetilate degli istoni, mentre proteine contenenti il cromodominio interagiscono con le code metilate degli istoni. Molte delle proteine che contengono il bromodominio, inoltre, posseggono attività acetil trasferasica e agiscono specificatamente sulle code istoniche, facilitando il mantenimento e la creazione di cromatina acetilata. In generale, i modificatori dei nucleosomi possono essere di due tipi: quelli che aggiungono gruppi chimici alle code degli istoni, come le istone acetiltransferasi (HAT) o le istone metiltrasferasi, che aggiungono rispettivamente acetili e metili, oppure quelli che rimodellano i nucleosomi, come l'SWI/SNF ATPdipendenti. Alcune HATs coincidono con fattori proteici classificati come attivatori della trascrizione. Ad esempio CPB/p300, noto come coattivatore che interagisce con diversi fattori di trascrizione (recettori per gli ormoni, AP-1 e MyoD), acetila H4. PCAF invece acetila H3. Altre HAT coincidono con alcune TAFs della DNA polimerasi I. Oppure possiamo trovare degli enzimi che catalizzano la reazione inversa, come eliminare i gruppi acetilici, istone deacetilasi (HADC) e che quindi sono coinvolti in molti fenomeni di repressione genica.

Biologia molecolare

Pagina 160 di 173

Domenico Azarnia Tehran

Sezione Appunti

106. Tecniche di studio dei geni e della conformazione della cromatina Per lo studio dei geni e della conformazione della cromatina si usano diverse tecniche. Una di queste è l'immunoprecipitazione della cromatina (ChIP) che ci permette di stabilire quale sequenza del genoma è legata ad una particolare proteina. Le proteine possono essere isoforme degli istoni modificati ad un amminoacido particolare o ad altre proteine associate alla cromatina. Quando viene utilizzato con gli anticorpi che riconoscono le modifiche dell'istone, il ChIP può essere usato "per misurare" la quantità della modifica. Un esempio è la misura della quantità di acetilazione dell'istone H3 connessa con una regione specifica del promotore del gene nelle varie circostanze che potrebbero alterare l'espressione del gene. Gli istoni non sono le uniche che possano essere studiate usando questa tecnica. Gran parte dell'interesse recente è focalizzato anche nell'analisi della distribuzione dei fattori di trascrizione. L'utilizzo del ChIP prevede che le cellule siano inizialmente fissate con formaldeide per effettuare il cross-linking del DNA e poi la cromatina viene raccolta dalle cellule e sottoposta ad un processo di immunoselezione, che richiede l'uso degli anticorpi specifici (il cross-linking in vivo con formaldeide lega covalentemente le proteine al DNA con cui interagiscono). Le cellule vengono lisate e il DNA viene rotto in frammenti di 500-1000 bp mediante sonicazione. L'immunoprecipitazione (IP) con un anticorpo (AB) specifico per la proteina di interesse consente la separazione del DNA legato dal resto del genoma. Il cross-linking può essere rimosso mediante riscaldamento, e il DNA identificato mediante PCR. Tutte le sequenze del DNA unite con crosslinking alla proteina di interesse coprecipiteranno come componente del complesso della cromatina. Dopo l' immunoselezione dei frammenti di cromatina e purificazione di quelli associati a DNA, la rivelazione delle sequenze di DNA specifiche viene svolta. Se il DNA che sarà rilevato è associato alla modifica dell'istone o della proteina che è esaminata, la rappresentazione relativa di quella sequenza del DNA sarà aumentata (o sarà arricchita) tramite il processo di immunoprecipitazione. Solitamente una PCR standard è effettuata per identificare la sequenza del DNA (il gene o la regione del genoma) connessa con la proteina di interesse. Un altra tecnica è quella dei Microarray. Mentre la ChIP ci permette di studiare una sola sequenza che lega una proteina, quest'ultima ci permette di analizzare un gran numero di sequenza. La tecnica dei microarray nasce negli anni 90 al fine di indagare i livelli di espressione dei geni in una cellula. Essa è in grado di stabilire se un certo gene è attivo in quella cellula, cioè se la proteina corrispondente viene effettivamente prodotta e in quale misura. Oggi è possibile stabilire l’espressione per migliaia di geni contemporaneamente, confrontando allo stesso tempo due diversi tessuti, ad esempio campioni provenienti da pazienti diversi (uno sano e uno ammalato) o dallo stesso paziente (prima e dopo la cura). Un microarray, o DNA-chip, è un sistema miniaturizzato in cui su un apposito supporto di pochi cm2 vengono immobilizzati acidi nucleici a sequenza nota, detti sonde o probes, corrispondenti ai geni che si vogliono studiare. Da un campione biologico si preleva un’opportuna quantità di RNA, che è il prodotto intermedio del processo che dai geni conduce le proteine e che ha la caratteristica di riconoscere le sonde complementari alle quali si lega chimicamente. L’RNA viene sottoposto ad un processo di etichettatura con marker radioattivi o fluorescenti in modo da poterlo rilevare in fase successiva. Infine si procede alla ibridazione, dove la miscela di RNA viene messa in contatto con il microarray in modo

Biologia molecolare

Pagina 161 di 173

Domenico Azarnia Tehran

Sezione Appunti

che le sue molecole si leghino alle rispettive sonde. Il microarray viene poi letto da uno scanner, rendendo un’immagine in cui la luminosità o il colore di ogni punto è proporzionale alla quantità di RNA legatosi alla sonda in quel punto. L’immagine è acquisita ed elaborata al computer per produrre dati “raw image”, una misura dell’espressione genica per ogni gene presente sul chip. Comunque, entrambi le tecniche, la ChIP e i microarray, vangono combinate. Ad esempio se vogliamo vedere in quale regione del genoma è presente l'istone H3 acetilato sulla lisina 4, ci prepariamo un anticorpo specifico e con la ChIP isoliamo tutto il DNA. Quest'ultimo viene utilizzato per sondare un chip di microarray. Dopo una PCR lo marchiamo con fluorescenti e lo ibridizziamo, vedendo sul genoma quali sequenze portano la modificazione. Con questo processo costoso e complicato si è visto che l'acetilazione delle lisine H4K5, K8, K12 e K16 è correlata con l’attivazione genica. H4K16 sembra avere un ruolo più importante rispetto agli altri residui. Inoltre, si è visto che per l'attivazione della trascrizione è importante la metilazione delle lisine H3/K4, K36 e K79. Altri ricercatori hanno utilizzato diversi anticorpi per altrettante modificazioni e hanno visto come le modificazioni degli istoni variano durante la trascrizione di particolari geni (tanto più è alto il segnale, tanto più è presente la modificazione). Grazie a questi esperimenti si è visto che: H3K4me3 (trimetilato: me3) si accumula al 5' dei geni e si associa con la forma di inizio della RNA polII (fosforilata sulla S5); H3K36me3 si accumula, invece, al 3' dei geni e si associa con la forma di allungamento della RNA polII (fosforilata sulla S2) e, infine, H3K79me3 è correlato con l’attivazione genica ma il suo ruolo non è ancora ben definito. Quindi, possiamo dire, che esistono diverse modificazioni correlate con le varie fasi della trascrizione. Infatti, alcuni residui risultano metilati all'inizio ed altri nella fase di allungamento.

Biologia molecolare

Pagina 162 di 173

Domenico Azarnia Tehran

Sezione Appunti

107. L'eterocromatina, inattivazione trascrizionale, dipende da interazioni con gli istoni L'inattivazione della cromatina avviene per aggiunta di proteine alla fibra di nucleosomi e può essere dovuta a una varietà di effetti, fra cui la condensazione della cromatina che la rende inaccessibile all'apparato necessario all'espressione genica, l'aggiunta di proteine che bloccano direttamente l'accesso ai siti regolatori o a proteine che inibiscono direttamente la trascrizione. Due sistemi caratterizzati a livello molecolare coinvolgono HP1 nei mammiferi e il complesso SIR nel lievito. Il meccanismo generale di queste due proteine è molto simile. H3 metilato sulla lisina 9 lega la proteina HP1 tramite il cromodominio, il che indica il modello per l'inizio dell'eterocromatina. Prima la deacetilasi agisce per rimuovere la modificazione sulla lisina 14 e quindi la metilasi SUV39H1 agisce sulla coda dell'istone H3 per creare il segnale metilato a cui si legherà HP1. La regione inattiva può allora essere estesa dall'attacco di ulteriori molecole HP1 che interagiscono fra loro; possiamo quindi dire che HP1 agisce con un legame cooperativo per estendere la regione non attiva trascrizionalmente.

Biologia molecolare

Pagina 163 di 173

Domenico Azarnia Tehran

Sezione Appunti

108. Il rimodellamento della cromatina I fattori di rimodellamento, di cui ne esistono molte famiglie, cambiano la conformazione della cromatina. Alcuni complessi portano ad attivazione genica mentre altri a repressione. Tutti, comunque, richiedono l'utilizzo di ATP in quanto il nucleosoma è in un complesso molto stabile. In generale i fattori di rimodellamento catalizzano diverse reazioni: sliding, abbimo lo scivolamento del DNA senza il distacco dal nucleosoma, ejection, il DNA si dissocia dal nucleosoma, H2A-H2B dimer ejection, il complesso che è meno stabile si distacca e quindi viene tolto, mentre nel replacment, troviamo delle varianti di H2A e H2B. Sicuramente, le famiglie più importanti dei fattori di rimodellamento sono: SWI/SNF e ISWI. Nelle prime c'è sempre un bromodominio che riconosce i residui acetilati quindi i due sono correlati nel senso che un acetilazione può richiamare un fattore i rimodellamento. In ISWI, invece, troviamo due domini: SANT e SLIDE, che si legano rispettivamente presso le code istoniche e sul DNA linker; in quest'ultimo caso SLIDE occupa 10-20 bp sul DNA linker spaziando i nucleosomi in maniera regolare.

Biologia molecolare

Pagina 164 di 173

Domenico Azarnia Tehran

Sezione Appunti

109. Varianti degli istoni Non tutte le varianti istoniche possono essere trattate, ma le principali sono: la deposizione di H3.1 è strettamente legata alla replicazione del DNA, ma può essere si accoppiata alla replicazione che indipendente. È presente preferenzialmente a siti trascrizionalmente attivi; H3.3 è arricchito in modificazioni post-traduzionali tipiche delle regioni trascrizionalmente attive: K4 è trimetilata, K79 metilata, K9, K18 e K23 acetilate. Inoltre, H3.3 è presente a bassi livelli durante la divisione cellulare. Il suo livello aumenta nelle cellule differenziate fino a rappresentare il 50% del totale; H2A.Z (Htz1 in lievito) ha un ruolo nell’espressione genica, nel silenziamento genico e nella segregazione dei cromosomi. Ha il 60% di omologia con H2A; H2A.X è l’istone principale in lievito. La fosforilazione del residuo S139 è uno dei primi eventi della risposta ai Double Strand Breaks (DSB); MacroH2A è una variante specifica dei vertebrati con un grande dominio C-terminale non-istonico(Macro domain). Il cromosoma X inattivo (Xi) delle femmine dei mammiferi è arricchito della variante MacroH2A;

Biologia molecolare

Pagina 165 di 173

Domenico Azarnia Tehran

Sezione Appunti

110. I siti ipersensibili alla dnasi i cambiano la struttura della cromatina, la metodologia frap e gli histone chaperones Oltre alle modificazioni generali che si verificano nelle regioni attive o potenzialmente attive, avvengono anche cambiamenti strutturali a livello di siti specifici associati all'inizio delle trascrizione o a certe caratteristiche strutturali del DNA, che sono stati rilevati per la prima volta dagli effetti della digestione con concentrazioni molto basse dell'enzima DNasi I. Quando si digerisce la cromatina con questo enzima, il primo effetto è l'introduzione di rotture nel duplex in siti ipersensibili specifici. Poiché la suscettibilità alla DNasi I riflette la disponibilità del DNA nella cromatina, si assume che questi siti rappresentino regioni della cromatina in cui il DNA è particolarmente esposto perché non è organizzato nella solita struttura nucleosomica. Le posizioni di questi siti ipersensibili possono essere determinate mediante la tecnica della marcatura terminale indiretta. In questo caso, il taglio a livello di questi siti da parte della DNasi I è usato per generare un'estremità del frammento di cui si misura la distanza dall'altra estremità generata dal taglio con un enzima di restrizione. Comunque, molti siti ipersensibili sono correlati all'espressione genica. Ogni gene attivo possiede un sito, o talvolta più di un sito, nella regione del promotore. La maggior parte dei siti ipersensibili si trova soltanto nella cromatina di cellule in cui il gene associato è espresso e non si trova quando il gene è inattivo. Quindi possiamo dire che in generale, la regione del promotore dei geni attivi è priva di nucleosomi (ne mancano 1-2). Ad esempio, nel gene della -globina, nelle cellule emapoietiche, è molto attiva la regione collegata al promotore e quindi è ipersensibile alla DNasi I. Se vogliamo invece analizzare la dinamica di una proteina con il suo sito dobbiamo fare affidamento ad una metodologia denominata FRAP (Fluorescence Recovery After Photobleaching) che appunto consente di studiare in vivo la cinetica di legame di specifiche proteine. Prima di tutto, si introduce, nella nostra coltura cellulare un transgene, ossia un gene che produce una proteina unita a un TAG fluorescente (GFP) che ne permette l’identificazione. Il transgene viene espresso e quindi si illumina una piccola area del nucleo. A questo punto con un raggio laser inattiviamo irreversibilmente il probe fluorescente (photobleaching). La proteina non viene modificata ma viene modificata solo la GPF che non emette più fluorescenza. L’area irradiata viene monitorata nel tempo e ne viene misurata la fluorescenza. Il tempo di recupero del segnale fluorescente dipenderà dalla dinamica di scambio della proteina. Se il recupero della fluorescenza è rapido vuol dire che c'è uno scambio veloce tra la proteina che era nell'area iniziale e le altre proteine; mentre, se non c'è recupero della fluorescenza vuol dire che la proteina è immobile. Il t50 (tempo necessario per recuperare il 50% della fluorescenza originaria) della maggior parte delle proteine esaminate è tra 3 e 8 secondi, mentre per arrivare al plateau il tempo richiesto varia tra 35 a 45 secondi. Se misuriamo H2A, H3 d H4 con questa tecnica osserveremo che spesso il t50 è molto lungo, a significare che i nucleosomi sono molto stabili. Lo scambio degli istoni avviene grazie agli histone chaperones, fattori che si associano con gli istoni per facilitare e controllare le loro interazioni con altre molecole, senza però fare parte del prodotto finale. Essi intervengono anche nel trasporto dal citoplasma al nucleo, nel deposito, nell’assemblaggio del nucleosoma, nella degradazione Un chaperones molto importante è Asf1 specifico per H3 e H4, che interagisce con dei fattori di assemblaggio come CAF1, per assemblare questi due istoni, ma può anche attuare la reazione

Biologia molecolare

Pagina 166 di 173

Domenico Azarnia Tehran

Sezione Appunti

inversa, ossia quella di dissociazione. Asf1 interagisce anche con altri fattori, come HIRA che è coinvolto nell'assemblaggio replicazione indipendente. HIRA scambia l'istone H3.1 canonico e inserisce la variante H3.3 che si trova più frequentemente nei geni trascritti. Un esperimento, per vedere se vi è scambio istonico a livello di un gene trascritto e se questo processo avviene dopo che il gene è stato attivato, è stato verificato da alcuni ricercatori in lievito. Questi hanno tolto i geni per l'istone H3 e gli hanno sostituiti con un gene H3 con Myc controllato dal promotore pHHT2 e un altro con a monte Flag e il promotore pGal, del galattosio. Al t=0, senza l'aggiunta di galattosio, abbiamo sempre l'espressione della proteina Myc. Se, invece, induciamo la sintesi del galattosio avremo l'istone H3 taggato con Flag. Attraverso immunoprecipitazione della cromatina possiamo osservare a diversi tempi la presenza di H3 taggato o con Myc o con Flag e quindi, come vengono a sostituirsi nel tempo. In questo modo, e con l'utilizzo di una mappa da microarray, vedremo il colore rosso dove vi è stato un alto scambio istonico. Questo colore ricorre infatti nella regione del promotore dove vi è un alto turnover, scambio, istonico. In vitro, la trascrizione e quindi la polimerasi parte ma quando arriva ai nucleosomi si blocca. Il complesso più importante, che permette la trascrizione, è FACT (Facilitates Chromatin Trascription). Questo fattore presenta due subunità: una è una rimodellatore della cromatina mentre l'altra è un chaperon che si lega al nucleosoma e provoca una parziale dissociazione dello stesso tagliando un dimero H2A/H2B. Quindi, il modello che si può considerare comprende: la cromatina che si dissocia e riassocia durante la trascrizione; FACT e altri chaperones e fattori di rimodellamento mediano la dissociazione/riassociazione e, infine, modificazioni specifiche sono collegate al processo di dissociazione/riassociazione della cromatina. Quindi ricapitolando tutto il processo di trascrizione avremo: una prima fase in cui abbiamo un complesso di preinizio dove tutte le proteine sono legate a una sequenza di DNA priva di nucleosomi ma ancora non si ha la trascrizione; per procedere la polimerasi deve uscire dal promotore e si è visto che in questa seconda fase vi sono vari prodotti abortivi di 50 nt, proprio come nei procarioti. A questo punto, la regione C-terminale dell'RNA polimerasi II (CTD) che contiene numerose serine, viene fosforilata per procedere nella sintesi. Una fosforilazione molto importante è quella della serina 5 grazie a CDK7 che è una chinasi. Successivamente la polII lega molteplici fattori: NELR, che non permette l'allungamento ma favorisce la formazione del complesso aperto, DSIF e PAF1, che reclutano diverse istone metiltransferasi, tra cui Set1 che metila H3K4 e Rad6 che ubiquitina H2B. Nella parte finale dell'inizio della trascrizione interviene pTEFb che fosforila la serina 2 della polimerasi II, in maniera tale da fornire il segnale per il distacco di DSIF e NELR dalla stessa polimerasi II, in maniera tale che possa iniziare la fase di elongazione. Recentemente è stato scoperto che la maggior parte dei promotori nell'uomo sono divergenti, ossia vi sono due RNA polimerasi II che vanno in direzione opposta, quindi una anche antisenso. Si pensa che questo servi per generare riavvolgimenti negativi a valle che possono aiutare il processo di trascrizione del gene vero e proprio. Comunque, i trascritti della RNA polimerasi II antisenso sono piccoli e vengono degradati.

Biologia molecolare

Pagina 167 di 173

Domenico Azarnia Tehran

Sezione Appunti

111. Eterocromatina, eucromatina ed eredità epigenetica I geni attivi spesso mostrano una elevata sensibilità al taglio con la DNasi I, indicativa di una regione non protetta dalla presenza di nucleosomi, o comunque più accessibile. Come regola generale si può affermare che le regioni di eterocromatina sono trascrizionalmente inattive, e che le regioni attivamente trascritte mostrano una organizzazione della cromatina modificata e meno compattata detta eucromatina. L’eterocromatina viene distinta in due tipi. L’eterocromatina costitutiva contiene sequenze specifiche che non hanno funzione codificante. Un esempio tipico sono i DNA satelliti che si trovano nelle regioni centromeriche. L’eterocromatina facoltativa, invece, si forma su regioni che possono differire da una linea cellulare a un’altra. Un esempio riguarda l’inattivazione di uno dei cromosomi X nel sesso femminile dei mammiferi. L’inattivazione genica legata alla formazione di eterocromatina è ereditabile dalle cellule figlie. Questo fenomeno prende il nome di eredità epigenetica, in quanto non coinvolge mutazioni nel DNA. Quindi, ad esempio, quando un gene viene trasferito, o per traslocazione cromosomica o per integrazione, in una posizione adiacente a eterocromatina, può diventare inattivo come risultato della nuova posizione, il che implica che è diventato eterocromatico. Questa inattivazione è il risultato, appunto, di un effetto epigenetico e può essere diversa nelle singole cellule di un animale e portare al fenomeno della variegatura da effetto di posizione, in cui cellule geneticamente identiche hanno fenotipi diversi. Ad esempio in Drosophila, si osserva variegatura da effetto di posizione nell'occhio, in cui alcune regioni sono prive di colore mentre altre sono rosse, in quanto il gene white è inattivo dall'eterocormatina adiacente in alcune cellule, mentre resta attivo in altre cellule. La spiegazione di questo effetto sta nell'inattivazione genica, che si diffonde dall'eterocromatina nella regione adiacente per una distanza variabile. In alcune cellule procede per una distanza sufficiente a inattivare un gene circostante ma in altre non lo fa. Una volta inattivata viene ad essere trasmessa alle generazioni successive.

Biologia molecolare

Pagina 168 di 173

Domenico Azarnia Tehran

Sezione Appunti

112. Silenziamento genico Come abbiamo detto, la più comune forma di silenziamento è associata ad una conformazione della cromatina che la rende più densa, detta eterocromatina. Quest'ultima è frequentemente associata a particolari regioni del cromosoma come i telomeri e i centromeri. Si è visto, infatti, che se un gene viene sperimentalmente spostato all'interno di queste regioni, questo gene viene generalmente spento. Nelle cellule di mammifero è stimato che circa il 50% del genoma è in uno stato eterocromatico. Inoltre, abbiamo detto che la regione eterocromatica può espandersi, ma questa sua espansione, come anche l’azione a distanza di un enhancer, può essere bloccata dall’azione di una regione detta isolatore. Non è ancora ben chiaro il suo modo d’azione. In lievito, invece, il silenziamento genico è tipico delle regioni telomeriche. La proteina Rap1 si lega sulle sequenze telomeriche e recluta il complesso Sir (Sir2, Sir3, Sir4). Sir2 è una HDAC (deacetilasi degli istoni) e il complesso Sir si lega preferenzialmente a nucleosomi ipoacetilati. In questo modo la regione silenziata si espande nella regione subtelomerica, grazie appunto alla deacetilazione che è un segnale di repressione della trascrizione. Oltre a modificazioni degli istoni (come la trimetilazione del residuo H3K9) anche la metilazione del DNA è correlata con l’inattivazione genica, probabilmente per il legame di proteine che riconoscono il DNA metilato (MeCP1, MeCP2). Dal 2 al 7% delle citosine del DNA di cellule animali è metilato, specialmente sul dinucleotide 5' meCG 3'. Si è visto che le regioni di eterocromatina sono ipermetilate, mentre le regioni attivamente trascritte sono demetilate. Lo stato di metilazione può essere perpetuato da un enzima che riconosca come substrato solo i siti emimetilati. In organismi come Drosophila il DNA non è metilato. Lo stato di metilazione è controllato da tre tipi di enzimi: de novo metilasi è richiesta per metilare nuovi siti, la metilasi di mantenimento per la perpetuazione , e la demetilasi per rimuovere gruppi metile in siti specifici. Metilazione e demetilazione sono fenomeni tipici dell’embriogenesi. I gameti sono sostanzialmente ipermetilati, ma spermatociti e oociti presentano patterns di metilazione differenti. Durante l’embriogenesi si ha una sostanziale demetilazione, seguita da metilazione di regioni specifiche in correlazione con il differenziamento cellulare. Per studiare la distribuzione dei gruppi metile si possono usare gli enzimi di restrizione MspI e HpaII. Questi enzimi riconoscono la stessa sequenza (CCGG), ma MspI non taglia la sequenza metilata. La metilazione del gene, in particolare della regione del promotore, porta all’inattivazione. Nei mammiferi, invece, la regione al 5' di molti geni (circa il 60% nell’uomo) è caratterizzata dalla presenza di una frequenza di dinucleotidi CG superiore alla media. Sono le isole CG, lunghe 1-2 kb e con un contenuto G+C superiore al 60%. Tutti i geni espressi costitutivamente (housekeeping) hanno isole CG demetilate (metà del totale delle isole). Il fenomeno dell'imprinting genomico, porta all’espressione soltanto dell’allele materno oppure paterno. E’ un tipo di regolazione presente nei mammiferi (circa 80 geni) e nelle piante ed è collegato con i pattern di metilazione specifici delle cellule germinali. L’imprinting è riprogrammato nella linea germinale ossia, lee marcature di metilazione del DNA vengono cancellate nelle cellule germinali. I geni coinvolti sono poi metilati de novo in uno dei gameti. Nell’uomo i geni H19 e Igf2 sono controllati dall’imprinting. Nel cromosoma materno H19 è espresso, mentre Igf2 è inibito dal legame delle proteine CTFC all’isolatore. Nel

Biologia molecolare

Pagina 169 di 173

Domenico Azarnia Tehran

Sezione Appunti

cromosoma paterno Igf2 è espresso e H19 è represso a causa della metilazione dell’isolatore e del promotore di H19. Un altro esempio di eredità epigenetica è l'inattivazione del cromosoma X nelle femmine di mammifero, in cui è un intero cromosoma a venir inattivato in seguito alla formazione di una struttura di eterocromatina. L’inattivazione del cromosoma X è regolata dall’attività di una regione, situata sullo stesso cromosoma X, chiamata Xic (X-inactivation center). Vari passaggi sono implicati (conteggio degli X, scelta, inizio del silenziamento, formazione e mantenimento della struttura repressa) e coinvolgono diversi prodotti genici e l’instaurazione di diverse caratteristiche tipiche dell’eterocromatina. Il prodotto più importante della regione Xic è Xist, un lungo RNA non codificante di 17 kb. Prima dell’inizio dell’inattivazione Xist è codificato a bassi livelli da entrambi gli X. Quindi la trascrizione di Xist del cromosoma che verrà inattivato aumenta molto, mentre viene represso il gene del cromosoma X che rimarrà attivo. Aumenta anche la stabilità dello Xist espresso, che forma una copertura del cromosoma inattivato. La struttura complessiva di Xist è ben conservata tra le varie specie. In particolare, l’esone 4 forma una caratteristica struttura a forcina. La stabilità e l’espressione di Xist è regolata dal gene Tsix, che produce un RNA antisenso rispetto a Xist. Tsix è represso sul cromosoma X inattivato e espresso sul cromosoma X attivo, in maniera inversa rispetto a Xist. La sintesi di Xist non è necessaria per il mantenimento della struttura repressa, che prevede la deacetilazione degli istoni, la metilazione del DNA e la presenza massiccia di macroH2A, una variante dell’istone H2A. Il reclutamento delle altre componenti che contribuiscono alla formazione della struttura eterocromatica è probabilmente mediato da Xist. Oltre a deacetilazione degli istoni e metilazione del DNA, in una fase precoce avviene la metilazione della Lisina K9 dell’istone H3.

Biologia molecolare

Pagina 170 di 173

Domenico Azarnia Tehran

Sezione Appunti

113. Silenziamento genico post trascrizionale - interferenza dell'RNA - e miRNA Per anni i biologi molecolari hanno usato RNA antisenso per inibire selettivamente l'espressione genica in cellule viventi. All'inizio, la logica era che l'RNA antisenso, complementare all'mRNA, si appaiasse all'RNA per inibire la traduzione. La strategia solitamente funziona, ma la logica era fallace. Nel 1995, infatti, alcuni scienziati stabilirono che l'iniezione di RNA di senso nelle cellule funzionava altrettanto bene di quella di RNA antisenso nel bloccare l'espressione di un particolare gene. Poi nel 1998, Andrew Fire e i suoi colleghi mostrarono che RNA a doppio filamento (dsRNA) funzionava ancora meglio sia dell'RNA di senso che di quello antisenso. Infatti, la ragione principale per cui gli RNA di senso e di antisenso funzionavano sembra essere che essi erano contaminati da (o producessero) piccole quantità di dsRNA, e che fosse il dsRNA, in realtà, a bloccare l'espressione genica. In più, i biologi molecolari cominciarono a notare che l'inserzione di transgeni in vari organismi induceva, a volte, effetti contrari a quelli desiderati. Invece di attivare il transgene, gli organismi spesso disattivavano non solo il transgene, ma anche la copia cellulare normale del gene. Questo fenomeno fu chiamato con diversi nomi: cosoppressione e silenziamento genico post trascrizionale (PTGS) nelle piante, interferenza dell'RNA (RNA interference, RNAi) negli animali. Come sappiamo gli RNA eucariotici si dividono in: coding RNAs, che vanno ad essere processati per la produzione di proteine (2% degli RNA totali) e da non-coding RNAs, che invece non codificano per proteine ma sono coinvolti in molti processi come lo splicing (98% degli RNA totali). Quest'ultima classe può essere ulteriormente suddivisa in large e small RNA che si differenziano a seconda del numero di basi. Nella classe degli small RNA fanno parte due RNA importanti definiti: siRNA e miRNA, che riescono a riconoscere la loro sequenza bersaglio attraverso complementarietà. Tutti gli siRNA e i miRNA delle piante, essendo molto piccoli 20-25 nt, vengono associati ad un complesso proteico detto RISC che ne evita la degradazione. Successivamente riconoscono l'mRNA bersaglio e grazie a complementarietà si appaiano. A questo punto si ha il taglio dell'mRNA stesso che risulterà instabile e quindi verrà degradato. In questo modo i siRNA e miRNA, delle piante, impediscono l'espressione di un particolare gene grazie alla degradazione dell'mRNA prodotto. I miRNa nell'uomo, invece, che sono protetti dalla degradazione dalla proteine miRNP, non si appaiano in maniera perfettamente complementare con l'mRNA bersaglio e quindi non si ha il taglio e la degradazione dell'mRNA stesso ma solo il suo silenziamento, bloccando la traduzione. Quindi i due meccanismi saranno distinguibili a seconda se la degradazione dell'mRNA è avvenuta oppure no. Invece, i rasiRNA, appartenenti sempre al gruppo degli small RNA, risultano complementari a regioni del promotore e permettono il reclutamento di enzimi che modificano la cromatina in maniera tale da silenziare il gene. Come dicevamo, l'RNA interference è un novo meccanismo di regolazione dell’espressione genica che regola i livelli di un trascritto mediante : soppressione trascrizionale (trascriptional gene silencing, TGS) o degradazione dell’RNA mediante un processo sequenza specifico (post trascriptional gene silencing PTGS/RNA interference (RNAi). Le osservazioni sperimentali furono primariamente riportate per il mondo vegetale e successivamente eventi di RNAi furono descritti in quasi tutti gli organismi eucariotici (protozoi, Drosophyla, nematodi, topi e linee cellulari umane). Intorno agli anni '80, alcuni scienziati volendo generare begonie con colori vivaci diversi inniettarono più copie geniche di pigmento. Essi videro, però, che

Biologia molecolare

Pagina 171 di 173

Domenico Azarnia Tehran

Sezione Appunti

all'aumentare dei geni che inserivano, le begonie reagivano diventando o sempre più bianche o sempre più viola o bianche e viola. All'inizio pensarono ad un errore nelle metodologie utilizzate ma successivamente scoprirono che l'RNA del transgene da loro iniettato non corrispondeva all'mRNA ricavato dalle piante ma era una “banda” molto corta, quindi pensarono fosse avvenuta degradazione. Quest'ultima ipotesi della degradazione però venne subito accantonata in quanto gli RNA trovati erano sì molto corti, circa 25 nt, ma nello stesso tempo molto stabili. Allora estrassero questo nuovo RNA e lo sequenziarono e notarono che questo particolare RNA era in grado di inibire sia il transgene che il gene endogeno. Contemporaneamente, a questo esperimento si vide anche che piante transgeniche che avevano incorporato il genoma del virus PVY, se sottoposta a nuova infezione non morivano. Successivamente si scoprì che questo virus a RNA produceva RNA capace di appaiarsi con l'RNA prodotto dalla stessa pianta. Inoltre, Fire e i suoi colleghi mostrarono che iniettando le gonadi di C. elegans con dsRNA (il dsRNA iniziatore, o trigger) si causavano RNAi negli embrioni risultanti. Inoltre, essi rilevarono la perdita dell'mRNA (l'mRNa bersaglio) negli embrioni sottoposti a RNAi. La stessa cosa si osservò negli anni successivi sempre in C. elegans, dove quando veniva introdotto un dsRNA la proteina GFP non si esprimeva, e in Neurospora Crassa dove si notava un fenomeno detto quelling (cambia solo il nome ma il meccanismo è lo stesso), dove l’introduzione di un transgene causa il silenziamento del gene omologo endogeno albino-1 (al-1), codificante per una proteina della via biosintetica dei carotenoidi. Quindi, il transgene causa la soppressione di entrambi i geni esogeno ed endogeno. Comunque, in maniera più dettagliata, possiamo dire che i siRNA sono elementi a doppio filamento di circa 19 nt e non appaiati per tutta la loro lunghezza in quanto presentano il filamento 3' sporgente. Il meccanismo dell'RNAi, inizia con il taglio da parte dell'enzima Dicer del dsRNA, che come sappiamo può derivare da un genoma virale oppure da un transgene, in piccoli frammenti di 22 nt. Il taglio operato rilascia piccoli frammenti di siRNA che hanno estremità sfalsate. Una volta prodotti, questi pezzi di RNA vengono accorpati nel complesso RISC, in cui soltanto uno dei due filamenti viene conservato, mentre l'altro degradato. A questo punto, il filamento che trova complementarietà con l'mRNA indurrà la degradazione dello stesso mRNA. La proteina Dicer presenta un dominio PAZ che riconosce l'estremità del dsRNA che si posiziona in sequenze ben precise dove avviene il taglio catalitico. Il dominio PAZ è stato riscontrato anche nelle proteine AGO che formano un complesso stabile per proteggere il dsRNA dalla degradazione. Quindi questo dominio è utile sia per il taglio che per il rivestimento. Nelle piante è presente anche la proteina RdRP, una polimerasi RNA dipendente che riconosce RNA e trascrive RNA. Nei mammiferi, invece, non abbiamo il silenziamento dovuto a dsRNA, in quanto le cellule sono in grado di riconoscerlo e considerarlo estraneo inducendo la via dell'apoptosi. Se questi dsRNA, però, risultano molto piccoli, su sequenze specifiche nell'uomo può avvenire il silenziamento di un solo mRNA senza indurre morte cellulare. Il primo microRNA fu scoperto nel 1993 in C. elegans e solo nel 2003 si scoprirono anche nei mammiferi. In elegans si vide che questi miRNA erano coinvolti nella regolazione dello sviluppo. Infatti, furono trovati degli stadi larvali mutanti che non erano in grado di andare aventi nello sviluppo. Per questo, attraverso un test di complementazione, trovarono che vi era appunto complementazione nel gene lin-4 ma non riuscirono

Biologia molecolare

Pagina 172 di 173

Domenico Azarnia Tehran

Sezione Appunti

a trovare la proteina codificata. Pensarono dunque come intermediario, non più ad una proteina ma ad un RNA, per questo con effettuarono un Northen blot, trovando corte sequenze di RNA. Successivamente, si scoprì che questo RNA estratto faceva si che l'mRNA di lin-14 e lin-28 non venisse degradato e che quindi lo sviluppo non potesse procedere. Quindi si scopri che i miRNA si legano a mRNA specifici in maniera parziale, inducendo silenziamento genico. L'espressione dei miRNA nell'uomo, invece, è sito-specifica quindi non tutti gli stessi tessuti esprimono gli stessi miRNA. Comunque, tutti i microRNA che vengono prodotti, vengono trascritti dalla RNA polimerasi II nel nucleo formando uno stem-loop. Questo viene riconosciuto da due proteine: DROSHA e DGCR8. La prima funziona come Dicer, però non essendoci le estremità sfalsate, vi è bisogno di DGCR8 per crearle. Questo pre-miRNA viene quindi esportato nel citoplasma con le estremità 3' sfalsate e quindi viene tagliato da DROSHA ogni 22 nt. Successivamente come per il siRNA un filamento si lega al complesso RISC proteggendolo. A questo punto il miRNA, al contrario del siRNA, si lega parzialmente all'mRNA producendo solo silenziamento genico, ma non degradazione. Comunque, di solito i miRNA si legano al 3' ed esistono quattro modelli per il silenziamento: 1) inibendo l'attacco del ribosoma; 2) l'inizio può avvenire ma non l'allungamento; 3) il miRNA favorisce l'assemblaggio di enzimi di degradazione dell'mRNA; 4) il mRNA favorisce la degradazione del polipeptide nascente.

Biologia molecolare

Pagina 173 di 173

Indice 1. La visione mendeliana del mondo

1

2. La genetica della trasmissione

2

3. Miescher: l'acido desossiribonucleico

5

4. Avery, Griffith e altri: il Dna può portare la specificità genetica

6

5. Garrod: l'azione dei geni

8

6. La struttura del Dna

9

7. Le ipotesi sulla copia del Dna

10

8. La sequenza dei componenti nucleotidici del Dna

12

9. Il dogma centrale nello studio del Dna

13

10. L'importanza dei legami deboli e forti nelle interazioni fra molecole

14

11. Caratteristiche dei legami chimici

15

12. Il concetto di energia libera

16

13. I legami deboli nei sistemi biologici

17

14. L'importanza dei legami forti nei sistemi biologici

19

15. I legami deboli e forti determinano la struttura delle macromolecola: le proteine

20

16. Caratteristiche strutturali del DNA

21

17. I bordi del DNA

22

18. Forme A e B del Dna

23

19. La replicazione del DNA

24

20. La topologia del DNA

25

21. La struttura dell' RNA

28

22. Metodi di solubilizzazione

29

23. Separazione di proteine

31

24. Cromatografia a scambio ionico

32

25. Cromatografia su carta

33

26. Cromatografia per gel filtrazione

34

27. Cromatografia per affinità

35

28. Elettroforesi

36

29. Elettroforesi su carta

37

30. Gel elettroforesi

38

31. Sds-Page

39

32. Gli enzimi di restrizione

40

33. Clonaggio del DNA

42

34. I fagi per lo studio del DNA

43

35. Mediante clonaggio si creano librerie di molecole di Dna

45

36. L'ibridazione - southern, northern e western blot

46

37. Cromosomi, cromatina e nucleosoma

48

38. La sequenza del cromosoma e la diversità

49

39. La mitosi

51

40. La meiosi

53

41. Il nucleosoma

55

42. Strutture di ordine superiore della cromatina

58

43. Regolazione della struttura della cromatina

59

44. La replicazione del DNA

61

45. La chimica della sintesi del DNA

62

46. Il meccanismo d'azione della DNA polimerasi

63

47. La forca replicativa

65

48. La specializzazione delle DNA polimerasi

67

49. La sintesi del DNA a livello della forca replicativa

68

50. La fase di inizio della replicazione

69

51. Selezione delle origini e attivazione operata dell'iniziatore

70

52. La terminazione della replicazione

72

53. La mutabilità e la riparazione del DNA

73

54. Gli errori di replicazione e la loro riparazione

74

55. I danni al DNA

76

56. La riparazione del DNA danneggiato

78

57. Riparazione diretta del danno al DNA

79

58. La riparazione per escissione di basi

80

59. La riparazione per escissione di nucleotidi

81

60. Riparazione del DNA tramite ricombinazione

83

61. La ricombinazione omologa a livello molecolare

84

62. I diversi modelli per la ricombinazione omologa

85

63. Gli apparati proteici per la ricombinazione omologa

87

64. La ricombinazione omologa negli eucarioti

89

65. Il cambio del gruppo di compatibilità

91

66. La ricombinazione sito-specifica e la trasposizione

93

67. La ricombinazione conservativa sito-specifica

94

68. Funzioni biologiche della ricombinazione sito-specifica

96

69. La trasposizione di DNA

98

70. La trasposizione a DNA mediante meccanismo replicativo e Tn10

100

71. I retrotrasposoni simili ai virus

102

72. I retrotrasposoni poli-a assomigliano ai geni

103

73. Footprinting con la DNasi I

104

74. I meccanismi della trascrizione del DNA

107

75. Le RNA polimerasi e il ciclo della trascrizione

108

76. Il ciclo della trascrizione nei batteri

110

77. La trascrizione negli eucarioti

114

78. Lo splicing DELL'RNA

118

79. La chimica dello splicing dell'RNA

119

80. Il macchinario dello spliceosoma e le vie dello splicing

120

81. Lo splicing alternativo

122

82. Il rimescolamento degli esoni

123

83. L'editing dell'RNA

124

84. Sintesi proteica: la traduzione

125

85. Funzioni dell'RNA messaggero

126

86. RNA transfer

127

87. Il legame degli amminoacidi al tRNA

128

88. Il ribosoma

130

89. Sintesi proteica: inizio della traduzione

132

90. Sintesi proteica: allungamento durante la traduzione

134

91. Sintesi proteica: conclusione della traduzione

136

92. Il codice genetico

137

93. I tRNA contengono basi modificate

138

94. Esistono alterazioni sporadiche del codice universale

139

95. Mutazioni soppressore possono trovarsi nello stesso gene o in geni diversi

140

96. I principi della regolazione genica trascrizionale

141

97. La regolazione dell'inizio di trascrizione: alcuni esempi nei batteri

143

98. Esempi di regolazione genica in passaggi successivi all'inizio di trascrizione

148

99. La terminazione dei geni trp di b. subtilis e' controllata dal triptofano e dal tRNATrp

152

100. L'operone del tTRP di e- coli e' controllato da attenuazione

153

101. La regolazione genica negli eucarioti

154

102. Diverse tipologie di fattori di trascrizione

155

103. Vari motivi di legami del DNA

157

104. Reclutamento di complessi proteici indotto dagli attivatori trascrizionali eucariotici

159

105. Il controllo della struttura della cromatina: attivazione trascrizionale

160

106. Tecniche di studio dei geni e della conformazione della cromatina

161

107. L'eterocromatina, inattivazione trascrizionale, dipende da interazioni con gli istoni

163

108. Il rimodellamento della cromatina

164

109. Varianti degli istoni

165

110. I siti ipersensibili alla dnasi i cambiano la struttura della cromatina, la metodologia

166

111. Eterocromatina, eucromatina ed eredità epigenetica

168

112. Silenziamento genico

169

113. Silenziamento genico post trascrizionale - interferenza dell'RNA - e miRNA

171

biologia-molecolare

Short Description

Description

Comments

We need your help!