Tom Stracham. Genetica Humana 3ra Ed - . VISION MEDICA

April 16, 2017 | Author: Xamakitow Ch O | Category: N/A

Share Embed Donate

Report this link

Short Description

Download Tom Stracham. Genetica Humana 3ra Ed - . VISION MEDICA...

Description

GENETICA

GTGACGATCGATGCG

3 a edición GTTCGACACAGTCGA CTCAGTCGACATGAC AGATGACAGTCGACA TGACAGCTG4CCTGA

fhl¿!WéPAÍ3' de la síntesis de la cadena lenta es la dirección opuesta respecto de la que sigue la horquilla de replicación. Como resulta do, la síntesis tiene que llevarse a cabo en pasos que generan una se rie progresiva de fragmentos pequeños, de manera característica de 100a 1 000 nucleótidos de largo (fragmentos de Okazaki). Debi do a que sólo la cadena rápida se sintetiza de modo continuo, se di ce que la síntesis de cadenas de DNA es semidiscontinua. Cada fragmento de la cadena lenta se sintetiza en la dirección 5’-*3’, la opuesta a la que sigue la horquilla de replicación. Los fragmentos sintetizados de forma sucesiva se unen de manera covalente en sus extremos mediante la enzima ligasa de DNA. Por consiguiente, la cadena lenta crece en la dirección en la que se mueve la horquilla de replicación.

1.2.3 La maquinaria de replicación del DNA en células de mamíferos es compleja Tal y como ocurre en los ribosomas, la maquinaria de replicación del DNA está muy conservada y es en esencia similar, desde la Es cherichia coli hasta las células de mamíferos, con una variedad de di ferentes tipos fundamentales de proteínas (recuadro 1-2). Sin embargo, la complejidad es mayor en las células de mamíferos, en términos de la cifra de diferentes polimerasas de DNA y el núme ro de proteínas constituyentes y subunidades de proteínas. Casi to das las polimerasas de DNA en las células de los mamíferos usan

1.2

A)

5'

AGACCACCAGTACAAGACGTTTCTTGTACTGGAACAAG

3'

ESTRUCTURA Y REPL1CACIÓN DEL DNA

B)

11

OH E xtrem o 3 '

I

i

A

C Extrem o 5 '( P ) C

i - i B razo a c e p to r A— T

1-8

G— C A-

Om—|it 1 -1

T

A-

T

C

G

G

B razo D

A- T

Clave: - E n la ce d e hidrógeno

T- A G-

C

A-

T

C— G

gI

G

_____ a c u u„ g l i l i

aG a a u

mC

Ua ffAG C-.G

B razo an ticodó n

C— G A G AC C A

u

A A C AA G

C

, r CG G C C , , 1 mC G G ' m5C G

U U

i1A

G B razo Tyj/ C

U-G C -G CC - GmsC

W

Anticodón

Fig. 1-7. Enlace de hidrógeno intramolecular en DNA y RNA. A) Formación de un asa en horquilla de doble cadena dentro de una cadena de DNA única. Las secuencias que se destacan en la cadena de DNA arriba representan secuencias de repetición invertidas que pueden enlazar hidrógeno para form ar una estructura en horquilla (abajo). B) El RNA de transferencia (tRNA) tiene una estructura secundaria extensa. El ejemplo que se muestra es un gen tRNAGIU humano. Los nucleósidos menores son: D,5,6-d¡hidrouridina; psi (\P), seudouridina (5 ribosiiuracilo); m5C, 5-metiicitidina; m 1A, 1-metiladenosina. La estructura en hoja de trébol está estabilizada por un enlace de hidrógeno intramolecular extenso, sobre todo por los pares de bases Watson-Crick G-C y A-U , pero asim ismo con el par de bases ocasional G-U. Se reconocen cuatro brazos: en el brazo aceptor puede fijarse un aminoácido (en el extremo 3 '); el brazo T'PC se define por este trinucleótido; el brazo D se denomina así porque contiene residuos de dihidrouridina; y el brazo anticodón contiene el trinucleótido anticodón en el centro del asa. La estructura secundaria del tRNA virtualmente no varía; siempre hay siete pares de bases en el tallo del brazo aceptor, cinco en el brazo T 'l'C , cinco en el brazo anticodón y tres o cuatro en el brazo D.

una cadena de DNA individual como plantilla para sintetizar una cadena de DNA complementario y en consecuencia son p o lim er a sas d e DNA d irigid a s p o r DNA. A diferencia de las polimerasas de RNA, las polimerasas de DNA requieren absolutamente el extremo hidroxilo 3 ’ de una cadena oligonucleótida iniciadora (cebador) de

bases pareadas como sustrato para la extensión de la cadena. Por consiguiente, se necesita un o ligo n u cleótid a in icia d o r d e RNA (cebador) sintetizado con anterioridad (que sintetiza una p rim a sa ) para proporcionar el grupo 3-OH libre que requieren las polimera sas de DNA para iniciar la síntesis de DNA. En las células de los mamíferos existen más de 20 tipos diferen tes de polimerasa de DNA (Friedberg y cois., 2000; 2002), que pue den agruparse de manera conveniente en tres clases principales (véase cuadro 1-2 ): ► P olim erasas d e DNA d irigid a s p o r DNA típ ica s (alta fi d e l i dad). De ellas, dos participan en la replicación estándar de DNA cromosómico, son específicas para sintetizar DNA a par tir de la cadena rápida o la lenta (polimerasas de DNA 8 y a,

Fig. 1-8. La replicación del DNA es semiconservadora.

Nuevo Original C adena hija

Original Nuevo C adena hija

El dúplex de DNA original consiste en dos cadenas de DNA antiparalelas y complementarias, que se desenrollan y a continuación actúan de manera individual como plantillas para la síntesis de nuevas cadenas de DNA antiparalelas y complementarias. Cada uno de los dúplex de DNA hijas contiene una cadena de DNA parental original y una nueva cadena de DNA que forman dúplex de DNA, que es en términos estructurales idéntico al dúplex del DNA parental. Nota: esta figura muestra el resultado de la duplicación de DNA, pero no la forma en que actúa el proceso (para ello véase fig. 1-9).

12 i CAPITULO UNO

c •o

ESTRUCTURA DEL DNA Y EXPRESIÓN GÈNICA

5'

5'

3'

5'

3'

'5

E o

H e lic a s a

3' 5'

3' 5'

C adena rá p id a

C adena le n ta

3 '5 '

3'5'

3 '5 '

3'5'

Fig. 1-9. Asimetría de la síntesis de la cadena durante la replicación del DNA. La helicasa desenrolla el dúplex de DNA para permitir que se repliquen las cadenas individuales. A medida que tiene lugar la replicación, la dirección

5'-*3’ de la síntesis del filamento rápido es la mism a en la que se mueve la horquilla de replicación y en consecuencia la síntesis puede ser continua. Sin embargo, la síntesis de la cadena lenta tiene la dirección opuesta a la del movimiento de la horquilla de replicación. Necesita sintetizarse en piezas (fragmentos de Okazaki), primero A, después B y a continuación C, que sella de manera subsecuente la enzima ligasa de DNA para form ar una cadena continua de DNA. Nota: la síntesis de estos fragmentos comienza mediante un nucleótido iniciador RNA. En células eucariotas, las polimerasas de DNA 8 y « sintetizan las cadenas rápida y lenta, respectivamente (véase cuadro 1 -2).

respectivamente), dos están encargadas de reparar DNA ((3 y e) y una de la replicación y reparación del DNA mitocondrial (7 ). ► P olim erasas d e DNA d irigid a s p o r DNA p ro p en sa s a error. Se identificó una amplia variedad de diferentes polimerasas de DNA con fidelidad muy baja de replicación de DNA (p. ej., la tasa de error para la polimerasa de DNA iota ( 1) es 20 000 ve ces mayor que la de la polimerasa del DNA e. Se sabe que

algunas poseen gran expresividad en células del sistema inmunitario y esta observación, aunada a su baja fidelidad de replica ción de DNA, sugiere su participación en la hipermutación en linfocitos B y T (véase sección 10.6). ► P olim erasas d e DNA d irigid a s p o r RNA. Algunas polimerasas de DNA sintetizan DNA mediante una plantilla del RNA y por esta razón se describen como tra n scrip ta sa s in versa s (véase secciones 1.2.4 y 1.3.1). Incluyen una actividad que se encuen-

Recuadro 1-2. Principales clases de proteínas que se utilizan en la maquinaria de replicación de DNA Las topoisomerasas inician el proceso de desdoblamiento del DNA al crear una muesca (romper) en una cadena de DNA. Como resultado, se libera la tensión que sostiene la hélice en sus formas arrollada y superarrollada. Las helicasas llevan a cabo el desenrollamiento de la cadena doble origi nal, una vez que se eliminó el superarrollamiento por acción de una topoisomerasa. Las polimerasas de DNA sintetizan nuevas cadenas de DNA. Las polime rasas de DNA son agregados complejos de varias subunidades de proteí nas diferentes, que incluyen con frecuencia actividades de lectura de pruebas y nucleasa de DNA, de tal manera que es posible identificar cualquier base incorporada de forma errónea y cortarse y eliminarse una tira local del DNA que contiene el error y a continuación repararse. En las células, el DNA se replica por la síntesis de nuevo DNA a partir de una plantilla de la cadena de DNA existente, para lo cual emplea polimerasas de DNA dirigidas por DNA y en las células de mamíferos existe una ex tensa variedad de estas polimerasas de DNA. En situaciones más espe cializadas, puede sintetizarse DNA en las células a partir de plantillas de RNA mediante polimerasas de DNA dirigidas por RNA (llamadas asimis

mo transcriptasas inversas), como en el caso de la síntesis de los ex tremos de un cromosoma lineal con la transcriptasa inversa de la enzima te lomera sa Primasas. Las polimerasas de DNA tienen dificultad para iniciar la sínte sis nueva de una plantilla desnuda de cadena única. En lugar de ello, se requiere un oligonucleótido iniciador (cebador) con un grupo OH 3 ' al cual puede fijar un dNTP la polimerasa. Las primasas fijan un oligonucleótido iniciador de RNA pequeño al DNA de cadena única para actuar como un sustituto de OH 3 ' a fin de que comience a sintetizarse la polimerasa de DNA a partir de él. Este oligonucleótido iniciador de RNA lo elimina al fi nal una ribonucleasa, se llena la hendidura mediante una polimerasa de DNA y a continuación se sella con una ligasa de DNA. Las ligasas catalizan la formación de un enlace fosfodiéster para obtener un OH 3 ' y un fosfato 5 ' no fijados pero adyacentes. Las proteínas de enlace de cadena única son importantes para conser var la estabilidad de la horquilla de replicación. El DNA de cadena única es muy lábil, o inestable, de tal manera que estas proteínas se unen a él en tanto permanece como cadena única y evitan que se degrade.

1.3

TRANSCRIPCIÓN DEL RNA Y EXPRESIÓN GÈNICA

13

Cuadro 1-2, Principales clases de polimerasas de DNA de mamíferos A) Polimerasas de DNA de alta fidelidad (típicas) dirigidas por DNA Clase de polimerasa de DNA a

P

Localización

Nuclear

Nuclear

Replicación general de DNA

Síntesis y oligonucleótido iniciado de cadena lenta

Exonucleasa3 3 ' -*■ 5'

No -

Función de reparación de DNA

7

8

e

Replicación de mtDNA mitocondrial

Nuclear

Nuclear

No

Sí

Sí

Sí

Por escisión de bases

Reparación de mtDNA

Por escisión de nucleótido y base

Por escisión de nucleótido y base

Síntesis de cadena rápida

aTiene actividad de lectura de pruebas.

B) Polimerasas de DNA de baja fidelidad (propensas a error) dirigidas por DNA Polimerasa de DNA £ (zeta)

Se expresa en células B y T mutantes; ¿participa en hipermutación?

Polimerasa de DNA t] (eta)

¿Muta nucleótidos A y T durante la hipermutación?

Polimerasa de DNA i (iota)

Fidelidad de replicación muy baja; se piensa que participa en la hipermutación

Polimerasa de DNA n, (mu)

Muy expresada en células B y T; se piensa que participa en la hipermutación

C) Polimerasas de DNA dirigidas por RNA (transcriptasas inversas) Telomerasa de transcriptasa inversa (Tert)

Replica DNA en los extremos de cromosomas lineales

Transcriptasa Inversa LINE-1/retrovlrus endógenos

En ocasiones convierte mRNA y otro RNA en cDNA que puede integrarse en cualquiera otra parte dentro del genoma

tra en la enzima telom era sa que tiene a su cargo la replicación de los extremos de cromosomas lineales (sección 2.2.5) junto con transcriptasas inversas codificadas por algunos DNA muy repetitivos y clases de retrovirus endógenos.

1.2.4 Los genomas virales se conservan con frecuencia por replicación de RNA en lugar de DNA El DNA es el material hereditario en todas las células en la actuali dad y se acostumbra pensar en genomas como término colectivo pa ra las moléculas de DNA hereditarias de un organismo o una célula. A pesar de la ubicuidad del DNA como material hereditario celular, hoy día muchas clases diferentes de virus tienen un gen o m a RNA. Las moléculas de RNA pueden autorreplicarse, pero el grupo OH 2' en los residuos de ribosa d el RNA hace que sean bastante inestables, des de el punto d e vista químico, los enlaces azúcar-fosfato. En el DNA, los residuos de desoxirribosa sólo llevan átomos de hidrógeno en la po sición 2' y por consiguiente el DNA es mucho más adecuado que el RNA para ser un portador estable de información genética. La repli cación de RNA también es propensa a errores y las tasas normales de error de replicación de RNA son alrededor de 10 000 veces más al tas que las registradas durante la replicación de DNA. Los virus desarrollaron muchas formas diferentes para infectar y trastornar células y sus genomas muestran una diversidad extraor dinaria (véase cuadro 1-3; fig. 1-10). Como resultado de su eleva da carga mutacional, los genomas de RNA virales suelen ser muy pequeños pero tienen como ventaja índices de mutación rápidos. A

diferencia de los virus DNA, que por lo general se replican en el núcleo, los virus RNA se replican casi siempre en el citoplasma. En tre algunas excepciones de importancia a esta regla general se en cuentra un grupo de virus RNA conocido como retrovirus. Los retrovirus son virus RNA raros porque se replican en el núcleo y el RNA se replica a través de un intermedio de DNA, mediante una tra nscripta sa inversa, una polimerasa de DNA dirigida por RNA que, al igual que las polimerasas de RNA, tiene tasas de error de replicación relativamente altas. Después de la conversión de RNA en DNA complementario (cDNA), se integra el cDNA retroviral en el DNA cromosómico del huésped (véase sección 21.5.3).

1.3

Transcripción dei RNA y expresión génica

1.3.1

El flujo de información genética en las células tiene un sentido casi exclusivo: ONA - » RNA - » proteína

La expresión de la información genética en todas las células es en gran parte un sistema de un sentido: el DNA especifica la síntesis de RNA y a continuación el RNA especifica la síntesis de polipéptidos (que de modo subsecuente forman proteínas). Debido a su universalidad, el flujo DNA -* RNA -» polipéptido (proteína) de información genética se describe como el dogma central de la bio logía molecular. En todos los organismos celulares son esenciales dos pasos sucesivos:

14

CAPÍTULO UNO

A)

ESTRUCTURA DEL DNA Y EXPRESIÓN GÉNICA

RNA

DNA

L IN E A L

C IR C U L A R

CADENA Ú N IC A P arv o viru s p. ej., M 1 3 , fd , f1

L IN E A L

C IR C U L A R

p e ro sin D N A in te rm ed io , p. ej., h e p a titis A

p. ej., viru s d e h e p a titis d e lta

p. ej., ra b d o v iru s

R é p lic a p o r D N A in te rm e d io , p. ej., retrovirus

DOBLE CADENA

iiiiiiiiiiiiiiiiiniiiiiiiiiiiii

H e rp e s virus,

X

P a p o v a v iru s b à cu lo v iru s

R eo v iru s

....................... A d en o viru s (tie n e u n a p ro te in a te rm in a l u n id a d e fo rm a covalente • ) P iiriìrn iiiirn m m m n n n rQ P o x viru s (tien e e x tre m o s c e rra d o s )

B)

V irus d e la in flu en za (R N A d e c a d e n a n e g a tiv a s e g m e n ta d a )

V irus G em in i (b ip a rtito ; d o s m o lé c u la s d e D N A circulares)

Fig. 1-10. La extraordinaria variedad de genomas virales. A) Estructuración y topología de los genomas virales. En genomas virales de cadena única, el RNA que se utiliza para elaborar productos proteínicos puede tener el mism o sentido que el genoma; éste, en consecuencia, es un genoma de cadena positiva ( + ) o de sentido opuesto (antisentido) al genoma que se describe como genoma de cadena negativa ( - ) . Algunos virus RNA de cadena única ( + ) pasan a través de un DNA Intermedio (retrovirus) y algunos virus DNA de cadena doble, como el de la hepatitis B, pasan a través de una forma repllcativa de RNA. B) Genomas virales segmentados y multipartitos. Los genomas segmentados tienen una variedad de diferentes moléculas de ácido nucleico que especifican mRNA monocistrónicos, como en los virus de la influenza que tienen ocho moléculas de RNA de cadena única negativas diferentes. Los genomas multipartitos son un subgrupo de genomas segmentados en los que cada una de las diferentes moléculas está empacada en una partícula viral separada.

1.3

I

TRANSCRIPCIÓN DEL RNA Y EXPRESIÓN GENICA

15

M ITO C O N D R IA

- núc leo ]

D N A crom osóm ico

Proteínas Transcripción nucleares

snRNA

í O tras proteínas m itocondriales

T

Transcripción /Transcrito prim ario

MitorRNA mRNA tRNA

Ribosomas citoplásmicos

A mRNA Traducción

RNA tRNA citoplásm ico pequeño

Procesam iento postraduccional

Proteínas en otros organelos + citosol

Proteínas secretadas

Fig. 1-11. Expresión gènica en una célula animal. Nota: a) Sólo de manera muy ocasional, una proporción pequeña de moléculas de RNA nucleares puede convertirse en forma natural en cDNA por transcriptasas inversas codificadas viralmente y celulares y más adelante integrarse en el DNA cromosómico en diversas localizaciones; b) la mitocondria sintetiza su rRNA y tRNA propios y unas cuantas proteínas que participan en el sistema de fosforilación oxidativa (Ox. fos.). Sin embargo, genes nucleares codifican a las proteínas de los ribosomas mitocondriales y la mayor parte de las proteínas del sistema de fosforilación oxidativa mitocondrial, además de otras proteínas mitocondriales, y se traducen en ribosomas citoplásmicos, antes de llevarse al interior de la mitocondria.

1 . Transcripción. Ésta emplea una p o lim era sa d e RNA d irigid a

p o r DNA y tiene lugar en el núcleo de células eucarióticas y, en grado limitado, en mitocondrias y cloroplastos, los únicos otros organelos que tienen capacidad genética además del núcleo (véase fig. 1- 11 ). 2. Traducción. Ocurre en los ribosomas, complejos grandes de RNA y proteínas que se encuentran en el citoplasma y asimis mo en las mitocondrias y los cloroplastos. Las moléculas de RNA que especifican polipéptidos se conocen como RNA mensajeros (mRNA). La expresión de la información genética sigue un principio de colinearidad: la secuencia lineal de nucleótidos en el DNA se descodifi ca en grupos de tres nucleótidos a la vez (trip leto s d e bases) para obtener una secuencia lineal de nucleótidos en el RNA que puede descodificarse a su vez en grupos de tres nucleótidos (codon es) para crear una secuencia lineal de aminoácidos en el producto polipéptido. En fecha reciente se aclaró que las células eucarióticas, incluidas las de los mamíferos, contienen secuencias de DNA cromosómico no virales que codifican transcriptasas inversas celulares, como los

miembros de la familia de DNA repetido de mamíferos LINE-1 (véase sección 9.5.2). Debido a que se sabe que ciertas secuencias de RNA no viral actúan como plantillas para la síntesis de DNA ce lular, ya no es estrictamente válido el principio del flujo unidirec cional de información genética en las células.

1.3.2 En organismos complejos, sólo se expresa una fracción pequeña del DNA para formar una proteína o producto de RNA Sólo una pequeña proporción de todo el DNA en las células se transcribe alguna vez. De acuerdo con sus necesidades, las diferen tes células transcriben distintos segmentos de DNA (unidades de transcripción) que son unidades discretas, espaciadas de forma irregular a lo largo de la secuencia de DNA. Las polimerasas de RNA utilizan unidades de transcripción como plantillas para sinte tizar de manera inicial moléculas de RNA de tamaño equivalente (tra n scrito sp rim a rio s) que a continuación se modifican para ge nerar productos de expresión maduros. Sin embargo, la gran mayo ría del DNA celular nunca se transcribe en ninguna célula. Más

16

CAPÍTULO UNO

ESTRUCTURA DEL DNA Y EXPRESIÓN GÈNICA

Cuadro 1 -3 . Diferentes clases de genomas (véase fig. 1-10 para revisar ejemplos de organización del genoma viral) DNA

RNA

Doble cadena (de)

Cadena única (cu)

Doble cadena (de)

Cadena única (cu)

Molécula circular única

Muchas bacterias y arc/iaea; mitocondria, cloroplastos; algunos virus

Ciertos virus

-

Muy pocos virus

Molécula lineal única

Unas cuantas bacterias; por ejemplo, Borrella; algunos virus

Ciertos virus

Unos cuantos virus

Ciertos virus

Moléculas lineales múltiples

Núcleos eucarióticos; algunos virus de DNA de segmentados

Ciertos virus DNA cu segmentados

Ciertos virus RNA de segmentados

Ciertos virus RNA cu segmentados

Moléculas circulares múltiples

Algunas bacterias; algunos virus bipartitos y tripartitos

-

-

-

Lineales y circulares mixtas

Muy pocas bacterias; por ejemplo, Agrobacterium tumefaciens

aún, sólo una porción del RNA elaborado mediante transcripción se traduce en un polipéptido. Ello se debe a que: ► Algunas unidades d e transcripción especifican RNA no codificante: el producto de RNA no codifica polipéptidos como mRNA, si no que tiene una función diferente. Además del RNA ribosómico (rRNA) y el RNA de transferencia (tRNA), bien establecidos hoy en día, se conoce una amplia variedad de RNA no codifi cantes de diversas funciones (sección 9.2). ► El transcrito prim ario d e unidades de transcripción que especifican mRNA se som ete a l procesam iento de RNA. Como resultado, gran parte de la secuencia de RNA inicial se descarta para formar un mRNA mucho más pequeño (sección 1.4.1). ► Sólo se traduce una parte central d el mRNA maduro; secciones de longitud variable en cada extremo del mRNA permanecen sin traducirse (sección 1 .5 . 1). En células animales se encuentra DNA en el núcleo y las mitocondrias. Sin embargo, las mitocondrias sólo tienen una fracción muy pequeña del DNA celular total y un número muy limitado de ge nes (véase sección 9.1.2); la inmensa mayoría del DNA de una cé lula se localiza en los cromosomas del núcleo. La fracción de DNA codificante en los genomas de eucariotas complejas es bastante pequeña. Ello resulta en considerable medi da de la naturaleza no codificante de gran parte de la secuencia den tro de los genes. Otra razón es que una fracción grande del genoma de eucariotas complejas contiene secuencias repetidas que no son funcionales o que no se transcriben en RNA. La primera incluye copias defectuosas de genes funcionales (seu d ogen es y fr a g m en to s gén ico s) y DNA no codificante muy repetido.

1.3.3 Durante la transcripción, ia información genética en algunos segm entos de DNA (genes) especifica RNA La síntesis de RNA se lleva a cabo mediante una polimerasa de RNA, con DNA como plantilla y ATP, CTP, GTP y UTP como precursores de RNA. Este último se sintetiza como una cadena ais

lada y la dirección de la síntesis es 5' 3'. El alargamiento de la cadena ocurre por la adición del residuo monofosfato del ribonucleósido apropiado (AMP, CMP, GMP o UMP) al grupo hidroxilo libre 3' en el extremo 3' de la cadena de RNA en crecimiento. Es tos nucleótidos se derivan al cortar un residuo pirofosfato (PP¡) de los precursores de trifosfato de ribonucleósido (rNTP) apropiados. Ello significa que el nucleótido en el extremo terminal 5' (el nucleó tid o in icia d or) difiere de todos los otros porque su cadena lleva un grupo trifosfato 5' ■ En condiciones normales, sólo una de las dos cadenas de DNA actúa como plantilla para la síntesis de RNA. Durante la transcrip ción se desenreda el DNA de doble cadena y la cadena de DNA que actúa como plantilla para la síntesis de RNA forma un h íb rid o R N A - D N A de doble cadena transitorio con la cadena de RNA en crecimiento. A medida que el transcrito del RNA es complementa rio de esta cadena plantilla, el transcrito tiene la misma dirección 5' 3' y secuencia de bases (excepto porque U reemplaza a T) res pecto de la cadena no plantilla opuesta de la doble hélice. Por esta razón, la cadena no plantilla se conoce con frecuencia como cadena de sentido y la cadena plantilla suele denominarse cadena de anti sentido (fig. 1-12). Cuando se documentan las secuencias génicas es usual mostrar sólo la secuencia de DNA de la cadena de sentido. La orientación de secuencias en relación con una secuencia génica se llama las más de las veces cadena de sentido. Por ejemplo, el extre mo 5' de un gen se refiere a secuencias en el extremo 5' de la cade na de sentido y las secuencias corriente arriba o corriente abajo aluden a las secuencias que flanquean al gen en los extremos 5' o 3', respectivamente, con referencia a la cadena de sentido. En células eucarióticas se requieren tres moléculas de polimera sa de RNA diferentes para sintetizar las distintas clases de RNA (cuadro 1-4). La inmensa mayoría de los genes celulares codifica polipéptidos y los transcribe la polimerasa II de RNA. Sin embar go, cada vez se concede mayor importancia a los genes que codifi can RNA como su producto maduro: hoy en día se sabe que moléculas funcionales de RNA tienen una amplia variedad de ac ciones y se han atribuido a algunas de ellas funciones catalíticas (véase sección 9.2.3).

i . 3 | TRANSCRIPCIÓN DEL RNA Y EXPRESIÓN GENICA

17

P ro m o to r

\J0

% é ^é W

f j j r * ' fá T ’''

^

-ni- é r á ^

/© t \ TF

RNA p ol.

l

TF

© 5'

f* S \á

%*. J ^ L w

'^ -ü »

<

5'

C a d e n a d e s e n tid o 3' 5'

111111111111111111111111

5 ' P P P > ....... .........i....:............-> O H 3 ' C la v e : l i l l l l l l l l i l Enlaces de ' — C a d e n a p la n tilla hidrógeno (= cadena de antisentido)

RNA

Fig. 1-12. El RNA se transcribe como una cadena única que es complementaria en la secuencia de bases a una cadena (cadena en plantilla) de un gen. Se requieren varios factores de transcripción (TF) para unirse a una secuencia promotora en la cercanía inmediata de un gen (1), a fin de colocar y guiar de form a subsecuente la polimerasa de RNA que transcribe el gen (2). La síntesis de la cadena se inicia con un trifosfato de nucleósido y el alargamiento de la cadena ocurre por la adición sucesiva de residuos de monofosfato de nucleósido proporcionados por rNTP al OH 3 ’ . Esto significa que el extremo 5 ' tiene un grupo trifosfato, que puede modificarse más adelante (p. ej., mediante bloqueo [capping]; véase sección 1.4.2) y el extremo 3 ' posee un grupo hidroxilo libre. Nota: en condiciones normales, la secuencia de RNA es idéntica a la cadena de sentido del gen (excepto que U reemplaza a T ) y complementaria en secuencia a la cadena plantilla.

1.3.4 Se requieren elementos reguladores de acción cis y factores de transcripción de acción trans en la expresión génica eucariótica Las polimerasas de RNA eucarióticas no pueden iniciar la transcrip ción por sí mismas. Por el contrario, las combinaciones de elemen tos de secuencia corta en la cercanía inmediata de un gen actúan como señales de reconocimiento para que se unan factores de transcripción al DNA a fin de guiar y activar la polimerasa. Mu chas veces se reúne un grupo mayor de estos elementos de secuen cia corta corriente arriba de la secuencia de codificación de un gen, en donde constituyen en conjunto el p rom otor. Después de unirse

Cuadro 1 Clase

varios factores generales de transcripción a la región promotora, se une una polimerasa de RNA al complejo de factor de transcripción y se activa para iniciar la síntesis de RNA desde una localización única. Se dice que los factores de transcripción tienen acción tra ns porque los sintetizan genes localizados en posición remota y se requieren para migrar a sus sitios de acción. En contraste, los elementos pro motores tienen acción cis porque su función está limitada al DNA dúplex en el que residen (cuadro 1-5). Los principales agrupamientos funcionales de elementos de acción cis incluyen: ► Promotores. Los elementos comunes de acción cis incluyen: • TATA box, con frecuencia TATAAA o una variante, y por lo general se encuentran en una posición alrededor de 25 pb

Las tres clases de polimerasa de R N A eucariótica Genes transcritos

Comentarios

28S rRNA; 18S rRNA; 5.8S rRNA

Localizado en el nucléolo. Se segmenta un transcrito primario único (45S rRNA) para form ar las tres clases de rRNA indicadas

Todos los genes que codifican polipéptidos; casi todos los genes snRNA

Los transcritos de polimerasa II son únicos porque están sujetos a bloqueo (capping) y poliadenilación

5S rRNA; tRNA genes; U6 snRNA; 7SL RNA; 7SK RNA; 7SM RNA; SiRNA

El promotor de algunos genes transcritos por polimerasa III de RNA (p. ej., 5S rRNA, tRNA, 7SL RNA) se halla dentro del gen (véase fig. 1-13) y en otros (p. ej., 7SK RNA) corriente arriba

18

CAPÍTULO UNO

ESTRUCTURA DEL DNA Y EXPRESIÓN GENICA

Ejemplos de elementos de acción cis reconocidos por factores de transcripción ubicuos Elemento cis

La secuencia de DNA es idéntica a (o es una variante de)

Factores de acción trans relacionados

Comentarios

GC box

GGGCGG

Spi

El factor Spi es ubicuo

TATA box

TATAAA

TFIID

TFIIA se une al complejo TFIID-box TATA para estabilizarlo

CAAT box

CCAAT

Muchos, p. e j„ C/EBR CTF/NF1

Familia grande de factores de acción trans

TRE (elemento de respuesta de TPA)

GTGAGT(A/C)A

AP-1 familia, p. ej., JUN/FOS

Familia grande de factores de acción trans

CRE (elemento de respuesta de cAMP)

GTGACGT(A/C)A(A/G)

CREB/ATF familia, p. ej., ATF-1

Genes activados en respuesta a cAMP

corriente arriba (—25) del sitio de inicio transcripcional (fig. 1-13). De manera característica se encuentran en genes que son transcritos de forma activa por la polimerasa II de RNA, pero en un sentido restringido, esto es, en una etapa especí fica del ciclo celular (p. ej., histonas) o en tipos específicos de células (como la globina (3). La mutación en el elemento

-100

-9 0

-8 0

-7 0

-6 0

-1 0 0 0

-9 0 0

-8 0 0

-5 0

__I_

G lo b in a -p

R e c e p to r g lu c o c o rtic o id e

TATA no previene el inicio de la transcripción, pero causa el desplazamiento del punto de inicio de la transcripción de la posición normal. GC box, una variante de la secuencia consenso GGGCGG, que se halla en una diversidad de genes, muchos de ellos ca recen del TATA box como en el caso de los genes que cuidan

-7 0 0

-4 0

I_

-6 0 0

-5 0 0

-4 0 0

-3 0 0

1---------.---------'------- *--------- J-------------- ---------------.------- U -------------- 1----------------O —

>

-1 5 0 -1 4 0 -1 3 0 H is to n a H 2 B _ _ | _______I_______I O ct

>

__

+40

+50

+60

+70

I

+1

-L

-1 0 0

+1

1------------- L

-1 2 0 -1 1 0 -1 0 0 -9 0 -8 0 -7 0 -6 0 -5 0 -4 0 -3 0 I_______I_______|_______I_______|_______|_______|_______|_______|_______I O ct

+30

-10 __|_

-2 0 I

-1 0 +1 I_______I

+80

C la v e : TATA b o x y

y significa orientación normal; < indica orientación inversa. El gen del receptor de glucocorticoides es poco común porque posee 13 boxes GC corriente arriba (10 en la orientación normal; tres en la orientación inversa). La polimerasa III de RNA transcribe los genes de tRNA y éstos tienen un promotor bipartito interno que comprende el elemento A (por lo general dentro de los nucleótidos numerados + 8 a + 1 9 , según el sistema de numeración de nucleótidos del tRNA estándar) y un elemento B (casi siempre entre los nucleótidos + 5 2 y + 6 2 ). A estos elementos se enlazan factores de transcripción específicos y a continuación guían a la polimerasa III de RNA para iniciar la transcripción en + 1 .

1.4 j PROCESAMIENTO DEL RNA_ 19

la casa (sección 1.3.5). Aunque la secuencia GC box es asi métrica, al parecer funciona en cualquier orientación (véase fig. 1-13). • CAAT box se localiza con frecuencia en la posición -80. Por lo regular es el determinante más potente de la eficiencia del promotor. Al igual que GC box, es capaz al parecer de fun cionar en cualquier orientación (fig. 1-13). Además de los anteriores se sabe que los factores de transcripción restringidos a tejido identifican más elementos de reconocimiento específicos (véase cuadro 10-3). ► Los intensificadores incluyen a grupos de elementos de secuen cia corta de acción cis, que pueden intensificar la actividad transcripcional de genes eucarióticos específicos. Sin embargo, a diferencia de los elementos promotores cuyas posiciones res pecto del sitio de inicio transcripcional son relativamente cons tantes (fig. 1-13), los intensificadores se localizan a una distancia variable, y a menudo considerable, del sitio de inicio transcripcio nal y su función es independiente de su orientación. Al parecer, enlazan proteínas reguladoras de gen y, de manera subsecuente, el DNA entre el promotor y el intensificador forma un asa, que permite que se unan proteínas al intensificador para interactuar con los factores de transcripción enlazados al promotor, o con la polimerasa de RNA. ► Los silenciadores son elementos reguladores con propiedades similares a las de los intensificadores, pero inhiben la actividad transcripcional de genes específicos.

1.3.5 La expresión génica específica de tejido incluye la activación selectiva de genes específicos El contenido de DNA de un tipo específico de célula eucariota, por ejemplo un miocito, es virtualmente idéntico al de un linfocito, una célula hepática o cualquier otro tipo de células nucleadas del mismo microorganismo. El hecho que distingue a los diferentes ti pos de células es que en una célula determinada sólo se expresa en grado significativo una proporción de los genes y el catálogo de genes expresados varía entre diferentes tipos d e células. En algunas células, en particular las cerebrales, se expresa un gran número de genes di ferentes; en muchos otros tipos de células, una fracción grande del gen es inactiva en sentido transcripcional. Desde luego, los genes que se expresan son los que definen las funciones de la célula. Algunas de ellas son funciones celulares gene rales y se especifican por los llamados genes que “cuidan la casa” (p. ej., genes que codifican histonas, proteínas ribosómicas, etc.). Otras funciones pueden restringirse en gran parte a tipos particulares de te jidos o células (expresión génica específica de tejido). Sin embar go, cabe señalar que incluso en el caso de genes que muestran una gran especificidad de expresión tisular, algunos transcritos génicos pueden estar representados a niveles muy bajos en todos los tipos de células. La distinción entre regiones de DNA activas en sentido trans cripcional e inactivas en una célula se refleja en la estructura de la cromatina vinculada: ► La cro m a tin a in a ctiv a d esd e e l p u n to d e vista tra n scrip cio n a l suele adoptar una conformación muy condensada y con fre cuencia se relaciona con regiones del genoma que se someten a una replicación tardía durante la fase S del ciclo celular. Esto se vincula con el enlace estrecho por la molécula H 1 de histona.

► La cro m a tin a a ctiv a en sen tid o tra n scrip cio n a l adopta una conformación más abierta y muchas veces se replica temprano en la fase S. Se caracteriza por el enlace relativamente débil por moléculas H1 de histona y acetilación extensa de los cuatro ti pos de histonas nucleosómicas (es decir, histonas H2A, H2B, H3 y H4; véase sección 10.2.1). De modo adicional, las regiones promotoras de los genes de verte brados suelen caracterizarse por la ausencia de citosinas metiladas (véase más adelante). Los factores de transcripción pueden mostrar nucleosomas y por consiguiente es posible distinguir por medios experimentales la conformación abierta de la cromatina activa en sentido transcripcional, porque ello también permite el acceso a nucleasas: a concentraciones muy bajas, la enzima desoxirribonucleasa I (DN-asa I) digiere regiones largas de DNA sin nucleosoma. Aunque las regiones reguladoras pueden contener varias proteínas de unión específicas de secuencia, la estructura de la cromatina abierta se caracteriza por la presencia de sitio s h ip ersen sib les a DN-asa /(véase sección 10.5.2).

1.4

Procesam iento del RNA

El transcrito de RNA de la mayor parte de los genes eucarióticos se somete a una serie de reacciones de procesamiento. Con frecuencia incluyen la eliminación de segmentos internos indeseables y la nue va unión de los segmentos restantes (RNA sp licin g, corte y unión). Además, en los transcritos de polimerasa II de RNA se añade una unión nucleótida especializada (7-trifo sfa to d e m etilgu an osin d) al extremo 5' del transcrito primario (capping, recubrimiento de blo queo) y se añaden de modo secuencial residuos de adenilato (AMP) al extremo 3' de mRNA para formar una cola poli-(A) (p o lia d en ilacióri).

1.4.1 El corte y unión (splicing) del RNA elimina secuencias de RNA no esenciales del transcrito primario La secuencia lineal de una unidad de transcripción rige la síntesis de un producto de expresión correspondientemente lineal, sea un polipéptido o un RNA no codificante maduro. Sin embargo, en la mayor parte de los genes de vertebrados se ha interpretado que só lo una porción pequeña de la secuencia del gen proporciona el pro ducto final. Por el contrario, en la gran mayoría de los genes que codifican polipéptidos, y muchos de los genes que especifican RNA no codificante, la información genética se halla en segmentos (exones) separados por secuencias intermedias que no contribuyen con información genética que se utiliza para sintetizar el producto final (intrones). El fenómeno de transcripción inicial incluye la producción de una secuencia de RNA complementaria a la longitud total del gen, el llamado tra n scrito p rim a rio . En genes que contienen múltiples exones, el transcrito primario posee secuencias complementarias para los exones y los intrones que incluye el gen. Sin embargo, más adelante, el transcrito de RNA se somete a splicing de RNA, una serie de reacciones de procesamiento mediante las cuales se cortan y descartan segmentos de RNA intrónicos y se unen los tramos de RNA exónicos extremo con extremo (spliced) para obtener un pro ducto de RNA más corto (fig. 1-14). El splicing (corte y unión) de RNA requiere que se reconozcan las secuencias de nucleótidos en

20

1

CAPÍTULO UNO

j

ESTRUCTURA DEL DNA Y EXPRESIÓN GENICA

Las reacciones anteriores las media un complejo RNA-proteína grande, el spliceosoma, que consiste en cinco tipos de snRNA (del inglés sm all nuclear RNA, RNA nuclear pequeño) y más de 50 pro teínas (véase Staley y Guthrie, 1998; Hastings y Krainer, 2001). Cada una de las moléculas de snRNA está unida a las proteínas es pecíficas para formar partículas snRNP y la especificidad de la reacción de splicing se establece por el pareamiento (formación de pares) de bases RNA-RNA entre el transcrito de RNA y las mo léculas de snRNA. Hay dos tipos de spliceosoma:

los límites del exón/intrón (uniones de splice). En la inmensa ma yoría de los casos, los intrones comienzan con GT (o GU a nivel del RNA) y el extremo con AG (regla GT-AG; véase fig. 1-15). Aunque los dinucleótidos GT (GU) y AG conservados tienen una importancia crucial para el splicing, no son suficientes por sí mismos para señalar la presencia de un intrón. Comparaciones de secuen cias comprobadas revelaron que las secuencias inmediatamente ad yacentes a los dinucleótidos GT y AG también muestran un grado considerable de conservación (fig. 1-15). Una tercera secuencia intrónica conservada que es esencial desde el punto de vista funcio nal en el splicing es el llamado sitio de ramificación, que suele estar localizado muy cerca d el extremo del intrón, cuando mucho 40 nucleótidos antes del dinucleótido AG terminal (fig. 1-15). Además, algunas otras secuencias exónicas e intrónicas tienen efectos positi vos (secuencias in ten sifica d o ra s d e splice) o efectos negativos (se cuencias silen cia d o ra s d e sp lice) en el sp licin gy las mutaciones en esas secuencias pueden ser patogénicas (sección 1 1.4.3). El mecanismo de splicing (corte y unión) comprende las secuen cias siguientes:

► El spliceosoma mayor (GU-AG) procesa intrones GT-AG típi cos. En la inmensa mayoría de intrones en genes que codifican polipéptidos, las cinco especies de snRNA son snRNA U l, U2, U4, U5 y U 6 . La terminal 5' del snRNA U l tiene una secuen cia UACUUAC cuya base forma pares con el consenso donador de splice (GUAAGUA). Después de enlazarse la snRNP U l, el snRNA U2 reconoce el sitio de ramificación por una reacción similar de pareamiento de bases y, de manera subsecuente, la in teracción entre snRNP U l y snRNP U2 acerca entre sí las dos uniones de splice. Más adelante, una partícula multi-snRNP que contiene snRNA U4, U5 y U 6 se vincula con el complejo snRNP U1-U2 (fig. 1-16B).

► Corte en la unión de splice 5'■ ► Ataque nucleofílico por el nucleótido G terminal del sitio do nador del splice en la invariante A del sitio de ramificación para crear una estructura en forma de lazo.

► Spliceosoma menor (AU-AC). Éste procesa una clase rara de intrones, que se conocen como intrones AT-AC porque los di nucleótidos 5' GT y 3' AG conservados son reemplazados por AT y AC, respectivamente. En este caso, snRNA U ll y U12 sustituyen a U l y U2 (véase Tarn y Steitz, 1997).

► Corte en el sitio de splice 3', que da lugar a la liberación del RNA intrónico como un lazo y splicing de segmentos exónicos de RNA (fig. 1-16A).

Unidad de transcripción

P ro m o to r

Exón 1

Exón 2

Intrón 1

Intrón 2 Exón 3

G en

E2

E1

¡>E3

T ra n s c rito d e R N A p rim a rio ¡Segmentación en :

GU— AG

- D e s c a r ta r

E3

E2

C o r te y u n ió n

/ / // // // // / ' / '

E2

E3 /

R N A m a d u ro

Fig. 1-14. El splicing de RNA incluye el corte endonucleolítico y la eliminación de segmentos de RNA intrónicos y splicing (unión) de segmentos de RNA exónicos.

1.4 | PROCESAMIENTO DEL RNA

S itio d o n a d o r d e c o rte y unión

S itio d e ra m ific a c ió n

£ag A

21

Sitio

splice a c e p to r

_ t A . „ x \ \ T..CTA .C C C CC C CCCCCCMC Ar G T G A G T .......................... ............................................... C T C G T ................................... T T T T T T T T T T T N T A G

Exó n

-—

1 0 s a > 1 0 0 0 0 n u c le ó tid o s — *

— < 20 n u c leó tid o s—1-

Exón

Fig. 1-15. Secuencias de consenso a nivel del DNA para el splice (corte) donador y el splice (unión) del aceptor y sitios de ramificación en los Intrones de eucariotas complejos. Los nucleótidos que se destacan son casi Invariables (nota: existen asimismo intrones AT-AC raros, en los que el dinucleótido GT splice donador conservado se reemplaza por AT y en los que el dinucleótido AG splice aceptor conservado se sustituye con AC; véase texto). Otros nucleótidos representan la mayor parte de los nucleótidos que se encuentran en esta posición particular, o el equivalente entre dos nucleótidos, por ejemplo entre C y T en la via de poiipirimidina adyacente al extremo 3 ' del intrón. Los elementos típicos preferidos para el splice donador, el sitio de ramificación y el splice aceptor en especies Individuales (Incluidos los humanos, Drosophila melanogaster, Caenorhabditis elegans y Saccharomyces cerevisiae) se encuentran en una lista de Lim y Burge (2001). Se sabe que algunas otras secuencias exónicas e ¡ntrónicas regulan el corte y la unión (splicing) Incluidas las secuencias splice intensificadoras y silenciadoras (véase Berget y cois., 1995). Véase asimismo Fairbrother y cois. (2002) para las secuencias consenso y la secuencias splicing Intensificadoras exónicas.

B)

A)

S plice

j donador

_ ... . S plice S itio d e . ... . . a c e p to r cCis UGU J UUA] Leu UUGJ UUC1 Fen UUUJ

Fig. 1-22. Los códigos genéticos nuclear y mitocondrial son similares pero no idénticos. Los cuatro codones (se muestran en rojo) se interpretan de manera diferente en el núcleo y las mitocondrias de las células de mamíferos; la interpretación mitocondrial se indica en verde. Por consiguiente, el código mitocondrial tiene cuatro codones de detención en lugar de tres (UAA, UAG, AGA, AGG), dos codones Trp en vez de uno (UGA, UGG), cuatro codones Arg en lugar de seis (CGA, CGC, CGG, CGU), dos codones Met en vez de uno (AUA, AUG) y dos codones lie en lugar de tres (AUC, AUU). Notas: a) la degeneración del código genético incluye con mayor frecuencia la tercera base del codón. En ocasiones puede sustituirse cualquier base (GGN = glicina, CCN = prolina, etc.; N es cualquier base). En otros casos lo hace cualquier purina (Pu) o pirimidina (Pi) (AAPu = lisina, AAPi = asparagina, etc.); b ) las señales en algunos mRNA pueden conducir a interpretaciones alternativas de codones de detención, de tal manera que UGA puede especificar un 21° aminoácido, selenocisteina, y UAG glutamina o un 22° aminoácido, p irro lisin a (Atklns y Gesteland, 2002).

Aunque hay 64 codones, es menor el número correspondiente de moléculas de tRNA con diferentes anticodones: 30 tipos de tR NA citoplásmico y sólo 22 tipos de tRNA mitocondrial. Es posible interpretar todos los 64 codones en ribosomas citoplásmicos y mitocondriales, dado que las reglas normales de pareamiento de bases se relajan cuando llegan al reconocimiento del codón-anticodón. La hipótesis de bamboleo indica que el pareamiento de codón y anticodón sigue las reglas normales A-U y G-C para las dos prime ras posiciones de bases en un codón, pero que tiene lugar un “bam boleo” excepcional en la tercera posición y que también pueden utilizarse pares de bases G—U (véase cuadro 1-6). Es usual describir el código genético como un có d ig o un iversal, lo que significa que se utiliza el mismo código en todas las formas de vida. Esto no es cierto en sentido estricto por la interpretación alternativa de codones debido a: ^ La d iv erg en cia ev o lu tiva d e có d igo s g e n é tico s d e organ elos. Las mitocondrias y los cloroplastos también tienen capacidad para sintetizar proteínas, aunque limitada. Durante la evolu ción, estos organelos adoptaron códigos genéticos algo diferen tes respecto de los que se usan en los genes nucleares. Por consiguiente, por ejemplo, continúa la traducción de mRNA de

Cuadro 1 -6 . El par codón-anticodón admite pares de bases relajadas (bamboleantes) en la posición tercera base de codones Base en el extremo 5' del anticodón tRNA

Base reconocida en el extremo 3' del codón mRNA

A

U sólo

B

G sólo

G (o 1)*

CoU

U

AoG

*1, inosina, una forma de adenina modificada de forma postraduccional. Véase el recuadro 9-4 para mayores detalles del reconocimiento de inosina y codón-anticodón dei tRNA citoplásmico.

codificación nuclear hasta que se encuentra un codón de ter minación, que es una de tres posibilidades -UAA, UAG, UGA, en tanto que en las mitocondrias de mamíferos hay cuatro po sibilidades: UAA, UAG, AGA y AGG; véase figura 1-22. ► N ueva d efin ició n d e cod on es d ep en d ien te d e l contexto. Las se ñales en algunos mRNA, incluidos unos cuantos tipos de mRNA de codificación nuclear, conducen a la nueva definición (redefini ción) de algunos codones. Por ejemplo, en una gran variedad de células (incluidas las humanas), algunos mRNA de codificación nuclear pueden interpretar de forma alternativa el mRNA como un 21° aminoácido, la selen ocisteina, e interpretarse de forma al ternativa UAG o glutamina (véase Atkins y Gesteland, 2002). Por consiguiente, la estructura básica del producto primario de la traducción tiene en un extremo una metionina con un grupo amino libre (el extremo N terminal) y en el otro un aminoácido con un grupo carboxilo libre (el extremo C terminal). Cabe señalar que aunque los codones se traducen en un marco de lectura traduccional específico, en ocasiones se encuentran en eucariotas genes superpuestos, en los que se utilizan marcos de lectura traduccional diferentes (véase para un ejemplo la fig. 9 -3 ). El paso predominante en el control de la traducción es el enla ce ribosómico. Además del cap 5’, la RNT 5' (con frecuencia < 200 pb) y la RNT 3 ' (por lo general mucho más larga que la RNT 5') tienen acciones críticas en la incorporación del mRNA para tra ducción. Se han caracterizado varios elementos de acción cis que participan en este proceso y, además, identificado unos cuantos fac tores de acción trans que se enlazan a estos elementos. Es posible que interactúen las secuencias de RNT 5' y 3' para mejorar la tra ducción. La RNT 3 ’ tiene un sitio fundamental en la regulación de la traducción y en esta región se encontraron señales para controlar la traducción, la estabilidad y la localización del mRNA (véase Wickens y cois., 1997; véase asimismo sección 10 .2 .6 ).

1.5.3 Las modificaciones postraduccionales incluyen modificaciones químicas de ciertos aminoácidos y segmentación polipeptídica Con frecuencia, los productos primarios de la traducción sufren una diversidad de reacciones de modificación que incluyen la adi ción de grupos químicos que se fijan de manera covalente a la ca dena polipeptídica en los niveles de traducción y postraduccional.

1.5 | TRADUCCIÓN, PROCESAMIENTO POSTRADUCCIONAL Y ESTRUCTURA DE LAS PROTEÍNAS | 27

Ello puede incluir una modificación química simple (hidroxilación, fosforilación, etc.) de las cadenas laterales de aminoácidos únicos o la adición de diferentes tipos de grupos de carbohidratos o de lípidos (véase cuadro 1-7).

Modificación de proteínas por la adición de grupos carbohidrato Las glucoproteínas contienen oligosacáridos que están fijados de manera covalente a las cadenas laterales de ciertos aminoácidos. Po cas proteínas en el citosol están glucosiladas, es decir, que tienen un carbohidrato unido y estas últimas llevan un residuo de azúcar úni co, iV-acetilglucosamina, unido de forma covalente a un residuo de serina o treonina. En contraste, las proteínas que se secretan de las células o se llevan a lisosomas, el aparato de Golgi o la membrana plasmática son glucosiladas. Los componentes oligosacáridos de las glucoproteínas son preformados en gran parte y se añaden en blo que a polipéptidos. Se reconocen dos tipos principales de glucosilación: ► Glucosilación N: incluye, en casi todos los casos, la transferen cia de una secuencia oligosacárida común al grupo NH2 de la cadena lateral de un residuo de asparagina dentro del retículo endoplásmico (RE; véase cuadro 1-7). En el aparato de Golgi sucede el recorte subsecuente de residuos y su restitución con diferentes monosacáridos.

Cuadro 1

► Glucosilación O: véase cuadro 1-7. Los proteoglucanos son proteínas con glucosam inoglucanos unidos que suelen contener unidades disacáridas repetidas que incluyen glucosamina o galactosamina. Los proteoglucanos mejor caracteri zados son componentes de la matriz extracelular.

Modificación de proteínas por la adición de grupos lípidos Algunas proteínas, en especial las de la membrana, se modifican por la adición de grupos grasos acilo o prenilo, que típicamente sir ven como fijadores de membrana. Los ejemplos de grupos grasos acilo incluyen el grupo miristoilo, un lípido C 14 fijado a un resi duo de glicina en el extremo N terminal que permite que la proteí na modificada interactúe con un receptor de membrana o la bicapa lipídica de la membrana. Otro grupo graso acilo que sirve como un fijador de membrana es el grupo palmitoilo C ^, que se fija al áto mo S de residuos de cisterna. Es típico que los gru p o s p r en ilo se fijen a residuos de cisterna cerca del C terminal e incluyen los grupos farnesilo (C 15) y geranilgeranilo (C 2o). Muchas proteínas que participan en la transducción de señal y el blanco de proteínas contienen una unidad farnesilo o una unidad geranilgeranilo en su C terminal. En la fijación de una proteína a la capa externa de la membra na plasmática se utiliza un mecanismo diferente: la fijación de un grupo inositol del glucosilfosfatidilo (GPI). Este grupo glucolípido

Principales tipos de modificación de polipéptidos

Tipo de modificación (grupo añadido)

Aminoácidos blanco

Comentarios

Fosforilación (P04~)

Tirosina, serina, treonina

Lograda por cinasas específicas. Pueden revertirse por fosfatasas

Metilación (CH3)

Usina

Lograda por metilasas y desechas por desmetilasas

Hidroxilación (OH)

Prolina, lisina, ácido aspártico

Hidroxiprolina e hidroxilisina son en particular comunes en colágenas

Acetilación (CH3C0)

Usina

Lograda por una acetilasa y desecha por desacetilasa

Carboxllación (COOH)

Glutamato

Lograda por carboxilasa 7

Acetilación (CH3C0)

Lisina

Lograda por una acetilasa y desecha por desacetilasa

Glucosilación N (carbohidrato complejo)

Asparagina, por lo general en la secuencia: Asn-X-(SerlThr)

Se lleva a cabo al principio en el retículo endoplásmico; X es un aminoácido distinto de la prolina

Glucosilación 0 (carbohidrato complejo)

Serina, treonina, hidroxilisina

Se lleva a cabo en el aparato de Golgi; menos común que la glucosilación N

GPI (glucolípido)

Aspartato en el C terminal

Sirve para fijar proteínas a la capa externa de la membrana plasmática

Miristoilación (grupo graso acilo C14)

Glicina en el N terminal (véase texto)

Sirve como fijador de membrana

Palmitoilación (grupo graso acilo C16)

Cisteína para form ar unión S-palmitoílo

Sirve como fijador de membrana

Farnesilaclón (grupo prenilo C15)

Cisteína en el C terminal (véase texto)

Sirve como fijador de membrana

Geranilgeranilación (grupo prenilo C20)

Cisteína en el C terminal (véase texto)

Sirve como fijador de membrana

28 ¡ CAPÍTULO UNO

j

ESTRUCTURA DEL DNA Y EXPRESIÓN GÈNICA

complejo contiene un grupo graso acilo que sirve como el anclaje de membrana, que está unido de manera sucesiva a una unidad de glicerofosfato, una unidad oligosacárida y al final, a través de una unidad fosfoetanolamina, al C terminal de la proteína. Con excep ción de la fijación GPI, la totalidad de la proteína se localiza en el espacio extracelular.

proteínas, incluidas las plasmáticas, hormonas polipeptídicas, neuropéptidos, factores de crecimiento, etc. Como se describe en la sección siguiente, muchas veces se usan secuencias de señal que pueden cortarse para marcar proteínas que están destinadas a en viarse a un sitio específico. Además, en algunos casos, una molécula de mRNA aislada puede especificar más de una cadena polipeptí dica funcional como resultado de la segmentación (corte) proteolítica de un polipéptido precursor grande (fig. 1-23).

Corte postraduccional El principal producto de la traducción también puede sufrir un corte (segmentación) interno a fin de generar un producto madu ro más pequeño. En ocasiones se corta la metionina iniciadora del producto primario de la traducción como sucede durante la sínte sis de la globina beta (fig. 1-19). Se observa una segmentación (cor te) polipeptídica más importante en la maduración de muchas

E xó n 1

G en

[

Intrón 1

]G T

mRNA

m 7G p p p

1ATG

l

G GT

Jl

i i i

(

n

1 ) [ M et

1 S e c . g u ía I M e t

E xó n 3

110 AG

110

^3'UTR//

UG

AA C

UAG

11 0 A sn |

©

24 ^ 25 A la | Fen

i

24

*

TG A A C IT A G y ....— ------------------ ----------- —T'

6gX

'“ I

J l

i i i P rep ro in su lin a

Intrón 2 63

i !! i

\ . ”

Para la función dentro de las mitocondrias se requieren proteínas sintetizadas en los ribosomas mitocondriales. Sin embargo, las nu-

E xó n 2

AG

\5 '

1.5.4 La secreción de proteínas y el traslado intracelular se controlan mediante señales de localización específicas o modificaciones químicas

i A A A A A A --A „ >

A la i

F en

65 2 66 A rg | G li

3 0 i 31 Leu I G lu

86 A sn | P roinsulina

i 35 IG I u 1 I Fen

C la v e :

Argl

P é p tid o d e c o n ex ió n

30 Leu I

C a d e n a B d e in s u lin a

1 I Gli

] R e g ió n sin tr a d u c ir

21 A sn l

C a d e n a A d e in s u lin a

S itio d e c o rte

Fig. 1-23. La síntesis de insulina incluye múltiples cortes postraduccionales de precursores polipeptídicos. El primer intrón interrumpe la región no traducida 5 '; el segundo intrón las posiciones base 1 y 2 del codón 63 y se clasifica como un intrón de fase I (véase recuadro 12-2 y figura 1-19 para otras fases de intrón). El producto primario de la traducción, preproinsulina, posee una secuencia guía de 24 aminoácidos que se requiere para que la proteína cruce la membrana celular y luego se descarte. El precursor proinsulina contiene un segmento central, el péptido de conexión, que al parecer es importante para conservar la conformación de los segmentos de las cadenas A y B de tal manera que puedan crear puentes disulfuro (véase fig. 1-25).

1.5 ! TRADUCCIÓN, PROCESAMIENTO POSTRADUCCIONAL Y ESTRUCTURA DE LAS PROTEINAS ¡ 29

merosas proteínas que se sintetizan en ribosomas citoplásmicos tie nen diversas funciones que quizá requieran que se secreten las mis mas proteínas de la célula en donde se sintetizaron (p. ej., las hormonas y otras moléculas de señalamiento intercelular) o que se trasladen a compartimientos intracelulares específicos, como el nú cleo (histonas, DNA y polimerasas de RNA, factores de transcrip ción, proteínas de procesamiento de RNA, etc.), la mitocondria (proteínas ribosómicas mitocondriales, muchos componentes de la cadena respiratoria, etc.), peroxisomas, etc. Con el fin de llevarlo a cabo, es necesario que esté alojada en la estructura del polipéptido una señal de localización específica, de tal manera que pueda en viarse a la dirección correcta. Por lo general, la señal de localización tiene la forma de una secuencia peptídica corta. A menudo esto re presenta una llamada secuencia de señal (o secuencia guía), que se elimina de la proteína por una peptidasa de señal especializada una vez que se lleva a cabo el proceso de selección.

Señales para el traslado al retículo endoplásmico (RE) y el espacio extracelular En las proteínas secretadas, el péptido de señal comprende casi los 20 primeros aminoácidos en el extremo N terminal y siempre in cluye un número considerable de aminoácidos hidrófobos (véase cuadro 1-8). La secuencia de señal se guía hacia el RE por una par tícula de reconocimiento de señal (PRS), un complejo de RNA y proteína que consiste en una especie de RNA citoplásmico pequeña, 7SL RNA, y seis proteínas específicas. El complejo de PRS se une a la cadena polipeptídica en crecimiento y al ribosoma y los dirige a una proteína receptora de PRS en el lado citosólico de la superfi cie de la membrana del retículo endoplásmico rugoso (RER). Con posterioridad, puede pasar un polipéptido a la luz del RE, destina do para eliminarse de la célula, a menos que haya segmentos hidró fobos adicionales que detengan el proceso de transferencia, como en el caso de las proteínas transmembranosas.

Otras señales Al igual que la señal del RE, se requiere una secuencia de señal de la N terminal para atravesar la membrana mitocondrial y se seg menta de modo subsecuente. De manera característica, un péptido de señal mitocondrial tiene, además de muchos aminoácidos hidró fobos, varios aminoácidos de carga positiva, las más de las veces es paciados a intervalos de unos cuatro aminoácidos. Se piensa que

esta estructura forma una hélice a anfipática, una estructura heli coidal con aminoácidos cargados en una superficie y aminoácidos hidrófobos en la otra (véase más adelante y fig. 1-24A). Las señales de localización nucleares pueden localizarse casi en cualquier parte de la secuencia polipeptídica y consisten de ma nera habitual en una tira de cuatro a ocho aminoácidos de carga positiva, junto con residuos prolina contiguos. No obstante, mu chas veces la señal es bipartita y los aminoácidos de carga positiva se encuentran en dos bloques de dos a cuatro residuos, separados por unos 10 aminoácidos (véase cuadro 1-8). Cabe señalar que al gunas proteínas nucleares carecen de cualquier secuencia de locali zación nuclear en sí mismas, pero se transportan al interior del núcleo con ayuda de otras proteínas nucleares que tienen las seña les apropiadas. Las proteínas lisosómicas se dirigen al lisosoma por la adición de un residuo de 6 -fosfato de manosa que se añade en el comparti miento cis del aparato de Golgi y que reconoce una proteína recep tora en el compartimiento trans de Golgi.

1.5.5 La estructura proteínica es muy variada y no es fácil predecirla por la secuencia de aminoácidos Las proteínas están compuestas de uno o más polipéptidos, cada uno de los cuales puede someterse a modificación postraduccional. Pueden interactuar con cofactores específicos (p. ej., que requieren cationes divalentes como Ca2+, Fe2+, Cu2+, Zn2+ o moléculas pe queñas para la actividad enzimàtica funcional, como NAD+) o ligandos (cualquier molécula que enlaza una proteína específica), cada uno de los cuales puede tener influencias poderosas en la con formación de la proteína. Por lo regular se distinguen para las pro teínas cuando menos cuatro niveles diferentes de organización estructural (véase cuadro 1-9). Dentro de una cadena polipeptídica aislada hay una esfera de acción amplia para enlaces de hidrógeno entre diferentes residuos; al margen de las cadenas laterales, el oxígeno de un enlace peptídico del grupo carbonilo (CO) puede enlazar hidrógeno al hidróge no del grupo NH de otro enlace peptídico. Las unidades estructurales fundamentales definidas por enlazamiento de hidró geno entre residuos aminoácidos muy cercanos de un polipéptido aislado incluyen: ► La hélice a . Ésta incluye la formación de un cilindro rígido. La estructura sufre el dominio del enlace de hidrógeno entre el

Cuadro 1 -8 . Ejemplos de secuencias proteínicas de localización Destino de la proteína

Localización y forma de señal

Ejemplos

Retículo endoplásmico y secreción de la célula

Péptido N terminal de unos 20 aminoácidos; muy hidrófobo

Insulina humana: 24 aminoácidos, péptido de señal muy hidrófobo; N-Met-Ala-Leu-Trp-Met-Arg-Leu-Leu-Pro-Leu-Leu-Ala-Leu-Leu-Ala-Leu-TrpGli-Pro-Asp-Pro-Ala-Ala-Ala

Mitocondrias

Péptido N terminal; hélice a con residuos de carga positiva en una cara e hidrófobos en la otra

Deshidrogenasa de aldehido mitocondrial humana 17 aminoácidos N terminal: N-Met-Leu-Arg-Ala-Ala-Ala-Arg-Fen-Gli-Pro-Arg-Leu-Gli-Arg-Arg-Leu-Leu

Núcleo

Secuencia interna de aminoácidos; con frecuencia un cordón de aminoácidos básicos más prolinas; puede ser bipartita

Antigeno SV40 T continuo: Pro-Pra-Lis-Lis-Lis-Arg-Lis-Val p53 bipartito: Lis-Arg-Ala-Leu-Pro-Asn-Asn-Tre-Ser-Ser-Ser Pro-GIn-Pro-Lis-Lis-Lis

Lisosoma

Adición de residuos de manosa 6-fosfato

30

CAPITULO UNO

ESTRUCTURA DEL DNA Y EXPRESIÓN GÉNICA

Cuadro 1-9. Niveles de estructura de proteínas Nivel

Definición

Comentario

Primario

Secuencia lineal de aminoácidos en un poiipéptido

Puede variar de longitud de modo notorio, desde un péptido pequeño hasta miles de aminoácidos de largo

Secundario

Vía que sigue la estructura básica polipeptídica

Puede variar en sentido local, por ejemplo como hélice a u hoja plegada p

Terciario

Estructura tridimensional total de un poiipéptido

Puede variar en grado notable; por ejemplo, globular, en bastón, tubo, serpentín, hoja, etcétera.

Cuaternario

Estructura total de una estructura multimérica ( = una combinación de subunidades de proteínas)

Con frecuencia estabilizada por puentes disulfuro y enlace a ligandos, etcétera.

Fig. 1-24. Con frecuencia, los enlaces de hidrógeno intracatenarios dominan las regiones de estructura secundaria en polipéptidos. A) Estructura de una hélice a . Izquierda: sólo se muestra la estructura básica del poiipéptido para efectos de claridad. El oxígeno carbonilo (CO) de cada enlace péptido está enlazado al hidrógeno en el enlace péptido del grupo amida (NH) del cuarto aminoácido distante, de tal form a que la hélice tiene 3.6 aminoácidos por giro. Nota: para mayor claridad se omitieron algunos enlaces. Las cadenas laterales de cada aminoácido se hallan en la parte exterior de la hélice y casi no hay un espacio libre dentro de la hélice. Derecha: se localizan aminoácidos cargados y aminoácidos hidrófobos en superficies diferentes en una hélice a antipática. La secuencia que se muestra es la secuencia peptídica de señal de 17 aminoácidos de largo para la deshidrogenasa de aldehido mitocondrial (véase cuadro 1-8). B) Estructura de una hoja plegada p . Obsérvese que el enlace de hidrógeno ocurre entre los átomos de oxígeno de CO e hidrógeno de NH de los enlaces peptídicos en segmentos paralelos adyacentes de la estructura básica pollpeptídica. El ejemplo muestra un enlace entre segmentos antiparalelos de la estructura básica polipeptídica (hoja p antiparalela), y el cambio súbito forzado de dirección entre segmentos antiparalelos suele llevarse a cabo mediante giros p (véase texto). Las flechas indican la dirección de la N terminal al C terminal. Nota: también es común encontrar hojas plegadas p paralelas con los segmentos adyacentes en la misma dirección.

! LECTURAS ADICIONALES

©

.............0

H j N - G I V E Q C C T S SH

C adena A

I C S L Y Q L E N Y C N -C O O ISH I

SH SH © 0 H j N - F V N Q H L C G S H L V E A L Y L V C G E R G F F Y T P K T -C O O

[s]— — [s]

©

H3N — G I V E Q c 1c

C T s I

j 31

i

rc S L Y Q L E N Y C N

C adena B

©

COO

fsl

©

h 3n

-

m f v n q h l c g s h l v e a l y l v c g e r g f f y t p k t

©

-C O O

Fig. 1-25. Puentes disulfuro intracatenarios e inlercatenarios en la insulina humana. Los puentes disulfuro ( -S -S -) se forman por una reacción de condensación entre grupos sulfhidrilo (-SH ) opuestos de los residuos de cisteina 6 y 11 de la cadena A o entre los residuos indicados de las diferentes cadenas.

oxígeno carbonilo de un enlace peptídico con el átomo de hi drógeno del nitrógeno amino de un enlace peptídico localizado cuatro aminoácidos más lejos (véase fig. 1-24). Cabe señalar que los dominios de enlace de DNA de los factores de transcrip ción suelen ser helicoidales a (véase sección 10.2.4). Una hé lice a anfipática tiene residuos cargados en una superficie e hidrófobos en otra (fig. 1-24). Las hélices a idénticas con una ordenación repetida de cadenas laterales no polares pueden arrollarse entre sí para formar una estructura estable particular llamada superarrollamiento. Los superarrollamientos largos parecidos a bastones se encuentran en muchas proteínas fibro sas, como las fibras de queratina a de la piel, el pelo y las uñas o el fibrinógeno del coágulo sanguíneo. ► La hoja plegada (3. Es característica de la formación de enlaces de hidrógeno entre enlaces peptídicos opuestos en segmentos paralelos (muchas veces en realidad antiparalelos) de la misma cadena polipeptídica (véase fig. 1-24). Las hojas plegadas (3 for man el núcleo de la mayor parte de las proteínas globulares. ► El giro p. El enlace de hidrógeno entre el enlace peptídico del grupo CO del residuo aminoácido n de un polipéptido con el enlace peptídico del grupo NH del residuo n + 3 tiene como resultado un giro en horquilla. Al permitir que el polipéptido invierta de forma súbita la dirección, pueden lograrse formas

globulares compactas. Los giros beta se llaman así porque tam bién conectan con frecuencia cadenas antiparalelas en hojas ple gadas (3 (véase fig. 1-24B). Elementos estructurales más complejos que consisten en combina ciones de los módulos estructurales anteriores constituyen los domi nios proteínicos; son regiones compactas de una proteína formadas por el doblamiento nuevo de la estructura primaria, de tal manera que los elementos de la estructura secundaria pueden aproximarse cerca entre sí. Estos dominios suelen representar unidades funciona les que participan en el enlace de otras moléculas. Además, a menu do se forman puentes disulfuro covalentes entre los grupos sulfhidrilo (—SH) de pares de residuos de cisteina que ocurren den tro de la misma cadena polipeptídica o en cadenas polipeptídicas di ferentes (véase fig. 1-25). Desde luego, la estructura terciaria o cuaternaria de las proteí nas depende de la secuencia primaria de aminoácidos. Sin embar go, aunque al analizar la secuencia primaria es posible predecir secuencias típicas de estructuras secundarias, como hélices a , hojas plegadas (i y giros (3, en la actualidad no es posible predecir con precisión la estructura tridimensional total. Además de la comple jidad estructural de los polipéptidos simples, muchas proteínas están organizadas como agregados complejos de múltiples subunidades polipeptídicas.

Lecturas adicionales A lb e rts B, J o h n s o n A , L e w is J, R a ff M , R o b e rts K , W a lte r P (2001) Molecular Biology of the Cell, 4th Edn. Garland Publishing, New York. B ell SP, D u tta A (2002) DNA replication In eukaryotic cell. Annu. Rev. Biochem. 71 , 307-331. B ig P ic tu re B o o k o f V iru s e s at: h ttD ://w w w .viro loQ v.ne t/B ia V iro lo g y /B V H o m e P a a e .h tm l B ra d e n C , T o o s e J (1999) Introduction to Protein Structure, 2nd Edn. Garland Science, New York.

B ro w n D A (2002) Allosteric cascade of spliceosome activation. Annu. Rev. Genet. 36, 333-360. C a rra d in e C R , D re w H R (1997) Undemanding DNA. The molecule and how it works. Academic Press, London. L o d is h H , B a ltim o re D, B e rk A . Z ip u rs k y L, M a ts u d a ira P, D a rn e ll J (1995) Molecular Cell Biology, 3rd Edn. Scientific American Books, New York.

32

CAPÍTULO UNO

ESTRUCTURA DEL DNA Y EXPRESIÓN GÈNICA

Bibliografía Atkins JF, Gesteland R (2002) The 22nd amino acid. Science 296, 1409-1410. Berget SM (1995) Exon recognition in vertebrate splicing. J. Biol. Chem. 24, 2411-2414. Fairbrother WG, Yeh RF, Sharp PA, Burge CB (2002) Predictive identification of exonic splicing enhancers in human genes. Science 297, 1007-1113. Friedberg EC, Feaver WJ, Gerlach VL (2000) The many faces of DNA polymerases: strategies for mutagenesis and for mutational avoidance. Proc. Natl Acad. Sei. USA 97, 5681-5883. Friedberg EC, Wagner R, Radman M (2002) Specialised DNA polymerases, cellular survival, and the genesis of mutations. Science 296, 1627-1630.

Hastings ML, Krainer AR (2001) Pre-mRNA splicing in the new millennium. Curr. Opin, Genet. Dev. 13, 302-309. Kozak M (1996) Interpreting cDNA sequences: some insights from studies on translation. Mamm. Genome 7, 563-574. Lim LP, Burge CP (2001) A computational analysis of sequence features Involved in recognition of short introns. Proc. Natl Acad. Sei. USA 98, 11193-11198. Staley JP, Guthrie C (1998) Mechanical devices of the spliceosome: motors clocks, springs and things. Cell 92, 315-326. Tarn WY, Steitz JA (1997) Pre-mRNA splicing: the discovery of a new spllceosome doubles the challenge. Trends Biochem Sei. 22, 132-137. Wickens M, Anderson P, Jackson RJ (1997) Life and death In the cytoplasm: messages from the 3' end. Curr. Biol. 7, 220-232.

CAPÍTULO

DOS

Estructura y función de los cromosomas Contenido del capítulo

34

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

El DNA funciona en un contexto. El DNA humano está estructu rado en crom osom a s y los cromosomas funcionan dentro de las cé lulas que se derivan de otras células por división celular. El proceso de la división celular es, por supuesto, un pequeño componente del ciclo celu la r, el proceso por el cual los cromosomas y sus molécu las de DNA constituyentes necesitan elaborar copias perfectas de sí mismas y a continuación segregarse en la forma de células hijas. Es to necesita dirigirse con sumo cuidado, de tal manera que las célu las hijas reciban el juego correcto de cromosomas. En la forma usual de división celular, la m itosis, cada célula hija tiene el mismo número y tipo de cromosomas que la célula parental. Además, en ciertas células del testículo y el ovario ocurre una forma de división celular especializada, m eiosis, que da lugar respectivamente a las cé lulas espermatozoo y óvulo.

2.1

Ploidía y ciclo celu lar

El número de diferentes cromosomas en cualquier célula nucleada, el juego de cromosomas, y el contenido de DNA relacionado se designan n y C, de forma respectiva. En los seres humanos n es igual a 23 y C se aproxima a 3.5 pg (3.5 X 10 12 g). Las células pueden variar en el número de copias que tienen del juego de cromosomas (ploidía). Los espermatozoos y óvulos llevan un juego de cromo somas y se dice que son haploides (n cromosomas; contenido de DNA, C). Sin embargo, casi todas las células humanas poseen dos co pias del juego de cromosomas y son diploides (2 n cromosomas; contenido de DNA, 2C). Casi todos los mamíferos son diploides (la rata vizcacha roja es una rara excepción; véase Gallardo y cois., 1999), pero en otros organismos hay muchos ejemplos de especies que en condiciones normales son haploides, tetraploides (4n) o poliploides (> 4n). Es menos común la triploidía (3n) porque los tri plo ides tienen problemas con la meiosis (véase más adelante). Las células diploides del cuerpo del hombre proceden al final de una célula diploide única, el cigoto, a través de rondas repetidas de división celular mitótica. Cada ronda puede resumirse como una vuelta del ciclo celular (fig. 2-1). Esto comprende una etapa corta de la división celular, la fase M (mitosis: véase fig. 2-7) y una interfase intermedia larga. La interfase puede dividirse en fase S (sín tesis de DNA), fase G1 (espacio entre la fase M y la fase S) y fase G2 (espacio entre la fase S y la fase M). Desde la anafase de la mi tosis, de manera directa, hasta la duplicación del DNA en la fase S, un cromosoma de una célula diploide contiene una doble hélice de DNA y el contenido total de DNA es 2C. La fase G1 es el estado normal de una célula y el estado final a largo plazo de las células que no se dividen. Las células sólo entran en la fase S si están dis puestas para la mitosis; las células que no se dividen permanecen en una etapa G1 modificada, llamada en ocasiones fase G0. El diagra ma del ciclo celular puede dar la impresión de que toda la acción interesante sucede en las fases S y M, pero esto es una ilusión. Una célula pasa la mayor parte de su vida en la fase GO o G1 y es allí donde el genoma lleva a cabo la mayor parte de su trabajo. Un subgrupo de las células diploides del cuerpo constituye la lí nea germinal (véase fig. 2-9). Dichas células originan las células di ploides especializadas en el ovario y los testículos, que pueden dividirse por meiosis para producir gametos haploides (espermato zoo y óvulo). En seres humanos (n = 23), cada gameto contiene 22 autosomas (cromosomas que no son sexuales) más un cromosoma del sexo. En los óvulos, el cromosoma del sexo siempre es una X; en el espermatozoo puede ser una X o una Y. Después de la fecun-

: Total d e 92 + « crom osom as j ¡ divididos en dos células hijas

46 c ro m o s o m a s (c o n d e n s a d o s ) 4C 46 crom osom as (extendidos), dos dobles hélices d e DNA por crom osom a

Síntesis DNA

46 crom osom as (extendidos), una doble hélice de DNA por crom osom a 2C

Fig. 2-1. Contenido cromosomico del DNA humano durante el ciclo celular. La interfase comprende G1 + S + G2. Los cromosomas contienen una hélice doble de DNA desde la anafase de la mitosis hasta que se duplicó el DNA en la fase S. Desde esta etapa hasta el final de la metafase de la mitosis, el cromosoma consiste en dos cromátides que contienen cada uno un dúplex de DNA, para form ar dos dobles hélices por cromosoma. El contenido de DNA de una célula diploide antes de la fase S es 2C (el doble del contenido de DNA de una célula haploide), en tanto que entre la fase S y la mitosis es 4C.

dación, el cigoto es diploide (2 n) con la constitución cromosómica 46,XX o 46,XY (fig. 2-2). Las otras células del cuerpo, aparte de la línea germinal, se conocen como células somáticas. Las células so máticas humanas suelen ser diploides, pero algunas células carecen de núcleo y cualquier cromosoma y se dice que son n u lip loides, y otras son p o r naturaleza poliploides como resultado de múltiples rondas de replicación del DNA sin división celular (véase sección 3.1.4).

2.2

Estructura y función de los crom osom as

Los cromosomas, como se observan bajo el microscopio y se ilus tran en libros de texto, son bastante engañosos porque representan un estado poco com ún que ocurre brevem ente en el ciclo celular, du rante una parte de la fase M, a medida que se preparan las células para llevar a cabo la división celular (metafase). Los cromosomas de metafase y los cromosomas de prometafase se hallan en un estado muy condensado y tienen una estructura poco común de dos cromátides

2.2

E s p e rm a to z o o

1 ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

35

C ig o to

Fig. 2-2. La vida humana desde un punto de vista cromosómico. Las células haploïdes espermatozoo y óvulo se originan por meiosls a partir de precursores dlploides (véase fig. 2-9). En el óvulo fecundado los crom o somas del espermatozoo y el óvulo forman al principio los pronúcleos femenino y masculino separados. Éstos se combinan durante la primera mitosis.

porque en esta etapa el DNA se replicó en preparación para la divi sión celular. Tan sólo por estar empacados apretadamente en haces puros, los cromosomas en metafase son lo bastante grandes para ob servarse con un microscopio de luz, pero no son representativos por que el empaque extremo asegura que los genes están desconectados. Los procesos de la división celular son fascinantes por sí mismos y los errores en el empaquetamiento o la división del genoma tienen consecuencias médicas de importancia (sección 2.5). Sin embargo, es esencial recordar que la inmensa mayoría de los cromosomas en el ciclo celular tiene un aspecto muy diferente. Durante toda la pro longada etapa de la interfase, los cromosomas están extendidos en gran proporción y por consiguiente son mucho más difusos que los cromosomas en metafase que se observan en la figura 2-14. Como hecho importante, un cromosoma de interfase sólo comprende una cromátide aislada y una doble hélice de DNA y la estructura extendi da permite que se expresen los genes. Como organelos funcionales, al parecer, los cromosomas eucarióticos sólo requieren tres clases de elementos de secuencia de DNA: centrómeros, telómeros y orígenes de replicación. Se verifi có este requerimiento simple por el éxito en la construcción de cro mosomas artificiales en levaduras: los fragmentos grandes extraños de DNA se comportan como cromosomas autónomos cuando se unen a secuencias cortas que especifican un centròmero funcional, dos telómeros y un origen de replicación (fig. 5-17). En fecha re ciente se crearon cromosomas artificiales de mamíferos con base en principios similares (Huxley, 1997; Schindelhauer, 1999).

2.2.1 El empaque del DNA en los cromosomas sugiere múltiples jerarquías de doblamiento del DNA En la célula está muy ordenada la estructura de cada cromosoma (Manuelidis, 1990). Incluso en el núcleo de interfase la doble héli ce de DNA de 2 nm está sujeta cuando menos a dos niveles de arro llamiento (fig. 2-3): ► El nucleosoma es la unidad fundamental del empaquetamiento. Consiste en un núcleo central de ocho proteínas histona, proteí nas básicas (= carga positiva) y pequeñas, muy conservadas, de 102 a 135 aminoácidos. Cada núcleo comprende dos molécu las de cada una de las histonas H2A, H2B, H3 y H4, alrededor de las cuales se arrolla un tramo de 146 pb de DNA de doble cadena en 1.75 vueltas. Los nucleosomas adyacentes están co

nectados por un tramo corto de DNA espaciador. Las fotomi crografías electrónicas de preparaciones adecuadas muestran un aspecto en hilo de cuentas. Nota: las células del espermatozoo son diferentes. Se logra un empaquetamiento muy apretado de DNA en las cabezas de los espermatozoos en reemplazo de his tonas con una clase alternativa de proteínas básicas pequeñas conocidas como protam in as. ► El hilo de cuentas, de unos 10 nm de diámetro, se arrolla a su vez en una fibra de cromatina de 30 nm de diámetro. Al pa recer, el cromosoma de interfase consiste en estas fibras de cro matina, organizadas tal vez en asas largas como se describe más adelante. Durante la división celular, los cromosomas están mucho más condensados. El DNA en un cromosoma en metafase está compactado alrededor de 1/10 000 de su longitud en extensión. Se encuentran asas de la fibra de cromatina de 30 nm, que contienen 20 a 100 kilobases (kb) de DNA por asa, unidas a una estructura central, que se integra con proteínas ácidas diferentes de las histonas, en espe cial topoisomerasa I I , una enzima que tiene la interesante capaci dad de pasar una hélice doble de DNA a través de otra y abrir una hendidura y repararla. Se sabe que la topoisomerasa II y algunas otras proteínas de la cromatina se unen a una secuencia abundante en AT y las asas de cromatina pueden ser unidas por tiras de varios cientos de pares de bases de DNA muy abundante en AT (> 65%) (regiones de fijación a la estructura central). En las cromátides de un cromosoma en metafase está más compactado aún el com plejo de asa-estructura central por arrollamiento (véase fig. 2-3).

2.2.2 Cromosomas individuales ocupan territorios no superpuestos en un núcleo en interfase Hace mucho tiempo se conoce el alto grado de organización en el citoplasma, pero el núcleo, asimismo, tiene una subestructura con siderable. Además del n u cleo lo familiar, en el que se transcribe el rRNA y se ensamblan subunidades ribosómicas, en fecha reciente se identificaron muchos otros compartimientos subnucleares (cuer pos d e CajaL, cuerpos de PML, paramanchas, etc.; véase recuadro 3-1). La colocación de los cromosomas dentro del núcleo también está muy organizada y se desarrollaron técnicas especializadas para seguir los movimientos de cromosomas individuales dentro de cé lulas vivas en el transcurso de la interfase.

36

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

C ro m á tid e s h e rm a n a s

80 M b de DNA

I

80 M b de DNA

I

A sa s d e fib ra d e c ro m a tin a (~ 7 5 kb)

D o b le h é lice

E s tru c tu ra ce n tra l

F ib ra d e c ro m a tin a d e 3 0 nm

1 0 nm

Fig. 2-3. Del DNA dúplex hasta el cromosoma en metalase. La figura muestra el cromosoma 17 humano, como se observa en una preparación de 400 bandas con bandeo G. Las relaciones estimadas de empacamiento (el grado de compactación del DNA dúplex lineal) para los cromosomas humanos son 1:6 para nucteosomas, 1:36 en la fibra de 30 nm y > 1:10 000 para el cromosoma en metafase. En la actualidad no se sabe con certeza si el DNA en el centròmero del cromosoma en metafase se retrasó en su replicación a diferencia del resto de la cromátide o si la replicación completa del DNA ocurrió en la fase S y la contracción en el cen tròmero se debe a alguna otra causa.

En cierto grado, la mitosis origina una restricción en la orienta ción cromosómica durante la interfase. Justo antes que se divida la célula, los microtúbulos unidos al centrómero tiran cada cromoso ma hacia uno de los dos polos del hu so m itó tico (la red de micro túbulos que colocan los cromosomas durante la mitosis; véase recuadro 2-1). Durante el movimiento de los cromosomas, los centrómeros guían el camino y tira detrás de sí los brazos de los cro mosomas para crear formas en V. Al inicio de la interfase, los cromosomas tienden a conservar esta llamada o rien ta ción Rabí, con los centrómeros alineados en dirección de un polo del núcleo y los telómeros en la dirección opuesta (en algunas células en las que la interfase es corta, los cromosomas tienden a adoptar esta orienta ción durante toda la interfase). En los mamíferos, los cromosomas de las células en interfase no suelen encontrarse en la orientación Rabí y no están tan bien ali neados los diferentes centrómeros (aunque tienden a agruparse entre sí en la periferia del núcleo durante la fase G 1 antes de dis persarse mucho más en el transcurso de la fase S). No obstante, aunque cada cromosoma se encuentra en una forma muy extendi da, los cromosomas no están entrelazados de manera extensa. Por el contrario, ocupan al parecer territorios cromosómicos no super puestos relativamente pequeños (fig. 2-4 y Cremer y Cremer, 2001; Parada y Misteli, 2002). Aunque en apariencia los cromosomas en interfase no tienen si tios nucleares favoritos, la colocación cromosómica no es aleatoria.

Por ejemplo, se sabe que los cromosomas humanos con mayor abun dancia de genes se concentran en el centro del núcleo, en tanto que los cromosomas con menos genes se localizan hacia la envoltura nu clear (fig. 2-4; véase Boyle y cois., 2001; y Parada y Mistelli, 2002). Es probable que los movimientos de los cromosomas se restrinjan por interacción con la envoltura nuclear y asimismo por las estructu ras internas del núcleo, incluido el nucleolo (en el caso de cromoso mas que contienen genes de RNA ribosómicos).

2.2.3 Cromosomas como organeios funcionales: sitio centrai del centróm ero Los cromosomas normales sólo tienen un centrómero que se obser va al microscopio como la constricción primaria, la región en la que se unen las cromátides hermanas. El centrómero es esencial pa ra la segregación durante la división celular. Los fragmentos cromo sómicos que carecen de un centrómero (fragmentos acéntricos) no se unen al hu so m itó tico (véase recuadro 2-1 y fig. 2 -7 ) y tam poco se incluyen en los núcleos de cualquiera de las células hijas. Durante la profase tardía de la mitosis se forman en cada cen trómero un par de complejos multiproteínicos grandes que se co nocen como cin eto co ro s, unido cada uno a una de las cromátides hermanas. Los microtúbulos se fijan a cada cinetocoro, con unión del centrómero de un cromosoma y los dos polos del huso (véase recuadro 2-1 y fig. 2-7). En la anafase, los microbútulos del cineto-

2.2 | ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

El huso mitótico (véase figura abajo) está formado por microtúbulos (polímeros hechos de un heterodímero repetido de tubulina a y p) y pro teínas relacionadas con microtúbulos. Cada uno de los dos polos del huso está definido por un centrosoma, el principal centro organizador del microtùbulo. El centrosoma origina el crecimiento hacia afuera de fibras microtubulares polares, con un extremo ( - ) en el exterior del centrosoma y el extremo distal en crecimiento definido como el extremo ( + ) . Cada centrosoma está compuesto de una matriz fibrosa (que consiste en unas 50 copias de un complejo anular de tubulina y) en la cual está inclu ido un par de centriolos (véase dibujo A en la figura de abajo). Los cen tró lo s son estructuras cilindricas cortas compuestas de microtúbulos y proteínas relacionadas y los dos centriolos del par siempre están dis puestos en ángulos rectos entre si, para form ar una figura en L (véase dibujo A de la figura). En cierto punto de la etapa G1 se separan los dos centriolos en un par y durante la fase S comienza a crecer un centriolo hijo en la base de cada centriolo madre y en ángulos rectos con éste has ta que se forma por completo alrededor de G2. Los dos pares de centrio los permanecen juntos entre sí en un complejo centrosómico único hasta el inicio de la fase IVI en la que se divide el complejo en dos y comienzan

+

¡

37

a separarse las dos mitades. Cada centrosoma desarrolla ahora su dis posición radial propia de los microtúbulos (áster) y comienza a migrar a los extremos opuestos de la célula en donde se forman los polos del huso (véase dibujo C en la figura). En el huso se encuentran tres formas diferentes de fibras de microtúbu los (véase dibujo C en la figura abajo): ► Fibras polares que se extienden desde los dos polos del huso hacia el ecuador. Se desarrollan en la profase en tanto está intacta aún la membrana nuclear. Nota: para mayor claridad sólo se muestra un par de estas fibras superpuestas. ► Las fibras del cinetocoro no se desarrollan hasta la prometafase. Estas fibras se fijan al cinetocoro, una estructura multiproteínica uni da al centròmero en cada cromátide (dibujo B) y se extienden en dirección de los polos del huso. ► Se forman fibras astrales alrededor de cada centrosoma y se extien den hacia la periferia.

M atriz del centro so m a

1 P laca de J m etafa se

C en triolos M ic rotúbulos del cin etocoro

M ic rotúbulos

o = co m p lejo s d e anillo d e tu b u lin a y

M icrotúbu los polares

M ic rotúbulos astrales

A ) Estructura del centrosoma; B) relación cinetocoro-centrómero; C ) estructura del huso mitótico.

coro tiran las dos cromátides hermanas hacia polos opuestos del huso (fig. 2-7). Los cinetocoros tienen un sitio central en este pro ceso y controlan el ensamble y desensamble de los microtúbulos fi jados y, a través de la presencia de moléculas motoras, impulsan al final el movimiento del cromosoma. Tal vez secuencias específicas de DNA dictaminan la estructura y función de los centrómeros. En eucariotas simples, las secuencias que especifican la función del centròmero son muy cortas. Por ejemplo, en la levadura Saccharomyces cerevisiae el elemento centròmero tiene alrededor de 110 pb de largo y consiste en dos elementos de flanqueo muy conservados de 9 pb y 11 pb y un segmento central rico en AT de unos 80 a 90 pares de bases (pb) (véase fig. 2-5). Los centrómeros de estas células son intercambiables; un fragmento del elemento cen tròmero derivado de un cromosoma de la levadura puede reemplazar al centròmero de otra sin consecuencias aparentes. En mamíferos, el DNA de centrómeros individuales consiste en cientos de kilobases de DNA repetido, algunos específicos de cro mosomas y otros inespecíficos. Un componente mayor del DNA

centromérico humano es un DNA sa télite a , una familia comple ja de DNA repetidos en tándem basada en un monómero de 171 pb (véase sección 9.4.1 para una descripción más completa de las secuencias centroméricas humanas). Se sabe que varias proteínas diferentes se relacionan con centrómeros humanos, incluido el CENP-B, que se enlaza de forma directa a un DNA satélite a (véa se cuadro 2-1). Como hecho sorprendente, al tomar en cuenta que la maquinaria de segregación cromosómica está muy conservada a través de eucariotas, han evolucionado con rapidez el DNA centro mérico y las proteínas vinculadas e incluso se considera que tienen a su cargo el aislamiento reproductor de especies en surgimiento (Henikoff y cois., 2001).

2.2.4 Cromosomas como organeios funcionales: orígenes de la replicación En condiciones normales, en la mayor parte de las células diploides el DNA sólo se replica una vez por ciclo celular. El inicio de la replica-

38

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

C e n trò m e ro

TCACATGAT AGTGTACTA

USA 18

80-90 pb > 90% (A+T)

TGATTTCCGAA ACTAAAGGCTT III

T e lóm ero R e p e tic io n e s tá n d e m b a s a d a s en la fó rm u la g en eral

H S Á 19

(TG)i_3 TG2. 3/C2- 3A(CA)1.3 e.g. 5'... .T G T G T G G G T G T G G T G T G T G T G G ... .3' 3 '....A C A C A C C C A C A C C A C A C A C A C C ....5 '

H S A 19 S ecuen cia d e replicación autónom a

H SA 18

C o n tie n e un co n s e n s o d e n ú c leo d e 11 p b q u e es a b u n d a n te en AT, a u n a d o a a lg u n as co p ia s im p e rfe c ta s d e e s ta s e c u e n c ia q u e a b a rc a una región del D N A d e unos 5 0 pb

SE

IQI Fig. 2-4. Cromosomas individuales ocupan territorios precisos en el cromosoma en el núcleo en interfase. La fotografía muestra un ejemplo de pintado crom osóm ico (véase sección 2.4.3) con dos pinturas cromosómicas, una específica para HSA18 ( = cromosoma humano 18: señal verde, localización periféri ca) y otra para HSA19 ( = cromosoma humano 19: señal roja, locali zación nuclear interna) con un núcleo en interfase. El núcleo aparece azul como resultado de la contratinción con DAPI, un colorante fluores cente que enlaza DNA. Imagen proporcionada gentilmente por Wendy Bickmore, MRC Human Genetics Unit, Edinburgh.

ción está controlado por secuencias de acción cis que se encuentran cerca de los puntos en que comienza la síntesis de DNA. Es probable que éstos sean sitios en los que se enlazan proteínas de acción trans. Los orígenes eucarióticos de la replicación se estudiaron de modo más exhaustivo en la levadura, en la que es posible estudiar mediante una valoración genética la presencia del posible origen de una replicación. A fin de analizar la capacidad de un fragmento aleatorio de DNA de levadura para promover la replicación autónoma, se incorpora en un plásmido bacteriano junto con un gen de levadura que es esencial pa-

C o p ia s im p e rfe c ta s

□

C o n se n so d e n ú c leo =

ATTTAT(A/G)TTTA TAAATA(T/C)AAAT

Fig. 2-5. Elementos funcionales del cromosoma de una levadura.

ra el crecimiento de células de levadura. Esta estructura formada se utiliza para transformar una levadura mutante que carece del gen esencial. Las células transformadas sólo pueden formar colonias si es posible que el plásmido se replique en las células de levadura. Sin em bargo, la replicación bacteriana originada en el plásmido no funciona en la levadura. Por consiguiente, los pocos plásmidos que se transfor man con una gran eficiencia deben poseer una secuencia dentro del fragmento de levadura insertado que confiere la capacidad para repli carse de forma extracromosómica con gran eficacia, un elemento lla mado de secuencia autónomamente replicante (SAR). Se piensa que los elementos SAR derivan de orígenes de repli cación auténticos y, en algunos casos, se ha confirmado al mapear

Principales proteínas del centròmero humano Nombre

Localización

Características

CENP-A

Placa externa del cinetocoro

Una variante H3 de histona específica de centròmero; esencial para la vida y necesaria para dirigir CENP-C al cinetocoro

CENP-B

Heterocromatina centromérica

Enlaza una secuencia de 17 pb que se encuentra en monómeros satélite alfa (box CENP-B); ¿necesaria para la estructura de la heterocromatina centromérica?

CENP-C

Placa interna del cinetocoro

Esencial para la función apropiada centrómero/cinetocoro

CENP-G

Placa interna del cinetocoro

Se enlaza a un subgrupo de secuencias en la familia satélite a

N ota: Las proteínas CENP-E (en la corona fibrosa), CENP-F (placa externa del cinetocoro) y las proteínas INCENP (heterocromatina céntrica) se vinculan de modo transitorio con el centròmero. Véase Craig y cois. (1999) para detalles adicionales.

2.2 | ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

un elemento SAR específico en una localización cromosomica pre cisa y demostrar que la replicación del DNA se inicia en realidad en ese punto. Los elementos SAR de la levadura sólo se extienden alrededor de 50 pb y consisten en una región abundante en AT que contiene un consenso de centro conservado y algunas copias imper fectas de esta secuencia (fig. 2-5). Además, los elementos de SAR contienen un sitio de enlace para un factor de transcripción y se sa be que se une al origen un complejo multiproteínico. Se han definido de manera más imprecisa los orígenes de la re plicación del DNA de mamíferos por la ausencia de una valoración genética. Se estudiaron algunos sitios de inicio pero esos estudios no fueron capaces de identificar un origen único de la replicación. Esto condujo a pensar que la replicación puede comenzar en múl tiples sitios sobre regiones de decenas de kilobases de largo (véase Gilbert, 2001). Al parecer, los cromosomas artificiales de mamífe ros actúan sin que se proporcionen secuencias de SAR específicas.

39

Telomerasa y el problema de la replicación del extremo Durante la replicación del DNA se sintetiza la cadena lenta en pie zas porque debe crecer en una dirección opuesta a la del sentido 5'—>3' de la síntesis de DNA. Se requiere una sucesión de síntesis de “puntos reversos” para formar una serie de fragmentos de DNA cuyos extremos sella a continuación la ligasa de DNA (véase fig. 1-9 y secciones 1.2.2 y 1.2.3). A diferencia de las polimerasas de RNA, las de DNA requieren absolutamente un grupo -OH 3' libre de un ácido nucleico de doble cadena a partir del cual pueden ex tender la síntesis. Ello se logra mediante una polimerasa de RNA para sintetizar un oligonucleótido iniciador (cebador) RNA com plementario a fin de cebar la síntesis de cada uno de los fragmen tos de DNA utilizado para elaborar la cadena lenta. En estos casos, los oligonucleótidos iniciadores RNA (cebadores) requieren la pre-

2.2.5 Cromosomas como organelos funcionales: los teióm eros Estructura, función y evolución del telómero Los teiómeros son estructuras especializadas que contienen DNA y proteínas y que cubren los extremos de cromosomas eucarióticos. Es posible que tengan varias funciones: ► C onservación d e la in tegración estructural. Cuando se pierde un telómero, el extremo resultante del cromosoma es inestable. Tiene la tendencia a fusionarse con los extremos de otros cromo somas rotos, participar en fenómenos de recombinación o ser degradado. Las proteínas de unión del telómero reconocen el ex tremo 3' sobresaliente de un telómero (véase más adelante) y pue de proteger el DNA terminal in vitro y tal vez in vivo. ► A segurar la rep lica ció n co m p leta d e l DNA (véase sección so bre telomerasa más adelante). ► C oloca ció n d e l crom osom a . Los teiómeros ayudan al esta blecimiento de la configuración tridimensional del núcleo, al pareamiento de cromosomas, o ambas cosas. En algunas célu las, los extremos del cromosoma parecen atados a la envoltura nuclear, lo que sugiere que los teiómeros pueden ayudar a la posición de los cromosomas. Los teiómeros eucarióticos consisten en disposiciones moderadamen te largas de repeticiones tándem de una secuencia simple abundante en TG en una de las cadenas de DNA y abundante en CA en la ca dena complementaria. En el hombre (y en otros animales), la secuen cia de repetición es el hexanucleótido TTAGGG. La estructura (TTAGGG)n del telómero humano abarca de manera característica alrededor de 3 a 20 kb, punto más allá del cual (en dirección del cen tròmero) se encuentran alrededor de 100 a 300 kb de rep eticio n es rela cion a d a s co n e l teló m ero antes de encontrar alguna secuencia única. A diferencia de los centrómeros, la secuencia de los teiómeros se conservó en la evolución -la secuencia simple repetida es muy similar en teiómeros de diferentes especies, por ejemplo TTGGGG en Paramecium, TAGGG en Trypanosoma, TTTAGGG en Arabidopsis y TTAGGG en Homo sapiens-. (Nota: sin embargo, en algunas especies existe cierta flexibilidad en la repetición precisa de la unidad como se observa en la levadura S. cerevisiae\ véase fig. 2-5.) Además, hay una gran conservación en los tipos de proteínas de enlace de telómero (véa se Blackburn, 2001). No obstante, las repeticiones relacionadas con el telómero no están conservadas en eucariotas y se desconoce su función.

S ín te sis de DNA

1 ▼

T e lo m e ra s a

Translocación en zim àtica

AATCCC 5'

S ín te sis de DNA

Fig. 2-6. La telomerasa extiende la cadena abundante en TG de teiómeros mediante la síntesis de DNA con una plantilla interna de RNA. Nota: se muestran hexanucleótidos recién sintetizados sombreados y el mecanismo de alargamiento depende de la plantilla de RNA que con tiene una repetición tándem casi perfecta com o se muestra subrayada en la secuencia siguiente: 5 ' CUAACCCUAAC 3 '.

sencia de cierto DNA adelante d e la secuencia que se copia con la finalidad de que sirva como plantilla. Sin embargo, nunca puede encontrarse dicha plantilla en el extremo final de una molécula li neal de DNA y es necesario un mecanismo diferente para solucio nar el problema de la replicación de los extremos de una molécula lineal de DNA.

40

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

El problema de la replicación del extremo se soluciona al ex tender la síntesis de la cadena rápida con una forma especializada de transcriptasa inversa (polimerasa de DNA dependiente de RNA) pro porcionada por una enzima de RNA y proteína especializada cono cida como telomerasa. Esta última lleva en su componente de RNA una secuencia corta dentro de su extremo 5’, CUAA CCCUAAC. con una secuencia hexanucleótida interna (cursivas subrayadas) que es la secuencia antisentido de la secuencia de repetición del telómero humano (TTAGGG). Esta secuencia actúa como una plantilla para cebar la síntesis extendida de DNA de secuencias de DNA teloméricas en la cadena rápida. La extensión adicional de la cadena rápida proporciona la plantilla necesaria para que la polimerasa alfa de DNA complete la síntesis de la cadena lenta (fig. 2-6). Este mecanismo de ja al telómero en sí mismo con un extremo 3’ saliente que suminis tra un blanco de DNA de filamento único para ser unido por proteínas específicas de telómero, como TRF2 humano. Pese a ello, es posible que no sea importante la naturaleza real de la secuencia del telómero. Se sabe que la longitud del telómero es muy variable y es tá sujeta a control genético (véase sección 17.5.1).

2.2.6 Heterocromatina y eucromatina En el núcleo de interfase, la mayor parte de la cromatina está ex tendida, dispersada en la totalidad del núcleo, y se riñe de forma di fusa (eucromatina). No obstante, durante el ciclo celular parte de la cromatina permanece muy condensada y forma la región de tin ción oscura (heterocromatina). Los genes que se hallan en la eu cromatina pueden expresarse o no, según sean el tipo de célula y sus requerimientos metabólicos, pero es muy poco probable que se ex presen los genes localizados dentro de la heterocromatina, sea de manera natural o como resultado de un reordenamiento cromoso mico. Existen dos clases de heterocromatina: ► Heterocromatina constitutiva: casi siempre es inactiva y con densada. Consiste en gran parte en repeticiones de DNA y se encuentra en los centrómeros de los cromosomas, alrededor de ellos y en ciertas otras regiones (véase fig. 2-15 para la localiza ción de heterocromatina constitutiva en cromosomas humanos y el cuadro 9-2 para las cantidades estimadas de DNA relacio nado) . ► Heterocromatina facultativa: puede existir en una forma ge néticamente activa (descondensada) o inactiva (condensada). Los ejemplos incluyen la inactivación del cromosoma X en ma míferos (sección 10.5.6) o el silenciamiento del cromosoma del sexo durante la meiosis masculina. En el último caso, durante la meiosis masculina están inactivados el cromosoma X y el Y (por un periodo aproximado de 15 días en seres humanos). Se condensan para formar el corpúsculo XY y son segregados ha cia un compartimiento nuclear especial. En la eucromatina, las ba n d a s G muestran algunas de las propieda des de la heterocromatina, pero en menor grado (las bandas G son las bandas oscuras del cromosoma que resultan de la tinción positi va con el colorante de Giemsa; las bandas pálidas, negativas al Giemsa, se denominan bandas R; véase la sección 2.4.1). La croma tina de la banda G en cromosomas en metafase está más condensa da que la de la banda R y las bandas G contienen relativamente pocos genes. El subgrupo de bandas R que se revela mediante el bandeo T tiene una densidad en particular alta de genes. En la sec ción 1.3.5 se discuten las diferentes estructuras de la cromatina en regiones cromosómicas activas e inactivas en sentido transcripcional.

2.3

Tipos de división celular: m itosis y m eiosis

2.3.1 La mitosis es la forma normal de división celular A medida que se forma una persona a partir de un embrión, en el tránsito de feto a lactante y adulto, se requieren divisiones celulares a fin de generar el gran número de células necesarias. Además, mu chas células tienen un periodo de vida limitado, de tal manera que en el adulto hay una necesidad continua de generar nuevas células. Todas estas divisiones celulares ocurren por mitosis. Esta última es el proceso normal de división celular, desde la segmentación del ci goto hasta la muerte de la persona. En el tiempo de vida de un ser humano puede haber alrededor de 10 divisiones mitóticas (sec ción 11 .2 . 1). La fase M del ciclo celular (fig. 2-1) consiste en las diversas eta pas de la división nuclear (profase, prometafase, metafase, anafase y telofase de la mitosis) y la división celular (citocinesis), que super pone las etapas finales de la mitosis (fig. 2-7). En preparación para la división celular se contraen y condensan los cromosomas, antes muy extendidos, de tal modo que alrededor de la metafase de la mitosis se observan con facilidad bajo el microscopio. Aunque el DNA se replicó antes en algún momento, sólo en la prometafase es posible observar que los cromosomas individuales comprenden dos cromátides hermanas, unidas en el centròmero. La interacción entre las diferentes fibras del huso (véase recua dro 2 - 1) tracciona los cromosomas hacia el centro y alrededor de la metafase está alineado cada cromosoma en el plano ecuatorial (pla ca de metafase). Nota: durante la mitosis, cada cromosoma en el juego diploide se comporta de manera independiente y no se rela cionan en lo absoluto los homólogos maternos y paternos. En la anafa se se dividen los centrómeros y dan lugar a la separación física de lo que fueron antes cromátides hermanas; la tracción por los fibras del huso asegura que las cromátides hermanas separadas se desplacen a polos opuestos (figs. 2-7 y 2-8). El DNA de las dos cromátides her manas es idéntico y se elimina cualquier error en la replicación del DNA. Por consiguiente, el efecto de la mitosis es generar células hi jas que contienen precisamente el mismo juego de secuencias de DNA.

2.3.2 La meiosis es una forma especializada de división celular que origina las células espermatozoo y óvulo Las células germinales primordiales migran dentro de la gónada embrionaria y llevan a cabo rondas repetidas de mitosis para formar la oogonia en mujeres y la espermatogonia en varones (n ota : esto incluye mucho más mitosis en varones que en mujeres -véase re cuadro 11-4—y ello puede ser un factor importante que explica las diferencias de sexo en el índice de mutación). El crecimiento y la diferenciación adicionales producen oocitos primarios en el ova rio y espermatocitos primarios en el testículo. Estas células diploides especializadas pueden sufrir meiosis (fig. 2-9). La meiosis incluye dos divisiones celulares sucesivas pero sólo una ronda de replicación del DNA, de tal manera que los produc tos son haploides. En varones, el resultado son cuatro espermato zoos; empero, en mujeres hay una d ivisió n celu la r a sim étrica porque el citoplasma se divide de manera desigual en cada etapa: los productos de la meiosis I (la primera división meiótica) son un

2.3 1 T IPOS DE DIVISIÓN CELULAR: MITOSIS Y MEIOSIS | 41

INTERFASE

Nucleolo

• Envoltura nuclear intacta • No hay crom osom as visibles

Profase • Se condensan los crom osom as y se tornan visibles • Se desarrolla el huso bipolar P laca de m etafase

Prometafase • Se disuelve la envoltura nuclear • Los crom osom as com ienzan a migrar al plano ecuatorial (placa d e m etafase) y se observa que contienen dos crom átides Mitosis

Metafase • C rom osom as plenam ente condensados y localizados en la placa de m etafase

Plano ecuatorial = placa d e m etafase

Anafase • Se divide ca d a centròm ero • Las dos crom átides d e cada crom osom a sufren tracción a polos opuestos

Telofase • Los crom osom as llegan a los polos y com ienzan a descondensarse • S e form a nuevam ente la m em brana nuclear • C om ienza a dividirse el citoplasm a

Citocinesis • División del citoplasm a term inada para crear dos células hijas

Fig. 2-7. Representación de la división celular por mitosis.

oocito secundario grande y una célula pequeña (cuerpo polar). Durante la meiosis II (la segunda división meiótica), el oocito se cundario origina a continuación la célula óvulo madura grande y un segundo cuerpo polar. Existen dos diferencias cruciales entre mitosis y meiosis (cuadro 2 - 2 ):

► Los productos de la mitosis son diploides; los de la meiosis son haploides. ► Los productos de la mitosis son idénticos en sentido genético; los de la meiosis son diferentes en ese mismo aspecto. La mitosis incluye una vuelta del ciclo celular (fig. 2-1). En la fase S se replica el DNA y en la fase M se dividen las dos copias exacta mente iguales entre las células hijas. La meiosis también va prece dida por una ronda de síntesis de DNA, pero a continuación hay dos divisiones celulares sin síntesis intermedia de DNA, de tal for

ma que los productos terminan haploides. La segunda división de la meiosis es idéntica a la mitosis, pero la primera división tiene di ferencias importantes cuyo propósito es generar diversidad genéti ca entre las células hijas. Esto se lleva a cabo por dos mecanismos: segregación independiente de homólogos paternos y maternos y re combinación.

Segregación independiente de homólogos paternos y maternos Durante la meiosis I, los homólogos materno y paterno de cada par de cromosomas forman un bivalente al parearse entre sí (sinapsis; véase fig. 2-11). Después de la replicación del DNA cada cromoso ma consiste en dos cromátides hermanas, de tal manera que el bi valente es una estructura de cuatro cadenas en la placa de metafase. A continuación, las fibras del huso tiran un cromosoma completo

42 j CAPÍTULO DOS i ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

Fig. 2-8. Vísta de la figura 2-7 realizada por un biólogo celular. Las imágenes son de células HeLa y se obtuvieron mediante microscopía de desconvolución. El DNA está teñido con OAPI (color rojo falso) y los microtúbulos con un anticuerpo a tubulina p (color verde falso). Imagen proporcionada por Willlam Eamshaw, University of Edinburgh. Reimpreso a par tir de Pollard y Earnshaw (2002), Cell Biology, con autorización de Elsevier.

Cuadro 2-2. Comparación de mitosis y meiosis Mitosis

Meiosis

Localización

Todos los tejidos

Sólo en testículos y ovario

Productos

Células somáticas diploides

Células haploides espermatozoo y óvulo

Replicación de DNA y división celular

En condiciones normales una ronda de replicación por división celular

Sólo una ronda de replicación pero dos divisiones celulares

Extensión de la profase

Corta (-30 minutos en células humanas)

La meiosis 1 es larga y compleja; puede requerir varios años para terminarse

Pareamiento de homólogos

Ninguna

Sí (en la meiosis 1)

Recombinación

Rara y anormal

En condiciones normales cuando menos una vez en cada brazo del cromosoma

Relación entre células hijas

Genéticamente Idéntica

Diferente (recombinación y separación independientes de homólogos)

2.3 | TIPOS DE DIVISIÓN CELULAR: MITOSIS Y MEIOSIS | 43

La célula germinal - primordial penetra la gónada

Ovario

® x Divisiones d e oogonia repetidas +

Testículo

--jp—

Esperm atogonia

m itóticas diploide esperm atogonia

C recim iento y diferenciación

m

Esperm atocito prim ario (2rí)

M eiosis I

Esperm atocitos secundarios (n )

Meiosis II

Un óvulo m aduro

Segundo cuerpo polar

(n)

(n)

m

m

1

l

I

w

(m) Esperm átides (n)

I

w

C uatro esperm atozoos m aduros (n)

Fig. 2-9. Desarrollo de la línea germinal. La línea germinal se desarrolla por división mitótica repetida de las células diploides y culmina con la producción de oocitos y espermatocitos primarios. Estas células diploides pueden someterse a meiosis. Esta última comprende dos divisiones celulares pero sólo una ronda de replicación de DNA, de tal manera que los productos son haploides. En los seres humanos, los oocitos primarios entran en meiosis I durante la vida fetal pero a continuación se detienen en la etapa profase hasta la pubertad o después. Durante este tiempo, los oocitos primarios completan su fase de crecimiento y adquieren una cubierta gelatinosa externa, granulos corticales, ribosomas, mRNA, vitelo, etc. Después de la pubertad, cada mes completa la meiosis un oocito. Los espermatozoos se producen de manera continua desde la pubertad en adelante.

(dos cromátides) hacia cada polo. Sin embargo, para cada uno de los 23 pares de homólogos es independiente la elección del homó logo que ingresa con la célula hija. Esto permite que se produzcan en una persona 22ii o alrededor de 8.4 X 106 posibles combinacio nes de cromosomas parentales (fig. 2 - 10 ).

Recombinación Durante la profase de la meiosis I los homólogos en sinapsis dentro de cada bivalente intercambian segmentos en una forma aleatoria. En la etapa cigotena, cada par de homólogos comienza a formar un complejo sinaptonemal que consiste en dos cromosomas en apo sición estrecha, separados por una proteína de centro lineal larga. La terminación de este complejo marca el inicio de la etapa paquitena, justo cuando ocurre la recombinación (cruzamiento o cruce). El cruce incluye la rotura física de la doble hélice en una cromátide materna y otra paterna y la unión de los extremos paterno y ma terno. En conjunto, la combinación de recombinación entre ho mólogos en la profase I aunada a la segregación independiente de

homólogos en la anafase I asegura que una célula individual pueda producir un número casi ilimitado de gametos diferentes desde el punto de vista genético. No se comprende el mecanismo que posibilita la alineación de los homólogos. Sin embargo, se piensa que para la recombinación se requiere esta aposición cercana. Se cree que los nodulos de recom binación, ensambles muy grandes de múltiples proteínas localizadas a intervalos en el complejo sinaptonemal, median los fenómenos de recombinación. Es posible observar que los dos homólogos están unidos físicamente en puntos específicos. Cada una de estas cone xiones se describe como un quiasma e indica un punto de cruza miento. En la meiosis masculina humana hay en promedio 55 quiasmas por célula y tal vez 50% más en la meiosis femenina. En el capítulo 13 se consideran las consecuencias genéticas del cruza miento. Además de su función en la recombinación, se piensa que los quiasmas son esenciales para la segregación correcta de cromosomas en la meiosis I. Al conservar los homólogos materno y paterno de cada par de cromosomas unidos en el huso hasta la anafase I (figs.

44

CAPÍTULO DOS

©

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

O 1 2 3 ¡4

5 6 7 8 9 10111213141516171819202122 X

M a te rn o

1 2 3 4 5 |6 7 8 |9 (1011 i1 2 f1 3 !14 (l5(l6 {l7¡18 |1 9¡2 0|2 1 ;22 Y

P a te rn o

C é lu la s o m á tic a d ip lo id e

A ) [ i 12 |3 |4 |5 ¡ 6 |7 ¡8 ¡9 [l0 |l1 [i2 [i3 r |4 [ l5 [ l 6 | l 7 [ l 8 [l9¡20|21 |2 2 [y [

— —I— 1 .1 i—'Rtti—I— ---r=l—T—i—f » 9 1011 [ Í 2 j l 3 ( l 4 [15 16N718p9|20 21 22 [xj

B)

|l ¡2 |3 4 5 6 7 8 9 10 11 1213(14 15(16 17 18 19 20 21 22 Y l

E s p e rm a to zo o s h a p lo id e s

D) |l 2 j3 |4 [5 |6 7|8|9[l0|nMNIl4|l5|l6h7|Í8|Í9|20|2l|22|x| |

I

I

1

J

.........I

I ...... 1..........

"

{

.........I

I ......... I

I

I

I" " " "

E) [1 2 3 4 5 |6 |7 8 9 10 11 |l2|l3|l4 1516 17|l8|l9j20Í21 2 2 |X

Fig. 2-10. Meiosis: la segregación independiente de homólogos maternos y paternos en la meiosis I produce el primer nivel de diversidad genética. Hay 223 u 8.4 millones de formas diferentes de tom ar un cromosoma de cada uno de los 23 pares en una célula diploide. Los gametos A-E muestran tan sólo cinco de las posibles combinaciones de cromosomas maternos y paternos. En este diagrama se Ignora la recombinación, que introduce un segundo nivel de diversidad genética, lo que asegura que cada cromosoma individual que pasa es una mezcla de secuencias maternas y paternas.

2-11 y 2 - 12 ) tienen una función que es análoga a la de los centró-

meros en la mitosis y la meiosis II. Pruebas genéticas indican que los niños con números incorrectos de cromosomas suelen ser el producto de gametos en los que un bivalente careció de cruces. Al parecer, la meiosis I I es idéntica a la mitosis, excepto que sólo existen 23 cromosomas en lugar de 46. Cada cromosoma consiste en dos cromátides y éstas se separan en la anafase II; em pero, hay una diferencia. Las cromátides hermanas de un cromo soma mitótico son idénticas, son copias una de la otra, pero las dos cromátides de un cromosoma en la meiosis II pueden ser di ferentes en sentido genético como resultado de cruces en la meio sis I (fig. 2 - 12 ).

2.3.3 Paramiento X-Y y regiones seudoautosómicas En la meiosis femenina, cada cromosoma tiene un compañero por completo homólogo y los dos cromosomas X hacen sinapsis y se cruzan justo igual que cualquier otro par de homólogos. En la meiosis masculina hay un problema. Los cromosomas humanos del sexo X y Y son muy diferentes entre sí. No obstante, en varones se parean en la profese I, lo que asegura así que en la anafase I cada célula reciba un cromosoma del sexo, sea X o Y. El pareamiento de los cromosomas X y Y es terminoterminal y no a lo largo de toda su longitud, y es posible por una región base de 2.6 mega (Mb) de homología entre los cromosomas X y Y en las puntas de sus brazos cortos. El pareamiento se sostiene por un cruce obligatorio en esta región. Los genes en el segmento de pareamiento tienen ciertas pro piedades interesantes: ► Se encuentran como copias homologas en los cromosomas X y Y. ► No están sujetos a inactivación X (como se esperaría ya que ca da sexo tiene dos copias). ► Debido al cruzamiento, los alelos de estos locus no muestran los patrones normales de herencia ligados a X o Y, sino que se segregan como alelos autosómicos.

Debido a esta conducta, esta región se conoce como región mayor seudoautosómica. En las puntas de los brazos largos de ambos cro mosomas se halla una segunda región seudoautosómica más peque ña de 320 kb, pero el pareamiento y cruzamiento en esta región seudoautosómica menor no es una característica obligatoria de la meiosis masculina.

2.4

Estudio de los crom osom as hum anos

2 A 1 Es posible observar cromosomas mitóticos en cualquier célula en división, pero en seres humanos es difícil estudiar ios cromosomas meióticos Obtención y preparación de céiuias humanas para análisis cromosómico En condiciones normales se observan los cromosomas en las célu las en división y es difícil obtener células en división directamente del cuerpo humano. La médula ósea es una posible fuente —pero siempre es mucho más fácil obtener una fuente accesible de células que no están en división y cultivarlas en el laboratorio. Las fuentes de células humanas que se utilizan más a menudo para análisis citogenético son las sanguíneas y los fibroblastos de la piel. Casi nin guna persona tiene inconveniente en proporcionar unos cuantos mililitros de sangre y mediante tratamiento con lectinas, como la fitohemaglutinina, es posible inducir con facilidad a los linfocitos T sanguíneos para que se dividan. Los fibroblastos de la piel se cul tivan de biopsias de piel. Además, el diagnóstico prenatal incluye de rutina análisis cromosómicos en células fetales que se despren den hacia el líquido amniótico o en vellosidades coriónicas. Aunque en algunos organismos se han descrito con precisión los cromosomas tan temprano como en la década de 1880, durante

2.4

17

17 ' 1

ESTUDIO DE LOS CROMOSOMAS HUMANOS ¡ 45

Leptoteno

------------------------------------- -

Los crom osom as son cadenas finas no pareadas que consisten en dos crom átides herm anas enlazadas d e m odo estrecho

Gigoteno 17

Los hom ólogos m aterno y paterno se parean entre sí para form ar bivalentes

Paquiteno Engrasam iento de los crom osom as O curre el cruzam iento

Diploteno Se separan los hom ólogos pero se conservan juntos por quiasm as Pueden contarse los cruces y registrarse las posiciones

Diacinesia Bivalentes más contraídos

Fig. 2-11. Meiosis: las cinco etapas de la profase en la meiosis I. Se muestran dos pares representativos de homólogos. Hay dos cruzamientos en el cromosoma 1 bivalente y uno en el cromosoma 17 bivalente. Para mayor claridad, los dos cruzamientos en el cromosoma 1 incluyen las dos mismas cromátides. En realidad, es probable que el número de cruzamientos sea alto y múltiples cruzamientos pueden incluir tres o Incluso todas las cuatro cromátides en un bivalente, como se muestra en la figura 13-2.

muchos decenios todos los intentos por preparar dispersiones de cromosomas humanos proporcionaron una maraña que impidió analizarlos. La clave para obtener preparaciones diseminadas anali zables fue una nueva técnica, el desarrollo de células en suspensión líquida y su tratamiento con solución hipotónica para tornarlas tu mefactas. Esto permitió obtener las primeras preparaciones de bue na calidad en 19 5 6 . Se colocan los glóbulos blancos de la sangre en un medio de cultivo rico entrelazado con fitohemaglutinina y se permite que crezcan durante 48 a 72 horas, cuando deben estar ya en división libre. No obstante, debido a que la fase M sólo ocupa una parte pequeña del ciclo celular, en realidad están en división pocas células en cualquier momento determinado. El índice mitótico (proporción de células en mitosis) se incre menta al tratar el cultivo con un agente que altera el huso, como la co lcem id a . Las células llegan a la fase M del ciclo, pero no son ca paces de superarla y de esa forma se acumulan células en la metafase de la mitosis. Muchas veces es preferible estudiar crom osom a s en la p rom eta fa se, que están menos contraídos y por consiguiente muestran más detalles. Los cultivos celulares pueden sincronizarse y evitar de modo temporal que lleven a cabo el ciclo. Con frecuencia eso se logra al añadir timidina en exceso (a fin de provocar una re ducción de dCTP y originar un retraso de la síntesis de DNA, de tal manera que las células permanezcan en la fase S). Cuando se supri men los efectos de la timidina, las células progresan a través del ciclo de manera sincrónica. Mediante ensayo y error, un tiempo después

de la supresión es posible determinar cuando se encuentra una bue na proporción de células en la etapa de prometafase deseada. La meiosis sólo puede estudiarse en muestras testiculares u ováricas. La meiosis femenina es en especial difícil, ya que sólo es activa en ova rios fetales, en tanto que la meiosis masculina puede estudiarse en una biopsia testicular de cualquier varón pospúber que desee proporcionar un espécimen. Los resultados de la meiosis pueden estudiarse al ana lizar los cromosomas de espermatozoos, aunque la metodología para ello es molesta. En algunos modelos de investigación de infecundidad masculina se recurre al análisis meiótico.

Cariotipificación y bandeo cromosómico Hasta la década de 1970 se identificaron los cromosomas a partir de su tamaño y la posición de los centrómeros. Esto hizo posible clasificarlos en grupos (cuadro 2-3), pero no identificarlos sin am bigüedad. La introducción de las técnicas de bandeo (recuadro 2-2) posibilitó al final identificar cada cromosoma y asimismo definir con mayor precisión puntos de rotura de translocación, deleciones subcromosómicas, etc. La resolución del bandeo puede incremen tarse mediante cromosomas más alargados, por ejemplo cromoso mas de la prometafase o más temprano, en lugar de la metafase. Los procedimientos típicos de bandeo de alta resolución para cromoso mas humanos pueden proporcionar un total de 400, 550 u 850 bandas (figs. 2-13 y 2-14).

46

CAPITULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

+

Fig. 2-12. Meiosis: de la metafase I a los gametos. La figura es una continuación de la tigura 2-11. A) De la m etalase a la d ivisió n ce lu la r en la m eiosis I. La figura muestra un posible patrón de segre gación de los dos bivalentes. B) M eiosis II. Aunque las dos cromátides hermanas de cada cromosoma se segregan a diferentes células hijas, los distin tos cromosomas se comportan de manera independiente y, en consecuencia, como se muestra, son posibles muchas combinaciones.

La constitución cromosomica se describe por un cariotipo que señala el número total de cromosomas y la constitución de cromo somas del sexo. Los cariotipos normales de mujeres y varones hu manos son 46,XX y 46,XY, respectivamente. Cuando hay una anormalidad cromosomica, el cariotipo también describe el tipo de anormalidad y las bandas o subbandas cromosómicas afectadas. Véase el recuadro 2-3 para detalles de la nomenclatura de los cro mosomas. Los cromosomas se muestran en un cariograma (véase fig. 2-14; con frecuencia denominado tan sólo cariotipo). Los cariogramas se preparaban al cortar una fotografía de los cromosomas homólogos diseminados y compatibles; en la actualidad se utiliza una compu tadora con un programa de análisis de imágenes. Como se comenta con detalle en el recuadro 2-2, el bandeo cro mosomico consiste en someter los cromosomas a desnaturación, di gestión enzimàtica, o ambos, seguido de la incorporación de un colorante específico de DNA, que origina que los cromosomas hu manos y otros mitóticos se tiñan como una serie de bandas claras y \ oscuras (figs. 2-13, 2-14; véase Craig y Bickmore, 1993). Son inte resantes los patrones de bandeo (y asimismo útiles para citogenetistas) porque proporcionan pruebas de cierta clase de estructura en regiones de 1 a 10 Mb. Los patrones de bandeo se correlacionan con otras propiedades. Las regiones que se tiñen como bandas G oscuras se replican tarde en la fase S del ciclo celular y contienen cromatina más condensada, en tanto que las bandas R (= bandas G

claras) suelen replicarse temprano en la fase S y tienen menos cromatina condensada. Los genes se concentran sobre todo en las ban das R, mientras que el DNA de la banda G más condensada, de replicación más tardía, es menos activo en sentido transcripcional. Existen asimismo diferencias en los tipos de elementos de repeti ción dispersados que se hallan en las bandas G y R (secciones 9.5.2 y 9.5.3). Es posible producir bandas similares a las G mediante tinción con q u in a crin a , que enlaza de preferencia DNA abundante en AT, en tanto que el patrón de bandeo R puede obtenerse con cro m o m icin a, que enlaza de modo preferencial DNA con abundancia de GC. Aunque el porcentaje del contenido de AT del DNA de la banda G humana sólo es un poco mayor que el del DNA de la ban da R, las bandas G son localm ente pobres en G-C (es decir, las ban das G individuales siempre tienen un %GC más bajo que sus secuencias de flanqueo inmediatas; Niimura y Gojobori, 2002). Saitoh y Laemmli (1994) sugirieron que la diferencia depende de las variaciones de la formación estructura central-asa. Se piensa que las asas de cromatina se fijan a la estructura central de los cromoso mas en regiones de fijación de estructuras centrales (RFEC) es peciales. Según el modelo de Saitoh y Laemmli, las bandas G tienen asas más pequeñas y una disposición más apretada de RFEC a lo lar go de la estructura central. Ello significa más RFEC por unidad de longitud de DNA en las bandas G que en las R, que da lugar a una tinción potente con colorantes selectivos de AT como Giemsa.

2.4 I ESTUDIO DE LOS CROMOSOMAS HUMANOS

A)

B)

47

C)

Fig. 2-13. Las diferentes resoluciones de bandeo cromosómico pueden determinar bandas, subbandas y sub-subbandas. Se muestra el cromosoma 4 (acompañado de un idiograma) a niveles crecientes de resolución que se aproximan a A) 400, B) 550 y C) 850 bandas por juego haploide. Nótese la subdivisión de bandas en subbandas a medida que aumenta la resolución. Adaptado a partir de Cross y Wolstenhoime (2001). En: Human Cytogenetics: Constitutional Analysis, 3rd Edn (ed. D. E. Rooney). Reproducido con autorización de Oxford University Press.

Fig. 2-14. Cariograma de prometafase con bandeo G de cromosomas mitóticos de linfocitos de un varón normal entre 550 y 850 bandas por juego haploide. Compárese con los ideogramas idealizados en la figura 2-15. Las longitudes totales de los cromosomas en metafase varían entre 2 y 10 /L/m; el DNA de cada célula tendría alrededor de 2 m de largo, si se estirara. Reproducido a partir de Cross y Wolstenhoime (2001). En: Human Cytogenetics: Constitutional Analysis, 3rd Edn (ed. 0. E. Rooney). Reproducido con autorización de Oxford University Press.

48

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

Cuadro 2-3. Grupos de cromosomas humanos

Grupo

Cromosomas

Descripción

A

1-3

El más grande; 1 y 3 son metacéntricos pero 2 es submetacéntrico

B

4,5

Grande; submetacéntrico, con dos brazos de tamaño muy diferente

C

6-1 2 ,X

Tamaño mediano; submetacéntrico

D

13-15

Tamaño mediano; acrocéntrico con satélites

E

16-18

Pequeño; 16 es metacèntrico pero 17 y 18 son submetacéntricos

F

19,20

Pequeño; metacèntrico

G

2 1 ,22,Y

Pequeño; acrocéntrico, con satélites en 21 y 22 pero no en la Y

Los autosomas se numeran del más grande al más pequeño, excepto que el cromosoma 21 es más pequeño que el 22.

Recuadro 2-2. Bandeo crom osom ico Bandeo G: se someten los cromosomas a digestión controlada con trip sina antes de teñirse con filernsa, un colorante químico que enlaza DNA. Las bandas oscuras de tinción positiva se conocen como bandas G. Las bandas pálidas son G negativas. Bandeo Q: se tiñen los cromosomas con un colorante fluorescente que se enlaza de modo preferencial a DNA abundante en AT. com o la Quinacrina, DAPI (4 ',6 díamidino-2-fenilindol) u Hoechst 33258 y se observan mediante fluorescencia ÜV. Las bandas fluorescentes se denominan ban das Q e indican los mismos segmentos cromosómicos que las bandas G. Bandeo R: es en esencia el patrón inverso (del inglés reverse) del patrón de bandeo G. Los cromosomas se desnaturalizan mediante calor en so lución salina antes de teñirse con Giemsa. El tratamiento con calor des-

2.4.2 Citogenètica molecular: hibridación fluorescente in situ (HFIS) cromosomica La h ib rid a ció n cro m o som ica in situ estándar consiste en hibridar una sonda de DNA marcada con DNA cromosómico desnaturali zado que se encuentra en una preparación de cromosomas en me talase en un portaobjetos para microscopio secado al aire. Con anterioridad se marcaban sondas con radioisótopos que a menudo proporcionaban relaciones de ruido: señal altas, pero el desarrollo de HFIS cromosomica (hibridación de fluorescencia in sitii) (véase Trask, 1991; Van Ommen y cois., 1995) ofreció una sensibilidad y resolución mejores en grado notorio (véase en la figura 2-16 el mé todo básico). En este caso, se marca la sonda de DNA de forma di recta mediante la incorporación de un precursor de nucleótidos marcado con fluorescencia, o de manera indirecta con la incorpo ración de un nucleótido que contiene una molécula rastreadora (o reportera) (como biotina o digoxigenina), que después de incorpo rarse en el DNA es enlazada a continuación por una molécula de afinidad marcada con fluorescencia (véase sección 6.1.2). Con el fin de incrementar la intensidad de la señal de hibridación, casi siempre se prefieren sondas de DNA grandes, si se dispone de ellas. La HFIS tiene la ventaja de proporcionar resultados rápidos que pueden calificarse de manera conveniente con la vista mediante un

ÍÜ! vm I n mi naturaliza DNA abundante en AT y las bandas R son Q negativas. Puede producirse el mism o patrón al enlazar colorantes específicos de GC como cromomicina A3, olivomicina o mitramicina. Bandeo T: identifica un subgrupo de bandas R que están concentradas sobre todo en los telómeros. Las bandas T son las bandas R que se tiñen de modo más intenso y se observan mediante un tratamiento por calor en especial Intenso del cromosoma antes de teñirlo con Giemsa, o con una combinación de colorante y fluorocromos. Bandeo C: se piensa que demuestra heterocromatina constitutiva, sobre todo en los centrómeros. De manera típica, los cromosomas se exponen a desnaturalización con una solución saturada de hidróxido de bario, an tes de teñirse con Giemsa.

m icroscop io d e flu o rescen cia (para los principios básicos subyacen tes de la microscopia fluorescente, véase fig. 6-5). En la HFIS cromo somica convencional se emplean dispersiones en metafase (HFIS d e m etafasé) y las señales de hibridación positiva con frecuencia se muestran como puntos dobles, que corresponden a la sonda hibridada a ambas cromátides hermanas (fig. 2-17A). Con un tipo de procesamiento de imágenes complicado y moléculas de enlace ras treadoras que llevan diferentes fluoróforos es posible mapear y or denar varias clonas de DNA de manera simultánea. La resolución máxima de la HFIS en la metafase es de varias megabases. El uso de los cromosomas de la prometafase más exten didos puede permitir una resolución de 1 Mb, pero debido a pro blemas con el doblamiento de la cromatina pueden aparecer dos señales de sonda marcadas de modo preferencial de lado a lado, a menos que estén separadas por distancias mayores de 2 Mb. Sin embargo, en fecha reciente se desarrollaron nuevas variaciones, co mo la HFIS de fibra, que incluye el estiramiento artificial de fibras de DNA o cromatina, que permite una resolución más alta (véase Heiskanen y cois., 1996). La HFIS en los cromosomas de núcleos de interfase (HFIS de interfase; véase fig. 2-17B) también puede suministrar un análisis de alta resolución porque los cromosomas es tán muy extendidos en forma natural comparados con los cromoso mas de la metafase o prometafase.

2.5 ! ANORMALIDADES DE LOS CROMOSOMAS

49

Recuadro 2-3. N o m e n c la t u r a d e l c r o m o s o m a h u m a n o El International System for Human Cytogenetic Nomenclature (ISCN) está fijado por el Standing Committee on Human Cytogenetic Nomenclature (véase lecturas adicionales). La terminología básica para el bandeo de cromosomas se decidió en una reunión en París en 1971 y con frecuen cia se conoce com o nomenclatura de París. Las localizaciones en el brazo corto se marcan p ip e tit) y en los brazos largos q (queue). Cada brazo del crom osom a está dividido en regiones marcadas p1, p2, p3, etc., y q1, q2, q3, etc., con conteo hacia fuera desde el centròmero. Las regiones están delimitadas por referencias específicas, que son características m orfológicas consistentes y pre cisas, com o los extremos de los brazos del cromosoma, el centròmero y ciertas bandas. Las regiones se dividen en bandas marcadas p11 (uno-uno, ¡no once!), p1 2 , p13, etc., subbandas marcadas p1 1 .1 , p1 1 .2 ,

2.4.3 Pintado cromosomico, cariotipificación molecular e hibridación com parativa del genoma Pintado cromosomico estándar Una aplicación especial de la HFIS ha sido el uso de sondas de DNA en las que el DNA de inicio está compuesto de un conjunto grande de diferentes fragmentos de DNA sólo de un tipo de cro mosoma. Estas sondas pueden prepararse al combinar todos los in sertos de DNA humano en una biblioteca de DNA específica de cromosomas (véase sección 8.3.2). De forma alternativa, es posible amplificar fragmentos específicos de seres humanos a partir de cé lulas híbridas monocromosómicas humanas (un tipo de célula híbri da de ser humano y roedor en la que hay un juego completo de cromosomas de roedor aunado sólo a un tipo de cromosoma hu mano (véase recuadro 8-4 para los detalles en la forma en que se preparan células híbridas; las secuencias humanas pueden amplifi carse de forma selectiva mediante Alu-PCR, un método de PCR en el que se usan oligonucleótidos iniciadores (cebadores) derivados de la secuencia repetida AIu que no se encuentra en el genoma de roe dores; véase recuadro 5-1). La señal de hibridación resultante representa las contribuciones combinadas de múltiples clonas de DNA marcadas, derivadas de muchos diferentes locus que abarcan un cromosoma completo, una p in tu ra d e l crom osom a, y en consecuencia causa fluorescencia de todos los cromosomas (pintado cromosomico; véase Ried y cois., 1998 y fig. 2-16 para la base del método). La figura 2-4 muestra un ejemplo de pintado cromosomico en núcleos en interfase, pero ca si todo el pintado cromosomico se lleva a cabo en cromosomas en metafase. Una aplicación importante es la definición de reordena mientos nuevos y marcado de cromosomas en citogenètica clínica y del cáncer (véase fig. 2-18 para un ejemplo). Es en particular útil en citogenètica del cáncer en la que las preparaciones de cromoso mas tumorales suelen ser de mala calidad.

Cariotipificación molecular e hibridación fluorescente in situ multiplex (HFIS-M) El pintado cromosomico se limitó al inicio por el número relativa mente pequeño de colorantes fluorescentes de distintos colores (fluoróforos) que podían emplearse para distinguir distintos cromo-

etc. y sub-subbandas, por ejemplo p1 1 .2 1 , p1 1 .22, con conteo en cada caso hacia fuera del centròmero (figs. 2-13 y 2-15). La distancia relativa del centròmero se indica con las palabras proximal y distai. Por consiguiente, Xq proximal significa el segmento del bra zo largo de X que está más cerca del centròmero, en tanto que 2p distal indica la porción del brazo corto del cromosoma 2 que está más distante del centròmero, y en consecuencia más cerca del telómero. Otros térm i nos comunes son los que se indican más adelante. Cuando se comparan cromosomas humanos con los de otras especies, el acuerdo es utilizar la primera letra del nombre de género y las dos prime ras letras del nombre de especie (p. ej., HSA18 significa humano: Homo sapiens, cromosoma 18).

somas. A fin de incrementar el número de diferentes blancos que pueden detectarse, suelen utilizarse un marcado combinatorio (sondas de marcado individuales con más de un tipo de fluoróforo) y la proporción de marcado (diferentes proporciones de los dis tintos fluoróforos) (véase Lichter, 1997). Los colores mixtos no se detectan mediante microscopía de fluorescencia estándar con fil tros apropiados. Por el contrario, es preferible el análisis digital au tomatizado de imágenes mediante el cual se asignan a diversas combinaciones de fluoróforos seudocolores artificiales. Los métodos anteriores permitieron en fecha reciente observar de modo simultáneo los 24 cromosomas humanos, una forma de cariotipificación molecular. El método general se conoce como HFIS multiplex (HFIS-M) y emplea imágenes digitales adquiridas por separado de cada uno de estos cinco fluoróforos diferentes me diante una cámara CCD (dispositivo de carga acoplado). Las imáge nes se analizan con un grupo de programas de computadora que generan una imagen compuesta en la cual a cada cromosoma se le proporciona un seudocolor diferente según sea la composición del fluoróforo. Estos métodos son aplicables en especial para analizar muestras tumorales en las que son en especial frecuentes reordena mientos cromosómicos complejos (véase fig. 17-10 para un ejemplo).

Hibridación comparativa del genoma (HCG) Una extensión adicional del pintado cromosómico es la hibridación comparativa del genoma (HCG) que incluye el pintado simultáneo de cromosomas en dos colores diferentes y que utiliza como sondas DNA total de dos fuentes relacionadas, que se espera que muestren diferencias que incluyen la ganancia o pérdida de regiones subcromosómicas o incluso de cromosomas completos. Una aplicación común es el análisis de muestras tumorales para prueba de regiones del genoma que se amplificaron, o en las que hubo pérdidas cromosómicas. Estas se identifican al comparar las proporciones de las dos señales de color cromosoma por cromosoma (véase fig. 17-3 para un ejemplo).

2.5 Anormalidades de ios cromosomas Las anormalidades de los cromosomas podrían definirse como cambios que dan por resultado una alteración visible de los cromo-

50 j CAPÍTULO DOS j ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

1 1 2 11

11.2 11

11.21 11.22 11.23 21.1 21.2 21.3

I ¡

31.2 31.3

31.2 31.3

37.1 37.2 37.3

12

13

O

O 13:1

21.2 21.3 22.1 22.2 22.3

14.1 14.2 14.3 21.1

24.1 24.2 24.3

12

13

14

15

11.32 11.31

11.2

21.2 21.3

Q

13.2 13.1

Itt 11.2

15 n

12.1

12.2 12.3

9

11:1

13.1 13.2

18

19

20

C lave:

iQ

□ □

C en tró m ero rD N A H etero cro m atin a no cen tro m érica

22

Fig. 2-15. Patrón de bandeo de cromosomas humanos. Se muestra una recopilación de los mejores patrones de bandeo que podrían observarse en cada cromosoma y no una fotografía de la forma en que apare cen al microscopio los cromosomas en cualquier célula. Los cromosomas están numerados en orden de tamaño, excepto que el 21 es en realidad más pequeño que el 22. Las disposiciones de genes de DNA ribosómico repetidos en los brazos cortos de los cromosomas acrocéntricos 1 3 ,1 4 ,1 5 , 21 y 22 aparece con frecuencia como tallos delgados que llevan perillas de cromatina (satélites). La heterocromatina constitucional ocurre en los centrómeros, en gran parte del brazo largo del cromosoma Y en las constricciones secundarias en 1q, 9q y 16q y en los brazos cortos de los cromosomas acrocéntricos.

2.5

j

ANORMALIDADES DE LOS CROMOSOMAS

B U SQ U ED A ESTÁNDAR

o

PINTADO C R O M O S O M IC O

C onjunto heterogéneo de m uchas clonas d e D N A con insertos derivados de m uchas diferentes regiones d e un m ism o crom osom a

C LO N A P U R IFIC A D A DE DNA Preparación d e crom osom a en portaobjeto para m icroscopio

i

Desnaturalización d e DNA

M arcado que incorpora nucleótidos con fluoróforo unido; desnaturalizar

in situ

Sonda única de marcado

i

Enlace de sonda única

51

o

Pintado cromosomico

D ejar fijar (annea/), exponer a UV y observar la fluorescencia in situ

Enlace d e pintado crom osom ico

Fig. 2-16. Bases de la HFIS de cromosomas y métodos de pintado cromosomico. Nota: para efectos de simplificación, sólo se muestra el resultado final en cromosomas en metafase. Véase las figuras 2-17A y 2-17B para ejemplos de HFIS en metafase y HFIS en interfase, respectivamente, y las figuras 2-18 y 2-4 para ejemplos de pintado cromosomico en cromosomas en metafase e interfase, de modo respectivo.

somas. La cuantía de lo que puede observarse depende de la técni ca utilizada. La pérdida o ganancia más pequeña de material visible mediante los métodos tradicionales en preparaciones citogenéticas estándar es alrededor de 4 Mb de DNA. Sin embargo, la HFIS per mite observar cambios mucho más pequeños; el desarrollo de la citogenética molecular eliminó cualquier línea divisoria clara entre los cambios descritos como anormalidades cromosómicas y los que se piensa que son defectos moleculares o del DNA. Una definición alternativa de anormalidad cromosómica es una anormalidad pro ducida por mecanismos específicamente cromosómicos. Casi todas las aberraciones cromosómicas se originan por pares erróneos de cromosomas rotos, recombinación inapropiada o mala segregación de cromosomas durante la mitosis o la meiosis.

Las anormalidades cromosómicas, sean constitucionales o so máticas, corresponden sobre todo a dos categorías: anomalías nu méricas y estructurales (véase recuadro 2-4). En ocasiones se identifican anormalidades en las que los cromosomas tienen el nú mero y estructura correctos, pero representan contribuciones desi guales de los dos padres (sección 2.5.4). Tal vez de forma inesperada corrigen problemas de origen parental.

2.5.2 Las anormalidades cromosómicas numéricas incluyen ganancia o pérdida de cromosomas completos Es posible distinguir tres clases de anormalidades cromosómicas numéricas: poliploidía, aneuploidía y mixoploidía.

2.5.1 Tipos de anormalidad cromosómica Las anomalías cromosómicas pueden clasificarse en dos tipos según sea la extensión con que ocurren en las células del cuerpo. En todas las células corporales existe una anormalidad constitucional. Cuando sucede, la anomalía debe presentarse muy temprano en el desarrollo, con mayor probabilidad como resultado de un espermatozoo u óvu lo defectuosos, o tal vez fecundación anormal o un fenómeno anó malo en el embrión muy temprano. Sólo en ciertas células o tejidos de un individuo existe una anormalidad somática (o adquirida). Como resultado, un individuo con una anomalía somática es un mo saico (fig. 4-10), contiene células con dos constituciones cromosómi cas diferentes y ambos tipos de células derivan del mismo cigoto.

Polipioidía Uno a 3% de los embarazos humanos reconocidos son triploides. La causa más usual es la de dos espermatozoos que fecundan un óvulo (dispermia); algunas veces se debe a un gameto diploide (fig. 2-19). Los triploides muy rara vez sobreviven hasta el término y el trastorno no es compatible con la vida. La tetraploidía es mucho más rara y siempre mortal. Por lo regular se debe a falta de terminación de la pri mera división cigótica: se replicó el DNA para dar un contenido 4C, pero a continuación no se efectúa la división celular en forma normal. Aunque la poliploidía constitucional es rara y mortal, todas las perso nas normales tienen algunas células poliploides (sección 3.1.4).

52

CAPÍTULO DOS

ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

Fig. 2-17. HFIS de dos colores en metafase e interlase para detectar el reordenamiento BCR-ABL en la leucemia mieloide crónica. Casi todos los casos de leucemia mieloide crónica resultan de una translocación recíproca en t(9 ;22 ) que genera la fusión de genes entre el oncogén ABL en 9q34 y el gen BCR en 22q11 (véase fig. 17-4 para detalles). Se muestra la hibridación con sondas marcadas para ABL (señal roja) y BCR (señal verde) para cromosomas en metafase de un paciente con LMC (a la izquierda y con las áreas dentro de los círculos con rayas aumentadas en los dibujos de la parte media) y para cromosomas de interfase del mismo paciente (fotografía de la derecha). Los genes ABL y BCR normales emiten señales estándar roja y verde, respectivamente (nota: son visibles las señales en la metafase de las dos cromátides hermanas cuando menos en el caso del gen ABL). Las flechas blancas muestran señales características para el gen de fusión BCR-ABL en los dos crom oso mas de translocación (der[9] y der[22]). Éstas pueden identificarse por la colocación muy cercana de las señales roja y verde y la superposición de las señales roja y verde aparece en naranja-amarillo. Imagen proporcionada por Fiona Hardíng, Institute of Human Genetics, Newcastle Upon Tyne.

Aneuploidía

J |

Fig. 2-18. Puede utilizarse el pintado cromosómico para definir reordenamientos de cromosomas. En este caso se investigó un cromosoma X anormal, con presencia de material cromosómico adicional en el brazo corto, identificado median te cariotipificación de una muestra de sangre periférica, con pintado completo del cromosoma X (rojo) y pintado completo del cromosoma 4 (verde). Esta imagen confirma que el material adicional que se en cuentra en el brazo corto del crom osom a X anormal se originó del crom osom a 4. La tinción de fondo de los cromosomas emplea el co lorante DAPI azul. Imagen proporcionada por Gareth Breese, Institute of Human Genetics, Newcastle Upon Tyne.

Euploidía significa la presencia de un juego completo de cromoso mas (n, 2n, 3n, etc.). La aneuploidía es lo opuesto: se encuentran uno o más cromosomas individuales en una copia adicional o fal tan en un juego euploide. Trisomía significa tres copias de un cro mosoma particular en una célula por otra parte diploide, por ejemplo trisomía 21 (47,XX+21 o 47,XY+21) en el síndrome de Down. Monosomía es la falta correspondiente de un cromosoma, por ejemplo monosomía X (45,X) en el síndrome de Turner. Con frecuencia, las células cancerosas muestran aneuploidía extrema, con múltiples anormalidades cromosómicas (véase fig. 17-10). Las células aneuploides surgen por dos mecanismos principales: ► No disyunción: falta de separación (desunión) de cromosomas pareados en la anafase de la meiosis I o falta de desunión de cromátides hermanas en la meiosis I I o la mitosis. La no dis yunción en la meiosis produce gametos con 22 o 24 cromoso mas, que después de la fecundación por un gameto normal producen un cigoto trisómico o monosómico. La no disyun ción en la mitosis crea un mosaico. ► Retraso de la anafase: falla de un cromosoma o una cromátide para incorporarse en uno de los núcleos hijos después de la división celular, como resultado del movimiento tardío (retra so) durante la anafase. Los cromosomas que no penetran en el núcleo de la célula hija se pierden.

Mixoploidía (mosaicismo y quimerismo) Mixoploidía significa la presencia de dos o más linajes de células di ferentes en sentido genético en un mismo individuo. Las poblacio-

2.5 [ ANORMALIDADES DE LOS CROMOSOMAS

nes celulares distintas desde el punto de vista genético pueden ori ginarse del mismo cigoto (mosaicismo) o más rara vez surgir de di ferentes cigotos (quimerismo). Véase la sección 4.3.6 y la figura 4-10 para una explicación más completa. Las anomalías que serían mortales en forma constitucional pueden ser compatibles con la vi da en mosaicos. Son comunes m osaicos d e aneuploidia. Por ejemplo, el mosaicis mo que da por resultado una proporción de células normales y otra de células aneuploides (p. ej., trisómicas) puede atribuirse a no dis yunción o retraso del cromosoma que ocurre en una de las divisio nes mitóticas del embrión temprano (cualquier célula monosómica que se forma suele morir). En ocasiones se encuentran m o sa ico sp o lip lo id es (p. ej., mosai cos humanos diploide/triploide). Como es muy poco probable la ga nancia o pérdida de un juego haploide de cromosomas por no disyunción mitótica, los mosaicos humanos diploides/triploides se originan con gran probabilidad por la fusión del segundo cuerpo po lar con uno de los núcleos segmentados del cigoto diploide normal.

Consecuencias clínicas de las anormalidades numéricas La presencia de un número erróneo de cromosomas tiene conse cuencias importantes, por lo general mortales (cuadro 2-4). Aun que el cromosoma 21 adicional en un varón con síndrome de Down es un cromosoma del todo normal, heredado de un padre normal, su presencia causa múltiples anomalías congénitas. Las monosomías autosómicas tienen consecuencias incluso más catas tróficas que las trisomías. Estas anormalidades deben ser conse cuencia de un desequilibrio en los niveles de productos génicos codificados en distintos cromosomas. El desarrollo y la función normales dependen de innumerables interacciones entre productos génicos, incluidos muchos que se codifican en diferentes cromoso mas. La alteración de las cifras relativas de cromosomas afecta estas interacciones.

53

D u p lic a c ió n d e D N A pe ro sin d ivisió n c e lu la r (en d o m ito s is) T e tra p lo id ía

Fig. 2-19. Orígenes de triploidía y tetraploidía.

La presencia de un número erróneo de cromosomas del sexo tie ne, con mucho, menos efectos perjudiciales que la existencia de un número erróneo de cualquier autosoma. Muchas veces, las personas 47,XXX y 47,XYY funcionan dentro de los límites normales; los varones 47,XXY tienen problemas relativamente menores compa rados con personas que presentan cualquier trisomía autosómica, e incluso la monosomía, en mujeres 45,X, tiene pocas consecuencias mayores. De hecho, ya que las personas normales pueden tener uno o dos cromosomas X, y uno o ninguno Y, deben existir mecanismos especiales que permitan el funcionamiento normal con números variables de cromosomas del sexo. En el caso del cromosoma Y, se debe a que lleva muy pocos genes, cuya función importante sólo es determinar el sexo masculino. En el cromosoma X humano, el me canismo especial en mamíferos de in a ctiv a ció n d e l crom osom a X

1 R e c u a d r o 1 i . N o m e n c la t u r a d e a n o r m a li d a d e s c r o m o s ó m ic a s Anorm alidades num éricas: Triploidía Trisomía Monosomía Mosaicismo

69,XXX, 69.XXY, 69.XYY p. ej. 47,X X ,+21a p. ej. 45,X p. ej. 47.XXX/46.XX

Anorm alidades estructurales: Deleción Inversión Duplicación Inserción Anillo (del inglés ring) Marcador Translocación recíproca Translocación robertsoniana (da lugar a un cromosoma derivado)

p. ej. 46,XYdel(4) (p16.30b; 46,XX,del (5)(q13q33)b p. ej. 46,XY¡nv(11)(p11p15) p. ej. 46,XX,dup(1)(q22q25) p. ej. 46,XX,ins(2)(p13q21q31)c p. ej. 46,XY,r(7)(p22q36) p. ej. 47,XX,+m ar‘i p. ej. 46,XX,t(2;6)(q35;p21.3)e

p. ej.45,XYder(14;21)(q10;q10)' p. ej. 46,XX,der(14;21 )(q10;q10),+ 2 1 9

Notas: aLa ganancia de un cromosoma está indicada por + ; la pérdida de un cro mosoma por bDeleción terminal (punto de rotura en 4p16.3) y deleción intersticial (5q13-q33). cUn reordenamiento de una copia del cromosoma 2 por inserción del seg mento 2q21-q31 dentro de un punto de rotura en 2p13. ‘’Cariotipo de una célula que contiene un cromosoma marcador (un cro mosoma adicional no identificado). eUna translocación reciproca equilibrada con puntos de rotura en 2q35 y 6p21.3. fUn portador equilibrado de una translocación robertsoniana 14:21. q10 no es en realidad una banda cromosomica sino que indica el centròmero; der significa derivado del cromosoma (y se utiliza cuando está presente un cromosoma de una translocación). 8Translocación de síndrome de Down; un paciente con un cromosoma normal 14, una translocación robertsoniana cromosomica 14;21 y dos copias normales del cromosoma 2 1 . Ésta es una nomenclatura corta; una nomenclatura más complicada está definida por el ISCN que permite la descripción completa de cualquier anormalidad cromosomica; véase Lecturas adicionales.

54 { CAPITULO DOS ¡ ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

(sección 10.5.6) controla el nivel de los productos génicos que co difica X al margen del número de cromosomas X que se encuen tren en la célula. La monosomía autosómica es, de manera invariable, mortal en la etapa más temprana de la vida embrionaria. En cada cromosoma hay tal vez unos cuantos genes en los que la reducción del nivel del producto génico al 50% es incompatible con el desarrollo. Asimis mo, si bien esta reducción no es desde luego patogénica para la ma yor parte de los genes (sección 16.4.2), puede tener efectos menores y la combinación de cientos o miles de estos efectos menores pue de ser suficiente para alterar el desarrollo normal del embrión. Las trisomías dan lugar a un cambio más pequeño que las monosomías en los niveles relativos de productos génicos y sus efectos son un poco menores. Los embriones trisómicos sobreviven más tiempo que los monosómicos y las trisomías 13, 18 y 21 son compatibles con la supervivencia hasta el nacimiento. Como hecho interesante, al parecer estos tres cromosomas contienen relativamente pocos ge nes (sección 9.1.4). No es tan obvia la razón por la que la triploidía es mortal en se res humanos y otros animales. Con tres copias de cada autosoma, la dosis de genes autosómicos está equilibrada y no debe causar pro blemas. Los triploides siempre son estériles porque los tripletos de cromosomas no pueden formar pares y segregarse de modo correc to en la meiosis, pero muchas plantas triploides son sanas y vigoro sas en todos los otros aspectos. La letalidad en animales se explica

quizá por un desequilibrio entre los productos codificados en el cromosoma X y los autosomas, que es incapaz de compensar la inactivación del cromosoma X.

2.5.3 Las anormalidades cromosómicas estructurales resultan de la reparación errónea de roturas de cromosomas o del mal funcionamiento del sistema de recombinación Las roturas cromosómicas ocurren como resultado de daño del DNA (p. ej., por radiación o sustancias químicas) o como parte del mecanismo de recombinación. En la fase G2 del ciclo celular (fig. 2-1) los cromosomas consisten en dos cromátides. Las roturas que suceden en esta etapa se manifiestan como roturas de cromátides y sólo afectan a una de las dos cromátides hermanas. Si las roturas que ocurren en la fase G1 no se reparan antes de la fase S, se pre sentan más tarde como roturas cromosómicas, que afectan a ambas cromátides. Las células tienen sistemas enzimáticos que reconocen, y tal vez reparan, extremos cromosómicos rotos. Las reparaciones pueden incluir la unión entre sí de dos extremos rotos o la adición de un telómero a uno de ellos. En condiciones normales, los meca nismos de punto de control del ciclo celular (sección 18.7.3) impi den que las células con roturas cromosómicas no reparadas inicien la mitosis; si no es posible reparar el daño, la célula se suicida (apoptosis).

Consecuencias de anormalidades cromosómicas numéricas Poliploidía Triploidía (69,XXX, XXY o XYY)

1-3% de todas las concepciones; casi nunca nace vivo; no sobrevive

Aneuploidía (autosomas) Nulísomía (falta de un par de homólogos)

Mortal antes de la implantación

Monosomía (falta de un cromosoma)

Mortal embrionaria

Trísomía (un cromosoma adicional)

Por lo general mortal en las etapas embrionaria o fetal; pero en las trisomías 13 (síndrome de Patau) y 18 (síndrome de Edwards) pueden sobrevivir hasta el término y la trísomía 21 (síndrome de Down) suele sobrevivir hasta los 40 años de edad o más

Aneuploidía (cromosomas del sexo) Cromosomas del sexo adicionales

(47,XXX; 47,XXY; 47,XYY) presenta problemas relativamente menores, con tiempo de vida normal

Ausencia de un cromosoma del sexo

45,X = síndrome de Turner. Alrededor de 99% de los casos se aborta de form a espontánea; los sobrevivientes tienen inteligencia normal pero son infecundos y muestran signos físicos menores. 45,Y = no viable.

Cuadro 2 - ~ Anormalidades estructurales que resultan de la reparación errónea de roturas cromosómicas o recombinación entre cromosomas no homólogos Un cromosoma afectado Una rotura Dos roturas

Tres roturas

Deleción terminal (cicatrizado por adición de telómero) Deleción intersticial; inversión Cromosoma anular (fig. 2-20) Duplicación o deleción por intercambio desigual de cromátides hermanas (fig. 11-7) Varios reordenamíentos, por ejemplo inversión con deleción, inserción intracromosómica

Dos cromosomas afectados

Translocación recíproca (fig. 2-21) Translocación robertsoniana (fig. 2-21) Duplicación o deleción por recombinación desigual (fig. 11-7) Inserción intercromosómica (directa o invertida)

2.5 ¡ ANORMALIDADES DE LOS CROMOSOMAS

Dos roturas en el mismo brazo

Inversión paracéntrica

Deleción intersticial

Dos roturas en diferentes brazos

Inversión pericéntrica

Crom osom a anular

Fig. 2-20. Posibles resultados estables de dos roturas en un mismo cromosoma.

Las anormalidades estructurales se presentan cuando las roturas no se reparan de forma correcta. A condición de que no haya extre mos rotos libres, es posible pasar a través de los puntos de control del ciclo celular. Por consiguiente, algunas veces se unen entre sí los extremos rotos erróneos. Cualquier cromosoma acentrico (falta de un centromero) o cromosoma dicéntrico (que posee dos centrómeros) resultante no se segrega de manera estable en la mitosis y al final se pierde. Sin embargo, los cromosomas con un centromero pueden propagarse de modo estable a través de rondas sucesivas de mitosis, incluso si son anormales desde el punto de vista estructu ral. La recombinación meiótica entre cromosomas pareados de for ma errónea es una causa común de translocaciones, en especial en la espermatogénesis. En el cuadro 2-5 se resumen las principales anormalidades estructurales estables. Una clase adicional rara de anormalidad estructural que no se muestra en el cuadro 2-5 es la de los isocromosomas. Son cromoso mas simétricos que poseen dos brazos largos o dos brazos cortos de un cromosoma particular. Se piensa que surgen de un intercambio anor mal tipo U entre cromátides hermanas justo cerca del centròmero de un cromosoma. Los isocromosomas humanos son raros excepto i(Xq) e i(21q), que es una causa ocasional de síndrome de Down. Las anomalías cromosómicas estructurales se equilibran si no hay ganancia o pérdida neta de material cromosómico y desequilibran si hay ganancias o pérdidas netas. En general, las anormalidades equili bradas (inversiones, translocaciones equilibradas) no tienen efecto en el fenotipo, aunque hay excepciones importantes a ello: ► Una rotura cromosomica puede alterar un gen esencial. ► La rotura puede afectar la expresión de un gen, aunque eso no altere la secuencia de codificación. Puede separar un gen de un elemento de control o colocar el gen en un ambiente de cro matina inapropiado, por ejemplo la translocación de un gen normalmente activo dentro de la heterocromatina. S atélites

T R A N S L O C A C IÓ N R O B E R TS O N IA N A

Intercam bio en brazos cortos proxim ales P érdida

C ro m osom as dicéntrico + acéntrico In estables en la m itosis

55

Translocación recíproca es tab le

Translocación ro bertsonian a estable

Fig. 2-21. Orígenes de translocaciones. Los cromosomas dicéntricos y acéntrícos son inestables durante toda la mitosis. Se producen translocaciones robertsonianas por intercambios entre los brazos cortos proximales de los cromosomas acrocéntricos 1 3 ,1 4 ,1 5 , 21 y 22 (las disposiciones de genes de DNA ríbosómico repetidos en los brazos cortos de los cromosomas acrocéntricos 1 3 ,1 4 ,1 5 ,2 1 y 22 aparecen con frecuencia como tallos delgados que llevan perillas de cromatína, satélites). En una translocación robertsoniana se encuentran los dos centrómeros pero funcionan com o uno y el cromosoma es estable. Se pierde el fragmento acéntrico pequeño, pero ello no tiene consecuencias patológicas porque sólo contiene secuencias repetidas de rDNA, que también se encuentran en los otros cromosomas acrocéntricos.

56 | CAPÍTULO DOS | ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

G a m e to s

A

F e c u n d a c ió n p o r g a m e to n o rm a l

n J jL

C ig o to s

N o rm a l

Portador balanceado Monosom ía parcial

Trísomía parcial

Fig. 2-22. Resultados de la meiosis en un portador de una translocación recíproca equilibrada. También son posibles otros modos de segregación, por ejemplo segregación 3:1. No es fácil predecir la frecuencia relativa de cada posible gameto. El riesgo de que un portador tenga un niño con cada uno de los posibles resultados finales depende de su frecuencia en los gametos y asimismo de la posibilidad de que un concepto con dicha anormalidad se desarrolle hasta el término. Véase el libro de Gardner y Sutherland (Lecturas adicionales) para la discusión.

► Translocaciones equilibradas del autosoma X que causan pro blemas con la inactivación de X (fig. 14-10). Las translocaciones robertsonianas se denominan en ocasiones fu siones céntricas, pero es erróneo porque de hecho las roturas se en cuentran proximales en los brazos cortos. La translocación del cromosoma es en verdad dicéntrica, pero debido a que dos centrómeros están muy cerca entre sí funcionan como uno y el cromoso ma se segrega de manera regular. Las partes distales de los brazos cortos se pierden como un fragmento acéntrico. Los brazos cortos de cromosomas acrocéntricos sólo contienen disposiciones de genes RNA ribosómicos repetidos y la pérdida de dos brazos cortos no tiene efecto fenotípico. Debido a que no existe este último, las translocaciones robertsonianas se consideran equilibradas, aunque de hecho se perdió cierto material. Las anormalidades desequilibradas pueden surgir de modo di recto, por deleción o, rara vez, duplicación, o de manera indirecta por segregación errónea de cromosomas durante la meiosis en un portador de una anomalía equilibrada. Los portadores de anorma lidades estructurales equilibradas pueden tener problemas durante la meiosis, si no corresponden las estructuras a los pares homólogos de cromosomas: ► Un portador de una translocación recíproca equilibrada puede producir gametos que, después de la fecundación, originan un niño por entero normal, un portador equilibrado desde el pun

to de vista fenotípico normal o varios cariotipos desequilibra dos que siempre combinan monosomía por parte de uno de los cromosomas con trisomía de parte del otro (véase fig. 2 -22 ). No es posible hacer afirmaciones generales sobre las frecuencias relativas de estos resultados finales. El tamaño de cualquier seg mento desequilibrado depende de la posición de los puntos de rotura. Si los segmentos desequilibrados son grandes, es proba ble que el feto se aborte de manera espontánea; un desequili brio de segmentos más pequeños puede tener como resultado niños anormales que nacen vivos. ► Un portador de una translocación robertsoniana equilibrada puede producir gametos que después de la fecundación dan lu gar a un niño del todo normal, un portador equilibrado en sen tido fenotípico normal o un concepto con trisomía o monosomía completas para uno de los cromosomas relaciona dos (fig. 2-23). ► Un portador de una inversión pericéntrica puede tener una descendencia desequilibrada porque los homólogos invertidos y no invertidos forman un asa cuando se parean de tal manera que se parean segmentos compatibles a lo largo de todo el cro mosoma. Si ocurre un cruce dentro del asa, el resultado es un cromosoma que lleva una deleción y duplicación desequilibra das. Las inversiones cromosómicas paracéntricas forman asas similares, pero cualquier cruce dentro del asa genera un cromo-

2.5 j ANORMALIDADES DELOS CROMOSOMAS

N o rm a l

P o rta d o r eq u ilib ra d o

(Trisom ía 14)

(M o n o so m ía 14)

(M o nosom ía 21 )

_57

Tris o m ía 21

v.

Fig. 2-23. Resultados de la meiosis en un portador de una translocación robertsoniana. Los portadores son asintomáticos pero con frecuencia producen gametos desequilibrados que pueden dar por resultado un cigoto monosómico o trisóm ico. Los cigotos monosómico y trisóm ico en este ejemplo no se desarrollarían hasta el término.

soma acéntrico o dicéntrico que no es probable que sobreviva. En el libro de Gardner y Sutherland (lectura adicional) o cual quier otro texto de citogenética se menciona con más detalles la meiosis en portadores de inversiones.

2.S.4 Los com plem entos eromosómícos al parecer norm ales pueden ser patogénicos si tienen el origen parental erróneo Las raras anomalías que se describen más adelante demuestran que no es suficiente tener el número y estructura correctos de cromoso mas; también deben tener el origen parental apropiado. Los con ceptos 46,XX en los que ambos genomas se originan del mismo padre (diploidía uniparental) nunca se desarrollan de forma co rrecta. En algunos cromosomas individuales, la presencia de ambos homólogos derivados del mismo padre (disomía uniparental) tam bién causa anormalidades. Un número pequeño de genes lleva la im pronta de su origen parental (sección 10.5.4) y se expresa de manera diferente según sea el origen. Se presupone que las anomalías de di somía y diploidía uniparentales se deben a la expresión anormal de estos genes improntados. La diploidía uniparental se observa en molas hidatidiformes, conceptos anormales con un cariotipo 46,XX de origen exclusiva mente paterno. Los embarazos molares muestran hiperplasia dise minada del trofoblasto, pero sin partes fetales y tienen un riesgo

considerable de transformarse en cariocarcinomas. Estudios de marcadores genéticos muestran que casi todas las molas son homocigotas en todos los locus, lo que indica que surgieron por duplicación cromosómica de un espermatozoo. Los teratomas ováricos resultan de diploidía uniparental materna. Son tumores benignos raros del ovario que consisten en tejidos embrionarios desorganizados, sin membranas extraembrionarias. Se originan por activación de un oocito no ovulado. La disomía uniparental (DUP), que afecta sólo a un par de ho mólogos, no se diagnostica si el resultado no es anormal, pero se de tecta por cromosomas en los que producen síndromes característicos (véase recuadro 16-6). La DUP puede incluir isodisomía, en la que los dos homólogos son idénticos, o heterodisomla, cuando derivan de ambos homólogos en un padre. Se piensa que la causa usual es res cate de trisomía: un concepto que es trisómico y que de otra mane ra moriría en ocasiones pierde un cromosoma por no disyunción mitótica o retraso de anafase de una célula totipotente. La progenie euploide de esta célula forma el embrión, en tanto que todas las cé lulas aneuploides mueren. Si cada una de las tres copias tiene una posibilidad igual de perderse, habrá dos de tres probabilidades de que se pierda un cromosoma aislado, lo que conduce a la constitu ción cromosómica normal y una en tres posibilidades de disomía uniparental (sea paterna o materna). La isodisomía uniparental pue de surgir tal vez por presión de selección en un embrión monosómi co para lograr la euploidía mediante la duplicación selectiva del cromosoma monosómico.

58

CAPITULO DOS i ESTRUCTURA Y FUNCIÓN DE LOS CROMOSOMAS

Lecturas adicionales Choo KH (2001) Domain organitation at the centromere and neo centromere. Development Cell 1, 165-177. Gardner RJM, Sutherland GR (1996) Chromosome Abnormalities and genetic Counseling, 2nd Edn. OUR Oxford [Exhaustiva in troducción a la naturaleza, origen y consecuencias de las anor malidades cromosómicas humanas]. ISCN (1995) An International System for Human Cytogenetic Nomenclature (ed. F Mitteiman). Karger, Basel. Pollard TD, Earnshaw WC (2002) Cell Biology, Saunders, Philadelphia. Rooney DE (2001) (ed.) Human Cytogenetics: Constitutional Analysis, 3rd Edn. Oxford University Press, Oxford [Protocolos de laboratorio detallados].

Rooney DE (2001) (ed.) Human Cytogenetics: Malignancy and Acquired Abnormalities, 3rd Edn. Oxford University Press, Oxford [Protocolos de laboratorio detallados]. Schinzel A (2001) Catalogue of Unbalanced Chromosome Aberrations in Man. Walter de Gruyter, Berlin. Therman E, Susman M (1992) (ed.) Human Chromosomes Structure, Behavior and Effects, 3rd Edn. Springer, New York [Ex celente introducción resumida, con énfasis en las bases cientí ficas, no tanto en las implicaciones clínicas], Web-based cytogenetic resources. Véase compilaciones simila res en: www.kumc.edu/gec/prof/cytogene.html

Bibliografía Blackburn EH (2001) Switching and signaling at the telomere Cell 106, 661-673. Boyle S, Gilchrist S, Bridger JM, Mahy NL, Ellis JA, Bickmore WA (2001) The spatial organization of human chromosomes within the nuclei of normal and emerin-mutant cells. Hum. Mot. Genet. 10, 211-219. Craig JM, Earnshaw WC, Vagnarelli P (1999) Mammalin cen tromeres: DNA sequence, protein composition, and role In cell cycle progression. Exp Cell Res. 246, 249-262, Craig JM, Bickmore WA (1993) Chromosome bands - flavours to savour. Bioessays 15, 349-354. Cremer T, Cremer C (2001) Chromosome territories, nuclear architecture and gene regulation in mammalian cells. Nature Rev. Genet. 2 292-301. Cross I, Wolstenholme J (2001) An introduction to human chro mosomes and their analysis. In: Human Cytogenetics: Constitutional Analysis, 3rd Edn (ed. DE Rooney) Oxford University Press, Oxford. Gallardo MH, Bickham JW, Honeycutt RL, Ojeda RA, Kohler N (1999) Discovery of tetraploidy in a mammal. Nature 401, 341. Gilbert DM (2001) Making sense of eukaryotic replication origins. Science 294, 96-100.

Heiskanen M, Peltonen L, Palotie A (1996) Visual mapping by high resolution FISH. Trends Genet. 12, 379-384, Henikoff S, Ahmad K, Malik HS (2001) The centromere paradox: stable inheritance with rapidly evolving DNA. Science 293, 1098-1102. Huxley C (1997) Mammalian artificial chromosomes and chromo some transgenics. Trends Genet. 13, 345-347. Manuelidis L (1990) A view of interphase chromosomes. Science 250, 1533-1540. Niimura Y, Gojobori T (2002) In silico chromosome staining: reconstruction of Giemsa bands from the whole human genome sequence. Proc NatlAcad. Sci. USA 99, 797-802. Parada LA, Misteli T (2002) Chromosome positioning in the interphase nucleus. Trends Cell Biol. 12, 425-432. Saitoh Y, Laemmli UK (1994) Metaphase chromosome structure: bands arise from a differential folding path of the highly AT-rich scaffold Cell 76, 609-622. Schindelhauer D (1999) Construction of mammalian artificial chromosomes: prospects for defining an optimal centromere. Bioessays 21, 76-83. Trask BJ (2002) Human cytogenetics: 46 chromosomes: 46 years and counting. Nature Rev. Genet. 3, 769-778.

CAPÍTULO

TRES

Células y desarrollo Contenido del capítulo

60

I

CAPÍTULO TRES | CÉLULAS Y DESARROLLO

Con excepción de los virus, toda la vida consiste en células —com partimientos acuosos limitados por membranas que interactúan en tre sí y con el ambiente-. Cada célula se origina por división o fusión de células preexistentes. Finalmente debe haber una cadena íntegra de células que conduce de nuevo a la primera célula primor dial satisfactoria que vivió tal vez hace 3.5 miles de millones de años. ¿Cómo se formó esa célula? Es una pregunta interesante. Algunas células son organismos unicelulares independientes, que pueden llevar a cabo todas las actividades necesarias para con servar la vida y deben ser capaces de reproducirse. Por tanto son en extremo sensibles a cambios en su ambiente, por lo general tienen ciclos de vida muy cortos y en consecuencia son adecuadas para proliferar con rapidez. Como resultado pueden adaptarse rápido a cambios en su alrededor —las mutantes que son más capaces de so brevivir en un ambiente particular pueden florecer muy rápido—. Ello dio lugar a una enorme gama de microorganismos unicelula res que evolucionaron para ajustarse a diferentes nichos ambienta les, en ocasiones extremos. Sin embargo, la complejidad de estos microorganismos siempre es limitada. En comparación, los organismos multicelulares tienen una mayor longevidad y los cambios en el fenotipo son lentos de manera corres pondiente. Su éxito se basa en la repartición de diferentes funciones a distintos tipos celulares, y la disponibilidad resultante de numero sas formas de interacción de célula con célula proporciona un poten cial enorme de complejidad funcional. El ciclo de vida de algunos microorganismos unicelulares, como el moho del limo Diclyostelium discoideum, tiene una etapa multicelular, pero existen de modo pre dominante como células únicas. En contraste los animales y las plan tas son multicelulares durante toda su existencia vegetativa, con células germinales especializadas que facilitan la reproducción. Los organismos multicelulares pueden variar mucho de tamaño, forma y número de células, pero en todos los casos la vida se inicia con una célula. El proceso de desarrollo, desde la célula única hasta el orga nismo maduro, incluye muchas rondas de división celular durante las que las células deben tornarse cada vez más especializadas y organi zarse en patrones precisos. Su conducta e interacciones durante el de sarrollo moldea la morfología total del organismo.

3.1 Estructura y diversidad de células 3.1.1

eucariotas representan la dm siófi fundamenta* de las term as de « d a I

Las células pueden clasificarse en grupos taxonómicos amplios de acuerdo con diferencias en su organización interna y distinciones funcionales mayores que surgen de la divergencia evolutiva tempra na (véase fig. 3-1). La principal división de los organismos en pro cariotas y eucariotas se basa en diferencias fundamentales en la arquitectura celular (fig. 3 -2 ). Las células procariotas tienen una organización interna simple, notablemente carente de organelos y compartimientos intracelulares. No poseen un núcleo definido. El DNA cromosómico, que no parece estar muy organizado, existe como un complejo de núcleoproteínas conocido como nucleoide. Las células procariotas se ob servan hasta cierto punto sin rasgos característicos bajo el microscopio electrónico. Sin embargo, las procariotas están muy le jos de ser primitivas, puesto que han existido a través de muchas

Protistas

ID o

P ro to p h y ta

LU

Pía ita s

M e ta p h y ta

Hongos

P ro to zo a

Unicelular

Aninr ,ales

M e ta z o a

Multicelular

Fig. 3-1. Clasificación de organismos unicelulares y multicelulares. Nota: los protistas incluyen organismos unicelulares que se clasificaron como animales (protozoarios), plantas (protofitos) y hongos (p. ej., leva dura), pero muchos protistas no se clasifican en ninguno de estos grupos.

más generaciones de evolución que los humanos. Comprenden dos reinos de vida: bacterias (llamadas con anterioridad eubacterias pa ra diferenciarlas de las archaebacterias) y archaea (un grupo de or ganismos muy mal comprendido que semeja en forma superficial a las bacterias y por esa razón antes se denominaban archaebacte rias). Todos los organismos procariotas son unicelulares. Las bacte rias se encuentran en muchos ambientes y algunas son patógenas para el hombre. Con frecuencia las archaea se hallan en ambientes extremos, como primaveras ácidas calientes, pero algunas especies se encuentran en localizaciones más aptas para la convivencia jun to con eubacterias (p. ej., en el intestino de las vacas). El genoma procariota típico se considera de manera convencional como un cromosoma circular único que contiene menos de 10 Mb de DNA. Sin embargo, este concepto se desafió en fecha reciente conforme más especies procariotas se caracterizaron a detalle y se descubrie ron estructuras genómicas diversas. Por ejemplo, se identificaron procariotas que poseen múltiples cromosomas circulares o lineales, mezclas de cromosomas circulares y lineales, y genomas hasta de 30 Mb de tamaño (p. ej., Bacillus megateriurn). Se piensa que las células eucariotas aparecieron por primera vez hace alrededor de 1.5 miles de millones de años. Tienen una orga nización mucho más compleja que sus contrapartes procariotas, con membranas internas y organelos limitados por membranas, in clusive un núcleo (véase recuadro 3-1). Sólo se conoce un reino de organismos eucariotas -el eukarya—pero abarca tanto especies uni celulares (p. ej., levaduras, protistas, algas) como multicelulares (en especial animales y plantas). En todos los organismos eucariotas co nocidos el genoma comprende dos o más cromosomas lineales con tenidos dentro del núcleo. Cada cromosoma es una molécula aislada de DNA muy larga empacada en una forma elaborada y

3.1 I ESTRUCTURA Y DIVERSIDAD DE CÉLULAS

E u c a río ta

Q

61

P ro c a rio ta

1 0 (OTTI

N u c le o lo

C á p s u la P a re d c e lu la r N ú c le o

R ib o s o m a s

M íto c o n d ria

Fig. 3-2. Anatomía de las células procariota y eucaríota. La célula eucaríota que se muestra en esta figura es una célula animal genérica. Los ejemplos de tipos individuales de células se describen en el recuadro 3-6.

muy organizada con histonas y otras proteínas. El número y el con tenido de DNA de los cromosomas varían mucho entre las especies v, aunque la tendencia se dirige a que el tamaño del genoma sea pa ralelo a la complejidad del organismo, se observan excepciones no tables (véase sección 3.1.4). Además de los organelos mayores, las porciones solubles tanto del citoplasma como del nucleoplasma es tán altamente organizadas. En el núcleo se identificó una diversi dad de estructuras subnucleares dispuestas en el contexto de la matriz nuclear (véase recuadro 3-1). El citoplasma alberga una red compleja de diferentes clases de filamentos proteínicos llamados en conjunto citoesqueleto, que determina la forma y el movimiento de la célula, y proporciona un esqueleto para el transporte intracelular (véase recuadro 3-2).

3.1.2 El tam año y la form a de las células puede variar enorm em ente, pera los índices de difusión fijan algunos límites superiores Muchos factores afectan el tamaño de las células (Su y OTarrel, 1998; Saucedo y Edgar, 2002). Las células dependen de la difusión para coordinar sus actividades metabólicas y sus interacciones con el ambiente y con otras células. Conforme su tamaño aumenta, la rela ción entre superficie y volumen disminuye. Se piensa que la estruc tura interna simple de las células procariotas limita su tamaño máximo —por lo general las células bacterianas tienen 1 mcm de diá metro-. Las membranas internas complejas y la compartamentaliza-

ción de las células eucariotas pueden ser importantes para permitir les crecer más. No obstante, las regiones internas con actividad metabólica rara vez se encuentran a más de 15 a 25 |i.m de la superficie celular y ello limita el tamaño de la célula a cerca de 50 |j,m. En rea lidad el diámetro promedio de las células en un organismo multice lular se encuentra dentro de los límites de 10 a 30 mcm. Algunas células especializadas pueden crecer mucho más de este tamaño. Por ejemplo, las neuronas suelen alcanzar hasta 1 m de largo, aunque eso refleja la proyección de axones largos y muy delgados, en tanto que el cuerpo celular permanece bastante dentro de los parámetros co mentados. Los óvulos también son células muy grandes. Los óvulos de los mamíferos tienen alrededor de 100 mcm de diámetro, pero los de otros animales que almacenan nutrimentos necesarios para el de sarrollo pueden ser mucho mis grandes. La célula más grande que se conoce es el huevo de avestruz, que puede alcanzar hasta 20 cm de largo y tiene un volumen aproximado al de 24 huevos de pollo.

3.1.3 Es organism os m ulticelulares, se observa una diferenciación fundam ental entre células som áticas y ia linea germinal Las funciones vegetativas y de la reproducción están separadas en los organismos multicelulares. Una población de células germinales es pecializadas para realizar las funciones de la reproducción se encuen tra aparte, en tanto que la función de las células somáticas restantes consiste en proporcionar un recipiente en el que estas células repro-

62 } CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Recuadro 3-1. Organización intracelular de las células animales La diversidad de organelos demuestra la complejidad de las células eucariotas, pero a causa de la especialización funcional no siempre se encuentran los mismos organelos en todos los tipos de células. Algunas células huma nas muestran variaciones extremas (p. ej„ los glóbulos rojos maduros care cen de núcleo y los queratinocitos diferenciados terminalmente no poseen organelos en lo absoluto). En otros casos se hallan organelos particulares en muy pocos tipos de células y se requieren para funciones especificas. Por ejemplo, las células epiteliales que recubren el aparato respiratorio contienen cilios para eliminar las partículas contaminantes de los pulmones, en tanto que los espermatozoos maduros son las únicas células humanas que po seen flagelos. Sin embargo, casi todas las células contienen un “ paquete es tándar" de organelos cuyas funciones se comentan a continuación. NÚCLEO: el depósito del material genético El núcleo contiene la inmensa mayoría (por lo general 99.55%) del DNA de una célula animal, en la forma de cromosomas lineales. Está rodeado por una envoltura nuclear, compuesta de dos membranas separadas por un espacio estrecho que se continúa con el retículo endoplásmico (véase más adelante). El resto de la célula se conoce como citoplasma y está constituido por diversos organelos, membranas y un compartimiento acuoso denominado citosoL La comunicación entre el núcleo y el cito plasma se efectúa a través de poros nucleares, aberturas en la envoltu ra nuclear que están rodeadas por complejos de poro nuclear. Estos últimos son complejos proteínicos que actúan como transportadores es pecíficos de macromoléculas entre el núcleo y el citoplasma. Dentro del núcleo, los cromosomas están dispuestos en una forma muy ordenada, que indica la existencia de una subestructura compleja conoci da como matriz nuclear, una red de proteínas y RNA a la que se fijan los cromosomas mediante secuencias de DNA que se denominan regiones de fijación de matriz (RFM). El núcleo presenta otras estructuras discernibles que sugieren una organización compleja de diferentes procesos bio químicos. El nucléolo es una región discreta en la que el RNA ribosómico (rRNA) se sintetiza y procesa En este organelo se localizan los genes del rRNA, que se encuentran de manera predominante como grupos en los brazos cortos de los cromosomas 1 3 ,1 4 ,1 5 , 21 y 22 en células huma nas. El alto contenido de RNA confiere al núcleo su aspecto denso en las fotomicrografías electrónicas. Se identifican otros corpúsculos nucleares pero están menos bien caracterizados. Por ejemplo, se piensa que los cor púsculos de Cajal (que también se conocen como corpúsculos arrollados o gems) son los sitios de síntesis de partículas de ribonucleoproteina nu clear pequeña (snRNP) y también pueden participar en la regulación génica. Está demostrado que el núcleo contiene varios factores de transcripción y proteínas reguladoras del ciclo celular, localizados en fo cos, que a menudo se relacionan con locus genéticos particulares. Esto sugiere que la cromatina se incorpora en regiones de transcripción acti va en sitios nucleares particulares, en contraste con el concepto tradicio nal de que los factores de transcripción se difunden con libertad alrededor del núcleo. Un ejemplo en particular interesante es el corpúsculo LPM, que aparece como un anillo y está compuesto sobre todo por la proteína de leucemia premíelocítíca (LPM). En pacientes con leucemia premielocítíca aguda, una translocación que incluye el gen de LPM y otro gen que codi fica un receptor de ácido retinoico genera una proteína de fusión que no puede formar corpúsculos de LPM en forma normal. El tratamiento con ácido retinoico restablece la capacidad de la célula para formar corpúscu los de LPM quizás al permitir que la proteína se localice correctamente y asimismo conduce a remisión del cáncer. Al parecer otros corpúsculos nu cleares participan en procesos de transcripción corriente abajo. Incluyen fibrillas de pericromatina (sitios de acumulación de RNA naciente), cor púsculos de segmentación (sitios de poliadenilación y segmentación) y manchitas o grupos de gránulos de intercromatina (que participan en el corte y la unión del RNA).

MITOCONDRIAS: las centrales de energía de células eucariotas aerobias Las mitocondrias, una característica notable en el citoplasma de la ma yor parte de las células eucariotas, son los organelos que se encargan de generar energía. La cadena respiratoria mitocondrial es una serie de cin co complejos proteínicos unidos a la membrana, que incluye varias quinonas, citocrom os y proteínas de hierro y azufre. El conjunto de estos complejos tiene a su cargo la fosforilación oxidativa, una reacción en la que el oxígeno molecular oxida los nutrimentos orgánicos y la energía quí mica resultante se utiliza para generar ATR Medíante la difusión subse cuente a todas las otras partes de la célula, el ATP puede donar su energía almacenada (por hidrólisis de ATP o ADP) y la energía liberada se emplea para impulsar numerosas funciones celulares. Aunque su tamaño es variable, el diámetro de las mitocondrias suele ser de alrededor de 1 mcm, similar al de las células bacterianas. Las m itocon drias tienen dos membranas: una externa, hasta cierto punto lisa, y una membrana mitocondrial interna compleja que posee un área de superfi cie muy grande por numerosos dobleces (crestas). El compartimiento in terno, la matriz mitocondrial, es una solución acuosa muy concentrada de muchas enzimas e intermediarios químícos relacionados con el metabolis mo energético. Las mitocondrias (y los cloroplastos de las células vegetales) son los úni cos otros organelos eucariotas que contienen DNA. Asimismo albergan ribosomas propios que son distintos de los que se encuentran en el citosol. Los ríbosomas mitocondriales se usan para traducir el mRNA transcrito del DNA mitocondrial. Esta prueba y otras sugieren que las mitocondrias son descendientes de bacterias aerobias que vivieron en simbiosis con los precursores de células eucariotas (sección 12.2.1). Sin embargo, el DNA mitocondrial sólo puede especificar unas cuantas de las funciones mitocondriales y casi todas las proteínas mitocondriales son codificadas por genes del núcleo. En el último c a s tv líl mRNA se traduce en ribosomas en el citosol y a continuación las proteínas resultantes se llevan al in terior de las mitocondrias. RETÍCULO ENDOPLÁSMICO: un sitio mayor de síntesis de proteínas y lípidos El retículo endoplásmico consiste en vesículas aplanadas, de membrana única, cuyos compartimientos internos, las cisternas, se conectan entre sí para form ar conductos a través del citoplasma. Desde los puntos de vista físico y funcional se divide en dos componentes. El retículo endoplás mico rugoso, llamado así porque la superficie está cubierta de ríbosomas que son más grandes que los que se encuentran en las mitocondrias, en tanto que el retículo endoplásmico liso carece de cualquier ribosoma ad herido. Las proteínas sintetizadas por los ríbosomas que se adhieren al retículo endoplásmico rugoso cruzan la membrana del retículo endoplás m ico y aparecen en el espacio intracisternal. Desde este sitio se trans portan a la periferia de la célula, donde se incorporarán a la membrana plasmática, restaurarán el retículo endoplásmico o se secretarán por completo de la célula. Muchas proteínas humanas son glucosiladas (tie nen residuos de azúcar añadidos a ellas) y este proceso se inicia en el re tículo endoplásmico. APARATO DE GOLGI: la maquinaria para secreción El complejo de Golgi consiste en vesículas aplanadas, de membrana úni ca, con frecuencia apiladas. Las principales funciones del aparato de Gol gi comprenden la secreción de productos celulares, como proteínas, hacia el exterior y la formación de las membranas plasmática y lisosómica. Vesículas pequeñas surgen en la periferia mediante un proceso de desprendimiento por pellizcado y algunas de estas vesículas concentran productos secretorios (vacuolas secretorias). Las glucoproteínas que llegan del retículo endoplásmico se modifican en forma adicional en el complejo de Golgi.

3.1 ¡ ESTRUCTURA Y DIVERSIDAD DE CÉLULAS

63

Recuadro 3-1. (con tinuació n) PEROXISOMAS (MICROCUERPOS): especialistas en química peligrosa Los peroxisomas (microcuerpos) son vesículas pequeñas de membrana única que contienen una diversidad de enzimas que emplean oxígeno m o lecular para oxidar sus sustratos y generar peróxido de hidrógeno. Este úl tim o lo utiliza una enzima peroxisómica mayor, catalasa, para oxidar una gran variedad de compuestos. Las especies de oxígeno reactivo, como peróxido, y los radicales superóxido son muy tóxicos para las células y deben guardarse con cuidado extremo. LISOSOMAS: órganos digestivos intracelulares Los lisosomas son vesículas pequeñas, delineadas por una membrana, que contienen enzimas hidrolítícas, como ribonucleasa y fosfatasa. Los li sosomas participan en la digestión de materiales que llegan al interior de la célula por fagocitosis o pinocitosis y ayudan a degradar los componen tes celulares después de la muerte de la célula. MEMBRANA PLASMÁTICA (MEMBRANA CELULAR): confín protector de la célula La membrana plasmática está compuesta por una bicapa fosfolípida en cuyo interior se localizan grupos lípidos hidrofóbicos. Se encuentran en tre grupos fosfato hidrofílicos que están en contacto con un ambiente acuoso polar en ambos lados, el exterior de la célula y el citoplasma. Ade más de proporcionar una barrera casi siempre protectora, la membrana plasmática tiene una diversidad de funciones importantes: ► es selectivamente permeable, regula el transporte de diversos iones y moléculas pequeñas al interior y el exterior de las células. Contiene sistemas de transporte activo para diversos iones, com o Na+ , K+ y Ca2+ , y varios nutrimentos, por ejemplo, glucosa y aminoácidos, así como diversas enzimas importantes: ► contiene una variedad de proteínas integrales de membrana o proteí nas unidas a una cara de la membrana que desempeñan funciones importantes en el señalamiento intercelular. CITOSOL: una solución acuosa muy concentrada y estructurada El cltosol, el componente acuoso del citoplasma, constituye alrededor de la mitad del volumen de la célula y es el sitio de mayor actividad metabò lica, que incluye casi toda la síntesis de proteínas y el metabolismo inter

mediario. El citosol, que también contiene componentes solubles, está muy organizado por una serie de filamentos proteínicos que se denomi nan en conjunto citoesqueleto y desempeñan una función importante tanto en el movimiento y la forma de las células como en el transporte in tercelular (véase recuadro 3-2). CILIOS y FLAGELOS: trasladadores y agitadores Los cilios y los flagelos son estructuras que se extienden desde la mem brana plasmática y se emplean para facilitar el movimiento. Los cilios son estructuras pequeñas que se baten hacia atrás y adelante o giran. Con fre cuencia los microorganismos unicelulares se desplazan por el movimiento coordinado de miles de cilios, pero en animales estas estructuras también se encuentran en células fijas en las que se usan para desplazar comentes de líquido. En humanos, los cilios se hallan en células epiteliales que recu bren las vías respiratorias (donde impulsan el moco y cualquier partícula de material contenido en él hacia fuera de los pulmones) y el oviducto (en el que proporcionan una corriente para desplazar el óvulo hacia el útero). Los cilios también se hallan en una estructura embrionaria muy pequeña llamada nu do (véase sección 3.7.5), donde su rotación produce el movimiento del lí quido perinodal a un lado del embrión. Se piensa que este proceso es Importante en la especificación del eje de izquierda a derecha del embrión (recuadro 3-7). Los flagelos son estructuras más grandes que se mueven en forma similar a un látigo. Aunque muchos microorganismos unicelulares se desplazan por flagelos, a diferencia de los cilios, sólo suele haber uno o dos por célula. Las únicas células humanas que poseen flagelos son los es permatozoos, que los utilizan como un medio de propulsión. Tanto los cilios como los flagelos están compuestos por haces de filamentos microtubulares, con una estructura característica '9 + 2 ' (nueve microtúbulos dobles externos rodeados por dos microtúbulos únicos en el centro) o una '9 + 0'. Estas estructuras se unen a corpúsculos basales bajo la membrana plas mática, que se originan por la duplicación repetida de centriolos durante la diferenciación celular (véase recuadro 2.1). El movimiento se produce por el deslizamiento entre sí de la pareja externa de microtúbulos, que está contro lado por la proteína motora dineína. Las deficiencias de dineína en humanos ocasionan el síndrome de cilios inmóviles, que se caracteriza por infec ciones respiratorias recurrentes y defectos de lateralidad, y también cau san infertilidad por la Imposibilidad de los óvulos para llegar al útero y la incapacidad de los espermatozoides para mover sus colas.

Recuadro 3-2. Citoesqueleto; elemento fundamental para el movimiento y la forma celulares, y un armazón estructural mayor para el transporte intracelular El citoesqueleto de las células eucariotas es una estructura interna de fila mentos proteinicos que proporciona estabilidad, genera la fuerza necesa ria para el movimiento y los cambios en la forma de la célula, facilita el transporte intracelular de organelos y permite la comunicación entre ia célula y su ambiente. Hay tres tipos de filamentos citoesqueléticos: microfilamentos de actina, microtúbulos (hechos de tubulina) y filamentos in termedios (elaborados con una diversidad de diferentes proteínas, algunas específicas de tipo celular). Las actinas y las tubulinas se conservaron bastante durante la evolución. Los microfllamentos y los microtúbulos son estructuras muy dinámicas y también están polarizados debido a la asime tría durante la polimerización de las subunldades de actina y tubulina a par tir de las cuales se forman. Por tanto los polímeros crecen por la fijación de nuevas subunidades en ambos extremos pero a ritmos distintos, lo que re sulta en un crecimiento más rápido de la punta denominada extremo plus ( + ) y uno más lento de la terminación que se conoce com o extremo minus ( - ) . A los filam entos polarizados suelen enlazarse clases espe cíficas de proteínas motoras que se mueven de manera constante a lo largo de ellos en una dirección, impulsados por hidrólisis de ATR Vi

Los filamentos de actina (también llamados microfilamentos) pueden dis ponerse en haces paralelos o enlazados semejantes a redes. Proporcionan apoyo mecánico en la forma de fibras para esfuerzo, posibilitan cambios con trolados de la forma de la célula (p. e j„ constricciones apicales, constriccio nes durante la división celular) y facilitan el movimiento de la célula por estructuras como filopodios y lamelipodios (extensiones de la célula que le permiten desplazarse a lo largo de superficies). Los filamentos de actina son la base de estructuras especiales, como las microvellosidades, las placas de adherencia y el proceso acrosómico de la cabeza del espermatozoo. Consis ten en polímeros helicoidales de dos cadenas de la proteína actina y tienen un diámetro aproximado de 7 a 8 nm. Interactúan con miembros de la superfamilia miosina de proteínas motoras. Las interacciones entre actina y miosina en las células musculares forman unidades contráctiles que confieren a las células musculares su potencia de contracción. Las actinas también tie nen una función celular más general en las células no musculares, por ejem plo, permitir que las membranas se invaginen, como en la endocitosis. Los microtúbulos son cilindros huecos largos, de unos 25 a 30 nm de diá metro, y mucho más rigidos que los filamentos de actina. Están formados

64

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

3 - 2 . (C por el ensamble de una serie de polímeros basados en residuos alternados de tubulina « y tubulina p. Con los microtübulos se vinculan miembros de dos superfamilias de proteínas motoras, dineínas y cinesinas, cuya función consiste en mover elementos particulares a lo largo de los trayectos de los microtübulos en la célula. Ésta es el modo en que las mitocondrias, los apilamientos de Golgi y las vesículas secretorias, por ejemplo, llegan a sus si tios apropiados dentro de la célula. Las dineínas y las cinesinas se mueven a lo largo de los microtübulos en direcciones opuestas. Por lo general los extremos minus de microtübulos individuales en célu las animales convergen en un centro de organización de m icrotübulos (COMT), que se localiza en una porción del citoplasma adyacente al nú cleo. En casi todas las células animales se encuentra un centro único y

ductoras puedan transportarse y un medio para lograr la reproduc ción (Wylie, 2000). En términos evolutivos, los animales pueden considerarse incubadores y facilitadores para el espermatozoo y los óvulos que permiten que la especie se reproduzca. Aunque en plan tas y animales primitivos, las células somáticas ordinarias pueden dar lugar a células germinales durante toda la vida del organismo, en casi todos los animales que se conocen a detalle —insectos, nematodos y vertebrados- las células germinales se sitúan aparte muy tem prano en el desarrollo, como una línea germinal especializada, y representan la única fuente de gametos. Las células germinales son las únicas células del cuerpo capaces de efectuar la meiosis y por consiguiente son las únicas células que dan lugar a descendientes haploides que pueden tomar parte en la fecundación. Las células de la línea germinal en mamíferos se originan a partir de células germi nales primordiales (CGP) que en el caso de los humanos surgen du rante la segunda semana del desarrollo.

3.1.4 Los organism os m ulticelulares no poseen dos células que porten la misma secuencia exacta de DNA Como se describió en la sección 2 . 1 , el contenido de referencia del DNA de las células, el valor C, lo proporciona el juego de cromo somas haploides (n), como en las células espermatozoo y óvulo. Es te valor varía de manera muy amplia para los diferentes organismos

bien definido de este tipo, que se conoce com o centrosoma. Durante la división celular, los microtübulos forman el huso m itó tico y los filamen tos de los microtübulos se fijan a un ensamble proteínico (el cinetocoro) localizado en los centrómeros de los cromosomas en duplicación y ase guran el movimiento ordenado de los cromosomas hacia las dos células hijas (recuadro 2-1). Asimismo los microtübulos forman el núcleo de ci lios y flagelos que se estudió en el recuadro 3-1. Los filamentos intermedios tienen 7 a 11 nm de diámetro y una función principalmente estructural. No están polarizados y no se vinculan con pro teínas motoras. Los neurofilamentos (específicos de las células neurales) y las queratinas (especiales de células epiteliales) son proteínas filam en tosas intermedias.

y la falta de una relación directa entre el valor C y la complejidad biológica se conoce como paradoja del valor C. Por ejemplo, en tanto que la mayor parte de los mamíferos tiene un tamaño de genoma haploide en los límites de unos 2 500 a 3 500 Mb de DNA, sorprende un poco encontrar que el contenido de DNA haploide de una célula humana es sólo 19% del de una cebolla, 4% del de algunos lirios y apenas 0.5% del de un eucariota unicelular, Amoeba dubia (véase cuadro 3-1 y la base de datos de tamaños del genoma en (http://www.cbs.dtu.dk/databases/DOGS). En un mismo individuo también se observa una variación consi derable en el contenido de DNA como resultado de diferencias en el número de copias del juego de cromosomas (ploidía). Aunque casi todas las células somáticas humanas son diploides, existen excepcio nes. Como se comenta en el recuadro 3-1, algunas células diferencia das terminalmente, como los glóbulos rojos, los queratinocitos y las plaquetas, carecen de núcleo y se describen como nuliploides. Otras células son poliploides como resultado de la replicación de DNA sin división celular (endomitosis) o de la fusión celular. Por ejemplo, la ploidía de los hepatocitos varía de 2 n a 8 n, la de los cardiomiocitos (células de músculo cardiaco) de 4 n a 8 n y la de los megacariocitos gigantes de la médula ósea de 16 n a 64 n. Las últimas células originan de modo individual miles de células plaquetarias nuliploides (fig. 3-3). La poliploidía que se debe a fusión celular ocasiona que al gunas células que ocurren de manera natural (p. ej., fibras muscula res) tengan múltiples núcleos diploides y formen un sincitio (fig. 3 -3 ).

V aso sa n g u ín eo (s e n o s sa n g u ín eo s )

Las plaq uetas b ro tan del p ro ce so del m e ga ca riocito

Fig. 3-3. Algunas células se forman por fragmentación o fusión de otras células. Las plaquetas se forman por gemación de un megacariocito gigante. Carecen de núcleo. Las células musculares se forman por fusión de un gran núme ro de células mioblastos.

3.1 I ESTRUCTURA Y DIVERSIDAD DE CÉLULAS

Cuadro 3-1 Paradoja del valor C : el tamaño del genoma no se relaciona simplemente con la complejidad del organismo Ta m añ o de l genom a

N ú m e ro de ge n e s

Escherichia coli

4.2 Mb

4 300

Saccharomyces cerevisiae

13 Mb

6 300

Amoeba dubia

670 000 Mb

?

Caenorhabditis elegans

95 Mb

ca. 20 000

Drosophila melanogaster

165 Mb

ca. 13 000

Allium cepa (cebolla)

15 000 Mb

?

Mus musculus

3 000 Mb

ca. 30 000

Homo sapiens

3 300 Mb

ca. 30 000

O rg a n is m o

Unicelular

65

► Q uim erism o y colonización. En muy pocas ocasiones un indi viduo puede estar representado por dos o más clonas de célu las con secuencias de DNA muy diferentes, que reflejan la fusión temprana de embriones gemelos fraternos en el desarro llo o la formación de un embrión de colonias de células deri vadas de otro (fig. 4-10). A nivel superficial, tales diferencias se identifican también cuando un individuo recibió un injerto, un trasplante o una transfusión.

3.1.5 Las células de organismos multicelulares pueden estudiarse in situ o en cultivo

M ulticelular

El DNA de las células de distintos organismos puede variar mu chísimo como resultado de diferencias hereditarias en la secuencia de DNA (mutaciones). La extensión de las diferencias de secuencia es en gran parte proporcional a la distancia evolutiva que separa los dos organismos. Por consiguiente el DNA de una célula humana se relaciona de modo muy cercano en secuencia con el de una célula de chimpancé (98 a 99%), pero las divergencias se incrementan en comparación con las células del ratón, la rana y la mosca de la fruta respectivamente. El DNA de las células de diferentes individuos de la misma especie también muestra diferencias mutacionales. Se ob serva aproximadamente un cambio en cada 1 000 nucleótidos cuan do se compara el DNA de dos humanos no relacionados. Asimismo existen diferencias en la secuencia de DNA de las células de un in dividuo aislado. Tales diferencias pueden originarse en tres formas: ► D iferencias program a das en células especializadas. Los ejem plos incluyen las células espermatozoos que tienen un cromo soma X o uno Y, y por tanto llevan diferentes juegos de DNA del cromosoma del sexo así como linfocitos B y T maduros que experimentan reordenamientos del DNA específicos de célula que conducen a diferencias de una célula con otra en los tipos de anticuerpo o receptor de célula T producidos. ► M utación aleatoria e inestabilidad d e l DNA. El DNA de to das las células está sujeto de manera constante a daño ambien tal, degradación y reparación química, y ello influye en la precisión de la replicación del DNA. La tasa de error pequeña, pero importante, significa que en cada ronda de división celu lar surgen nuevas mutaciones en la secuencia del DNA. En consecuencia durante el desarrollo cada célula forma un perfil único de mutaciones y ningún p a r de células del mismo indivi duo tendrá la misma secuencia de DNA precisa. La mayor parte de estas mutaciones no tiene ningún efecto fenotípico e inclu sive las mutaciones que se presentan en genes esenciales tienen poco efecto en el organismo como conjunto cuando se presen tan en células aisladas (a menos que causen proliferación de la célula, véase cap. 17). Sólo cuando una mutación perjudicial en la línea germinal, en las células madre o en las células somá ticas ocurre temprano en el desarrollo es probable que los efec tos se observen a nivel fenotípico.

Con frecuencia los organismos unicelulares pueden estudiarse cul tivándolos en un medio que representa su ambiente normal. Como tal vez sea difícil reproducir el ambiente de una célula individual en el caso de los organismos multicelulares, las células de estos orga nismos pueden estudiarse en su contexto natural entero o en un ambiente artificial fuera del mismo. Es factible utilizar varios mé todos distintos. ► Análisis in situ (como parte del animal original). En los anima les más simples, como Caenorhabditis elegans, pueden estudiar se con el microscopio células individuales en especímenes vivos completos. El uso de la proteína fluorescente verde como un marcador vital (recuadro 20-4) permite realizar estudios in situ en especímenes vivos de animales más grandes en tanto el teji do que se investiga sea ópticamente transparente. Los embrio nes de muchos animales (p. ej., Drosophila, pez cebra, ratón) son transparentes en las etapas tempranas: En especímenes opacos, quizá sea necesario preparar cortes de tejido después de tratarlos. ► Como un explante d e tejido. La investigación de la conducta de explantes de tejidos particulares aislados o en combinación facili ta muchos estudios de biología del desarrollo. Tal investigación se usa para probar el efecto de moléculas del desarrollo particulares o los efectos inductores ele una población celular en otra (véase sec ción 3.4.2). ► Como células prim arias. Un explante tisular puede disociarse, lo que permite separar células individuales y desarrollarlas de ese mismo modo en cultivo. Éste no siempre es un método di recto ya que quizá sea muy difícil que algunos tipos de células crezcan y el esfuerzo necesario para conservar las células prima rias puede ser considerable. ► Como una línea celu lar estable. A menudo es fácil que una lí nea de células estables crezca en cultivo y por tanto puede ex pandirse con facilidad y enviarse a investigadores de todo el mundo. Puesto que las células se distinguen por diversas carac terísticas diagnósticas, los investigadores pueden estar seguros de que los resultados que obtienen de una línea celular son comparables con los de otras personas que trabajan en alguna otra parte en la misma línea celular o integrarse a ellos. Aunque el estudio de explantes tisulares o de células primarias cul tivadas tiene muchas ventajas, éstos son difíciles de manejar y re presentan un recurso temporal. Ello se debe a que casi todas las células animales en cultivo pasan por cierto número de divisiones y a continuación envejecen, dejan de dividirse y se eliminan del ci clo celular al entrar al estado latente conocido como Gq (Campisi, 1996). El número de rondas de división depende del tipo de célula, la especie y la edad del organismo de origen. Por ejemplo, los fibroblastos fetales humanos se dividirán cerca de 60 veces en

66 ¡ CAPÍTULO TRES

CÉLULAS Y DESARROLLO

cultivo, en tanto que los fibroblastos obtenidos de un adulto expe rimentarán casi la mitad de este número de divisiones. Al parecer el potencial de división y la longevidad de la especie guardan cier ta relación. Por ejemplo, el número de divisiones que los fibroblas tos fetales humanos efectúan (alrededor de 60 divisiones, periodo máximo de vida 120 años) se encuentra entre la cifra lograda por los fibroblastos fetales de ratones (alrededor de 15 divisiones, perio do de vida máximo tres años) y los fibroblastos fetales de la tortu ga gigante Galapagos (alrededor de 125 divisiones, periodo de vida máximo 175 años). Las limitaciones de las células primarias pueden superarse me diante el establecimiento de una línea celular permanente que se di vidirá en forma indefinida en cultivo. Se establecieron muchas líneas celulares de explantes de tumores que ya habían perdido ciertas res tricciones del crecimiento. Por ejemplo, la línea celular HeLa que se utiliza con amplitud se derivó de un tumor cervical extirpado a una paciente llamada Henrietta Lacks en 1995. El problema con las lí neas celulares de tejidos tumorales es que a menudo tienen cariotipos muy distintos en comparación con los del tejido original del que se obtuvieron, lo que da por resultado diferencias fenotípicas que se tornan más pronunciadas con el número creciente de pasos. Tam bién es posible obtener líneas celulares de células primarias hacien do que sufran transformación del crecimiento (inmortalización) en cultivos. Este proceso, que es análogo a la pérdida de restricciones

del crecimiento que se observa en tumores, puede ocurrir de modo espontáneo por mutaciones adquiridas o inducirse mediante radia ción, mutágenos químicos o virus de transformación. En fecha más reciente se establecieron líneas celulares mediante la transfección de células primarias con secuencias particulares de DNA que son oncógenas. Se conservan miles de líneas celulares, que representan di ferentes tejidos humanos y de animales, en bancos de células como la American Type Culture Collection (ATCC), la European Collection of Cell Cultures (ECACC) y la Interlab Cell Line Collection (ICLC) (véase cuadro 3-2; Stacey y Doyle, 2000). Una aplicación importante de las líneas celulares es la conserva ción de recursos genéticos renovables de pacientes humanos par ticulares. Esto se requiere para diversos procedimientos: desde el control de calidad en laboratorios que tipifican tejido hasta el aná lisis de enlace y el mapeo basado en marcadores. En este caso el fe notipo de la célula no es importante pero el genotipo debe conservarse con precisión. Uno de los medios más directos para lo grarlo es hacer líneas de células linfoblastoides mediante transfor mación con virus Epstein-Barr (EBV), que permanece episóm ico (no integrado) y en consecuencia no altera el genoma endógeno. Los linfocitos B humanos tienen un receptor para EBY y una vez que se infectan pueden inmortalizarse con una tasa alta de éxito pa ra producir una línea celular que es posible propagar en forma in definida en el cultivo (o criopreservarse para necesidades futuras).

Cuadro 3-2. Ejemplos de líneas celulares humanas y sus usos Código ATCC

Línea celular

Orígenes y aplicaciones

CCL123

DAU0I

Línea de células B, derivadas del linfoma de Burkitt, se utiliza en estudios de cáncer

CRL1432

NAMALWA

Línea de células B, derivadas del linfoma de Burkitt, se usa para elaborar interferones

TIB152

JURKAT E61

Línea de células T, derivadas de la leucemia linfoblástica aguda, produce grandes cantidades de interleucina-2

CRL1942

SUP-T1

Línea de células T, derivadas de la leucemia linfoblástica T, apoya la replicación del VIH

CCL240

HL-60

Derivada de células de leucemia promielocíticas, se emplea para estudiar la diferenciación del linaje mieloide

TIB202

THP

Derivada de leucemia monocítica aguda, se utiliza para estudiar la activación y la maduración de macrófagos

CRL1573

293

Células de riñón fetal transformadas por adenovirus, se usan para estudiar los adenovirus

CRL2190

HK-2

Línea de células tubulares proximales transformadas con genes E6/E7 de virus del papiloma humano, se emplea como sistema modelo para estudios del túbulo proximal

HB8064

Hep3B

Produce muchas proteínas del plasma

HTB52

SK-HEP-1

Se deriva del adenocarcinoma hepático, induce tumores en el ratón desnudo

HTB75

Caov-3

De adenocarcinoma del ovario, produce el mutante p53, se utiliza en estudios de citocinas y cáncer

CRL1572

PA/1

De teratoma del ovario, se usa en estudios del desarrollo y pruebas de fármacos

Líneas celulares linfoides

Líneas celulares mieloides

Líneas celulares renales

Líneas celulares hepáticas

Líneas celulares ováricas

3.2 I INTERACCIONES CELULARES

3.2 In teracciones celulares 3.2.1 La comunicación entre células incluye la percepción de moléculas de señalamiento por receptores específicos La supervivencia y la reproducción de células individuales en un or ganismo multicelular está subordinada a la supervivencia y la re producción del organismo como un todo. Las células somáticas deben cooperar entre sí en beneficio del organismo. Por esta razón las células de un organismo multicelular necesitan comunicarse a fin de coordinar y regular funciones fisiológicas y bioquímicas. La comunicación celular se basa en la producción de moléculas de se ñalamiento por una población de células y su reconocimiento por los receptores que suelen encontrarse en la superficie de las células correspondientes (cuadro 3-3). Las células animales se cubren po sitivamente en abundancia con receptores para moléculas de señala miento y estos receptores están conectados con vías de transducción de señal internas que permiten regular la actividad del factor de

67

transcripción y por último alterar patrones de expresión génica (véase Twyman 2001 para una revisión general). El señalamiento entre las células puede realizarse en diferentes extensiones. Casi todas las personas están familiarizadas con el con cepto de señalamiento endocrino, en el que una hormona liberada de una glándula endocrina en una parte del cuerpo llega a una po blación distante de células blanco a través del torrente sanguíneo. El señalamiento endocrino es importante para conservar la ho meostasis y también tiene una función destacada en el desarrollo ulterior, una vez que el sistema vascular se establece. Sin embargo, en el desarrollo temprano las señales más importantes viajan distan cias cortas. El señalamiento paracrino comprende la liberación de una molécula de señalamiento de una población de células y la di fusión de dicha molécula por una distancia corta a las células que responden. El señalamiento yuxtracrino se basa en la interacción de células vecinas y suele reflejar el hecho de que la señal produci da por una célula permanece fijada a la membrana plasmática. Las células también responden a moléculas que se encuentran en su ambiente inmediato, la matriz extracelular (sección 3.2.4).

Cuadro 3-3 Clases importantes de moléculas de señalamiento y sus receptores Receptor

Ejemplos

Diversas (péptidos, proteínas, moléculas orgánicas pequeñas, estímulos físicos)

Receptor acoplado a proteína G Polipéptldo único. La región hidrofóbica central form a un dominio transmembrana de siete pasos, el dominio terminal N enlaza el ligando, el dominio terminal C interno se vincula con una proteína de enlace de nucleótido de guanidina

Receptores de adrenalina, serotonina, glucagon, hormona estimulante del folículo, histamina, opioides y neurocininas. También receptores olfatorios, del gusto y del receptor visual rodopsina

Factores de crecimiento, efrinas

Receptor de cinasa de tirosina Dimérico; dominio de enlace de ligando de la terminal N, dominio de cinasa interno, atraviesa la membrana una vez

Receptores de Insulina, factores de crecimiento de fibroblastos y de crecimiento epidérmico, efrinas

Citocinas

Receptores con actividad relacionada de cinasa de tirosina Oligoméricos; dominio de enlace de ligando de la terminal N, dominio interno vinculado con cinasa Janus (JAK)

Receptores de hormona del crecimiento, prolactina, eritropoyetina, factores estimulantes de colonias, interleucinas, interferones

Familia del factor de transformación del crecimiento p

Receptores con actividad relacionada de cinasa de serina/treonina Oligoméricos; dominio de enlace de ligando de la terminal N, dominio Interno vinculado con proteínas SMAD

Receptores de proteínas TGF-p y morfogenéticas óseas, Nodal, factor neurotrófico derivado glial

Familia hedgehog

En placas

Receptores para Sonic e Indlan hedgehog en el desarrollo de mamíferos

Familia Wnt

Rizado

Receptores para proteínas de la familia Wnt en el desarrollo de mamíferos

Hormonas esteroides, retinoides

Receptores nucleares Diméricos; residen en el citoplasma o el núcleo, se convierten en factores de transcripción en relación con ligando

Receptores para hormonas esteroides y tiroideas, vitamina D, ácido retinoico

Escotadura

Delta y Serrate en el desarrollo neural

SEÑALES SECRETADAS

SEÑALES FIJAS Familia delta/Serrate

68

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

3.2.2 Receptores activados inician vías de transducción de señal que pueden incluir cascadas enzimáticas o segundos mensajeros y dar por resultado activación o inhibición de factores de transcripción Una vez que el receptor de una proteína de señalamiento particu lar se activa, se desata una cadena de acontecimientos cuyo último resultado es un cambio del patrón de actividad gènica en la célula que responde. El número y la naturaleza de uniones en la cadena depende de la molécula de señalamiento particular relacionada. Tanto las hormonas esteroides y tiroideas como el ácido retinoico que regula el desarrollo son capaces de difundirse a través de la membrana plasmática, de tal manera que sus receptores se localizan en el interior de la célula. Tras unirse a sus ligandos, estos recepto res actúan de manera directa como factores de transcripción a fin de modular la expresión de genes corriente abajo. Por tanto las mo léculas similares a esteroides utilizan una vía de transducción de se ñal de un paso (Tsai y O’Malley, 1994). Casi todas las otras moléculas de señalamiento permanecen fue ra de la célula y se enlazan a receptores transmembrana. El enlace del ligando al dominio extracelular del receptor ocasiona un cam bio de conformación en el dominio interno que suele estimular una actividad enzimàtica latente. En el caso de las cinasas de receptor, este cambio de conformación estimula una actividad de cinasa que

Ligando

Ì /\/> 'V v/V/

Fig. 3-4. Los receptores de citocina son diméricos u oiigoméricos, con cada polipéptido atravesando la membrana una vez. Los receptores no poseen actividad de cinasa de tirosina intrínseca, pero se relacionan de manera constitutiva con cinasas de tirosina citoplásmicas de la familia Janus (cinasas Janus, JAK). El enlace de ligando causa la dimerización de los receptores. Esto resulta en autotransfosforilación recíproca de las JAK vinculadas, que se tornan activas y fosforilan el receptor en sí mismo. A continuación el receptor es capaz de incorporar factores de transcripción inactivos llamados STAT (transductores de señal y activadores de transcripción) que se unen a residuos de fosfotirosina mediante sus dominios SH2. Después los STAT son fosforilados por las JAK, lo que les permite dimerizarse y translocarse hacia el núcleo, donde activan genes corriente abajo. Redibujado de Twyman (2001) Instant Notes in Developmental Biology, publicado por BIOS Scientific Publishers.

es integral para el receptor o para una proteína que se relaciona con el mismo. Ello causa que el receptor se fosforile en sí mismo prime ro y a continuación permite que fosforile otras proteínas dentro de la célula y en consecuencia las active. Estas proteínas blanco suelen ser cinasas en sí mismas, que en seguida fosforilan proteínas co rriente más abajo. Al final esta cascada de actividad de cinasa llega a un factor de transcripción, que se activa o inhibe según sea apro piado y que produce un cambio en la expresión génica. En algunos casos esta cascada de señalamiento es corta (p. ej., la vía JAK-STAT regulada por citocina; Pellegrini y Dusanter-Fourt, 1997; Hou y cois., 2002; fig. 3-4), en tanto que en otros puede contener muchos pasos (como la vía de cinasa MAP regulada por factor de creci miento; Robinson y Cobb, 1997; fig. 3-5). La transducción de señal en receptores acoplados a la proteína G se efectúa por la activación de segundos mensajeros (moléculas pequeñas, como cAMP, calcio y lípidos). El enlace del ligando oca siona que la proteína de enlace de nucleótido de guanidina (proteí na G) relacionada con el receptor intercambie GDP por GTP, que da lugar a que se disocie en unidades a y fS-7 . A continuación ca da una de estas unidades puede interactuar con proteínas corriente abajo con objeto de regular los niveles de segundo mensajero (Bourne, 1997). Según el tipo particular de proteína G presente, el enlace del ligando puede estimular o inhibir la enzima ciclasa de adenilato, lo que resulta en un cambio en los niveles de cAMP intracelular (Houslay y Milligan, 1997). Otras proteínas G estimulan la producción de lípidos, como 1,4,5 trifosfato de inositol y diacilglicerol (Speigel y cois., 1996), o la liberación de iones de calcio (Clapham, 1995). Los segundos mensajeros activan a su vez cina sas de proteína corriente abajo, como la cinasa de proteína A de pendiente de cAMP y la cinasa de proteína C dependiente de calcio, que se fosforilan y en consecuencia modifican la actividad de factores de transcripción particulares. Las vías de señalamiento comentadas sostienen una plática cru zada extensa. Por ejemplo, tanto la cinasa de proteína A como la ci nasa de proteína C interactúan con la vía de cinasa MAP, las cinasas del receptor de tirosina pueden estimular la vía JAK-STAT e influir los niveles de segundos mensajeros, y los receptores de citocina sue len influir la actividad Ras. La respuesta que una célula particular produce depende de la suma de todos los señalamientos que llegan a su superficie y de los receptores y componentes de señalamiento específicos que se presentan.

3.2.3 La organización de las células para formar tejidos requiere adherencia celular Las células se organizan en tejidos mediante la expresión de mo léculas de adherencia (Cunningham, 1995; Gumbiner, 1996). En esencia las moléculas de adherencia actúan en la misma forma que cualquiera otra interacción receptor-ligando, aunque en este caso el receptor y el ligando están fijos a las superficies de células adyacen tes y puede haber cientos de miles de estas moléculas por célula pa ra asegurar que el enlace sea muy potente. Las células pueden adherirse entre sí de modo directo, por la expresión de moléculas de adherencia complementarias en sus superficies, mediante la for mación de vínculos con la matriz extracelular, o por ambos proce sos. Durante el desarrollo, los cambios en la expresión de moléculas de adherencia permiten que las células formen y rompan conexio nes entre sí, lo que facilita que la migración sea individual o en ho jas y produce reordenamientos a gran escala (McNeil, 2000; Irvine y Rauskolb, 2001). En el organismo maduro las interacciones de

3.2 I INTERACCIONES CELULARES [ 69

Fig. 3-5. Los factores de crecimiento actúan como ligandos para cinasas de tirosina receptoras. El enlace de ligando estimula la dimerización del receptor e inicia la actividad de cinasa de tirosina citoplásmica intrínseca para el receptor. Luego el receptor puede fosforilar no sólo otras proteínas sino también a sí mism o (autotransfosforilación) y ocasionar la incorporación de proteínas que se enlazan en forma específica a residuos de fosfotirosina, inclusive enzimas que modulan la actividad de Ras. Los Ras activados incorporan Raf a la membrana donde se estimula su actividad de cinasa. En seguida Raf activa MEK, que a su vez activa la cinasa MAR Tanto MEK como la cinasa MAP activan factores de transcripción latentes y por tanto cambian los patrones de expresión en el núcleo. Redibujado de Twyman (2001), Instant Notes Developmental Biology, publicado por BIOS Scientific Publishers.

i. Uniones celulares Uniones adherentes

Uniones de anclaje en las que los filamentos de actina del citoesqueleto se conectan con caderinas en la superficie celular y por tanto unen células vecinas en un cinturón continuo de adherencia

Desmosomas

Uniones de anclaje en las que los filamentos intermedios del citoesqueleto se conectan con caderinas en la superficie celular

Contactos focales

Uniones de anclaje en las que los filamentos de actina del citoesqueleto se conectan con integrinas en la superficie celular y proporcionan sitios de fijación punteados a la matriz extracelular

Hemidesmosomas

Uniones de anclaje en las que los filamentos intermedios del citoesqueleto se conectan con integrinas en la superficie celular, se utilizan para conectar células epiteliales con la lámina basal

Uniones comunicantes

Son poros que conectan el cltosol de células adyacentes. Están formados por seis proteínas conexina idénticas que forman un canal en cada membrana. La fijación de complejos de conexina en células adyacentes crea la unión comunicante

Uniones estrechas

Proteínas transmembrana interconectadas que sellan células epiteliales en una hoja continua. Según la densidad de las proteínas en la unión, la barrera puede ser por completo impermeable o selectivamente permeable a moléculas de un tamaño particular

70 | CAPÍTULO TRES

CÉLULAS Y DESARROLLO

adherencia entre las células suelen reforzarse por la formación de regiones de contacto especializadas que se conocen como uniones celulares (Steinberg y McNutt, 1999; Pérez-Moreno y cois., 2003; cuadro 3-4). Las principales clases de moléculas de adherencia celular son cuatro (Humphries y Newham, 1998; Hynes, 2002): ► Caderinas. Son proteínas de adherencia transmembrana depen dientes de calcio que reconocen caderinas idénticas en la super ficie de otras células y se enlazan con ellas. El proceso de enlace con moléculas idénticas se conoce como enlace homofílico. En los mamíferos se encuentran alrededor de 30 caderinas distin tas, las más importantes de las cuales son la caderina E (que se restringe sobre todo a células epiteliales) y la caderina (que se expresa de manera predominante en el sistema nervioso). ► CAM-lg. Son moléculas de adherencia transmembrana inde pendientes del calcio que tiene una similitud estructural con la familia de las inmunoglobulinas (Ig). Por ejemplo, la molécula de adherencia d e células neurales (NCAM) se expresa en el siste ma nervioso y en las somitas en desarrollo. ► Integrinas. Son moléculas de adherencia dependientes de cal cio que suelen mediar interacciones entre la célula y la matriz (véase más adelante), pero ciertas integrinas de leucocitos tam bién participan en la adherencia intercelular. ► Selectinas. Estas moléculas las expresan células endoteliales du rante una respuesta inflamatoria. Reconocen residuos de car bohidratos en la superficie de los neutrófilos y guían estas células a los sitios de inflamación.

3.2.4 La matriz extracelular proporciona una estructura central para todos los tejidos del cuerpo y también es una fuente importante de señales que controlan la conducta celular Los espacios entre las células del cuerpo están vacíos. El espacio extracelular está lleno de una estructura tridimensional de fibras proteínicas embebidas en un gel de carbohidratos complejos llamados glucosaminoglucanos. Este material, el material extracelular (MEC), tiene una composición variable según los materiales que las células locales secreten hacia su ambiente inmediato. Las células también influyen en la estructura del MEC mediante la secreción de enzi mas modificadoras, como proteasas, y esto puede influir en la con ducta celular (Streuli, 1999). A su vez el MEC proporciona una estructura central que desempeña una función esencial en la con servación de la integridad tisular y guía la conducta de la célula du rante el desarrollo al interactuar con receptores que abarcan la membrana (Giancotti y Ruoslahti, 1999; Bokel y Brown, 2002). Los componentes del MEC pueden dividirse en varios grupos (véase cuadro 3-5): ► proteínas estructurales, como colágenas y elastinas; ► proteínas de adherencia, por ejemplo, lamininas y fibronectinas; ► proteoglucanos, que comprenden una proteína central relaciona da con varios glucosaminoglucanos. Los proteoglucanos difie ren de las glucoproteínas porque los residuos de azúcar en los primeros representan hasta 95% del peso total de la molécula; ► el glucosaminoglucano libre, ácido hialurónico. Las proteínas estructurales y de adherencia de la MEC tienen una participación importante en la determinación de su función. Por ejemplo, los tejidos ricos en colágena son muy fuertes (como los

tendones), en tanto que los tejidos ricos en elastina son muy elásti cos (p. ej., los vasos sanguíneos). Las proteínas de la MEC interactúan con las células por medio de receptores transmembrana llamados integrinas. Éstas se unen a proteínas de la MEC en el ex terior de la célula y a microfilamentos de actina en el interior me diante proteínas en puente, como la talina y la actinina alfa. Tales interacciones permiten que las células se muevan al contraer los fi lamentos de actina contra la estructura fija en el material extracelu lar (MEC). Asimismo está demostrado que las integrinas activan las vías internas de señalamiento, lo que sugiere que la MEC puede in fluir en la expresión génica dentro de la célula y por tanto modifi car la conducta celular en respuesta a componentes específicos del material extracelular (MEC). Un ejemplo importante de la función del MEC en la conducta de las células es la conservación de la po laridad celular por medio de la lámina basal (para más ejemplos, véase Dustin, 2002). En el epitelio intestinal, la presencia de la lá mina basal en Un lado de la monocapa celular tiene a su cargo el es tablecimiento y la conservación de una superficie basal plana adyacente al tejido conjuntivo y una superficie apical caracterizada por un borde en cepillo. Los componentes proteoglucano y glucosaminoglucano de la MEC realizan varias funciones. Primero, las moléculas son muy so lubles y forman geles hidratados que actúan como amortiguadores para proteger los tejidos contra compresiones. El tejido es muy re sistente a la compresión (p. ej., cartílago) en los sitios en que el con tenido de proteoglucano de la MEC es en particular alto. Los proteoglucanos pueden formar superestructuras complejas en las que moléculas de proteoglucano individuales están dispuestas alre dedor de estructuras básicas de ácido hialurónico. Estos complejos actúan como reservorios biológicos al almacenar moléculas activas, por ejemplo, factores de crecimiento. De hecho es posible que los proteoglucanos sean esenciales para la difusión de ciertas moléculas de señalamiento. Por ejemplo, las vías de señalamiento Hedgehog y Wingless se inhiben en el mutante Drosophila sugarless, que es in capaz de sintetizar de modo correcto proteoglucanos (véase Selleck, 2000). Por último los proteoglucanos también ayudan a mediar la adherencia entre la célula y la matriz. Ello se logra mediante el en lace con enzimas en la superficie celular conocidas como glucosiltransferasas, cuya función consiste en añadir residuos de azúcar a los grupos de carbohidratos. Cuando no hay azúcar libre, la enzi ma mantiene la cadena de carbohidratos. Cuando se dispone de azúcar, la reacción se completa y la cadena de carbohidratos se libe ra. Estos ciclos de adherencia y liberación pueden tener importan cia particular en el control de la migración celular.

3.3

G eneralidades del desarrollo

El término desarrollo, como se aplica a los animales, se refiere a un proceso por el que una célula aislada origina un organismo maduro. A menudo es conveniente dividir el desarrollo animal en una etapa embrionaria, durante la cual se establecen todos los principales siste mas orgánicos, y una posembrionaria que (en el caso de los mamífe ros) consiste sobre todo en crecimiento y refinamiento. Los biólogos del desarrollo tienden a concentrarse en la etapa embrionaria porque es ésta en la que ocurren los acontecimientos más excitantes y dramá ticos, pero esto no disminuye la importancia del desarrollo posembrionario. Aún no se aclara cuándo se detiene el desarrollo una vez que el plan básico del cuerpo se establece. Los humanos experimen tan un continuo de crecimiento y consolidación posembrionarios

3.3

GENERALIDADES DEL DESARROLLO

71

Cuadro 3 ' Componentes moleculares de la matriz extracelular Componente

Distribución

Colágenas

Muchos tejidos

Las colágenas son glucoprotreínas triméricas grandes. Existen varias formas de colágena químicamente distintas cuya abundancia varía en diferentes tejidos. Las formas más abundantes son las colágenas I, II y III, que tienden a form ar fibrillas estabilizadas mediante enlaces cruzados entre residuos de lisina. Brindan apoyo estructural e influyen en la diferenciación y la migración celulares por medio de interacciones con integrinas. En contraste, la colágena IV forma enrejados más que fibrillas y es un componente importante de la lámina basal. Interactúa de manera indirecta con células, mediante el vínculo con laminina

Fibronectina

Muchos tejidos

La fibronectina es una glucoproteína dimérica cuya principal función es facilitar la adherencia entre célula y matriz. Las fibronectinas tienen dominios de enlace de colágena y heparina que ayudan a organizar el MEC. Las fibronectinas interactúan con células por medio de integrinas e influyen en la forma, el movimiento y la diferenciación celulares

Lamininas

Tejidos epiteliales

Las lamininas son proteínas triméricas que comprenden las subunldades A, B1 y B2. Interactúan con la colágena IV para form ar la lámina basal y su principal función es facilitar la adherencia de las células a la lámina basal al interactuar con integrinas y otras moléculas de la superficie celular. Hay muchas formas específicas de tejidos de cada subunidad de laminina

Entactina

Tejidos epiteliales

Se relaciona estoiquiométricamente con laminina y contiene secuencias que pueden permitir interacciones con Integrinas de la superficie celular

Elastina

Muchos tejidos, pero abundantes en vasos sanguíneos, piel y otras estructuras que se estiran y deforman

La elastina es una proteína no glucosilada que forma redes y hojas por enlace cruzado. La proteína tiene un retroceso elástico natural y confiere a los tejidos la capacidad de recuperar su form a después de deformarse

Tenasclna

Embrión, sistema nervioso adulto

La tenascina es una glucoproteína hexamérica que desempeña una función importante en el control de la migración celular. Posee efecto adhesivo en algunas células y repelente en otras según los receptores que se encuentran en la superficie celular

Vitronectina

Sangre y otros tejidos

Esta proteína suele vincularse con la fibronectina, aunque no se distribuye de manera tan amplia, e Interactúa con clases particulares de integrinas para facilitar la adherencia entre célula y matriz

Proteoglucanos

Muchos tejidos

Familia muy diversa de moléculas que comprende una proteína de centro, como decorina o sindecán, relacionada con uno o más glucosaminoglucanos (p. ej., sulfato de condroitina, sulfato de dermatán, heparina, sulfato de heparán). A menudo adopta una estructura de mayor orden en el material extracelular (MEC). Estas moléculas median la adherencia celular y también pueden enlazar factores de crecimiento y otras moléculas bloactivas

Acido hialurónico

Muchos tejidos

El único glucosaminoglucano no sulfatado y no unido de modo covalente a una proteína para form ar un proteoglucano. Facilita la migración celular en particular durante el desarrollo y la reparación de tejidos

Estructura/función

que inicia en el nacimiento y transcurre hasta por dos decenios pos teriores, con algunos órganos que llegan a la madurez antes que otros. Podría argumentarse que el desarrollo humano cesa cuando el individuo se torna maduro sexualmente, pero muchos tejidos nece sitan restituirse durante toda la vida (p. ej., piel, sangre, epitelio in testinal) y en estos casos el desarrollo nunca se detiene del todo, sólo llega a un equilibrio. Algunos científicos consideran inclusive el en vejecimiento como una parte del desarrollo puesto que representa una parte natural del ciclo de vida. El desarrollo es un proceso gradual. El óvulo fecundado origina primero un embrión simple con características relativamente grue sas. Conforme el desarrollo prosigue, el número de tipos de células aumenta y la organización de estas últimas se toma más compleja.

La complejidad se adquiere de manera progresiva. A nivel molecu lar, el desarrollo incorpora varios procesos distintos que afectan la conducta de las células. Estos procesos están interrelacionados y pueden ocurrir por separado o en combinación en diferentes par tes del embrión (Twyman, 2 0 0 1 ): ► proliferación celular, por la división repetida de las células, que conduce a un incremento de su número. En el organismo ma duro, ésta se equilibra por la pérdida celular; ► crecimiento, por la síntesis de macromoléculas, que conduce a un aumento del tamaño y la biomasa totales; ► diferenciación, el proceso por el que las células se toman espe cializadas desde los puntos de vista estructural y funcional;

72 j CAPÍTULO TRES j CÉLULAS Y DESARROLLO

► formación de patrón, el proceso mediante el cual se organizan las células, primero para formar el plan del cuerpo fundamen tal del organismo y luego las estructuras detalladas de diferen tes órganos y tejidos; ► morfogénesis, o cambios en la forma total. En la morfogénesis pueden participar varios mecanismos subyacentes, que incluyen proliferación celular diferencial, adherencia selectiva intercelu lar o adherencia entre célula y matriz, cambios en la forma y el tamaño de las células, uso selectivo de la muerte celular progra mada y control de la simetría y el plano de la división celular. Todos los procesos anteriores están controlados por genes, que espe cifican dónde y cuándo se sintetizan proteínas particulares en el em brión y por tanto la forma en que las distintas células se comportan. Si bien un organismo multicelular presenta diferencias menores en la secuencia de DNA entre las células, la mayor parte de ellas con tiene cuando menos los mismos genes. Por consiguiente, para que las células en el embrión en desarrollo se diversifiquen debe haber una expresión génica diferencial. Puesto que la expresión génica está controlada por factores de transcripción, el desarrollo depende final mente de los factores de transcripción que se activan en cada célula (véase, p. ej., Kuo y cois., 1992). Como se señaló en la sección 3.2.2, la actividad de los factores de transcripción puede regularse por se ñalamiento entre las células. Un objetivo mayor de la investigación biomédica es descubrir las vías de señalamiento y los programas re guladores que controlan el desarrollo. Este capítulo se dirigirá al de sarrollo de vertebrados y en especial de mamíferos. El conocimiento del desarrollo inicial del humano es fragmentario porque el acceso a

La investigación de! desarrollo se dirigió a un número hasta cierto punto pequeño de organismos modelo, que se consideran representativos de las principales divisiones taxonómicas de la vida multicelular. Algunos de estos organismos se eligieron al principio por la facilidad con que podrían obtenerse y reproducirse en cautividad, en tanto que otros se selecciona ron por las ventajas experimentales específicas que ofrecían. El estudio de estos organismos demostró que los genes del desarrollo, y de hecho to das las vias reguladoras, están muy conservados. Han sido instrumenta les en la identificación y la caracterización de los genes humanos que participan en el desarrollo. La importancia de estas especies com o m o delos experimentales la indica su precedencia entre los proyectos del genoma que se planean o se encuentran en curso (recuadro 8.8). INVERTEBRADOS Los principales modelos invertebrados son la mosca de la fruta (Drosop hila melanogaster) y el nematodo (Caenorhabditis elegans). Estos dos organismos son genéticamente accesibles y por consiguiente adecuados para la selección de mutaciones a gran escala y el análisis y la manipula ción genéticas. Los embriones de ambas especies (y también los gusa nos adultos) son transparentes y factibles de manipulaciones quirúrgicas. Drosophila fue el primer modelo animal que se estudió con detalle a nivel molecular y muchos de los mecanismos moleculares que sustentan el desarrollo embrionario temprano se establecieron en esta especie. Dro sophila también proporciona modelos con utilidad particular de neurogénesis y desarrollo del ojo. Caenorhabditis es notable por su programa estereotipado de desarrollo que se caracteriza por un linaje celular casi in variable y la disponibilidad de un diagrama completo de conexiones del sistema nervioso. Los mutantes de linaje constituyen un medio útil para estudiar ia memoria celular en el desarrollo. La vulva del nematodo es un modelo bien establecido de organogénesis. Otros modelos de Invertebra dos Incluyen moluscos, ascidianos (tunicados) y anélidos.

muestras para estudio suele restringirse por razones éticas o prácti cas. Como resultado gran parte de la información disponible se de riva de modelos animales del desarrollo (véase recuadro 3-3).

3 .4

Especialización de las células durante el desarrollo

3.4.1 La especialización celular incluye una serie irreversible de decisiones jerárquicas El desarrollo es comparable con una corriente que desciende por un lado de una montaña, con las células individuales representadas por hojas que fluyen con el agua (fig. 3-6). El curso del agua puede ra mificarse muchas veces antes de llegar al fondo, pero una hoja sólo puede seguir una vía. Conforme se aproxima a un punto de rami ficación, la hoja debe comprometerse con una vía u otra. Una vez que la decisión se toma, la hoja ya no puede retroceder y elegir una vía diferente. La decisión es irreversible. Después de la fecundación, las primeras divisiones celulares que el cigoto de mamíferos experimenta son simétricas y originan células hijas con el mismo potencial (o potencia) de desarrollo. El cigoto y sus descendientes inmediatos no son especializados; se dice que son totipotentes porque cada célula retiene la capacidad para diferenciar se en todas las posibles células del organismo, inclusive las membra nas extraembrionarias. Esto es análogo a una hoja al inicio de su trayecto en la montaña. A medida que el desarrollo procede, las cé lulas se tornan más especializadas y a la vez más restringidas en su ca-

VERTEBRADOS Los organismos modelo vertebrados sirven como modelos representati vos del desarrollo humano a los niveles tanto anatómico como molecular. Se prefieren el pollo doméstico (Gallus gallus) y la rana africana con ga rras (Xenopus iaevis) porque ambas especies producen embriones robus tos que se desarrollan fuera del cuerpo y pueden manipularse con facilidad. Sin embargo, estas especies se utilizan poco para análisis genético; en el caso de X. iaevis, a causa sobre todo del intervalo de generación prolon gado y el genoma tetraploide, que dificultan el análisis genético. En fecha más reciente despertó interés una especie relacionada, X. tropicalis, que produce embriones más pequeños pero tiene un intervalo de generación más corto y es diploide. El ratón [Mus musculus) tiene ventajas en térm i nos de su accesibilidad genética, su adecuación a manipulaciones genéti cas (en particular dirigirse a blancos génicos, lo que permite inactivar genes específicos; véase cap. 20), y su cercanía con humanos. No obs tante, como el embrión debe desarrollarse internamente, resulta difícil efectuar manipulaciones quirúrgicas. El pez cebra (Danio reiro) combina ia docilidad con la accesibilidad genéticas y por tanto tal vez sea el más ver sátil de los organismos modelo de vertebrados. Todos los embriones vertebrados pasan por etapas similares del desarro llo, inclusive segmentación de un óvulo grande, gastrulación, neurulación, somitogénesis y formación de yemas de los miembros. Llegan a una eta pa filotípica en la que el plan corporal de todos los vertebrados es muy parecido. A pesar de estas similitudes, las cinco clases de vertebrados también presentan diferencias mayores entre si, en especial en las etapas de segmentación y gastrulación, que indican estrategias nutricionales al ternativas. Este hecho se explica con mayor amplitud en la sección 3.7.2. Asim ism o existen diferencias en los métodos que se utilizan para especi ficar los ejes embrionarios primarios (sección 3.5.1) y en otros procesos del desarrollo, com o la determinación del sexo (recuadro 3-9).

3.4 1 ESPECIALIZACIÓN DE LAS CÉLULAS DURANTE EL DESARROLLO

Fig. 3-6. Las vías de desarrollo pueden imaginarse como corrientes ramificantes que corren cuesta abajo por el lado de una montaña.

racidad para generar diferentes tipos de descendientes celulares. Las células son forzadas a tomar decisiones y elegir vías alternativas. La primera decisión en el embrión de los mamíferos es la elec ción entre masa celular interna y trofoblasto. La primera se constitu ye en el embrión propiamente dicho y el amnios, en tanto que la segunda se torna en el corion de la porción embrionaria de la pla centa. Las células de la masa celular interna son pluripotentes, es decir, pueden dar lugar a todas las células del embrión y en conse cuencia a un animal completo, pero ya no son capaces de originar -¿s estructuras extraembrionarias derivadas de un trofoblasto. En cualquier momento hasta este punto, la potencia de las células em brionarias se demuestra por la capacidad del embrión para formar gemelos (recuadro 3-4). Las células que se ramificaron hacia el linaje de la masa celular ..-.terna afrontan luego tres elecciones. Pueden escoger uno de los tres tipos celulares fundamentales del embrión: ectodermo, mesodermo o endodermo. A continuación cada una de estas capas germinativas puede dar lugar a una gama específica y limitada de tipos celulares pero ninguna de ellas es capaz de producir un embrión completo. Se dice que son multipotentes. Además, una vez que las ;elulas se comprometen a una capa germinativa, por lo general no c-ieden producir los tipos de células característicos de las otras, =_nque una prueba reciente sugiere que las células madre podrían —: ;trar más plasticidad en el desarrollo de lo que se supuso con an terioridad (véase sección 3.4.6). Por ejemplo, las células del linaje ecrodérmico suelen originar epidermis, células de tejido neural o de k cresta neural, pero por lo regular no pueden dar lugar a células renales (que se derivan del linaje mesodérmico) ni a células hepátique provienen del linaje endodérmico) (recuadro 3-5). Por úl

73

timo, en el fondo de la montaña, surgen las células progenitoras que sólo dan origen a un tipo aislado de células diferenciadas. És tas se describen como unipotentes. Los libros de texto de histología reconocen más de 200 tipos di ferentes de células en el cuerpo humano, que comprenden una va riedad amplia de funciones (véase recuadro 3-6). Algunas tienen una función limitada a un órgano (p. ej., hepatocitos, cardiomiocitos), mientras que otras pueden tener funciones más generales, co mo los fibroblastos. Algunas células especializadas maduras no se dividen y se dice que son diferenciadas terminalmente. Otras cé lulas se dividen en forma activa y actúan como precursoras de cé lulas diferenciadas terminalmente. Estos tipos de células suelen distinguirse por el sufijo - blasto, como en osteoblastos, condroblastos, mioblastos, etc. En algunos casos las células precursoras tam bién son capaces de renovarse por sí mismas y éstas se conocen como células madre (sección 3.4.3).

3.4.2 La elección entre destinos alternativos puede depender del linaje o la posición Una pregunta que los biólogos del desarrollo suelen hacerse es si el destino de una célula (la gama de tipos de células que puede pro ducir) depende de su linaje (es decir, las células de las que se deri va) o de su posición (esto es, las células con que se encuentra en contacto). La posición de una célula parece ser el determinante de mayor importancia del destino celular en el desarrollo temprano de los embriones de vertebrados. Con frecuencia los destinos de las cé lulas están especificados por señales de células cercanas, un proceso denominado inducción. La formación de la placa neural en el em brión de Xenopus constituye un ejemplo bien caracterizado (Harland, 2000; Bainter y cois., 2001; fig. 3-7). La placa neural proviene del ectodermo de superficie a lo largo de la línea media dorsal del embrión en tanto que el ectodermo a cada lado de la línea media da lugar a la epidermis. Sin embargo, al inicio todo el ectodermo de superficie no está comprometido o es virgen; es decir, es competente para dar lugar a la epidermis o la placa neural. La señal para la inducción neural proviene del notocordio, una estruc tura mesodérmica que corre a lo largo del eje craneocaudal del em brión. Las células ectodérmicas arriba del notocordio reciben señales que promueven el desarrollo neural, no así el ectodermo circundante. Sin embargo, si el notocordio se extirpa, entonces todo el ectodermo forma epidermis. De igual forma, si se injerta una pieza extra de no tocordio bajo el ectodermo ventral o lateral (que en condiciones nor males formaría epidermis), en lugar de ello forma tejido de la placa neural. El ectodermo removido de la supuesta región de la placa neu-

Recuadro .3-4. Gemelación en embriones humanos - rededor de 1 de cada 200 embarazos humanos origina gemelos. Éstos son de dos tipos distintos: fraternos (dicigóticos) e idénticos (monocigótícosi Los gemelos fraternos resultan de la fecundación independiente de dos óvulos y no se relacionan en forma más cercana que cualquiera otro nermano. Aunque se desarrollan en la misma matriz, los embriones tienen ru p o s separados e independientes de membranas extraembrionarias. Los :í~ e lo s idénticos surgen del mism o fenómeno de fecundación y se pro:. : e n por la división del embrión en tanto las células son aún totipotentes : plunpotentes. Las divisiones tempranas, que ocurren durante la etapa de -o ru la o antes, producen blastocistos separados que originan embriones r * je ito s por grupos independientes de membranas extraembrionarias.

Éstos constituyen alrededor de un tercio de los gemelos idénticos. En los dos tercios restantes, la gemelación ocurre en la etapa de blastoclsto y comprende la división de la masa celular interna. La naturaleza de la ge melación indica la etapa exacta en que la división ocurre y qué tan com pleta es. En casi todos los casos la división se realiza antes del noveno día de la gestación, que es cuando se forma el amnios. Estos gemelos com parten una misma cavidad coriónica pero están rodeados por amnios in dividuales. En una proporción muy pequeña de los embarazos la división ocurre después del noveno día y los embriones en desarrollo están ence rrados dentro de un amnios común. En ocasiones estos gemelos son sia meses sea por separación Incompleta o por fusión subsecuente.

74 | CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Recuadro 3-S. De dónde provienen los tejidos: jerarquía del desarrollo en mamíferos Cada tipo de célula humana puede seguirse a través de la jerarquía del de sarrollo hasta el óvulo fecundado. El esquema de la parte inferior mues tra las decisiones del desarrollo necesarias para que el óvulo dé lugar a cada uno de estos tipos de células, el viaje de descenso por la montaña

según la analogía en la sección 3.4.1. Casi todas las células se derivan de una de las tres capas germinales primarias y la mayor excepción son las células germinales primordiales, que se separan del linaje somático antes de la gastrulación.

C igoto Células germ inales prim ordiales

G am etos

I S eg m entació n

4

Vejiga urinaria*

G lándulas sudoríparas*

E ctoderm o extraem brionario de am nios y corion

U ñas

Gastrulación Glándulas mamarias*

Pelo

ENDODERMO

A lantoides* H ígado

Tráquea,* bronquios,* pulm ones

Páncreas*

EPITELIO EXTER N O ' DEL C U E R P O

E C TO D E R M O

T Cristalino del ojo

Tubo digestivo* NOTOCORDtO Tiroides

FARINGE

t j

Mecanismo del oído interno

R eceso am igdalino*

Epitelio nasal y olfatorio y nervio olfatorio

MESODERMO PARAXIL

Tim o prim itivo,* paratiroides*

V_____ Esqueleto axil Esqueleto ap endicular

Yemas para apéndices

Divertículo metanéfrico, uréteres, pelvis renal, túbulos colectores Mesonefros, conductos eferentes

P arte neural Raíces de los nervios d e la hipófisis raquídeos motores Conducto anal* A Médula espinal M iotom as ^

Músculos esqueléticos del tronco

C ap a s de tejido < conjuntivo d e la piel

Lóbulo anterior d e la hipófisis

I

Esclerotomas

Músculos de apéndices

Epitelio bucal Esmalte de los dientes

Epitelio proctodeal

C uerpos posbranquiales

"*

Epitelio estom odeal

MESODERMO

Fosas faríngeas* Oído medio,* trompa de Eustaquio

Vesícula auditiva*

G lándulas sebáceas*

R etina* y nervio óptico

D erm atom as

r

Epididim o, conductos deferentes

r~

i ___

TUBO NEURAL

C RESTA N EU R A L

J

--------------

)

^ Vesículas ópticas i

\ C erebro

Nervios motores craneales

Raíces de los nervios Ganglios y nervios raquídeos sensoriales *■ sensoriales craneales Ganglios en las - raíces raquíde; dorsales

MESODERMO IN TE R M E D IO

M é d u la suprarrenal

D entina

I

G anglios C ráneo y sim páticos -------------------------------- f cartílagos a h . . i i. . S ^ RM0 M E S É N Q U IM A DE LA | branquiales C ap a s externas Vagina* Oviductos* U tero* LATERAL .. C A B E ZA i del ojo ^ Tejido Mesodermo extraembrionario conjuntivo Mesodermo C0JV de amnios y corion cefálico extraembrionario del saco vitelino M e so d erm o som atopleural y la alantoides M úsculos I Mesodermo Corteza de las M esenterios Peritoneo visceral Pleura, pericardio, esplacnopleural suprarrenales « 4 Epim iocardio, peritoneo V___ C orazón epicardio, Estrom a o m iocardio ---------------------------% M e sé n q u ím a g ónadas * Pleura visceral Tejido hemangioblástico

M etanefros, túbulos renales*

Pronefros

J

f

’ Indica el origen sólo de partes epiteliales

Tejido conjuntivo y músculo liso de visceras y vasos sanguíneos

T

C orpúsculos sanguíneos

Endotelio de vasos sanguíneos

Endocardio

3.4 [ ESPECIALIZACfÓN DE LAS CÉLULAS DURANTE EL DESARROLLO

75

V --------► D

D

¡t* \k

Placa neural

Placa neural

Epidermis

Fig. 3-7. Los experimentos de injertos en Xenopus muestran cuándo las células del ectodermo se comprometen con destinos de células epidérmi cas y neurales. En el lado izquierdo, el ectodermo ventral (V) (verde) da lugar a epidermis en tanto que el ectodermo dorsal (D) (rojo) origina la placa neural. A la dere cha, si se Injerta ectodermo ventral en el lado dorsal del embrión, éste se reespecifica y es capaz de formar la placa neural. Lo anterior demuestra que el destino del ectodermo depende de las señales que emanan de otras células en la cercanía de la placa neural, es decir, las células del mesodermo axil.

Recuadro 3-6. Diversidad de células humanas

....

......................

*................... .

Los libros de texto de histología describen más de 200 tipos de células. A continuación se ilustra la variedad de tamaño y forma entre algunos ti pos de células comunes. Óvulo y espermatozoo (véase fig. 3-12 para las características y recua dro 11.4 para la form a en que se generan a partir de células germinales primordiales). Linfocito (fig. 3-9): célula redonda pequeña, de 6 a 8 y,m de diámetro. Muy poco citoplasma. Por lo general 5 000 por (xm de sangre. Eritrocito (fig. 3-9): disco bicóncavo plano de 7.2 de diámetro. Los eritrocitos carecen de núcleo, mitocondrias o ribosomas. El metabolismo ocurre mediante giucólisis por completo. El periodo de vida es de 120 días. Casi siempre 5 millones por mcl de sangre. Megacariocito (figs. 3-3 y 3-9): célula grande de la médula ósea de 35 a 150 |xm de diámetro. Núcleo lobulado Irregular que contiene 8 a 32 genomas, formados por endomitosis. Los megacarlocítos se fragmentan para form ar miles de plaquetas. Plaquetas (figs. 3-3 y 3-9): fragmento de 3 a 5 ^ m de citoplasma muy es tructurado sin núcleo. Periodo de vida de ocho días. Por lo general 200 000 por p.l de sangre. Macrófago (fig. 3-9): célula de form a variable que se desplaza por medio de seudópodos. Especializada para englobar partículas por fagocitosis, contiene muchos lisosomas para digerirlas. Muchos macrófagos se fu sionan alrededor de grandes cuerpos extraños y forman células tisulares gigantes.

....................

Célula epitelial: células muy adherentes que se unen entre sí para formar los epitelios con uniones estrechas (desmosomas) entre las células. Al gunas células epiteliales están especializadas en transporte de Iones, ab sorción o secreción. Fibroblasto: célula de tejido conjuntivo no especializada capaz de diferen ciarse en cartílago, hueso, grasa y células de músculo liso. Hepatocito: célula polihédrica de 20 a 30 (¿m de diámetro, en ocasiones muitinucleada. Abundante en mitocondrias y retículo endoplásmico; con tiene lisosomas; puede incluir gotitas de lípidos. Célula de fibra muscular (fig. 3-3): célula muitinucleada formada por la fusión de mioblastos. Tiene 10 a 100 p.m de diámetro y puede alcanzar varios centímetros de largo. Los núcleos se sitúan alrededor de la perife ria; casi todo el interior está ocupado por miofibrillas de 1 a 2 ^ m , con muchas mitocondrias entre ellas. Neurona: tamaño y forma muy variables. Cuerpo celular de 4 a 150 ^ m ; por lo general muchas dendritas y un axón. Una célula puede tener más de 100 000 conexiones con otras neuronas. Los axones de células espi nales que inervan los pies miden 1 m de largo. Melanocito (fig. 3-9): célula epitelial con procesos ramificados largos si tuada entre queratinocitos y que pasa paquetes de pigmento (melanosomas) al interior de ellos. Por lo general 1 500 por mm 2 de piel (con independencia del color de la misma). Queratinocito: los queratinocitos maduros son estructuras similares a es camas llenas de queratina y desprovistas de núcleo o cualquier organelo.

76

I

CAPITULO TRES [ CÉLULAS Y DESARROLLO

ral del embrión e injertado en alguna otra parte formará epidermis, en tanto que el ectodermo que se extirpa del lado ventral del embrión y se injerta arriba del notocordio formará placa neural. Por consiguien te, es claro que el destino del ectodermo —epidérmico o neural—de pende de la posición de las células y no de su linaje, y al principio es reversible. En esta etapa se dice que el destino de las células es especi ficado, lo que significa que aún puede alterarse si se cambia el ambien te de las células. Una vez que transcurre cierto periodo, el destino del ectodermo se torna fijo y ya no puede alterarse mediante injertos. En esta etapa se dice que las células son determinadas, o sea, comprome tidas de manera irreversible con su destino. Por lo general determina ción significa que la célula inició un proceso molecular que conduce de modo inevitable a diferenciación. En algunos casos esto se debe a la síntesis de nuevo factor de transcripción y el factor de transcripción no puede inactivarse. En otros casos puede haber modificaciones de la cromatina que fijan el patrón de expresión génica en el sitio. Tam bién es posible que ocurra pérdida de competencia por inducción. Por ejemplo, las células ectodérmicas que están comprometidas a transfor marse en epidermis pueden dejar de sintetizar el receptor que respon de a la señal que proviene del notocordio. Aunque se cuenta con menos ejemplos del destino de las células es pecificado por el linaje en embriones de vertebrados, un caso explícito es la conducta de las células madre, que se comenta más adelante.

3,4.3 Las células madre son células progenitores que se renuevan por sí mismas Inclusive cuando un organismo está desarrollado a plenitud, algu nas células —en especial las sanguíneas, las epiteliales en la piel y el intestino, y las espermáticas—necesitan producirse de manera con tinua. Éstas son producto de células precursoras que se renuevan por sí mismas, o células madre. Las células madre pueden proliferar por división celular simétrica y generar dos células hijas simila res. Según se requiera, también pueden someterse a división celular asimétrica-, una célula hija tiene el mismo tipo de propiedades que la célula madre original, pero la otra célula hija posee propiedades alteradas y queda comprometida a producir un linaje de células di ferenciadas. El destino de la célula hija comprometida no está in fluido por su posición o por las señales de otras células. La decisión es intrínseca al linaje de la célula madre. Este tipo de especificación no condicional (autónomo) de los destinos de las células es resulta do de la distribución asimétrica de moléculas reguladoras en la di visión celular. Por ejemplo, en las células madre neurales se observa una distribución asimétrica de las proteínas Notch-1 (concentradas en el polo apical) y las Numb (que se concentran en el polo basal). La división en el plano de la superficie epitelial ocasiona que estos determinantes se distribuyan por igual, pero una división en ángu-

Fig. 3-8. El destino de la célula en los descendientes de células madre neurales depende del plano de división celular, que refleja la distribución asi métrica de proteínas que abarcan la membrana como Notch y determinantes intracelulares, por ejemplo Numb. Ocurre división simétrica en el plano del neuroepitelio y da por resultado la distribución uniforme de Notch (círculos verdes) y Numb (triángulos rojos) entre células hijas. Las divisiones asimétricas perpendiculares al neuroepitelio conducen a la formación de un progenitor neuronal apical y una célula madre de reemplazo basal.

3.4 | ESPECIALIZACIÓN DE LAS CÉLULAS DURANTE EL DESARROLLO | 77

CÉLULA MADRE HEMOPOYÉTICA PLURIPOTENTE A u to rre n o v a c ió n

1

R e p lic a d o r) e n d o m itó tic a

1r

Y

____

i

i t

1i

< S >

' f

< g >

v

O Reticulocito

I OOO C é lu la B

C é lu la T

o o

Plaquetas (trombocitos)

■ Macrofago

L in fo cito s

Basófilo

Neutrófilo

Eosinófilo

Eritrocito

Granulocitos

Fig. 3-9. Compromiso y diferenciación en el linaje de células sanguíneas.

los rectos a la superficie epitelial causa que éstos se segreguen en las células hijas, que en consecuencia se desarrollan de manera distin ta (Kim y Schagat, 1996; fig. 3-8). Las células sanguíneas son un ejemplo útil de linajes de células madre. Un tipo de célula único, la célula madre hemopoyética (CMH), puede dar lugar a todas las células sanguíneas (Morrison y cois., 1995). Esto se comprobó con claridad mediante la irradiación de ratones para asegurar la destrucción de la médula ósea y a conti nuación injertando CMH purificadas de una cepa distinta de rato nes, tras lo cual las células que se produjeron fueron capaces de diferenciarse y repoblar la sangre. Las CMH son multipotentes pero los linajes celulares a que dan lugar se tornan cada vez más especiali zados y por último producen todas las células hematológicas diferen ciadas terminalmente (fig. 3-9).

3.4.4 Se sabe que existe una variedad de células madre tisulares, pero aún queda mucho por aprender acerca de ellas Una célula madre tisular (en ocasiones también descrita como una célula madre somática) es una célula indiferenciada que se encuen

tra entre las células diferenciadas en un tejido u órgano (Verfaile, 2002). Puesto que es una célula madre, puede renovarse por sí mis ma y diferenciarse para reproducir los principales tipos de células especializadas del tejido o el órgano. Por lo general cada tejido po see un número muy pequeño de estas células y aunque su origen preciso se desconoce en gran parte, se piensa que residen en áreas específicas de cada tejido. En algunos casos pueden permanecer la tentes (sin dividirse) durante muchos años hasta que una enferme dad o lesión las activa, pero en otras circunstancias en las que es necesario restituir células con frecuencia (p. ej., para reemplazar cé lulas epiteliales de la piel y el intestino) son regularmente activas. Las primeras células madre de adultos se encontraron en el de cenio de 1960 cuando se observó que la médula ósea contenía cuando menos dos tipos de células madre; células madre bemopoyéticas, que forman todos los tipos sanguíneos, y células d el estroma de la médula ósea, una población mixta que genera hueso, cartílago, grasa y tejido conjuntivo fibroso. A partir de entonces se realizaron algunos descubrimientos sorprendentes y se hizo público que las células madre cerebrales generan los tres tipos principales de célu las del cerebro: las neuronas (células nerviosas) y los astrocitos y oligodendrocitos no neuronales.

78

i

CAPÍTULO TRES

Cuadro 3

CÉLULAS Y DESARROLLO

Ejemplos de células madre adultas

Tipo de célula madre

Localización

Diferenciación en

Células madre hemopoyéticas

Médula ósea

Todas las células sanguíneas (véase fig. 3-9)

Células madre mesenquimatosas de médula ósea (células estrómicas)

Médula ósea

Osteocitos (células óseas), condrocitos (células de cartílago), adipocitos (células adiposas) más otros tipos de células de tejido conjuntivo como las de tendones

Células madre neurales

Cerebro

Neuronas (células nerviosas), astrocitos, oligodendrocitos

Células madre de epitelio intestinal

Criptas profundas en el recubrimiento del tubo digestivo

Células de absorción, caliciformes, de Paneth y enteroendocrinas

Células madre epidérmicas

Capa basal de la epidermis

Queratinocitos

Células madre foliculares

Base de los folículos pilosos

Folículos pilosos y células epidérmicas

En la actualidad las publicaciones indican que diversos tejidos adultos contienen células madre (véase cuadro 3 -6 ) y se ha progre sado un poco en la identificación de localizaciones especificas de al gunas células madre tisulares. Una de las principales dificultades para el uso experimental de células madre tisulares estriba en que la mayor parte sólo puede permanecer en cultivo sin diferenciarse du rante periodos cortos (a diferencia de las células madre embriona rias; véase la sección siguiente) y su potencial de diferenciación es mucho más limitado que el de las células madre embrionarias. No obstante, pruebas recientes sugieren que el potencial de desarrollo de algunas células madre adultas puede ser más plástico de lo que se pensaba. Este tema se expone en la sección siguiente.

3.4.5 Las células madre embrionarias (ME) tienen el potencial para formar cualquier tejido Desde etapas muy tempranas del desarrollo, las células son indiferenciadas comparativamente. Como su nombre lo sugiere, las célu las madre embrionarias (ME) se derivan de embriones. Al inicio del decenio de 1980 se efectuó un adelanto científico importante cuando se logró cultivar células de la masa celu lar in tern a de blastocistos de ratón (Evans y Kaufman, 1981; Martin, 1981). Las cé lulas ME son plu rip oten tes y poco tiempo más tarde se demostró que son capaces de desarrollar ratones adultos sanos después de in yectarse en blastocistos de una cepa de ratón diferente que luego se transfirieron al oviducto de una madre adoptiva (las aplicaciones de este proceso se comentan en el cap. 20 ). Las células ME de ratón se cultivaron mediante la transferencia de células de la masa celular interna a un plato que contenía un medio de cultivo y cuya superficie interna estaba recubierta con una capa de cé lulas alimentadoras. Las células de la masa celular interna (MCI) pue den crecer y dividirse en tanto están unidas a la superficie adherente de las células alimentadoras que, como su nombre lo indica, también li beran nutrimentos hacia el medio. Una vez que las células de la MCI proliferan, se extraen con suavidad y se subcultivan sembrándolas de nuevo en varios platos para cultivo fresco. Tras unos seis meses de subcultivos repetidos, las cerca de 30 células originales de la MCI pueden proporcionar millones de células madre embrionarias (ME). Las célu las ME que proliferaron en cultivo celular durante seis meses o más sin diferenciarse y que son pluripotentes y parecen genéticamente norma les se denominan línea de células madre embrionarias (ME).

Para valorar si es probable que las células ME sean pluripoten tes pueden seguirse varios métodos experimentales, algunos de los cuales conducen a la producción de los tipos deseados del produc to de la diferenciación. ► D iferenciación espontánea. En circunstancias normales las cé lulas ME se desarrollan bajo ciertas condiciones que las man tienen en un estado indiferenciado. Las alteraciones de las condiciones del cultivo suelen permitir que las células se adhie ran entre sí para formar grupos celulares que se conocen como cuerpos embrioides, tras lo cual las células comienzan a dife renciarse de modo espontáneo para formar células de diferen tes tipos, aunque en una forma bastante impredecible. ► D iferenciación dirigida. Las células se manipulan (por medio del cambio de la composición química del medio de cultivo, etc.) de tal manera que se diferenciarán para formar los tipos de célula especifica deseados. ► Form ación d e teratomas. Las células se inyectan en un ratón inmunosuprimido a fin de estudiar la formación de un tipo particular de tumor benigno que se conoce como teratoma. Los teratomas que ocurren en forma natural y los inducidos por medios experimentales contienen de manera característica una mezcla de muchos tipos de células diferenciadas o parcialmen te diferenciadas -una indicación de que las células ME son ca paces de diferenciarse en múltiples tipos celulares. Cabe señalar que aunque las células ME se denominan células madre, son diferentes a las células madre tisulares porque no se dividen de modo asimétrico para producir una célula madre de reemplazo y una célula hija preparada para la diferenciación. Las células ME se dividen simétricamente y todas las células hijas tienen el mismo potencial de diferenciación, acorde con las circunstancias experimentales. En fecha más reciente se notificó éxito en el cultivo de células ME humanas (Thomson y col-, 1998), derivadas de embriones de sarrollados de óvulos fecundados in vitro en una clínica de fecu n d a ción in vitro (FIV). El objetivo del procedimiento de FIV es ayudar a las parejas con dificultades para tener hijos y por lo general se ob tiene un exceso de óvulos fecundados que pueden donarse después para fines de investigación. Los embriones de los que se derivan las células ME casi siempre son de cinco días de edad o blastocistos, pelotas microscópicas huecas que contienen alrededor de 100 célu las, de las que casi 30 constituyen las células de la masa celular in

3.5 j FORMACIÓN DEL PATRÓN EN EL DESARROLLO

terna (MCI). El éxito en el cultivo de células ME humanas fue un ¿delanto científico importante y excitante porque originó la posi bilidad de nuevas conductas terapéuticas y nuevos caminos de in vestigación hacia la diferenciación celular. Los trastornos y las -csiones graves en los que la patogénesis es resultado de la pérdida ce células del cuerpo podrían tratarse mediante estrategias de res titución celular y puesto que, en principio, es posible programar las .elulas ME para que se diferencien en células de un tipo específico, hay grandes expectativas (cap. 2 1 ). Una estrategia alternativa es el aislamiento de células germinales primordiales, las células del reborde gónadal que en condiciones nor males se desarrollarán en gametos maduros (véase figura en el recua dro 11.4). Estas células pueden cultivarse in vitro y dar lugar a células germinales embrionarias (GE) pluripotentes que se mantienen en torma muy similar a las células ME. Shamblott y colaboradores 998) cultivaron por primera vez las células GE humanas derivadas de células germinales primordiales o de embriones y fetos de 5 a 10 ¿emanas de edad. Véase también Donovan y Gearhart, 2001.

3.4.6 Ei potencia! de diferenciación de ias células madre tisulares es motivo de controversias El potencial de diferenciación de las células madre tisulares se revaoró en los últimos años con base en varios informes de finales del decenio de 1990 que indicaron que al parecer ciertas células madre tisulares adultas son pluripotentes. La capacidad aparente de las cé. Jas madre adultas para diferenciarse en múltiples tipos de células muy distintas se denomina transdiferenciación o plasticidad. Los templos informados incluyen: ► células madre hemopoyéticas que se diferencian en los tres tipos principales de células cerebrales (neuronas, oligodendrocitos y astrocitos), en células de músculo esquelético y de músculo car diaco, y en hepatocitos (p. ej., Petersen y cois., 1999); ► células cerebrales que se diferencian en células sanguíneas y de músculo esquelético o viceversa (p. ej., Shih y cois., 2002; Clarke y cois., 2000; Bjornson y cois., 1999). ► células del estroma de la médula ósea que se diferencian en cé lulas de músculo cardiaco y esquelético (Orlic y cois., 2001). La excitación que estos informes originaron reflejó en gran parte el potencial de la terapéutica con células madre. En principio cual quier tejido u órgano dañado podría renovarse y aun reemplazarse utilizando las células madre más accesibles y éstas podrían inclusive manipularse de manera previa (véase Weissman, 2000; Daley, 2002). Por ejemplo, las células madre hemopoyéticas de un paciente, que son de fácil acceso, podrían reprogramarse para producir células ce rebrales que reemplacen las que se perdieron en una enfermedad neurodegenerativa o en lesiones de la médula espinal. Sin embargo, surgieron dudas respecto a la posibilidad de aprovechar con fines te rapéuticos la transdiferenciación (véase Medvinsky y Smith, 2003). Véase también el capítulo 21 para problemas prácticos y éticos gene rales relacionados con el uso de células madre humanas.

5.5 Formación del patrón en el desarrollo Si bien la diferenciación da lugar a células con estructuras y funcio nes especializadas, eso no constituye un organismo a menos que las células se organicen en una forma útil. Sin organización, el huma no podría terminar como una burbuja amorfa de tejido heterogé

79

neo, con células hepáticas, neuronas y de la piel distribuidas de ma nera aleatoria incapaces de formar tejidos y órganos identificables. Aunque los individuos presentan muchas diferencias menores, to dos los miembros de la misma especie tienden a ajustarse al mismo plan básico del cuerpo (Wolpert, 1996). En los humanos, y en los vertebrados en general, el plan del cuerpo muestra simetría bilate ral superficial con respecto al eje craneocaudal, en tanto que el otro eje mayor (el dorsoventral) sigue de la espalda al vientre. Al interior del cuerpo ciertos órganos están colocados asimétricamente y defi nen un eje de izquierda a derecha. Los órganos y tejidos del cuerpo se distribuyen en esencia de la misma manera en relación con estos ejes en cada individuo y este patrón surge muy temprano en el de sarrollo. Después emergen patrones definidos dentro de órganos particulares. Un buen ejemplo es la formación de los cinco dedos de cada mano y de cada pie. El ordenamiento de células dentro de los tejidos genera patrones más detallados. Tales patrones surgen de manera gradual durante el desarrollo, con un embrión al principio tosco que poco a poco se refina como una fotografía que se enfoca con precisión. En esta sección se estudian la manera en que la for mación del patrón en el embrión en desarrollo se inicia y los meca nismos moleculares relacionados.

3.5.1 El surgimiento del plan del cuerpo depende de la especificación y la polarización del eje El desarrollo comienza con una célula aislada, que debe polarizarse de alguna manera para producir un embrión con una cabeza y una cola, un dorso y un frente, y lados izquierdo y derecho. En muchos animales la diferenciación del huevo durante la gametogénesis com prende el depósito de moléculas particulares en diferentes sitios intracelulares y éstas dan lugar a la polaridad del óvulo. Cuando el huevo fecundado se divide, estos determinantes se segregan hacia diferentes células hijas y de este modo se polariza el embrión. La si metría del huevo de otros animales se rompe por un indicio exter no del ambiente. Por ejemplo, en pollos el eje craneocaudal del embrión se define por la gravedad conforme el huevo gira en su ca mino hacia el oviducto. Las ranas utilizan ambos mecanismos: una asimetría preexistente en el huevo definida por la distribución de los productos génicos matemos, en tanto que el sitio de entrada del es permatozoo proporciona otra coordenada de posición. Aunque aún no se aclara el mecanismo de simetría-rotura en mamíferos, es pro bable que también incluya el sitio de entrada del espermatozoo (re cuadro 3-7).

3.5.2 Las mutaciones homeóticas revelan la base molecular de la identidad posicional Investigaciones a gran escala de mutagénesis en Drosophila que se realizaron en el decenio de 1980 produjeron un número pequeño de moscas en las que una parte del cuerpo se desarrolló con el as pecto de otra (una transformación homeótica). Un ejemplo es la Antennapedia mutante, en la que las patas crecen de la cabeza en lu gar de las antenas. Lo que este hecho muestra respecto a la forma ción del patrón es que la identidad posicional de una célula, es decir, la información que indica a cada célula dónde se encuentra en el embrión y por consiguiente cómo debe comportarse para ge nerar una estructura apropiada para la región está controlada por genes. Estos genes se conocen como genes homeóticos. Análisis moleculares subsecuentes de las mutantes homeóticas de Drosophila revelaron dos grupos de genes muy similares (fig. 3-10),

8°

|

CAPÍTULO TRES

1

C ÉLULAS Y DESARROLLO

cada uno de los cuales codifica un factor de transcripción que con tiene un dominio de unión de DNA conservado llamado homeodominio. Los genes se expresaron de manera notable en patrones superpuestos a lo largo del eje de la cabeza a la cola de la mosca para dividir el cuerpo en zonas discretas. Al parecer la combinación parti cular de genes expresados en cada zona estableció un código que con firió a cada célula una identidad posicional específica a lo largo del eje (véase Morata, 1993; Lawrence y Morata, 1994). La manipula ción de los códigos, sea mediante la mutación de uno o más de los genes o por su expresión deliberada en exceso, permitió generar mos cas con transformaciones específicas de partes del cuerpo. En mamíferos se encuentran grupos muy similares de genes homeobox (genes Hox). Tanto los humanos como los ratones tienen cuatro grupos no unidos de genes Hox que se expresan en patrones superpuestos a lo largo del eje craneocaudal de una manera muy si milar a la de las moscas (Krumlauf, 1994; Lumsden y Krumlauf, 1996; Burke, 2000; fig. 3-10). Más aún, al parecer el mecanismo general de actividad del gen Hox se conserva ya que los estudios de mutaciones knockout y la expresión excesiva deliberada lograron transformaciones de partes del cuerpo que incluyen las vértebras del ratón. Por ejemplo, la alteración dirigida del gen Hoxc8 produ jo ratones con un par extra de costillas a causa de la transformación de la primera vértebra lumbar en la 13a. vértebra torácica (Le Mouellic y cois., 1992). Dos de los grupos de genes Hox, HoxA y HoxD, también se ex presan en patrones superpuestos a lo largo de los miembros. El ra tón knockout y los mutantes de expresión excesiva de estos genes muestran reordenamientos específicos de los segmentos de los miembros. Por ejemplo, los ratones con alteraciones dirigidas de los genes H ox all y H ox dll carecen de radio y cúbito (Davis y cois., 1995). Las mutaciones que ocurren de manera natural en el gen HOXD13 humano se acompañan de una gama de defectos de las manos, inclusive polisindactilia (Manouvrier-Hanu y cois., 1999).

3.5.3 La formación de patrones suele depender de los gradientes de señal La especificación del eje y la polarización son acontecimientos tem pranos importantes en el desarrollo porque las células de las distin tas partes del embrión deben comportarse de manera diferente, en última instancia en términos de los productos del gen que sinteti zan, a fin de generar el plan corporal apropiado. Una célula sólo se comporta de modo apropiado si puede indicar dónde se encuentra en relación con otras células. Ello requiere a su vez un armazón de referencia. Los principales ejes del embrión brindan una referencia que permite definir en forma absoluta y sin ambigüedad la posición de cualquier célula. ¿Cómo reconocen las células su posición a lo largo de un eje y en consecuencia se comportan como corresponde? Esta pregunta resulta pertinente porque a menudo es necesario que células con funciones equivalentes en diferentes posiciones produzcan estruc turas distintas. Los ejemplos abarcan la formación de los distintos dedos a partir de los mismos tipos de células en la mano en desa rrollo y la de diferentes vértebras (algunas con costillas y otras sin ellas) de variedades idénticas de células en las somitas. Está demostrado que en muchos sistemas en desarrollo la con ducta específica de región de las células depende de un gradiente de señal, que tiene diferentes efectos en células blanco equivalentes a distintas concentraciones. Las moléculas de señalamiento que ac

túan en esta forma se conocen como morfógenas. Tanto el princi pal eje craneocaudal del cuerpo como los ejes anteroposterior y proximodistal de los miembros de embriones vertebrados se mode lan mediante este mecanismo (Wolpert, 1996; Ng y cois., 1999). En los miembros en desarrollo (véase Schwabe y cois., 1998; Niswander, 2003), se encuentra un subgrupo particular de células en el margen posterior de cada brote de los miembros llamado zo na de actividad polarizante (ZAP) que es el origen de un gradien te morfógeno (fig. 3-11). Las áreas más cercanas a la ZAP forman los dedos más pequeños y posteriores de la mano o el pie, en tanto que las que están más alejadas originan el pulgar o el dedo gordo. La capacidad de organización de la ZAP puede demostrarse con fa cilidad si se injerta una ZAP donadora en el margen anterior del brote de un miembro que ya tiene su propia zona de actividad po larizante (ZAP). En este experimento el miembro se torna simétri co, con dedos posteriores en ambas extremidades. Al parecer el morfógeno en el miembro en desarrollo es la proteína de señala miento Sonic hedgehog (Shh), aunque se piensa que la proteína ac túa de manera indirecta puesto que no es capaz de difundirse más allá de unas cuantas células de ancho desde su origen. Una cuenta sumergida en la proteína Shh sustituirá en funciones a la ZAP, lo mismo que una cuenta humedecida en ácido retinoico, que se sabe induce la expresión del gen Shh. Los cinco genes distales HoxD (Hoxd9 a Hoxdl3) se expresan en el centro de la ZAP. Sin embar go, conforme la fuerza de la señal disminuye, los genes HoxD se apagan uno por uno hasta el margen anterior de la yema del miem bro que forma el pulgar y sólo Hoxd9 permanece activo. Los gra dientes de señal que especifican los principales ejes embrionarios están unidos a los genes homeóticos que controlan la conducta re gional de la célula en esta forma. Como ya se comentó, los genes Hox no sólo se expresan en los miembros sino también a lo largo de los ejes craneocaudales mayo res del embrión. En este caso se piensa que el origen del gradiente morfógeno que guía la expresión del gen Hox es el mido em briona rio y que el morfógeno en sí mismo es ácido retinoico. Puesto que el nudo secreta cantidades cada vez más abundantes de ácido reti noico a medida que involuciona, las células posteriores se exponen a mayores cantidades de la sustancia química que las células ante riores, lo que produce la activación progresiva de más genes Hox en las regiones posteriores del embrión.

3.6

Morfogénesis

La división celular, con la formación progresiva de patrones y dife renciación celular, proporcionaría por último un embrión con tipos de células organizadas, pero ese embrión sería una pelota estática de células. Los embriones reales son estructuras dinámicas, con célu las y tejidos que se someten a interacciones y reordenamientos constantes para generar estructuras y formas. Las células forman hojas, tubos, masas reticulares laxas y aglomerados densos. Las cé lulas migran de manera individual o en masa. En algunos casos es ta conducta es una respuesta al programa de desarrollo, pero en otros tales procesos impulsan el desarrollo al llevar entre sí grupos de células que de otra manera nunca entrarían en contacto. Varios mecanismos sustentan la morfogénesis; se resumen en el cuadro 3-7 y se comentan con mayor detalle más adelante (Hogan, 1999; Mathis y Nicolás, 2002; Peifer y McEwan, 2002; Lubarsky y Krasnow, 2003).

3.6 i MORFOGÉNESIS ¡ 81

1 Pro A N T -C

Labial

Mia a iv

2

3

M x Lb

4

5

T1 T 2 T 3

6

7

8

10

9

11

12

13

14

A1 A 2 A 3 A 4 A 5 A 6 A 7 A 8

P a ra s e g m e n to s Tel

S e g m e n to s

m

proboscipedia d eform ada peines de sexo reducidos antennapedia B X -C

U ltrabitórax

l

abdom inal-a

i

l

i

l

í

abdom inal-B

! lab

Pb

Dfd

Ser

Antp

Ubx

abdA

I

AbdB

H O M -C

O c c ip ita l

C ervical

1 2 3 4 1 2 3 4 5

T o rá cic o

Lum bar

S a c ro

Caudal

6 1 2 3 4 1 2 3 4

Fig. 3-10. Comparación de los complejos génicos HOM-C/Wox de Drosophila y el ratón y sus dominios de expresión a lo largo del eje anteroposterior del embrión. Redibujado de Twyman (2001 ) Instant Notes in Developmental Biology, publicado por BIOS Scientific Publishers.

82

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

G e n e s H oxD

IV

11 1 0 9 G e n e s H oxD

IV

Flg. 3-11. El Injerto de una segunda zona de actividad polarizante en el margen anterior de la yema del miembro del pollo ocasiona duplicación de los dedos en una imagen en espeio. A) Un gradiente de señal establecido por la expresión de Sonic hedgehog en la zona de actividad polarizante (ZAP) genera un patrón anidado de superposición de patrones de expresión del gen HoxD en la yema de la extremidad en desarrollo, que conduce a la especificación de cinco dedos. B) Los injertos de ZAP establecen un gradiente opuesto y producen una reversión en imagen en espejo de los destinos de los dedos. El efecto puede simularse mediante perlas recubiertas con ácido retinoico (AR) o proteína sónica hedgehog (Shh). Redibujado de Twyman (2001) Instant Notes in Developmental Biology, publicado por BIOS Scientific Publishers.

Procesos morfogenéticos en el desarrollo y ejemplos de sistemas modelo del desarrollo P ro c e s o

E je m p lo s

Ritmos diferenciales de proliferación celular

Brote selectivo de yemas de los miembros de vertebrados mediante proliferación de células en la zona de progreso

Colocación alternativa, orientación del huso mitótico, o ambos

Patrones de segmentación embrionaria diferentes en animales. Divisiones celulares estereotipadas en nematodos

Cambio del tamaño celular

Expansión celular conforme los adipocitos acumulan gotitas de lípidos

Cambio de la form a celular

Cambio de forma de las células de cilindrica a cuña durante el cierre del tubo neural en aves y mamíferos

Fusión celular

Formación de trofoblasto y miotubos en mamíferos

Muerte celular

Separación de los dedos en la yema de los miembros de vertebrados. Selección de slnapsis funcionales en el sistema nervioso de mamíferos

Ganancia de adherencia célula-célula

Condensación del mesénquima de cartílago en la yema de los miembros de vertebrados

Pérdida de adherencia de célula-célula

Deslaminación de células del epiblasto durante la gastrulación en mamíferos

Interacción célula-matriz

Migración de células de la cresta neural y células germinales. Migración del axón

Pérdida de adherencia célula-matriz

Deslamlnación de las células de la capa basal de la epidermis

Reproducido de Twyman (2001 ), Instant Notes in Developmental Biology. © 2001 BIOS Scientific Publishers.

3.6 | MORFOGÉNESIS ] 83

3.6.1 Cambios en la forma y el tamaño de las células pueden impulsar la morfogénesis La reorganización del citoesqueleto puede originar cambios instrumen tados en la forma de la célula y es posible que esto tenga un efecto ma yor en la estructura de todos los tejidos. Uno de los acontecimientos destacados en el desarrollo de los vertebrados, la formación del tubo neural, es impulsado en parte por cambios en la forma de la célula. Las constricciones apicales originadas por la contracción local de microfilamentos determinan que algunas de las células cilindricas de la placa neural tomen forma de cufia, lo que les permite actuar como bisagras. En combinación con el incremento de la proliferación en los márgenes de la placa neural, ello proporciona la fuerza suficiente para que toda la placa neural se enrolle hacia un tubo (Schoenwolf y Smith, 1990). Una conducta similar dentro de cualquier hoja plana de células tenderá a ocasionar la invaginación de esa hoja.

3.6.2 Los principales cambios morfogenéticos en el embrión son resultado de la afinidad diferencial de las células La adherencia selectiva célula-célula y la de la célula con la matriz se describieron en las secciones 3.2.3 y 3.2.4 como mecanismos que se utilizan para organizar las células en tejidos y conservar los límites del tejido. En el desarrollo, la regulación de la síntesis de moléculas de adherencia celular particulares permite que las células formen y rom pan contactos entre sí, y experimentan una reorganización muy di námica. La gastrulación, que se describe en la sección 3.7.5, es quizás el ejemplo más notable de un proceso morfogenético. La hoja única de epiblasto gira sobre sí misma y se convierte en las tres capas ger minales fundamentales del embrión, un proceso impulsado por una combinación de cambios en la forma de la célula, proliferación celu lar selectiva y diferencias en la afinidad de las células. La alteración de

Recuadro 3-7. Polarización del embrión de mamíferos: señ ales y productos génicos EJE D0RS0VENTRAL El primer signo franco de asimetría en el embrión de mamíferos es la se gregación de la masa celular interna (MCI) a un lado del blastocisto (Lu y col., 2001; Zernicka-Goetz, 2002). Ello define el e/e embrionario-abembrionario y la MCI representa el polo embrionario. La cara embrionaria de la MCI está expuesta al trofoblasto y en contacto con él, en tanto que la cara abembrionarla está abierta hacia el blastocele. Esta diferencia en el ambiente es suficiente para especificar las dos primeras capas precisas de células en la MCI: ectodermo primitivo en el polo embrionario y endodermo primitivo en el polo abembrionario. Esto a su vez define el eje dorsoventral del embrión. Aunque aún no se aclara cómo se posiciona asimétricamente la MCI en el blastocisto en primer lugar, es Interesante señalar que cuando el sitio de entrada del espermatozoo se sigue median te cuentas fluorescentes, siempre se localiza en las células del trofoblas to en el borde embrionario-abembrionario. EJE CRANEOCAUDAL La posición de la entrada del espermatozoo también tiene una función im portante en la definición del eje craneocaudal del embrión de mamíferos, pero aún no se aclara cómo se polariza este eje (Beddington y Robertson, 1999; Lu y cois., 2001). La fecundación induce la segunda división meiótica y por lo general se expulsa el segundo cuerpo polar opuesto al sitio de entrada del espermatozoo. Lo anterior define el eje animal-vegetal del cigoto, con el cuerpo polar en el polo animal. Las divisiones por segmen tación subsecuentes que ocurren en el contexto del eje animal-vegetal producen un blastocisto que muestra simetría bilateral alineada con el eje animal-vegetal inicial del cigoto. El eje de simetría bilateral en el blastoclsto predice la alineación de la estria primitiva, pero no su orientación. La decisión en cuanto al extremo que debe form ar la cabeza y el que form a rá la cola descansa en una región de tejido extraembrionario llamada endodermo visceral anterior (EVA). En ratones, al principio se localiza en la punta del cilindro del huevo. Éste gira hacia el futuro polo craneal del eje craneocaudal justo antes de la gastrulación y el nudo embrionario se es tablece en el extremo opuesto del epiblasto. EJE IZQUIERDA A DERECHA El primer signo evidente de asimetría izquierda-derecha en el embrión de mamíferos es la formación del asa del tubo cardiaco. Sin embargo, m u

cho antes de este hecho se observa asimetría molecular (Capdevila y col., 2000). En el embrión de mamíferos ocurre un paso de determinación im portante durante la gastrulación cuando la rotación de cilios en el nudo embrionario ocasiona un flujo unidireccional del líquido perinodal que se requiere para especificar el eje izquierda-derecha. Aunque aún no se aclara el mecanismo (Tabin y Vogan, 2003), el resultado es la activación de genes que codifican las moléculas de señalamiento Nodal y Lefty-2, de manera específica en el lado izquierdo del embrión. Éstas inician vías de señalamiento que activan factores de transcripción específicos del la do izquierdo (p. ej., Pitx2) e inhiben factores de transcripción específicos dei lado derecho. En el lado derecho del embrión, que carece de Lefty-2 y Nodal, Pitx2 no se activa. Otras proteínas, com o Lefty-1, se expresan en la línea media del embrión y establecen una barrera que Impide el es cape de señales de un lado del embrión al otro. Las mutaciones en los ge nes humanos LEFTA, LEFTB y NODAL se acompañan de una gama de malformaciones del eje que incluyen reversión izquierda-derecha (situs inversus, situs ambiguous) y simetría de imagen en espejo (isomerismo). En ocasiones estas malformaciones afectan la totalidad del cuerpo y a ve ces sólo órganos individuales (heterotaxia). Las mutaciones que afectan subunidades de la proteína motora dineína, necesaria para la rotación uni direccional de cilios, también se acompañan de defectos de lateralidad. Como hecho interesante, con frecuencia éstas ocurren aunadas a infec ciones respiratorias recurrentes e infertilidad, que refleja la falta de motilidad de los cilios en otras partes del cuerpo (recuadro 3-1). Generalidades de la formación temprana del eje en el embrión de ratón desde la fecundación hasta la etapa de estría media (véase pág. sig.). El polo animal del eje animal-vegetal en el embrión de ratón se define co mo el punto en el que el segundo cuerpo polar se expulsa justo después de la fecundación. El eje embrionario-abembrionario en el blastocisto es ortogonal al eje animal-vegetal y se define por la localización de la MCI con el polo embrionario en el lado del blastocisto que contiene la MCI y el polo abembrionario en el lado con la cavidad del blastocele. El eje P-D en la etapa de cilindro del huevo del embrión se forma con el polo proximal localizado en el cono ectoplacentario y el polo distal en el fondo del em brión en forma de copa. Antes de la gastrulación, el eje P-D gira 90° y se convierte en un eje A-R Tomado de Lu y col. (2001) Curr. Opin. Genet. Dev. 11, 384-392. Con autorización de Elsevier.

84

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Recuadro 3-7. (co n tin u a ció n )

Ó vu lo sin fe c u n d a r

A n im al

A nim al

¡ A nim al j

] V eg etal ¡

[V eg etal [

V eg etal :

Segundo c u e rp o p o la r

Segundo c u e rp o p o la r

Posición de la entrada del espermatozoo

Posición de la entrada del espermatozoo

Embrión de dos células

C ig o to

Embrión de tres células

! E m b rio n ario i V eg etal

Cono ectoplacentario Ectodermo extraembrionario'

A nim al

Abembrionario Trofoectodermo polar

MCI Endodermo primitivo

EV extraembrionario Epiblasto proximal — EV EV/A

Cuerpo polar

Trofoectodermo mural 4.5 dpc

Posición de la entrada del espermatozoo Cavidad del blastocelo

EV distal Trofoblasto 5.5 dpc

5.75 dpc

EV extraembrionario

A n terio r ]-| P o s te rio r]

EV desplazado

Mesodermo extraembrionario

Estría ------ primitiva Neuroectodermo anterior Mesodermo anterior

6.0 dpc 6.5 dpc

Nudo . 7.5 dpc

3.7 [ DESARROLLO HUMANO INICIAL: FECUNDACIÓN A GASTRULACIÓN

las propiedades adherentes de las células puede dar lugar a varios pro cesos diferentes (McNeil, 2000; Irvine y Rauskolb, 2001): ► Migración. Movimiento de una célula individual con respecto a otras células del embrión. Algunas células, en especial las de la cresta neural y las germinales, sufren migración extensa du rante el desarrollo y pueblan partes del embrión que están muy distantes de sus sitios originales. ► Ingresión. Movimiento de una célula de la superficie de un embrión hacia su interior.

85

La muerte celular programada (apoptosis) es otro mecanismo morfogenético importante, ya que permite que se introduzcan hen diduras dentro del plan corporal (Vaux y Korsmeyer, 1999). Las hendiduras entre los dedos de las manos y los pies se originan por la muerte de células interdigitales en las placas de la mano y del pie que comienza alrededor de los 45 días de la gestación. En el sistema ner vioso de mamíferos, la apoptosis se utiliza para eliminar las neuro nas con conexiones no productivas, lo que permite que el circuito neuronal se refine progresivamente. De esta manera se descarta has ta 50% de las neuronas y en la retina puede aproximarse a 80%.

► Egresión. Movimiento de una célula del interior de un em brión a la superficie externa. ► Deslaminación. Movimiento de células fuera de una hoja epi telial, con frecuencia para convertir una hoja aislada de células en múltiples capas. Éste es uno de los principales procesos que sustentan la gastrulación en embriones de mamíferos. Las cé lulas también pueden deslaminarse a partir de una membrana basal, como ocurre en el desarrollo de la piel. ► Intercalación. Fusión de células a partir de múltiples capas ce lulares hacia una capa epitelial única. ► Condensación. Conversión de células mesenquimatosas empa cadas de manera laxa en una estructura epitelial. En ocasiones se denomina transición mesenquimatosa a epitelial. ► Dispersión. Conversión de una estructura epitelial en células me senquimatosas laxas. Una transición epitelial a mesenquimatosa. ► Epibolia. Diseminación de una hoja de células. ► Involución. Giro hacia el interior de una hoja de células en ex pansión de tal manera que las células se diseminan sobre la su perficie interior de la hoja y crean una segunda capa.

3.6.3 La proliferación celular y la muerte programada de las células (apoptosis} son mecanismos morfogenéticos importantes Después de un periodo inicial de segmentación en el que todas las -elulas se dividen casi al mismo ritmo, células en distintas partes dd embrión comienzan a dividirse a ritmos diferentes. Esto puede ;mplearse para generar nuevas estructuras. Por ejemplo, la división ;¿u lar rápida en regiones seleccionadas de la placa lateral mesodér—_ca da origen a las yemas de los miembros, en tanto que las regio nes adyacentes, que se dividen más lentamente, no forman estas estructuras. El plano de la división celular también es importante. Por ejemplo, las divisiones perpendiculares al plano de una hoja ;c:telial ocasionarán que la hoja se expanda por la incorporación de cuevas células. Sin embargo, las divisiones en el mismo plano de la generarán capas adicionales. Si las células son asimétricas, co- ; es el caso de las células madre neurales que se comentan en la sección 3.4.3, entonces el plano de la división celular puede influir en .os tipos de células hijas que se producen. Más aún, si el plano as segmentación no es medial, es posible que se generen células de "trentes tamaños. Eso ocurre en la gametogénesis femenina, - jn dn la división meiótica produce un óvulo masivo que contie.i. mayor parte del citoplasma y cuerpos polares vestigiales que esencia son vasijas de desecho del juego de cromosomas haploiI no deseado. Lo anterior contrasta con la gametogénesis mascuen la que la meiosis produce cuatro espermátides equivalentes - iü e figura del recuadro 11-4).

3.7

Desarrollo hum ano inicial: fecundación a gastrulación

3.7.1 La fecundación activa el óvulo y une entre sí los núcleos del espermatozoo y el óvulo para formar un individuo único Fecundación es el proceso por el que dos células sexuales (gam etos) se fusionan entre sí para crear un nuevo individuo con potenciales genéticos derivados de ambos padres, pero diferentes a ellos (Wassarman, 1999). El gameto masculino, la célula espermatozoo, es una célula pequeña con citoplasma muy reducido y un núcleo haploide. El núcleo está condensado de manera intensa y no posee ac tividad transcripcional porque las histonas normales están reemplazadas por una clase especial de proteínas de empaque cono cidas como protaminas. En el extremo posterior se encuentra un fla gelo largo que se ondula para dar impulso y en el extremo ante rior se halla la vesícula acrosómica, que contiene enzimas digesti vas (véase fig. 3-12). El gameto femenino, la célula óvulo (o huevo), es una célula grande que contiene el material necesario para iniciar el crecimien to y el desarrollo (véase fig. 3-12). El citoplasma está en extremo bien dotado de muy grandes cantidades de mitocondrias y ribosomas, y de DNA y polimerasa de RNA. También alberga cantidades enormes de proteínas, RNA, sustancias químicas protectoras y fac tores morfogenéticos. En muchas especies, inclusive aves, reptiles, peces, anfibios e insectos, el huevo contiene una cantidad grande o moderada de vitelo, un conjunto de nutrimentos necesarios para nutrir el embrión en desarrollo antes que pueda alimentarse en for ma independiente. Aunque los embriones de mamíferos tienen un saco vitelino, los óvulos de mamíferos no requieren vitelo porque el embrión se nutre gracias al aporte sanguíneo de la placenta. Fuera de la membrana plasmática se encuentra la envoltura vitelina, que en los mamíferos es una matriz extracelular separada y gruesa conocida como zona pelúcida. También en los mamíferos, el óvulo está rodeado por una capa de células que se conocen como células cúmulo y sirven para nutrir el óvulo antes y justo después de la ovulación. Las células espermatozoo humanas tienen que migrar distancias muy considerables y sólo alrededor de 200 de los cerca de 280 mi llones que se eyaculan en el interior de la vagina llegan a la parte ne cesaria del oviducto donde la fecundación se efectúa. Esta última inicia con la fijación de un espermatozoo a la zona pelúcida seguida de la liberación de enzimas de la vesícula acrosómica, que causan la digestión local de la zona. A continuación la cabeza del espermato zoo se fusiona con la membrana plasmática del oocito y el núcleo del espermatozoo pasa al interior del citoplasma. Dentro del oocito,

86

j

CAPÍTULO TRES | CÉLULAS V DESARROLLO

A) M e m b ra n a p la s m á tic a

G ràn u lo co rtical

V es ícu la a c ro s ó m ic a N ú c le o P ie z a m e d ia 5 |j,m

M ito c o n d ria M e m b ra n a p la s m á tic a

F la g elo

Fig. 3-12. Células sexuales especializadas. A) Óvulo (huevo). El óvulo de mamíferos es una célula grande, de 120 ixm de diámetro, rodeada por una envoltura extracelular, la zona pelúcida, a la que debe unirse primero el espermatozoo, que contiene tres glucoproteínas, ZP-1, ZP-2 y ZP-3, que se polimerizan para form ar un gel. El primer cuerpo polar (no se muestra), el producto de la meiosis I, se sitúa abajo de la zona dentro del espacio perívitelino. En la ovulación los oocitos se encuentran en metafase II. La meiosis II no termina hasta después de la fecundación. Esta última desencadena la secreción de gránulos corticales que inhiben con efectividad el paso de espermatozoos adicionales a través de la zona pelúcida. B) Espermatozoo. Esta célula es mucho más pequeña que el óvulo con una cabeza de 5 (im que contiene DNA muy compactado, un cuerpo cilindrico de 5 (xm, la pieza media, con múltiples mitocondrias, y una cola de 50 |xm. En el frente, el acrosoma contiene enzimas que ayudan al espermatozoo a hacer un orificio en la zona pelúcida, los que le permite acceder al óvulo y fecundarlo. Por lo general el semen contiene 100 millones de espermatozoos por mililitro. Tomado de Alberts y cois. (2002), M olecular Biology o fth e Cell, 4a. ed., p. 1147. Copyright © 2002, Garland Science.

al principio se separan entre sí los juegos haploides de cromosomas del espermatozoo y el óvulo, y constituyen los pronúcleos masculino y femenino respectivamente. Más adelante se fusionan para formar un núcleo diploide. El oocito fecundado se conoce como cigoto.

3,7.2 La segmentación divide ei cigoto en muchas células más pequeñas Segmentación es la etapa del desarrollo en la que el cigoto se divide para formar varias células más pequeñas llamadas blastómeros. La naturaleza de las divisiones de segmentación tempranas varía con amplitud entre las distintas especies animales y en muchos insectos (inclusive Drosophild) el proceso no incluye siquiera división celular (por el contrario, el núcleo del cigoto sufre una serie de divisiones en un citoplasma común para generar una gran célula multinucleada aplanada, el blastodermo sincitial). Con algunas excepciones, el re sultado de la segmentación suele ser una pelota de células, que a me nudo rodea una cavidad llena de líquido llamada blastocele. La pelota de células que resulta de la segmentación se denomina blástula en casi todos los invertebrados, pero la terminología varía en los vertebrados. En anfibios y mamíferos se utiliza el término mórula para describir la pelota inicial, empacada con laxitud, de cé lulas que resultan de la segmentación inicial y más adelante, cuando el blastocele lleno de líquido se forma, la pelota de células se cono ce como blástula en anfibios, pero como blastocisto en mamíferos (véase fig. 3-13). La situación es distinta en aves, peces y reptiles, en los que el huevo contiene mucho vitelo que inhibe la división celu

lar. En este caso la segmentación se restringe a un blastodisco apla nado en la periferia de la célula. En muchas especies (pero no en mamíferos, véase más adelan te), las divisiones por segmentación son rápidas porque no intervie nen las fases de latencia intermedias G1 y G2 del ciclo celular entre la replicación del DNA y la mitosis. En estos casos no hay creci miento neto del embrión y de esa manera conforme el número de células aumenta, el tamaño de las mismas disminuye. Cuando lo anterior sucede, el genoma heredado del cigoto (el genom a cigóticó) es transcripcionalmente inactivo durante la segmentación y en conse cuencia esta última depende mucho de los productos génicos de la herencia materna distribuidos en el citoplasma del óvulo. Los pro ductos génicos maternos regulan el ciclo celular y determinan el ritmo de segmentación, y las divisiones de segmentación son sin crónicas. Con frecuencia este tipo de regulación se denomina re gulación por el gen om a m aterno y los productos génicos maternos suelen conocerse como determ in an tes m aternos. La segmentación de los mamíferos es excepcional en varios aspectos: ► activación temprana del genoma cigótico: en algunas especies tan pronto como en la etapa de dos células. Como resultado, el genoma cigótico, en lugar de los productos génicos heredados de la madre, controla las divisiones de segmentación y éstas son divisiones lentas (porque los ciclos celulares incluyen las fases de latencia G1 y G2) y asincrónicas; ► segmentación rotacional: el primer plano de segmentación es vertical, pero en la segunda ronda de división celular una de

3.7 | DESARROLLO HUMANO INICIAL: FECUNDACIÓN A GASTRULACIÓN

Ó vulo

S e g m e n ta c ió n ro tac io n a l

87

E ta p a d e c u a tro c é lu la s

T ro fo e c to d e rm o MCI U nión e s tre c h a

I

\ B la s to c e le

♦

M ó ru la

\

M ó ru la c o m p a c ta d a B la s to c is to

Fig. 3-13. Desarrollo temprano del embrión de mamífero, desde la fecundación hasta la formación del blastocisto. êcibujado de Twyman (2001) Instant Notes Developmental Biology, publicado por BIOS Scientific Publishers.

las células se segmenta en sentido vertical y la otra en direc ción horizontal (véase fig. 3-13); ► compactación: los blastómeros del embrión de ocho células, vinculados de manera laxa, se aplanan unos contra otros para maximizar su contacto y formar una mórula empacada apreta damente (nota: la compactación no ocurre en muchos embrio nes no mamíferos, inclusive Xenopus, pero en mamíferos es manifiesta). La compactación tiene el efecto de introducir un erado de p o la rid a d celular. Antes de la compactación, los blas tómeros son células redondas con microvellosidades distribui das de modo uniforme y la molécula de adherencia celular caderina E se encuentra siempre que las células están en con tacto entre sí. La situación es muy diferente después de la com pactación: las microvellosidades se restringen a la superficie apicaL en tanto que la caderina E se distribuye sobre las super ficies basolaterales. Ahora las células forman uniones estrechas con sus vecinas y los elementos citoesqueléticos se reorganizan para formar una banda apical (véase cuadro 3-4). Alrededor de la etapa de mórula de 16 células en mamíferos es pom tie diferenciar dos tipos de células: polarizadas externas y apolares jzrimas. Conforme la población de células apolares aumenta, las céUas comienzan a comunicarse entre sí a través de uniones comuniLa distinción entre los dos tipos de células es fundamental y se txplica en la sección siguiente.

1 7 2 Sólo un porcentaje pequeño de las células del embrión temprano de mamíferos origina el organismo maduro muchos modelos animales del desarrollo el organismo está for—.i- o por células que son descendientes de todas las células del em

brión original. Sin embargo, los mamíferos son muy diferentes y sólo una pequeña minoría de las células del embrión inicial da lu gar al organismo propiamente dicho. Ello se debe a que gran parte del desarrollo inicial de los mamíferos se relaciona con el estableci miento de tejidos que actúan como apoyo para la vida pero que en su mayor parte no contribuyen al organismo final, éstos son las membranas extraembrionarias y la placenta (véase recuadro 3-8). Los dos tipos de células que pueden distinguirse alrededor de la etapa de 16 células en mamíferos tienen diferentes destinos. Las cé lulas polarizadas externas comprenden el trofoblasto (o trofectodermo) que evolucionará para formar una de las cuatro membranas extraembrionarias, el corion, que proporciona la porción embrio naria de la placenta. Las células apolares internas comprenden el embrioblasto. A medida que el blastocele se forma (alrededor de la etapa de 32 células en humanos), las células apolares internas se congregan en un extremo del blastocele para formar una masa de células internas (MCI) descentrada. Las células de la MCI origina rán todas las células del organismo aunadas a las otras tres membra nas extraembrionarias (recuadro 3-8).

3.7.4 Implantación Después de algún tiempo (día cinco del desarrollo humano), el blas tocisto m adura: se libera una enzima que perfora un orificio a tra vés de la zona pelúcida y el blastocisto se exprime hacia el exterior. Ahora el blastocisto está libre para interactuar en forma directa con el endometrio uterino. Muy poco después de llegar al útero (día seis del desarrollo humano), el blastocisto se fija estrechamente al epite lio uterino (implantación). Las células del trofoblasto proliferan con rapidez y se diferencian en una capa interna de citotrofoblasto y una capa externa de células multinucleadas, el sincitiotrofoblasto, que comienza a invadir el tejido conjuntivo del útero.

88

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Incluso antes que la implantación ocurra, las células de la MCI co mienzan a diferenciarse en capas externa e interna precisas. La capa ce lular externa es el epiblasto (o ectodermo primitivo). Las células del epiblasto originan el ectodermo, el endodermo y el mesodermo (y en consecuencia todos los tejidos del embrión), así como el amnios, el sa co vitelino y la alantoides. La capa de células internas, el hipoblasto (o endodermo primitivo) origina el m esoderm o extraem brionario que recubre el saco vitelino primario y el blastocele. Al interior de la masa de células internas se forma una cavidad llena de líquido, la cavidad amniótica, encerrada por el amnios. El embrión, que se deriva de una parte de la masa celular interna, con siste ahora en las capas distintas epiblasto e hipoblasto (y se cono ce como disco germinal bilaminar). Se localiza entre dos cavidades llenas de líquido: la cavidad amniótica en un lado y el saco vitelino en el otro (fig. 3-14).

3.7.5 La gastrulación es un proceso dinámico por el que las células del epiblasto originan las tres capas germinales Como Lewis Wolpert lo remarcó “el acontecimiento realmente im portante en la vida no es el nacimiento, el matrimonio o la muerte, sino la gastrulación”. La gastrulación se efectúa durante la tercera se mana del desarrollo humano y es el primer proceso morfogenético importante del desarrollo. Durante la gastrulación se establece la orientación del cuerpo y el embrión se convierte en una estructura de tres capas germinales: ectodermo, endodermo y mesodermo, todas las cuales se derivan d el epiblasto. Las tres capas germinales son las progenitoras de la totalidad de los tejidos del organismo (recuadro 3-5). La principal estructura que caracteriza la gastrulación en mamí feros, aves y reptiles es lineal, la estría primitiva. Aparece alrededor del día 15 del desarrollo humano, como un surco débil a lo largo de la línea media longitudinal del disco germinal bilaminar ahora de forma oval. En el transcurso del día siguiente, el surco prim itivo se profundiza y alarga para ocupar alrededor de la mitad de la lon gitud del embrión. Alrededor del día 16 es evidente una depresión profunda (el fo so p rim itivo) rodeada por un montículo ligero de epiblasto (el nudo p rim itivo) al final del surco, cerca del centro del disco germinal (véase fig. 3-14). El proceso de gastrulación es en extremo dinámico e incluye mo vimientos celulares muy rápidos (Narasimha y Leptin, 2000; Myers y cois., 2002). El día 16 del desarrollo humano comienzan a proliferar y aplanarse las células del epiblasto, cerca de la estría primitiva, y pierden sus interconexiones. Estas células aplanadas desarrollan seudópodos que les permiten migrar a través de la estría primitiva hacia el espacio entre el epiblasto y el hipoblasto (fig. 3-14). Algunas de las células del epiblasto que están ingresando invaden el hipoblasto, des plazan sus células y por último reemplazan por completo el hipoblas to con una nueva capa de células, el endodermo definitivo. A partir del día 16 algunas de las células del epiblasto que migraron a través de la estría primitiva se desvían hacia el espacio entre el epiblasto y el endodermo definitivo naciente para formar una tercera capa, el me sodermo intraembrionario. Una vez que el mesodermo intraembrionario y el endodermo definitivo se forman, el epiblasto residual se describe como ectodermo y la nueva estructura de tres capas se de nomina disco germinal trilaminar (fig. 3-14). Las células mesodérmicas que ingresan migran en diferentes di recciones, algunas hacia afuera y cranealmente, en tanto que otras se depositan en la línea media. Las células que migran a través del foso primitivo y llegan a reposar en la línea media forman dos es tructuras:

► la placa precordial, una masa compacta de mesodermo craneal al foso primitivo. La placa precordial inducirá estructuras cra neales importantes en la línea media, como el cerebro; ► el proceso notocordial, un tubo que brota del foso primitivo y aumenta de longitud conforme las células que proliferan en la región del nudo primitivo se añaden a su extremo proximal y conforme la estría primitiva involuciona. El proceso notocor dial está formado por completo alrededor del día 20 del desa rrollo humano, pero a continuación se transforma de un tubo en un bastón sólido, el notocordio, que después induce la for mación de componentes del sistema nervioso (véase la sección siguiente). Las células mesodérmicas que ingresan y migran hacia las partes la terales se condensan hacia estructuras similares a bastones y hojas en ambos lados del notocordio. Hay tres estructuras principales (véase fig. 3-15): ► El mesodermo paraxil (MP), un par de condensaciones cilin dricas que se sitúan justo adyacentes al notocordio y lo flan quean. El MP se desarrolla primero en una serie de estructuras semejantes a verticilos que se conocen como somitómeros y se forman en una secuencia craneal a caudal durante la tercera y cuarta semanas del desarrollo humano. Los primeros siete son los somitómeros craneales que al final formarán los músculos es triados de la cara, la mandíbula y la garganta, pero los otros so mitómeros se desarrollan adicionalmente en bloques discretos del mesodermo segmentario conocidos como somitas (véase fig. 3-15). Las somitas cervicales, torácicas, lumbares y sacras es tablecerán la organización segmentaria del cuerpo al dar lugar a la mayor parte del esqueleto axil (inclusive la columna verte bral), los músculos voluntarios y parte de la dermis de la piel. ► El mesodermo intermedio (MI), un par de condensaciones ci lindricas menos pronunciadas, justo laterales al mesodermo pa raxil. El MI formará el sistema urinario y partes del sistema genital. ► El mesodermo de la placa lateral (MPL), el resto del mesoder mo lateral que forma una hoja aplanada. El MPL se divide en dos capas a partir del día 17 del desarrollo humano:

3.8

•

el m esoderm o esplacnopleural, la capa adyacente al endo dermo, que origina el recubrimiento mesotelial de los ór ganos viscerales;

•

el m esoderm o som atopleural, la capa adyacente al ectoder mo, que da lugar al recubrimiento interno de la pared del cuerpo, parte de los miembros y la mayor parte de la der mis de la piel.

Desarrollo neural

Como ya se describió, el resultado de la gastrulación es un grupo notable de cambios en el embrión que lo transforman de una es tructura en dos capas en una de tres capas. Ahora el desarrollo del embrión está programado para organizar los tejidos en los precur sores de muchos órganos y sistemas contenidos en el adulto. A con tinuación se describe el desarrollo inicial del sistema nervioso como un ejemplo de organogénesis porque muestra la forma en que los procesos de diferenciación, formación de patrones y morfogénesis se coordinan de manera exquisita.

3.8 | DESARROLLO NEURAL

89

Recuadro 3-8. Membranas extraem brionarias y placenta El desarrollo temprano de los mamíferos se relaciona sobre todo con la formación de tejidos que en general* no contribuyen al organismo final. Hay cuatro membranas extraembrionarias (saco vitelino, amnios, corion y alantoides) y la placenta, que se deriva de una combinación de tejido embrionario (el corion) y tejido materno. Además de proteger el embrión (y después el feto), estos sistemas de apoyo de la vida son necesarios :ara proveer su nutrición, respiración y excreción. 'L a s excepciones son: la parte dorsal del saco vitelino, que se incorpo ra en el embrión como el precursor del intestino primitivo, y la alantoi des, que en el adulto está representada por un cordón fibroso, un residuo del cordón umbilical.) SACO VITELINO. La más primitiva de las cuatro membranas extraembriolarias, el saco vitelino, se encuentra en todos los amniotas y asimismo en tiburones, peces vertebrados y algunos anfibios. En embriones de aves, el saco vitelino rodea una masa vitelina nutritiva (la parte amarilla del huevo, que consiste principalmente en fosfolípidos). En muchos ma míferos (inclusive humanos y ratones) el saco vitelino no contiene ningún vitelo. El saco vitelino suele ser importante porque: ► las células germinales primordiales, que se originan del epiblasto, migran al saco vitelino antes que invadan el reborde gónadal; ► es la fuente de las primeras células sanguíneas del conceptus y de casi todos los primeros vasos sanguíneos (algunos de los cuales se extienden por sí mismos dentro del embrión en desarrollo). El saco vitelino se origina de la placa lateral esplácnica (visceral) mesodermo y endodermo. AMNIOS. El amnios no sólo se encuentra en amniotas (mamíferos, aves, reptiles) sino también en forma primitiva en algunos peces vertebrados y ciertos anfibios. Es la más interna de las membranas extraembrionarias y oermanece unida al embrión rodeándolo inmediatamente. Contiene liqui do amniótico que baña el embrión y en consecuencia evita que este últi mo se seque durante el desarrollo: lo ayuda a que flote (lo que reduce los efectos de la gravedad en el cuerpo) y actúa como un cojín hidráulico pa■a protegerlo de sacudidas mecánicas, etc. El amnios se deriva del ectodermo y el mesodermo somático de la placa lateral. CORION. Como el amnios, el corion se encuentra en amniotas y también en forma primitiva en algunos peces vertebrados y anfibios. Asimism o se

3.8.1 El sistema nervioso se desarrolla después que el mesodermo subyacente induce al ectodermo a diferenciarse El desarrollo del sistema nervioso marca el principio de la organogé nesis y comienza al final de la tercera semana del desarrollo humano. El acontecimiento inicial es la inducción del ectodermo suprayacenrc por el mesodermo axil (Wilson y Edlund, 2001). Al interior de es te ultimo, células de la placa precordial y de la porción craneal de la r aca notocordial transmiten señales a las células suprayacentes del ectodermo y ocasionan su diferenciación en una placa gruesa de cé_las neuroepiteliales (neuroectodermo). La placa neural resultante ¡carece el día 18 del desarrollo humano pero crece con rapidez y cambia de proporciones durante los siguientes dos días (fig. 3-16). Al inicio de la cuarta semana, un proceso que se conoce como neurulación conduce a la conversión de la placa neural en el tubo oeural, el precursor del cerebro y la médula espinal. La placa neu ral comienza a plegarse en sentido ventral a lo largo de su línea me

deriva del ectodermo y el mesodermo somático de la placa lateral. En em briones de aves, como los pollos, el corion está presionado contra la membrana de recubrimiento pero en embriones de mamíferos está com puesto por células trofoblásticas, que producen las enzimas que erosio nan el recubrimiento del útero y ayudan al embrión a implantarse en la pared uterina. El corion también es una fuente de hormonas (gonadotropina coriónica) que Influyen tanto en el útero como en otros sistemas. En todos estos casos el corion sirve como una superficie para el intercam bio respiratorio. El corion proporciona el componente fetal de la placenta en mamíferos placentados (véase más adelante). ALANTOIDES. La más reciente en términos evolutivos de las membranas extraembrionarias, la alantoides, sólo se encuentra en amniotas (cuyo nombre quizá deba cambiarse por alantoisotas). Actúa como un sistema de depósito de desechos (orina) en aves, reptiles y de hecho en la mayor parte de los amniotas, pero no en mamíferos placentados. La alantoides se deriva de un abultamiento hacia el exterior del piso del intestino caudal y en consecuencia se compone de endodermo y mesodermo esplácnlco de la placa lateral. Aunque es notable en algunos mamíferos, en otros (in clusive los humanos) es un vestiglo (no tiene ninguna función) excepto que sus vasos sanguíneos dan origen al cordón umbilical. PLACENTA. La placenta es una característica que sólo presentan los ma míferos placentados y se deriva en parte del conceptus y en parte de la pared uterina. Se desarrolla después de la implantación, cuando el em brión induce una respuesta en el endometrio materno vecino y lo cambia para que se constituya en un tejido muy vascular que contiene nutrimen tos llamado decidua. Durante la segunda y la tercera semanas del desa rrollo, el tejido del trofoblasto se torna vacuolado, las vacuolas unen los capilares maternos cercanos y se llena rápidamente con sangre. Confor me el corion se forma, se proyectan evaginaciones al interior de las va cuolas, conocidas como vellosidades coriónícas, que ponen en íntimo contacto los aportes sanguíneos materno y embrionario. Al final de las tres semanas el corion está diferenciado a plenitud y contiene un sistema vascular conectado al embrión. El intercambio de nutrimentos y produc tos de desecho ocurre sobre las vellosidades coriónicas. Al inicio el em brión está rodeado del todo por la decidua, pero a medida que crece y se expande hacia el útero, el tejido decidual suprayacente (decidua capsular) se adelgaza y luego se desintegra. La placenta madura se deriva por com pleto de la decidua basal subyacente.

dia para formar una depresión llamada surco neural. Se piensa que éste se desarrolla en respuesta a señales inductoras del notocordio apuesto en la cercanía. Los pliegues neurales gruesos giran alrede dor del surco neural y se encuentran dorsalmente, al principio en un punto medio a lo largo del eje craneocaudal (fig. 3-16A). El cie rre del tubo neural prosigue en forma semejante a una cremallera y en ambas direcciones. Los sitios en que el cierre es incompleto muestran un neuroporo anterior y un neuroporo posterior. En oca siones parte del tubo neural no se cierra y esto ocasiona trastornos como la espina bífida. Durante la neurulación, una población específica de células que surge a lo largo de los márgenes laterales de los pliegues neurales se desprende de la placa neural y migra a muchos sitios específicos dentro del cuerpo. Este grupo de células muy versátiles, denomina do cresta neural, origina parte del sistema nervioso periférico, los melanocitos, parte de hueso y músculo, la retina y otras estructuras (García-Castro y Bonner-Fraser, 1999; Knecht y Bonner-Fraser, 2 0 02 ; recuadro 3-5).

GASTRULACIÓN DEL RATÓN

GASTRULACIÓN HUMANA

C ono ectoplacen tario Ectoderm o extraem brionario Endoderm o visceral Endoderm o parietal S aco vitelino

M e m b ra n a am niotica C avidad am niotica Epiblasto (em brión) H ipoblasto S aco vitelino

Epiblasto (curvado)

Pared uterina Trofoblasto

M esod erm o Estría prim itiva

N udo prim itivo

B)

Am nios

Epiblasto Endoderm o

H ipoblasto

\ x Epiblasto S aco vitelino

N otocordio

C)

M ovim iento de células a través del surco prim itivo. Invaginación para form ar m esoderm o y en doderm o

D isco germ inal bilam inar

Estría prim itiva

Epiblasto Hipoblasto

14 a 15 días

Endoderm o

16 días

M esod erm o

E ndoderm o definitivo

Fig. 3-14. La gastrulación en humanos y otros primates incluye la reorganización de un disco germinal bilaminar plano para formar un embrión tri laminar mediante la deslaminación programada de células del epiblasto. (A a C) Aunque el resultado final de la gastrulación es similar en todos los mamíferos, puede haber diferencias mayores en los detalles de la morfogénesis, en particular en el modo en que se forman y utilizan las estructuras extraembrionarias. A la derecha se muestra la gastrulación en el ratón para comparación. En esta especie el disco germinal plano es reemplazado por un huevo cilindrico en forma de copa y las células “ salen” de la estria primitiva hacia la superficie del embrión y no al interior del mismo. El futuro eje anteroposterior se envuelve alrededor de la base de la copa. D) Después de 14 a 15 días del desarrollo huma no, las células mesodérmicas que están ingresando invaden el hipoblasto y desplazan sus células, lo que conduce a la formación del endodermo embrionario. El día 16 alguna de las células del epiblasto que está ingresando se desvían hacia el espacio entre el epiblasto y el endodermo naciente para formar el meso dermo embrionario. Obsérvese que si bien el epiblasto da lugar a las tres capas germinales (ectodermo, endodermo y mesodermo), el hipoblasto origina el endodermo extraembrionario que recubre el saco vitelino. Embriones humanos redibujados de Larsen (2002) Human Embryology 3a. ed, con autorización de Elsevier. Embriones de ratón redibujados de Twyman (2001), Instant Notes Developmental Biology. Publicado por BIOS Scientific Publishers.

3.8

DESARROLLO NEURAL

91

A) S u rc o p r im it iv o N udo p r im it iv o

E p ib la s t o E n d o d e rm o

B)

M e s o d e rm o p a r a x il M e s o d e rm o in te r m e d io M esod erm o de la p laca lateral P ro c e s o n o to c o r d ia i

S o m ita

D)

M e s o d e r m o in te r m e d io

S o m itó m e r o s 1 a 7

S o m ita s N o to c o r d io

M e s o d e r m o in te r m e d io

E m in e n c ia — caudal

Fig. 3-15. Vías de migración y destinos de las células mesodérmicas que ingresan durante la gastrulación. A) Migración temprana del mesodermo. Las células del epiblasto que ingresan a través del nudo primitivo migran cranealmente para formar la placa precordial, una masa compacta de mesodermo justo craneal al nudo primitivo, y el proceso notocordiai un tubo denso en la línea media que después formará un bastón sólido, el notocordio. Las células del epiblasto que ingresan a través del surco primitivo migran para form ar el mesodermo lateral que flanquea la línea media. B) Diferenciación temprana del mesodermo lateral. El mesodermo que flanquea inmediatamente el proceso notocordiai forma condensaciones cilindricas, el mesodermo paraxil. Las condensaciones cilindricas vecinas, menos pronunciadas, son el mesodermo intermedio. El res to del mesodermo lateral form a una hoja aplanada, el m esodermo de la placa lateral. C) Diferenciación del mesodermo de la placa lateral (MPL). Se forman vacuolas en el MPL y se dividen en dos capas, una ventral, el mesodermo esplacnopieural. que da lugar al recubrimiento mesotelial de los órga nos viscerales, y el mesodermo somatopleural dorsal, que origina el recubrimiento interno de las paredes del cuerpo y la mayor parte de la dermis. D) Formación de somitómeros. El mesodermo paraxil forma una serie de estructuras redondas semejantes a verticilos, los somitómeros. Con excep ción de los somitómeros 1 a 7 (véase texto), los somitómeros darán lugar a las somitas, bloques de mesodermo segmentario que establecen la organi zación segmentaria del cuerpo. En este diagrama de un embrión humano de 21 días ya se diferenciaron en somitas seis somitómeros centrales. Adaptado de Larsen (2002) con autorización de Churchill Livingstone Publishers.

92

CAPÍTULO TRES ! CÉLULAS Y DESARROLLO

> o ca * 8 = I 1 =

^ ~ r -fe «

^

'3 r o

1 ®-

■= ca “O cp co

§3l 5ü C=J) C O CO 03 b^3 03 ^ w

s J3 CTJ

^ -c: -a ___.

v 3

(/) c

— — «3 co 05

2=3 03 = u0:

^ c a) I Cl

T3 0

03 CO ca o to

^

CT3 03 03

c

co

o

:2 o 03 co o

. Q ■o rír=33 Ífa -o _ 0 033 - o 03 ca ^ w 03 c tí ro > _ 03 co o CO 03 -a 03 o ir 1 s ™ 2 . æ s- o = -

A) M orfogénesis

Surco neural

Pliegues neurales

ü — 2 Z3 n 2

O

CL

S « 1

ñ 03 03 ca «o co .c — 03 0co3 F += 03 *=• r 1 co

O~ — (O CON

O

!

i

cn

W

I I

3

8 3

CL d û .

o

03

ÍH

CO

ca "o c l ca a 2 — £ — ë

co 03

-=

O)

03

SZ

id q

I I I 03 co 42

c 'O « a Q)

03

03 co

>,

o .Q E o

■o c

'2 o (0 E

ca .o —o ca ca S i2 ro C O Q. g ca JS o co § ja -o cD o o ca a - o c ■—

■2 03 i

O

i

5

03 O C

■° Y , S- o E

Cj> ,g

ffl

ça

c

E

o

.2 —I I — Q.t/3 03 DI □

3.8

DESARROLLO NEURAL

93

Recuadro 3-‘>. Determinación del sexo: genes y ambiente en el desarrollo Como los mamíferos, los humanos son sexualmente dimorfos, es decir hay sexos masculino y femenino separados. La decisión entre desarrollo masculino y femenino ocurre en la concepción, durante la que el esper matozoo lleva un cromosoma X o uno Y al óvulo, que siempre contiene un cromosoma X (Schafer y Goodfellow, 1996). Las únicas excepciones a esta regla general se observan cuando errores en la meiosis producen gametos con menos o más cromosomas del sexo, cuyo resultado son in dividuos con aneuploidias de cromosoma del sexo (sección 2.5.2). Aun que el sexo del embrión humano se establece en la concepción, la diferenciación sexual comienza hasta que el embrión tiene alrededor de cinco semanas de edad. Las formas de diferenciación sexual son dos; una incluye las características sexuales primarias (el desarrollo de la gónada y la elección entre el desarrollo de espermatozoo y óvulo) y otra comprende las características sexuales secundarias (las estructuras específicas del sexo del sistema urogenital y los genitales externos). Las características sexuales primarias dependen del genotipo del embrión, en tanto que las características sexuales secundarias, de señales del am biente, mediadas por señalamiento hormonal.

I

El desarrollo masculino depende de la presencia o ausencia del crom oso ma Y, que contiene un gen determinante masculino critico llamado SRY (región determinante del sexo del cromosoma Y). El SRY codifica un fac tor de transcripción que activa genes corriente abajo necesarios para el desarrollo de los testículos. A continuación estos últimos producen hor monas sexuales que se requieren para el desarrollo de las características sexuales secundarias masculinas. Durante mucho tiempo se pensó que el desarrollo de la gónada femenina era un “estado de descuido” y que el gen SRY era suficiente para cambiar la gónada embrionaria indiferente de la diferenciación femenina a la masculina. Este hecho se apoyó en varias líneas de pruebas: los raros varones XX suelen tener un fragmento peque ño del cromosoma Y, inclusive SRY, translocado hacia la punta de uno de sus cromosomas X y los ratones genéticamente hembras transgénicos del gen Sry del ratón se desarrollan como machos. Sin embargo, estudios más recientes sugieren que los genes en el cromosoma X y los autosomas participan en la regulación positiva del desarrollo del ovario. La ex presión excesiva de estos genes, que comprenden DAX y WNT4A, puede feminizar individuos XY aun si poseen un gen SRY funcional. Al parecer el desarrollo temprano del gameto está controlado más por el ambiente que por el genotipo de las células germinales. Las células ger minales primordiales (CGP) femeninas introducidas en los testículos co

3.8.2 La formación del patrón en el tubo neural incluye la expresión coordinada de genes a lo largo de dos ejes Tan pronto se forma la placa neural, se tornan visibles tres vesículas craneales grandes (el futuro cerebro) y una sección caudal más estre cha que formará la médula espinal. Esta polaridad craneocaudal re fleja la especificidad regional de la inducción neural, es decir, que las señales que provienen del mesodermo axil contiene información posidonal que conduce a que el ectodermo suprayacente forme tejido neural específico para diferentes partes del eje. La naturaleza precisa de la señal en amniotas no se comprende (Stern, 2002). En Xenopus hay un modelo bien establecido en el que miembros de la familia de la proteína morfogenética ósea (PMO) de proteínas de señalamien to previenen el desarrollo neural y antagonistas de la proteína mor fogenética ósea (PMO) inician la inducción neural. Sin embargo, al parecer el mecanismo en aves y mamíferos es mucho más complejo

menzarán a diferenciarse en espermatozoos y las CGP masculinas que se introducen en el ovario comenzarán a diferenciarse en oocitos. Esto pue de indicar la regulación del ciclo celular, ya que las CGP que entran en el testículo se detienen antes de la meiosis en tanto que las que ingresan al ovario comienzan la meiosis de inmediato. Por tanto las CGP de cualquie ra de los sexos que invaden tejido somático fuera de la gónada empiezan a diferenciarse en oocitos porque no hay una señal para detener el ciclo celular. Sin embargo, no se producen gametos funcionales en todas estas situaciones poco frecuentes. La diferenciación aborta en una etapa hasta cierto punto tardia, tal vez porque el genotipo de las células germinales en sí mismas también tiene una función crítica en el desarrollo del gameto. A diferencia de lo que ocurre con las características sexuales primarias, al parecer las caracteristicas sexuales secundarias femeninas son el es tado de falta de cumplimiento. Uno de los genes regulados por SRY es NR5A1, que codifica otro factor de transcripción llamado factor 1 esteroidógeno (SF1). Éste activa genes necesarios para la producción de hormonas sexuales masculinas, Inclusive HSD17B3 (que codifica la deshidrogenasa 3 de hidroxiesteroides beta-17, necesaria para la síntesis de testosterona) y AMH (el gen que codifica la hormona antimulleriana). Ambas hormonas tienen acciones importantes en la diferenciación del sistema urogenital masculino. Por ejemplo, AMH origina la desaparición de los conductos mullerianos (que se constituyen en las trompas de Falopio y el útero en mujeres). Las mutaciones que inhiben la producción, distribu ción, eliminación o percepción de estas hormonas producen individuos XY feminizados. Por ejemplo, el síndrome de insensibilidad al andrógeno es resultado de defectos en el receptor de testosterona que impiden que el cuerpo responda a la hormona aun si se produce a concentraciones normales. El aspecto exterior de los individuos XY con esta enfermedad es de mujeres normales, pero debido a los efectos de SRY y AMH poseen testículos no descendidos en lugar de ovarios y carecen de útero y trom pas de Falopio. Las mutaciones que conducen a la producción excesiva de hormonas sexuales masculinas en mujeres tienen el efecto opuesto, es decir, la virilización de individuos XX. En ocasiones esto ocurre en ge melos fraternos masculino/femenino en desarrollo cuando el gemelo hembra se expone a las hormonas masculinas de su hermano. La enzima CYP19 convierte los andrógenos en estrógenos de tal manera que las mutaciones que incrementan su actividad pueden producir feminización de varones, en tanto que las que la disminuyen o suprimen suelen condu cir a virilización en mujeres.

y constituye un área de investigación activa. Parece probable que una señal general neurulizante se libere del mesodermo que induce la formación de la placa neural que es de carácter anterior. Esto de be “posteriorizarse” por otra señal que se origina en la región caudal del embrión. Se requieren moléculas adicionales, secretadas de mo do específico por el mesodermo anterior, para formar la cabeza. Cualquiera que sea el mecanismo subyacente, las señales activan diferentes grupos de factores de transcripción a lo largo del eje y és tos confieren identidades de posición a las células y regulan su con ducta. En el cerebro anterior y el cerebro medio se expresan factores de transcripción de las familias Emx y Otx. Las identidades de po sición están controladas por los genes H oxen el cerebro caudal y la médula espinal. Al parecer en el cerebro caudal los valores posicionales de las células se fijan en la etapa de la placa neural y las célu las de la cresta neural que migran con esta información posicional imponen identidades de posición en los tejidos circundantes. Por el contrario, la identidad posicional en la médula espinal está impues

94

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

ta por señales del mesodermo paraxil circundante. Esto puede de mostrarse mediante el trasplante de células a diferentes partes del eje. Las células de la cresta neural craneal se comportan según su li naje cuando se mueven a una nueva posición, es decir, hacen las mismas cosas que harían en su posición original. Las células de la cresta del tronco se comportan de acuerdo con su nueva posición -hacen las mismas cosas que sus vecinas. El sistema nervioso central en desarrollo es un buen modelo de formación y diferenciación del patrón, ya que a lo largo del eje dorsoventral surgen varios tipos de células (diferentes clases de neuro nas y glía). Una jerarquía de reguladores genéticos controla este proceso (Lumsden y Krumlauf, 1996; Tanabe y Jessel, 1996;EisIen 1999; fig. 3-16B, C). La polaridad dorsoventral es generada por grupos oponentes de señales que se originan en el notocordio y el ectodermo adyacente. El notocordio secreta la molécula de señalamiento Sonic hedgehog, que tiene actividad ventralizante, en tanto que el ectodermo secre ta varios miembros de la superfamilia del factor transformador del crecimiento ¡3 (TGF), inclusive BMP4, BMP7 y una proteína de nominada dorsalina. Conforme la placa neural comienza a doblar se, estas mismas señales empiezan a expresarse en las regiones extremas ventral y dorsal del tubo neural en sí mismo -la placa del piso y la placa del techo respectivamente—. Las señales oponentes tienen efectos contrarios en la activación de varios factores de trans cripción de clase homeodominio. Como se muestra en la figura 316B, esto divide el tubo neural en zonas dorsoventrales discretas, o dominios de factor de transcripción, que después se convierten en los centros regionales de diferentes clases de neuronas. Por ejemplo, la zona definida por la expresión de Nkx6.1 sólo se convierte en la región poblada por neuronas motoras, que residen en el tercio ven tral del tubo neural.

3.8.3 La diferenciación neurona! incluye ta actividad com binatoria de facto res de transcripción Las neuronas no surgen de manera uniforme en el ectodermo neural sino que se restringen a regiones específicas delimitadas por la expre sión de genes proneurales, como neurogenina, MASH1 y MATH1 (fig. 3-16C), que codifican factores de transcripción de la familia bHLH. La expresión génica proneural confiere a las células capacidad para formar neuroblastos, pero no todas las células proneurales pue den adoptar este destino. Por el contrario, hay competencia entre las células que incluyen la expresión de genes neurógenos como Notch y Delta. Las células que tienen éxito forman neuroblastos e inhiben las células circundantes para que realicen lo mismo. En consecuencia los neuroblastos surgen en un patrón de espaciamiento preciso. Este pa trón que forma procesos se denomina inhibición lateral. A continua ción las neuronas comienzan a diferenciarse según su posición con respecto a los ejes dorsoventral y craneocaudal del sistema nervioso, que se define por la combinación de los factores de transcripción que se comentaron en la sección previa (Panchision y McKay, 2002). Refinamientos en los patrones de expresión de estos factores de transcripción controlan la diversificación adicional. Por ejemplo, al principio todas las neuronas motoras expresan dos factores de trans cripción de la familia homeodominio LIM: Islet-1 e Islet-2. Luego só lo las neuronas motoras que proyectan sus axones a los músculos de la extremidad ventral expresan estos factores de transcripción LIM y no otros. Las neuronas que expresan Isl-1, Isl-2 y un tercer factor de transcripción, Lim-3, proyectan sus axones hacia los músculos axiles

de la pared del cuerpo. Las neuronas que expresan Isl-2 y Lim-1 pro yectan sus axones a los músculos de la extremidad dorsal, en tanto que las que expresan Isl-1 sólo proyectan sus axones a ganglios linfáticos (fig. 3-16C). Los factores de transcripción determinan las combina ciones particulares de receptores que se expresan en los conos de cre cimiento del axón y por tanto determinan también la respuesta de los axones en crecimiento a diferentes indicios físicos y químicos (quimioatrayentes, etc.) (Tessier-Lavigne y Goodmans, 1996). Una vez que los primeros axones llegan a sus blancos, los axones adicionales pueden encontrar su camino al crecer a lo largo de las vías de axón existentes -un proceso que se denomina fasciculación—,

3.9 Conservación de las vías dei desarrollo

3.9.1 M uchas enferm edades hum anas % deben a falla de procesos del desarrollo norm ales Las enfermedades humanas más espectaculares incluyen anormalida des morfológicas notables que se deben a alteraciones de los procesos generales de diferenciación, formación de patrón y morfogénesis. Un ejemplo es la holoprosencefalia, una falla del proceso normal de de sarrollo del cerebro anterior que en su forma más grave da lugar a individuos con un solo ojo (ciclopía) y sin nariz. Como en otras en fermedades humanas, el fenotipo puede influirse tanto por factores genéticos como ambientales. En algunos casos es claro que este de fecto lo causaron mutaciones específicas, por ejemplo, mutaciones en el gen SHHque codifican la proteína de señalamiento Sonic hed gehog. Por otra parte la anormalidad puede seguirse hasta una cau sa ambiental, como el consumo limitado de colesterol en la dieta materna. La determ inación del sexo, que se describe en el recuadro 39, ilustra con claridad las funciones relativas de los genes y el am biente en un proceso de desarrollo. Aunque ciertas anormalidades del desarrollo pueden seguirse hasta el uso de fármacos (las sustancias químicas que se sabe tienen efectos teratógenos incluyen alcohol, ciertos antibióticos, talidomida, ácido retinoico y drogas ilegales como cocaína y heroína), mu chas resultan de mutaciones en genes específicos. Como se indicó al inicio de este capítulo, algunos de los genes del desarrollo más importantes son de naturaleza reguladora y codifican factores de transcripción o componentes de vías de señalamiento. Los genes que codifican componentes estructurales de la célula o de la matriz extracelular, e inclusive enzimas metabólicas, también tienen una función destacada en el desarrollo y revelan fenotipos de enferme dades importantes. El cuadro 3-8 presenta algunos ejemplos.

3.9J2 Los procesas del desarrollo están muy bien conservados tanto a nivel de genes únicos co n » a nivel de vías com pletas En los casos en que se demuestra que los genes causan enfermeda des del desarrollo, a menudo se observa un grado notable de con servación evolutiva entre animales. Esta conservación no sólo se aplica a los genes sino también a las vías completas en las que par ticipan (Pires-daSilva y Sommer, 2003; fig. 3-17). Con frecuencia se utilizan vías moleculares conservadas para procesos similares en especies relacionadas de manera muy distan te. Por ejemplo, como se comentó antes brevemente, la inducción

3.9 ^ CONSERVACIÓN’ DE LAS VIAS DEL DESARROLLO

95

Cuadro 3-8 Selección de genes del desarrollo humano relacionados con fenotipos de enfermedad específicos. Se consideran varias cla ses mayores de productos génicos: proteínas de señalamiento, receptores, factores de transcripción, proteínas estructurales y enzimas Gen

Producto y función normal

Trastorno relacionado

Proteínas de señalamiento secretadas SHH

Sonic hedgehog Proteína de señalamiento a cargo de la form a ción del patrón de tubo neural, somltas, intesti no y yemas de los miembros

Holoprosencefalia, un trastorno en el que el cerebro anterior en desarrollo no se separa en hemisferios izquierdo y derecho. En casos graves, hay un ventrículo cerebral único y ciclopía. En casos muy leves, la enfermedad puede manifestar se por un incisivo central único

EDN3

Endotelína 3, hormona péptída que regula la va soconstricción, necesaria durante el desarrollo para la diferenciación de derivados de la cresta neural

Enfermedad de Hirschsprung, un trastorno de la diferenciación de la cresta neu ral en el que no se forman ganglios entéricos; causa megacolon (estreñimiento y obstrucción intestinal crónicos) que se debe a la ausencia de movimientos pe ristálticos

GH1

Hormona del crecimiento 1, hormona polipéptida que se expresa en la glándula hipófisis y tie ne a su cargo la regulación del crecimiento

Enanismo hipofisario, una form a de enanismo que puede tratarse con la admi nistración de hormona del crecimiento purificada o recombinante durante la ni ñez

LEFTB

Lefty 2, proteína de señalamiento relacionada con el nudo que se expresa de manera especifica en el lado izquierdo del embrión temprano y ayuda a establecer la asimetría izquierda-derecha

Defectos de lateralidad — situs inversus, isomerlsmo o heterotaxia— , ocasiona dos por falta de especificación del eje izquierda-derecha

FGFR3

Receptor para factores de crecimiento de fibro blastos, que se expresa con fuerza particular en cartílago y sistema nervioso. Desempeña una función mayor en el desarrollo óseo

Acondroplasla, la forma más frecuente de enanismo de miembros cortos Síndrome de Crouzon y craneosinostosis, anormalidades craneofaciales graves

EDNRB

Receptor de endotelína B, se encuentra en célu las de la cresta neural y se requiere para su dife renciación en melanocltos y ganglios entéricos

Enfermedad de Hirschsprung (véase EDN3, antes)

KIT

KIT es un receptor de cinasa de tirosina, llama da así porque originalmente se encontró como oncogén en un virus de sarcoma felino. El re ceptor se expresa en form a amplia pero tiene acciones particularmente Importantes en el de sarrollo del linaje de células sanguíneas, melanocitos y células germinales

Piebaldismo, caracterizado por placas congénitas de piel y pelo blancos por fal ta de proliferación de melanocitos

GHR

Receptor de hormona del crecimiento, transduce señales para la hormona del crecimiento (véase antes)

Enanismo de Laron, una forma de enanismo en la que los valores séricos de hor mona del crecimiento son normales y que no responde al tratamiento con hor mona del crecimiento. También se conoce como síndrome de insensibilidad a hormona del crecimiento

Receptores

Factores de transcripción H0XD13

Factor de transcripción que participa en la for mación del patrón. Confiere información posicional a lo largo del eje craneocaudal y en el desarrollo de los miembros

Polisindactllia (dedos extrafusionados) causada por la especificación errónea de tipos celulares y la consiguiente formación de estructuras óseas anormales en las regiones distales de los miembros

PAX6

Factor de transcripción con múltiples acciones en el desarrollo del ojo

Defectos oculares que varían de pupilas con ectopia leve (pupilas fuera del cen tro) a aniridia (ausencia parcial o total del iris, en combinación con malformacio nes del cristalino y la cámara anterior, y degeneración corneal)

TBX5

Factor de transcripción que se expresa de modo es pecífico en la región del miembro delantero del em brión en desarrollo, tiene una función importante en el establecimiento de la Identidad del miembro (de sarrollo del brazo comparado con el de la pierna)

Síndrome de Holt-Oram, un trastorno de los miembros superiores que también afecta el desarrollo del corazón

SRY

Factor de transcripción expresado en el reborde gonadal de embriones masculinos y necesario para iniciar la diferenciación sexual masculina. Se encuentra en el cromosoma Y

Reversión del sexo masculino (aspecto externo femenino en individuos XY) que suele acompañarse de disgenesia gonadal completa

96 1 CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Cuadro 3-8. continuación Gen

Producto y función norm al

Trastorno relacio nado

Proteínas estructurales C0L6A1

Subunidad alfa de la colágena VI, principal com ponente de microflbrillas en la matriz extracelular que proporciona rigidez estructural a los tejidos

Míopatía de Bethlem, que incluye la contracción de articulaciones (en particular los codos y los tobillos), a causa de ausencia de microfibrlllas de colágena VI. La expresión excesiva puede contribuir a defectos cardiacos en el síndrome de Down

ELN

Elastina, una proteína de la matriz extracelular que permite que los tejidos recuperen su forma original después de deformarse

Cutis laxa, piel suelta y holgada que resulta de una deformación permanente; puede deberse a elastina anormal y disfuncional Estenosis aórtica, ocasionada por deformación de la aorta

LAMA3

Subunidad alfa 3 de laminina 5, un componente de la membrana basai de la piel que desempeña una función Importante en la diferenciación de queratinocitos

Epidermólisis ampollar de la unión grave, un trastorno vesicante de la piel en el que se desprenden células basales de la membrana basai

USH2A

Proteina de matriz extracelular necesaria para el desarrollo del ojo y el oído interno

Síndrome de Usher tipo II, caracterizado por sordera grave desde el nacimiento e inicio de retinitis pigmentosa en los últimos años de la adolescencia

WRN

Una helicasa que tal vez se relaciona con la re paración de roturas del DNA de doble cadena

Síndrome de Werner, una enfermedad de envejecimiento prematuro

CYP11B1

Hidroxilasa de esteroides 11 -beta, necesaria pa ra la síntesis de aldosterona (una hormona que actúa en los riñones y regula el equilibrio mine ral y del agua)

Hiperplasia suprarrenal congènita, que incluye crecimiento rápido en la niñez pe ro terminación prematura del alargamiento óseo cuyo resultado es estatura cor ta de adulto

HSD17B3

Deshidrogenasa de hidroxíesteroides beta-17, necesaria para la síntesis de testosterona

Seudohermafroditismo masculino, en el que los niños nacen con aspecto feme nino externo no ambiguo, pero se virilizan durante la pubertad

EXT1

Glucosiltransferasa necesaria para la síntesis de un sulfato de heparán, un constituyente impor tante de la matriz extracelular

Exostosis múltiple hereditaria, un trastorno en el que se forman tumoraciones cartilaginosas cerca de los extremos de los huesos, en particular en los miem bros, pero a veces también en las costillas y los hombros

Enzimas

neural en embriones de Xenopus incluye una batalla entre los efec tos opuestos de BMP4, que favorece destinos ventral y lateral, y factores de dorsalización (neurulizantes) como Chordin, Noggin y Follistatin. Los ortólogos de Drosophila de BMP4 y Chordin son proteínas llamadas decapentapléjicas (Dpp) y de gastrulación corta (Sog) respectivamente. Resulta notable que estas proteínas tengan funciones equivalentes en la formación del sistema nervioso de Drosophila. De hecho la relación va más allá. La actividad de Dpp en Drosophila se incrementa con la proteína Tolloid (Tol) que de grada Sog. En Xenopus la función de Tol la realiza su ortólogo Xolloid (Xol) y en el pez cebra la molécula equivalente es BMP1. Tanto Xolloid como BMP1 degradan Chordin. Hay asimismo un pareamiento de phylum cruzado de Xenopus BMP7 y la proteína Drosophila Screw, proteínas accesorias necesarias para la actividad de BMP4/Dpp. En otros casos la misma vía del desarrollo se emplea para pro pósitos muy diferentes en distintas especies. En mamíferos el factor de crecimiento epidérmico (EGF) se utiliza para promover la pro liferación de células epidérmicas. Este factor de crecimiento se en laza con el receptor de EGF, un receptor de cinasa de tirosina, e inicia la cascada de cinasa Ras-Raf-MAP (sección 3.2.1). Drosophi la usa la misma vía para promover la diferenciación de uno de los ocho tipos de células fotorreceptoras durante el desarrollo del ojo.

Los nematodos emplean la misma vía para estimular la división y la diferenciación de células vulvares. El mejor ejemplo de conservación evolutiva incluye los genes que contienen homeobox, que al parecer se encuentran en todos los animales y desempeñan funciones muy similares. La capacidad de genes ortólogos de muy diferentes especies para sustituirse entre sí demuestra la función fundamental de estos genes en la formación del patrón. Por ejemplo, se introdujeron genes humanos HOX y OTXen líneas de Drosophila en las que se mutaron genes ortólogos y ello condujo a un rescate completo del fenotipo mutante. Sin embargo, también se observan diferencias importantes en tre especies, aun entre las que están relacionadas muy de cerca. Con base en la similitud extensa entre humanos y ratones, tal vez sor prenda que el proceso de gastrulación deba ser tan distinto (fig. 3-14). De hecho se observa una gran diferencia entre los embrio nes vertebrados antes de la gastrulación, que refleja diferentes estra tegias para la adquisición de nutrimentos. Los mecanismos que determinan el sexo también son muy diversos (Morrish y Sinclair, 2002). No todos los mamíferos emplean el modelo humano de de terminación del sexo XY (Graves, 2002) y muchos reptiles prescin den por completo del uso de cromosomas del sexo heteromorfos y confían en la temperatura del ambiente para especificar el sexo del embrión.

BIBLIOGRAFÍA ! 97

»

V e r te b r a d o s

D ro s o p h ila

In h ib id o r

X o llo ¡d /B M P 1

T o llo id

E lim in a d o r

C h o rd in

SOG

A c tiv a d o r

BMP7

S c re w

L ig a n d o

BMP4

DPP

H um anos

D ro s o p h ila

C a e n o r h a b d itis

L ig a n d o

EGF

BOSS

L IN -3

R e c e p to r

EGFR

S e v e n le s s

L E T -2 3

- A d a p t a d o r S H 2 /S H 3

GRB2

D rk

S E M -5

— P r o te ín a G

R as

R asi

L E T -6 0

G A P /G N R P

G a p 1 /S O S

G a p -1

A ctivador de G T P -as a e intercam blador d e nucleótido

Fig. 3-17. Conservación evolutiva de las vías del desarrollo. A) Vía BMP4/Chordin que sustenta la inducción neural en Drosophila y vertebrados. B) Vía de señalamiento del factor de crecimiento, que tiene diversas acciones en vertebrados, moscas y gusanos.

Lecturas adicionales Arias AM, Stewart A (2002) Molecular Principles of Animal Development. Oxford University Press, Oxford. Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P (2002) Molecular Biology of the Cell, 4th Edn. Garland Science, New York.

Gilbert SF (2003) Developmental Biology, 7th Edn. Sinauer Associates, Sunderland. Twyman RM (2001) Instant Notes in Developmental Biology. BIOS Scientific Publishers, Oxford. Wolpert L (2002) Principles of Development, 2nd Edn. Oxford University Press, Oxford.

Bibliografía Balnter JJ, Boos A, Kroll KL (2001) Neural induction takes a tran scriptional twist. Dev. Dynamics 222, 315-327. Beddington RSP, Robertson EJ (1999) Axis development and early asymmetry in mammals. Cell 96, 195-209. Bjornson CRR, Rietz RL, Reynolds BA ef at. (1999) Turning brain into blood: a hematopoietic fate adopted by adult neural stem cells in vivo. Science 283, 354-357. Bokel C, Brown NH (2002) Integrins in development: Moving on, responding to, and sticking to the extracellular matriz. Dev. Cell 3. 311-321. Bourme HR (1997) How receptors talk to trimetric G proteins. Curr. Opin. Cell Biol. 9, 134-142. Burke AC (2000) Hox genes and the global patterning of the somitic mesoderm. Curr. Top. Dev. Biol. 47, 155-181. Campisl J (1996) Replicative senescence: an old live’s tale? Cell 84, 497-500.

Capdevila J, Vogan KJ, Tabin CJ, Belmonte JCI (2000) Mechanisms of left-right determination in vertebrates. Cell 101, 9-21. Clapham DE (1995) Calcium signaling. Cell 80, 259-268. Clarke DL, Johansson CB, Wilbertz J ef at. (2000) Generalized potential of adult neutral stem cells. Science 288, 1660-1663. Cunningham BA (1995) Cell adhesion molecules as morphoregulators. Curr. Opin. Cell Biol. 7, 628-633. Daley GQ (2002) Prospects for stem cell therapeutics: myths and medicines. Curr. Opin. Genet. Dev. 12, 607-613. Davis AP, Witte DP, Hsieh-Li HM ef al. (1995) Absence of radius and ulna in mice lacking Hoxa-11 and Hoxd-11. Nature 375 791-795. Donovan PJ, Gearhart J (2001) The end of the beginning for pluripotent stem cells. Nature 414, 92-97.

98

CAPÍTULO TRES

CÉLULAS Y DESARROLLO

Dustin ML (2002) Shmoos, rafts, and uropods - The many facets of cell polarity. Cell 100, 13-18. Eislen JS (1999) Patterning motoneurons in the vertebrate nervous system. Trends Neurosci. 22, 321-326. Evens MJ, Kaufman MH (1981) Establishment in culture of pluripotential cells from mouse embryos. Nature 292, 154-156. Garcia-Castro M, Bonner-Fraser M (1999) Induction and differ entiation of the neuyral crest. Curr. Opin. Cell Biol. 11, 695-698. Giancotti FG, Ruoslahti E (1999) Transduction - Integrin sig nalling. Science 285, 1028-1032. Graves JAM (2002) The rise and fall of SRY. Trends Genet. 18, 259264. Gumbiner BM (1996) Cell Adhesion: the molecular basis of tissue architecture and morphogenesis. Cell 84, 345-357. Harland R (2000) Neural induction. Curr. Opin. Genet. Dev. 10, 357-362. Hogan BLM (1999) Morphogenesis. Cell 96, 225-233. Hou SX, Zheng XY Chen X ef a/. (2002) The JAK/STAT pathway in model organisms: Emerging roles in cell movement. Dev. Cell 3, 765-778. Houslay MD, Milligan G (1997) Tailoring cAMP-signalling respons es through isoform multiplicity. Trends Biochem. Sci. 22, 217224. Humphries MJ, Newham P (1998) The structure of cell-adhesion molecules. Trends Cell. Biol. 8, 78-83. Hynes RO (2002) Integrins: Bidirectional, allosteric signaling machines. Cell 110, 673-687. Irvine KD, Rauskolb C (2001) Boundaries in development: forma tion and function. Annu. Rev. Cell Dev. Biol.. 17, 189-214. Kim H, Schagat T (1996) Neuroblasts: a model for the asymetric division of cells. Trends Genet. 13, 33-39. Knecht AK, Bonner-Fraser M (2002) Induction of the neural crest: A multigene process. Nature Rev. Genet. 3, 453-461. Krumlauf R (1994) Hox genes in vertebrate development. Cell 78, 191-201. Kuo CJ, Conley PB, Chen L ef a/. (1992) A transcriptional hierar chy involved in mammalian cell type spediflcation Nature 355, 457-461. Larsen W (2002) Human Embryology, 3rd Edn. Churchill Livingstone, New York. Lawrence PA, Morata G (1994) Homeobox genes: their function In Drosophila segmentation and pattern formation. Cell 7 8 ,181189. Le Mouellic H, Lallemand Y, Brulet P (1992) Homeosis In the mouse induced by a null mutation in the Hox 3.1 gene. Cell 69, 251-264. Lu CC, Brennan J, Robertson EJ (2001) From fertilization to gastrulation: axis formation In the mouse embryo. Curr. Opin. Genet. Dev. 11, 384-392. Lubarsky B, Krasnow MA (2003) Tube morphogenesis: Marking and shaping biological tubes. Cell 112, 19-28. Lumsden A, Krumlauf R (1996) Patterning the vertebrate neuraxis. Science 274, 1109-1115. Manouvrier-Hanu S, Holder-Espinasse M, Lyonnet S (1999) Genetics of limb anomalies in humans. Trend Genet. 15, 409417. Martin GR (1981) Isolation of a plurlpotent cell line from early mouse embryos cultured In medium conditioned by teratocarcinoma stem cells. Proc. Natl Acad. Sci. USA 78, 7634-7638. Mathis L, Nicolas J-F (2002) Cellular patterning of the vertebrate embryo. Trends Genet. 18, 627-635. McNeil H (2000) Sticking together and sorting things out: adhesion as a force in development. Nature Rev. Genet. 1, 100-108. Medvinsky A, Smith A (2003) Stem cells: Fusion brings down bar riers. Nature 422, 823-825. Morata G (1993) Homeotic genes of Drosophila. Curr. Opin. Genet. Dev. 3. 606-613.

Morrish BC, Sinclair AH (2002) Vertebrate sex determination: many means to an end. Reproduction 124, 447-457. Morrison SJ, Uchida N, Weissman IL (1995) The biology of hematopoietic stem cells. Ann. Rev. Cell Biol. 11, 35-71. Myers DC, Sepich DS, Solnica-Krezel L (2022) Convergence and extension in vertebrate gastrulae: cell movements accord ing to or in search of identity? Trends Genet. 18, 447-455. Narasimha M, Leptin M (2000) Cell movements during gastrulation: come in and be Induced. Trends Cell Biol. 10, 169-172, Ng JK, Tamura K, Buscher D ef al. (1999) Molecular and cellular basis of pattern formation during vertebrate limb development. Curr. Top. Dev. Biol. 41 , 37-66. Niswander L (2003) Pattern formation: Old models out on a limb. Nature Rev. Genet. 4, 133-143. Orlic D, Kajstura J, Chimenti S, Jakoniuk I et al. (2001) Bone marrow cells regenerate infarcted myocardium. Nature 410, 701-705. Panchision DM, McKay RDG (2002) The control of neural stem cells by morphogenetic signals. Curr. Opin. Genet. Dev. 12, 478487. Peifer M, McEwen DG (2002) The ballet of morphogenesis: Unveiling the hidden choreographers. Cell 109, 271-274. Pellegrini S, Dusanter-Fourt I (1997) The structure, regulation and function of the Janus kinases (JAKs) and the signal trans ducers and activators of transcription (STATs). Eur. J. Biochem. 248, 615-633. Perez-Moreno M, Jamora C, Buchs E (2003) Sticky business: Orchestrating cellular signals at adherens junctions. Cell 112, 535-548. Petersen BE, Bowen WC, Patrene KD ef al. (1999) Bone mar row as a potential source of hepatic oval cells. Science 284, 1168-1170. Pires-daSilva A, Sommer RJ (2003) The evolution of signalling pathways in animal development. Nature Rev. Genet. 4, 39-49. Robinson MJ, Cobb MH (1977) Mitogen activated kinase path ways. Curr. Opin. Cell Biol. 9, 180-186. Saucedo LJ, Edgar BA (2002) Why size matters: altering cell size. Curr. Opin. Benet. Dev. 12, 565-571, Schafer AJ, Goodfellow PN (1996) Sex determination in humans. Bioessays 18, 955-963. Schoenwolf GC, Smith JL (1990) Mechanisms of neurulation: traditional viewpoint and recent advances. Development 109, 243-270. Schwabe JWR, Rodriguez-Esteban C, Belmonte JCI (1998) Limbs are moving: Where are they going? Trends Genet. 14, 229-235. Selleck SB (2000) Proteoglycans and pattern formation: sugar biochemistry metes development genetics. Trends Genet. 16, 206-212. Shamblott MJ, Axelman J, Wang SP, Bugg EM et al. (1998) Derivation of pluripotent stem cells from cultured human pri mordial germ cells. Proc. Natl Acad. Sci. USA 95, 13726-13731. Shih CC, Mamelak A, LeBon T, Forman SJ (2002) Hematopoietic potential of neural stem cells. Nature Med. 8, 535-536. Speigel S, Foster D, Kolesnick R (1996) Signal transduction through lipid second messengers. Curr. Opin. Cell Biol. 8, 159167. Stacey G, Doyle A (2000) Cell Banks: A service to animal cell tech nology. En: Encyclopedia of Animal Cell Technology (ed. Spier R). Wiley, New York, pp. 293-320. Steinberg MS, McNutt PM (1999) Cadherins and their connec tions: adhesion junctions have broader functions. Curr. Opin. Cell Biol. 11, 554-560. Stem CD (2002) Induction and initial patterning of the nervous sys tem - the chick embryo enters the scene, Curr. Opin. Genet. Dev. 12, 447-451.

CAPÍTULO

CUATRO

Genes en genealogías y poblaciones Contenido del capítulo

102

CAPÍTULO CUATRO

GENES EN GENEALOGÍAS Y POBLACIONES

4.1 Herencia monogènica comparada con muitifactorial Los caracteres genéticos más simples son aquellos cuya presencia o ausencia dependen del genotipo en un locus aislado. Esto no signi fica que el carácter en sí mismo sea programado sólo por un par de genes: es probable que la expresión de cualquier carácter humano re quiera un gran número de genes y factores ambientales. Sin embar go, en ocasiones es tanto necesario como suficiente un genotipo particular en un locus para que el carácter se exprese, si se conside ra el fondo genético y ambiental humano normal. Estos caracteres se denominan mendelianos. Los caracteres mendelianos pueden re conocerse por los patrones genealógicos característicos que propor cionan (sección 4.2). En el hombre se conocen más de 6 000 caracteres mendelianos. Como se describe en “Antes de comenzar: uso inteligente de la Internet”, el punto de inicio esencial para ad quirir información de cualquiera de estos caracteres, sea patológico o no, es la base de datos OMIM (www.ncbi.nlm.nih.gov/Omim/). Casi todos los caracteres humanos están regidos por genes en más de un locus. Cuanto más alejado esté un carácter de la acción gènica primaria, menos probable es que muestre un patrón de ge nealogía mendeliana simple. Las variantes de secuencias del DNA casi siempre son puramente mendelianas -lo que constituye su principal atracción como marcadores genéticos (sección 13.2)-. Aunque las variantes de proteínas (movilidad electroforética o acti vidad de la enzima) suelen ser mendelianas, pueden depender de más de un locus por la modificación postraduccional (sección 1.5.3). Es probable que la falla o el mal funcionamiento de una vía del desarrollo que origina un defecto de nacimiento incluya un equilibrio complejo de factores. Por tanto, los defectos comunes del nacimiento (paladar hendido, espina bifida, cardiopatia congènita, etc.) rara vez son mendelianos. Aunque es menos probable aún que los caracteres conductuales, como el desempeño en la prueba de IQ (CI) o la esquizofrenia sean mendelianos, pueden estar determina dos genéticamente en mayor o menor grado. Los caracteres no mendelianos dependen de dos, tres o muchos locus genéticos, con contribuciones mayores o menores de factores ambientales. En este capítulo se utiliza muitifactorial como un tér mino incluyente que abarca todas estas posibilidades. De manera más específica, la determinación genética puede comprender un nú mero pequeño de locus (oligogénica) o muchos de ellos, cada uno con un efecto individual pequeño (poligénico); o es posible que ha ya un locus mayor único con un fondo poligénico. Para los caracte res dicótomos (caracteres que pueden tenerse o no, como dedos extra) los locus subyacentes se asumen como genes de susceptibili dad en tanto que para los caracteres cuantitativos o continuos (estatura, peso, etc.) se ven como locus de carácter cuantitativo

d

Varón

0

M u je r

0

1 S e x o d e s c o n o c id o

□

O

(LCC). Cualquiera de estos caracteres puede tender a presentarse en familias, pero los patrones genealógicos no son mendelianos y no ad miten un análisis simple.

4.2

Patrones de genealogía mendelianos

4.2.1 Dominancia y recesividad son propiedad de caracteres, no de genes Un carácter es dominante si se manifiesta en heterocigotos y re cesivo si no se presenta. Cabe señalar que dominancia y recesividad son propiedades de caracteres, no de genes. Por consiguiente la ane mia de células falciformes es recesiva porque sólo los homocigotos manifiestan HbS, pero el carácter falciforme, que es el fenotipo de los heterocigotos de HbS, es dominante. Casi todos los síndromes dominantes en humanos se conocen sólo en heterocigotos. A veces se describen homocigotos que nacen de matrimonios de dos perso nas heterocigotas afectadas y a menudo los homocigotos se afectan mucho más. Los ejemplos son la acondroplasia (enanismo con miembros cortos, MIM 100800) y el síndrome de Waardenburg ti po 1 (sordera con anormalidades pigmentarias, MIM 193500). No obstante, por lo general estos dos trastornos se describen como do minantes porque estos términos indican fenotipos que se observan en heterocigotos. En organismos experimentales, en los que la incertidumbre no cabe, los genetistas tienden a utilizar el término se midominante cuando el heterocigoto tiene un fenotipo intermedio y reservan “dominante” para los padecimientos en que no es posible distinguir entre homocigoto y heterocigoto -p. ej., la enfermedad de Huntington (deterioro neurològico progresivo de inicio en el adulto, MIM 143100)-. Wilkie (1994) revisó bien el problema de la dominancia. Los varones son hemicigotos para lo cus en los cromosomas X y Y, donde sólo tienen una copia de cada gen, de manera que no presentan el problema de dominancia o re cesividad para caracteres ligados a X o a Y.

4.2.2 Los cinco patrones básicos de genealogía m endeliana La figura 4-1 muestra los símbolos que se utilizan para dibujar ge nealogías y el recuadro 4-1 resume los principales factores de cada patrón. Los caracteres mendelianos pueden ser determinados por locus en un autosoma o en los cromosomas del sexo X y Y. Los caracteres autosómicos en ambos sexos y los caracteres ligados a X en mujeres pueden ser dominantes o recesivos. Nadie tiene dos cro mosomas Y genéticamente distintos (en los raros varones XYY, los dos cromosomas Y son duplicados). Por tanto existen cinco patro-

In d e m n e

M a trim o n io c o n s a n g u ín e o (o p cio n al)

A fe c ta d o 0

(D

P o rta d o r (op cio n al)

G e m e lo s

JZÍ 0

M u e rte

Fig. 4-1. Principales símbolos utilizados en genealogías. Las generaciones suelen indicarse en números romanos y los individuos dentro de cada generación en números arábigos; III-7 o ili7 es la séptima per sona de la izquierda (a menos que se numere en forma explícita de otra manera) en la generación II!. Puede emplearse una /* para indicar los hijos de pacientes o propósitos (mujer: proposita) a través de los que se descubrió la familia.

4.2

A)

PATRONES DE GENEALOGÍA MENDELIANOS | 103

O

C br¿ ¿ t O 1

2

3

III D ¿ 1

Sh E 5

6

é r O ÓrO ¿ tO

4

o

d o

5

6

□ □

2

B)

4

3

&

4

8

7

9

£ o

¿

b

11

12

10

1

|

¿ h rO

2

3

III 4 t O 1

13

- 3 4

5

5

6

|

6

7

8

á ó ■ é>

IV

iv ¿ T

(l H - Q

| 4

2

3

4

5

6

-o

D)

2

á III

•4 55

3

é. ¿ 1

ír O

2

3

56

6 á

4

5

i

6

i7-

Ó

7

~D

E ^ ¿10

8

9

IV 1

2

3

4

5

6

7

8

9

10

11

12

"i □ 13 14

Fig. 4-2. Patrones de genealogía mendeliana básicos. A) Autosómico dominante; B) autosómíco recesivo; C) recesivo ligado a X; D) dominante ligado a X; E) ligado a Y. El riesgo para los individuos que se ¡ndican con una interrogación son: A) 1 en 2; B) 1 en 4; C) 1 en 2 varones o 1 en 4 de toda la descendencia; D) insignificantemente bajo para varones, 100% para mujeres. Véase la sección 4.3 y la figura 4-5 para las complicaciones de estos patrones básicos.

nes de genealogía mendeliana arquetípicos (fig. 4-2). Como se des cribe más adelante, se aplican consideraciones especiales a padeci mientos ligados a X y ligados a Y, de modo que en la práctica los natrones de genealogía mendeliana importantes son autosómico dominante, autosómico recesivo y ligado a X (dominante o recesi vo). Estos patrones básicos están sujetos a varias complicaciones que se comentan en la sección 4.3 (más adelante) y se ilustran en la figura 4-5.

La inactivación de X (iionización) confunde la distinción entre padecimientos ligados a X dominantes y recesivos Los portadores de afecciones ligadas a X “recesivas” suelen manifes tar algunos signos del padecimiento, en tanto que comparados con los varones afectados, los heterocigotos para afecciones ligadas a X “dominantes” suelen afectarse en menor grado y de manera variable. Esto es una consecuencia de la inactivación de X. Como se describe

104

CAPÍTULO CUATRO

GENES EN GENEALOGÍAS Y POBLACIONES

R ecuadro 4-1. C aracterísticas de los patrones de herencia m endelianos Herencia autosómica dominante (fig. 4-2A): una persona afectada suele tener cuando menos un padre afectado (para excepciones véase fig. 4-4); afecta cualquier sexo; la transmite cualquier sexo; un niño de un apareamiento afectado x no afectado tiene 50% de posibi lidad de afectarse (ello supone que la persona afectada es heterocigota, lo que suele ser cierto en padecimientos raros). Herencia autosómica recesiva (fig. 4-2B): las personas afectadas suelen nacer de padres no afectados; los padres de personas afectadas suelen ser portadores asintomáticos; la incidencia de consanguinidad parental es mayor; afecta cualquier sexo; después del nacimiento de un niño afectado, cada niño subsecuente tie ne 25% de posibilidad de afectarse (si se asume que ambos padres son portadores fenotipicamente normales).

las mujeres pueden afectarse si el padre lo está y la madre es un porta dor o en ocasiones como resultado de inactivación de X no aleatoria (sec ción 4.2.2); no se transmite de varón a varón en la genealogía (pero los matrimonios de un varón afectado y una mujer portadora pueden dar el aspecto de transmisión de varón a varón, véase fig. 4-5G). Herencia dominante ligada a X (fig. 4-2D): afecta cualquier sexo, pero más a las mujeres; por lo general las mujeres se afectan de manera más leve y variable que los varones; el niño de una mujer afectada, con independencia de su sexo, tiene una posibilidad de 50% de afectarse; todas las hijas de un varón afectado están afectadas, pero ninguno de los hijos. Herencia ligada a Y (fig. 4-2E): sólo afecta a varones;

Herencia recesiva ligada a X (fig. 4-2C):

los varones afectados siempre tienen un padre afectado (a menos que haya una mutación nueva);

afecta sobre todo a varones;

todos los hijos de un varón afectado están afectados.

los varones afectados suelen nacer de padres no afectados; por lo gene ral la madre es un portador asintomático y puede tener familiares varones afectados;

en la sección 10 .5 .6 , los mamíferos compensan números desiguales de cromosomas X en varones y mujeres mediante la inactivación permanente de todos los cromosomas X, excepto uno en cada célu la somática. Los varones XY conservan su X única activa, en tanto que las mujeres XX inactivan una X (que se elige de modo aleato rio) en cada célula. La inactivación ocurre temprano en la vida em brionaria y una vez que una célula elige la X que activa, esa elección se transmite en forma clonal a todas sus células hijas. Un heterocigoto femenino para un padecimiento ligado a X (dominante o recesivo) es un mosaico (véase sección 4.3.6). Cada célula expresa el alelo normal o el anormal, pero no ambos. Cuan do el fenotipo depende de un producto circulante, como la hemo filia (falta de coagulación de la sangre, MIM 306700, 306900), hay un efecto promediado entre las células normales y anormales. Las mujeres portadoras tienen un fenotipo intermedio y no suelen ma nifestar afección clínica pero son anormales desde el punto de vis ta bioquímico. Cuando el fenotipo es una propiedad localizada de células individuales, como en la displasia ectodérmica hipohidrótica (falta de glándulas sudoríparas, dientes y pelo anormales; MIM 305100), las mujeres portadoras muestran placas de tejido normal y anormal. En ocasiones se observan heterocigotos con manifes taciones de padecimientos recesivos ligados a X. Estas mujeres pue den afectarse de modo muy grave porque, por mala suerte, casi todas las células de algunos tejidos críticos inactivaron la X normal.

El cromosoma Y porta hasta cierto punto pocos genes Además de la masculinidad en sí misma, la genealogía estereotípi ca ligada a X de la figura 4-2E no confiere ningún carácter huma no conocido (las afirmaciones de “varón puerco espín” y “oídos pilosos” son dudosas, véase MIM 146600 y 425500 respectivamen

te). Puesto que las mujeres normales carecen de todos los genes li gados a Y, cualquiera de dichos genes debe codificar los caracteres no esenciales o las funciones específicas masculinas. Algunos genes existen como copias funcionales, tanto en Y como en X; quizá re sulten una excepción a este argumento, pero no proporcionarían un patrón de genealogía ligado a Y clásico. Las deleciones intersti ciales de Yq son una causa importante de infertilidad masculina pe ro, desde luego, los varones infértiles no producirán genealogías como la de la figura 4-2E. Jobling y Tyler-Smith (2000) y Skaletsky y cois. (2003) resumieron el contenido génico del cromosoma Y y su posible participación en enfermedades.

Genes localizados en la región de pareamiento Xp-Yp muestran herencia seudoautosómica Como se menciona en la sección 2.3.3, las 2.6 Mb distales de Xp e Yp son homologas y están sujetas a cruzamiento en la meiosis. Por consiguiente los pocos genes en estas regiones se segregan en un pa trón “seudoautosómico” y no alguno ligado al sexo.

4.2.3 Rara vez es posible definir sin ambigüedad la modalidad de herencia en una genealogía aislada Con base en el tamaño limitado de las familias humanas, rara vez es posible estar del todo seguro de la forma de herencia de un ca rácter mediante la simple inspección de una genealogía aislada. En animales de experimentación podría establecerse una prueba cruza da y revisarse para una relación 1:2 o 1:4. En genealogías humanas la proporción de niños afectados no es un indicador muy seguro. Ello se debe sobre todo a que los números son muy pequeños pe ro, además, la forma en que se descubre a la familia puede predis

4.2

poner la relación de niños afectados con los que no lo están. En pa decimientos recesivos a menudo la proporción de niños afectados parece mayor de 1 en 4. Esto se debe a que las familias suelen des cubrirse cuando tienen un niño afectado; las familias en que ambos padres son portadores pero, por fortuna, ninguno está afectado se pasan por alto de manera sistemática. Estos sesgos de indagación y las formas de corregirlos se comentan en la sección 15.2.1. La modalidad de herencia establecida para muchos de los pade cimientos más raros no es más que una suposición informada. La asignación de las modalidades de herencia tiene importancia por que constituye la base de las estimaciones del riesgo que se utilizan en asesoría genética. Sin embargo, es esencial reconocer que con frecuencia las formas de herencia son hipótesis de trabajo más que hechos establecidos. La OMIM utiliza un asterisco para indicar las entradas con modalidades de herencia hasta cierto punto bien esta blecidas. La herencia sólo puede definirse con certeza cuando se dispone de una copia clonada del gen.

4.2.4 Un gen-una enzima no implica un gen-un síndrome Los patrones de genealogía proporcionan el punto de entrada esen cial a la genética humana, pero sólo son un punto de inicio para de rruir genes. Sería un error muy serio imaginar que los cerca de 6 000 caracteres mendelianos definen 6 000 secuencias de codifi cación de DNA. Constituiría una extensión injustificada de la hi pótesis un gen-tina enzima de Beadle y Tatum. Desde el decenio ce 1940 esta hipótesis permitió un adelanto importante en la comprensión de la forma en que los genes determinan fenotipos. A par i r de entonces se extendió: algunos genes codifican RNA no Traducidos, ciertas proteínas no son enzimas y muchas proteínas contienen varias cadenas polipéptidas que se codifican por separa do. Pero, incluso con estas extensiones, no es posible utilizar la hir-ótesis de Beadle y Tatum para implicar una correspondencia uno i uno entre entradas en el catálogo de OMIM y unidades de trans cripción de DNA. Los genes de la genética clásica son entidades abstractas. Nin gún carácter determinado en una localización cromosómica única ^ segregará en un patrón mendeliano -pero es posible que el de terminante no sea un gen en el sentido de la palabra molecular de ios genetistas-. Aunque la distrofia muscular fascio-escápulo-hu—eral (debilidad intensa pero no mortal de ciertos grupos muscu.¿res; MIM 158900) se debe a deleciones pequeñas de secuencias

i

PATRONES DE GENEALOGÍA MENDELIANOS

è

► heterogeneidad de locus, cuando el mismo fenotipo clínico pue de resultar de mutaciones en cualquiera de varios locus distintos; ► heterogeneidad alélica, cuando pueden observarse muchas mutaciones diferentes dentro de un gen determinado en distin tos pacientes con cierto padecimiento genético (se analiza en forma más completa en el cap. 16). Muchas enfermedades muestran heterogeneidad tanto de locus como alélica; ► heterogeneidad clínica, que se utiliza aquí para describir la si tuación en que las mutaciones en el mismo gen producen dos o más enfermedades diferentes. La sección 16.6 proporciona ejemplos.

La heterogeneidad de locus es común en síndromes que se deben a la falla de una vía compleja La pérdida de la audición brinda buenos ejemplos de heterogenei dad de locus. Cuando dos personas con pérdida de la audición con gènita profunda, autosómica recesiva, contraen matrimonio, como suele suceder, por lo general los niños tienen una audición normal (fig. 4-3). Es fácil observar que se necesitarían muchos genes distin tos para construir una máquina tan exquisita como las células piliformes cocleares y un defecto en cualquiera de estos genes podría ocasionar sordera. Los niños tienen una audición normal siempre que los padres llevan mutaciones en diferentes genes. Éste es un ejemplo de complementación (recuadro 4-2). Esta heterogeneidad de locus sólo cabe esperarla en padecimientos como sordera, cegue ra o retraso mental, en los que fracasó una vía bastante general; pe ro incluso con patologías más específicas, múltiples locus son muy frecuentes. Un ejemplo notable es el síndrome de Usher, una com-

O

AaB B

è

AABb

Ó

É -r-é aa B B

III A aB b

A aB b

Ó

AABb

É

ó

AAbb

Ó A aB b

105

4q35, hasta el momento de escribir este libro nadie ha intentado encontrar una secuencia de codificación de proteínas importante en esa localización a pesar de la investigación y la secuenciación in tensivas. El “gen” de la enfermedad de Charcot-Marie-Tooth tipo 1A (neuropatía motora y sensorial; MIM 118220) resultó ser una duplicación tándem de 1.5 Mb sobre el cromosoma 17pl 1.2 (sec ción 16.5.2). Estos ejemplos son muy poco frecuentes; la mayor parte de las entradas de OMIM probablemente describen las con secuencias de mutaciones que afectan una unidad de transcripción aislada. Sin embargo, aún no se establece una correspondencia uno a uno entre fenotipos y unidades de transcripción a causa de tres ti pos de heterogeneidad:

O AaB B

i

A aB b

Ó A aB b

A aB b

- ; 4-3. Complementación: los padres con pérdida profunda de la audición autosómica recesiva suelen tener niños con audición normal. « , ll7 son descendientes de padres no afectados pero consanguíneos y cada uno tiene hermanos afectados, lo que determina que sea probable que cada . X tenga pérdida de la audición autosómica recesiva. Todos sus niños no están afectados, lo que demuestra que ll6 y ll7 tienen mutaciones no alélicas.

106

CAPÍTULO CUATRO ¡ GENES EN GENEALOGÍAS Y POBLACIONES

binación autosómica recesiva de pérdida de la audición y ceguera progresiva (retinitis pigmentosa) que puede deberse a mutaciones en 10 locus o más no relacionados (Hereditary H earing Loss Home page, www.uia.ac.be/dnalab/hhh/). La OMIM separó entradas pa ra ejemplos conocidos de heterogeneidad de locus (definidos por análisis de enlace o mutación), pero deben existir muchos ejemplos no detectados que aún se incluyen dentro de entradas únicas.

Las series aiélicas son una causa de heterogeneidad clínica En ocasiones varios fenotipos humanos en apariencia distintos tienen como causa diferentes mutaciones aiélicas en el mismo locus. La di ferencia puede ser de grado: mutaciones que inactivan en forma par cial el gen de distrofina producen la distrofia muscular de Becker, en tanto que mutaciones que inactivan por completo dicho gen causan la distrofia muscular de Duchenne, similar pero más grave (desgaste muscular mortal: MIM 310200). Otras veces la diferencia es cualita tiva: la inactivación del gen del receptor de andrógeno ocasiona in sensibilidad al andrógeno (los embriones 46,XY se desarrollan como mujeres; MIM 313700), pero la expansión de un tramo de codones de glutamina dentro del mismo gen causa una enfermedad muy di ferente, la atrofia muscular espinobulbar o enfermedad de Kennedy (MIM 313200). Tanto estas correlaciones entre genotipo y fenotipo como otras más se comentan con mayor amplitud en el capítulo 16.

4.2.5 La herencia mitocondrial origina un patrón de genealogía matrilineal identificable Además de las mutaciones en genes que se portan en los cromoso mas nucleares, las mutaciones mitocondriales son una causa impor tante de enfermedad genética humana (véase la base de datos MITOMAP para detalles; www-mitomap.org). El genoma mito condrial (sección 9.1.2) es pequeño pero muy mutable en compa ración con el DNA nuclear, tal vez porque la replicación del DNA mitocondrial es más propensa a errores y el número de replicaciones es mucho mayor. Las enfermedades codificadas de manera mitocon drial tienen dos características poco usuales: herencia matrilineal y heteroplasmia frecuente. La herencia es matrilineal porque el espermatozoo no contribu ye con mitocondrias al cigoto (la afirmación se apoya en pruebas li mitadas; sin embargo, en niños casi nunca se detectan variantes mitocondriales derivadas del padre). Por tanto un padecimiento heredado en forma mitocondrial puede afectar ambos sexos, pero sólo las madres afectadas lo transmiten (fig. 4-4), lo que origina un patrón de genealogía identificable. Las células contienen muchos genomas mitocondriales. En al gunos pacientes con una enfermedad mitocondrial cada genoma mitocondrial lleva la mutación causal (homoplasmia), pero en otros

casos se observa una población mixta de genomas normales y mutantes (heteroplasmia) dentro de cada célula. A diferencia del mosaicismo genético nuclear, que debe surgir después de la etapa de cigoto (sección 4.3.6), la heteroplasmia mitocondrial puede trans mitirse de la madre heteroplásmica al niño heteroplásmico. En es tos casos la proporción de genomas mitocondriales anormales puede variar de modo notable entre la madre y el niño, lo que su giere que un número en extremo pequeño de moléculas de DNA maternas origina todo el DNA mitocondrial del niño (véase sec ción 11.4.2). La patología molecular complicada de las enfermeda des mitocondriales se estudia en la sección 16.6.6.

4

C om plicaciones de ios patrones de genealogía m endeiianos básicos

En la vida real varias complicaciones suelen ocultar un patrón mendeliano básico. La figura 4-5 muestra diversas complicaciones fre cuentes.

4.3.1 Padecimientos recesivos comunes pueden originar un patrón de genealogía seudodominante Si un carácter es común en la población, es muy posible que dos o más personas lo introduzcan en la genealogía de manera indepen diente. Un carácter recesivo común, como el grupo sanguíneo O, puede observarse en generaciones sucesivas por matrimonios repeti dos de personas grupo O con heterocigotos. Esto produce un patrón que semeja la herencia dominante (fig. 4-5A). Por consiguiente los patrones genealógicos clásicos se observan mejor con caracteres raros.

4.3.2 La falta de manifestación de un padecimiento dominante se denomina no penetrancia La no penetrancia es una complicación frecuente en padecimientos dominantes. Para un genotipo determinado, la penetrancia de un ca rácter se define como la probabilidad de que una persona con el geno tipo manifieste el carácter. Por definición un carácter dominante se manifiesta en una persona heterocigota y por tanto debe mostrar 100% de penetrancia. No obstante, aunque muchos caracteres en hu manos suelen mostrar herencia dominante, a veces brincan una gene ración. En la figura 4-5B, II2 tiene un padre y un niño afectados, y casi con certeza porta el gen mutante, pero es normal desde el punto de vis ta fenotípico. Éste se describiría como un caso de no penetrancia. La no penetrancia no entraña ningún misterio -de hecho, 100% de penetrancia es el fenómeno más sorprendente—. Muy a menudo la presencia o ausencia de un carácter depende, tanto en las

Recuadro 4-2. Prueba de complementación para descubrir si dos caracteres recesivos están determinados por genes alélicos Cruzamiento parental

un locus a ^ x a2a2

dos locus aaBB x AAbb

Descendencia

a ^

AaBb

Fenotipo

mutante

tipo silvestre

Anímales homocigotos para los dos caracteres se cruzan y se observa el fenotipo de la descendencia. Cuando ambos animales llevan mutaciones

en el m ism o locus, la progenie no tendrá un alelo tipo silvestre y en consecuencia será fenotípicamente anormal. Si hay dos locus diferentes, la progenie es heterocigota para cada uno de los dos caracteres recesivos y pQ(. cons¡gU¡ente fenotípicamente normal. En muy pocas ocasiones alelos en el m ism o locus pueden complementarse entre sí (complementación interalélica).

4.3 | COMPLICACIONES DE LOS PATRONES DE GENEALOGÍA MENDELIANOS BÁSICOS ; 107

4.3.3 Muchos padecimientos muestran expresión variable

Fig. 4-4. Genealogía de una enfermedad mitocondrial. Patrón de genealogía típico que muestra pérdida de la audición deter—nnada de modo mitocondrial (familia informada por Prezant y cois., 1993). Obsérvese la penetrancia incompleta.

circunstancias principales como en las normales, del genotipo en n locus, pero un fondo genético poco frecuente, un estilo de vida particular o tan sólo el azar significan que es posible que una per sona ocasional no manifieste el carácter. La no penetrancia es un rtligro latente mayor en asesoría genética. Sería imprudente que un üesor que sabe que el padecimiento de la figura 4-5B es dominan:e y observa que III7 no tiene signos diga a la mujer que no corre riesgo de procrear niños afectados. Una de las labores de los aseso res genéticos es conocer el grado usual de penetrancia de cada sín drome dominante. Con frecuencia, por supuesto, un carácter depende de mu chos factores y no muestra un patrón de genealogía mendeliano inclusive si es del todo genético. Existe un continuo de caracte res, desde el mendeliano por completo penetrante hasta el multifactorial (fig. 4-6), con influencia creciente de otros locus genéticos, el ambiente, o ambos. Ninguna división lógica sepa ra los caracteres mendelianos imperfectamente penetrantes de 'os multifactoriales; éste es un aspecto de la descripción más útil que se aplicaría.

Penetrancia relacionada con la edad en enfermedades de inicio tardío En enfermedades de inicio tardío se observa un caso en particular importante de penetrancia reducida. Los padecimientos genéticos no siempre son congénitos (presentes al nacer). Aunque el genoti po se fija en la concepción, es posible que el fenotipo no se mani fieste hasta la vida adulta. En estos casos la penetrancia se relaciona con la edad. Un ejemplo bien conocido (fig. 4-7) es la enfermedad de Huntington (neurodegeneración progresiva; MIM 143100). El retraso del inicio podría deberse a la acumulación lenta de una sus tancia nociva, la muerte paulatina del tejido o la incapacidad para reparar cierta forma de daño ambiental. Los cánceres hereditarios son causados por una segunda mutación que afecta una célula de una persona que ya porta una mutación en un gen supresor de tu mor (cap. 17). Según la enfermedad, la penetrancia puede ser de 100 % si la persona vive el tiempo suficiente o es posible que un in dividuo que lleva el gen nunca presente síntomas sin considerar el tiempo que viva. Las curvas de edad de inicio, como las de la figu ra 4-7, son medios importantes en asesoría genética porque permi ten que el genetista estime la posibilidad de que una persona con riesgo pero asintomática desarrolle después la enfermedad.

Relacionada con la no penetrancia, la expresión variable se obser va a menudo en padecimientos dominantes. La figura 4-5C mues tra un ejemplo de una familia con síndrome de Waardenburg. Diferentes miembros de la familia presentan distintas características del síndrome. La causa es la misma que la de la no penetrancia: otros genes, factores ambientales o el azar puro tiene cierta influencia en el desarrollo de los síntomas. Por lo general la no penetrancia y la ex presión variable son problemas con caracteres dominantes, más que recesivos. Ello indica en parte la dificultad para señalar casos no pe netrantes en una genealogía recesiva típica. Sin embargo, como re gla general, los padecimientos recesivos son menos variables que los dominantes, tal vez porque el fenotipo de un heterocigoto incluye un equilibrio entre los efectos de los dos alelos, de manera que el resultado final puede ser más sensible a la influencia externa que el fenotipo de un homocigoto. Sin embargo, tanto la no pene trancia como la expresión variable se observan a veces en padeci mientos recesivos. Estas complicaciones son mucho más notables en humanos que en plantas u otros animales. Los animales de laboratorio y las plan tas de siembras presentan mayor uniformidad genética que los hu manos. Lo que se observa en genética humana es típico de una población silvestre. No obstante, los genetistas de ratones están fa miliarizados con la forma en que la expresión de un mutante pue de cambiar cuando se introduce en un fondo genético distinto -una consideración importante cuando se estudian modelos de en fermedades humanas en el ratón—.

La anticipación es un tipo especial de expresión variable Anticipación se refiere a la tendencia de algunos padecimientos dominantes variables a tornarse más graves (o iniciar antes) en ge neraciones sucesivas. Hasta hace poco tiempo la mayoría de los ge netistas se mostraba escéptica respecto a que este hecho sucediera alguna vez. El problema es que variaciones aleatorias en la grave dad simulan con mucha facilidad la anticipación verdadera. Una familia recibe atención clínica cuando nace un niño con una afec ción grave. En la investigación de los antecedentes el genetista ob serva que uno de los padres está afectado, pero de manera muy leve. Aunque esto parece anticipación, en realidad puede ser sólo un sesgo de indagación. Si el padre hubiera estado muy afectado es muy posible que nunca hubiera tenido un hijo; si la afección del niño es muy leve, es probable que la familia no se hubiera detec tado. Con base en la falta de cualquier mecanismo plausible para la anticipación, y en los problemas estadísticos de demostrarla an te estos sesgos, la mayoría de los genetistas no deseaba considerar con seriedad la anticipación hasta que los adelantos moleculares los obligaron a hacerlo. La anticipación se tornó respetable de pronto, e inclusive se puso de moda, con el descubrimiento de repeticiones extensibles de trinucleótidos inestables en el síndrome de X frágil (retraso mental con varios signos físicos; MIM 309550) y después en la distrofia miotónica (una enfermedad multisistémica muy varia ble con disfunción muscular característica; MIM 160900) y la enfermedad de Huntington. La gravedad o la edad de inicio de estos trastornos se correlaciona con la longitud de la repetición y esta última tiende a crecer conforme el gen se transmite a través de las generaciones (véase sección 16.6.4). Estos padecimientos

108 | CAPÍTULO CUATRO

A)

C)

I

B)

■ -1 00

AO

AO | AA

0 0 | AO

AO

00

AA

GENES EN GENEALOGÍAS Y POBLACIONES

AO

6

AO

AO

00

AO

■

OO

4

00

i

IV

E)

I

-Q -

0 D r¿ Ó

□

-O

F)

i II

2>

¿ " " S

# yO 4 -rD

1

á -rO

Ó -rD

< 5 tE í

r 5 é í

¿i

ó

¿

¿

IV

H)

I

II

D yO

á - r O Ó - r D á -T -O Ó - r D

6 ó l ¿ o

6cj £ ■ /

Fig. 4-5. Complicaciones de los patrones mendelianos básicos. A) Un recesivo común, por ejemplo, un grupo sanguíneo O, puede dar el aspecto de un patrón dominante. B) Herencia autosómica dominante con no penetrancia en ll2. C) Herencia autosómica dominante con expresión variable: en esta familia con síndrome de Waardenburg, primer cuadro lleno = pér dida de la audición; segundo cuadro = ojos de diferentes colores; tercer cuadro = copete blanco; cuarto cuadro = encanecimiento prematuro. D) Impronta genética: en esta familia los tumores glomosos autosómicos dominantes se manifiestan sólo cuando el gen se hereda del padre (familia descrita por Heutink y cois., 1992). E) Impronta genética: en esta familia el síndrome de Beckwith-Wledemann autosómico dominante se manifiesta sólo cuando el gen se hereda de la madre (familia Informada por Viljoen y Ramesar, 1992). F) Incontinencia pigmentaria dominante ligada a X. Los varones afectados se abortan de manera espontánea (cuadros pequeños). G) Genealogía recesiva ligada a X en la que la endogamia produce una mujer afectada y transmisión aparente de varón a varón. H) Mutación autosómica dominante nueva que simula un patrón autosómico o ligado a X recesivo.

muestran anticipación verdadera. Ahora de nuevo se reclama considerar la anticipación para muchas enfermedades y es impor tante recordar que la objeción antigua respecto el sesgo de inda gación aún es válida. A fin de que sea creíble, una afirmación de anticipación requiere un respaldo estadístico cuidadoso, no sólo la impresión clínica.

4.3.4 En genes improntos, la expresión depende del origen parental Ciertos caracteres humanos son autosómicos dominantes, afectan a ambos sexos y los transmiten los padres de cualquier sexo, pero sólo se manifiestan cuando se heredan de un padre de un sexo particular.

4.3 I COMPLICACIONES DE LOS PATRONES DE GENEALOGIA MENDELIANOS BÁSICOS j 109

Gen único

A

M endeüano

Fig. 4-6. Espectro de caracteres humanos. Pocos caracteres son puramente mendelianos, poligénicos o ambien tales. Casi todos dependen de la misma mezcla de determinantes genéti cos mayores y menores aunados a influencias ambientales. La mezcla de factores que determina cualquier carácter determinado podría repre sentarse por un punto localizado en alguna parte dentro del triángulo.

Por ejemplo, se describen familias con tumores glomosos autosómicos dominantes que sólo se expresan en varones o mujeres que here dan el gen de su padre (fig. 4-5D), en tanto que el síndrome de Beckwith-Wiedemann (exónfalos, macroglosia, crecimiento excesi vo; MIM 130650) en ocasiones es dominante pero sólo se expresa en niños que lo heredan de su madre (fig. 4-5E). Estos efectos del sexo parental son prueba de improntación, un fenómeno mal compren dido por el que ciertos genes son marcados (“improntos”) de alguna manera con su origen parental. Los múltiples problemas que rodean el mecanismo y el propósito evolutivo de la improntación se estudian en la sección 10.5.4 y el recuadro 16.6 describe un ejemplo clínico de particular notabilidad.

4.3.5 La letalidad m asculina puede com plicar genealogías ligadas a X En algunos padecimientos dominantes ligados a X, la ausencia del alelo normal es letal antes del nacimiento. Por consiguiente los varo nes afectados no nacen y se observa un padecimiento que sólo afecta a mujeres, que lo transmiten a la mitad de sus hijas pero a ninguno de sus hijos (fig. 4-5F). Es posible que haya un antecedente de abor tos espontáneos, pero las familias rara vez son lo bastante grandes pa ra demostrar que el número de hijos sólo es la mitad que el de hijas. Un ejemplo es la incontinencia pigmentaria (defectos lineales de la piel que siguen patrones definidos conocidos como líneas de Blaschko, que a menudo se acompañan de problemas neurológicos o esque léticos; MIM 308310).

4.3.6 Con frecuencia nuevas m utaciones complican ia interpretación genealógica y pueden conducir a mosaicismo Muchos casos de enfermedad genética dominante o ligada a X gra ve resultan de mutaciones nuevas, sin advertencia notable en una

E d a d (años)

Fig. 4-7. Curva de edad de inicio en la enfermedad de Huntington. Curva A: probabilidad de que un individuo que porta el gen de enfer medad desarrolle síntomas a una edad determinada. Curva B: riesgo de que un niño sano de un padre afectado lleve el gen de enfermedad a una edad determinada. Tomado de Harper (2001). Practical Genetíc Counselling, 5a. ed„ Hodder Arnold. Reproducido con autorización de Hodder Arnold.

familia que carece de antecedentes de la enfermedad. Un dominan te mortal por completo penetrante ocurriría de manera necesaria por una mutación nueva y los padres nunca estarían afectados; un ejemplo, es la displasia tanatofórica (acortamiento grave de los hue sos largos y fusión anormal de suturas craneales; MIM 187600). Para un padecimiento dominante no mortal, pero grave, se aplica un argumento similar, aunque en menor grado. Si la enfermedad impide que la mayoría de las personas se reproduzca, pero de cual quier modo se presentan casos nuevos de la enfermedad, muchos o la mayor parte de ellos se deben a nuevas mutaciones. Los recesivos ligados a X importantes también muestran una proporción signifi cativa de mutaciones nuevas, porque el gen está expuesto a selec ción natural siempre que se encuentra en un varón. Por otra parte, las genealogías autosómicas recesivas no se afectan de modo impor tante -un alelo mutante puede propagarse durante muchas genera ciones en portadores asintomáticos y cabe asumir con seguridad que ambos padres de un niño afectado son portadores—. Si se considera que, promediadas con el tiempo, las mutaciones nuevas reemplazan a los genes de enfermedad que se perdieron a través de la selección natural, su frecuencia en la población depen de de una relación simple (que se describe en la sección 4.5.2) en tre el ritmo al que la selección natural elimina genes desventajosos y el ritmo al que se crean nuevas mutaciones. Los mecanismos ge nerales que afectan la frecuencia de alelos en la población se comen tan en el capítulo 11 , recuadro 11 .2 . Puede ser muy difícil decidir la modalidad de herencia y el ries go de recurrencia cuando una pareja normal sin un antecedente

110

CAPÍTULO CUATRO

GENES EN GENEALOGÍAS Y POBLACIONES

familiar importante tiene un niño con anormalidades graves (fig. 4-5H); el problema podría ser autosómico recesivo, autosómico dominante con una mutación nueva, recesivo ligado a X (si el ni ño es varón) o no genético. El mosaicismo germinal introduce una complicación adicional (véase a continuación).

Los mosaicos tienen dos genéticamente distintas

(o más)

líneas celulares

Suele observarse que en enfermedades autosómicas dominantes y li gadas a X importantes, en las que las personas afectadas no tienen niños o muy pocos, los genes de la enfermedad se conservan en la población mediante mutación recurrente. Una suposición usual es que una persona por completo normal produce un gameto mutante único. Sin embargo, no siempre sucede así. A menos que exista algo especial en el proceso mutacional, como sólo puede suceder du rante la gametogénesis, las mutaciones pueden surgir en cualquier momento durante la vida poscigótica. Las mutaciones poscigóticas producen mosaicos con dos (o más) líneas celulares genéticamente distintas. El mosaicismo puede afectar tejidos con líneas somáticas, germi nales, o ambas. Las mutaciones poscigóticas no sólo son frecuentes, si no inevitables. Por lo general las tasas de mutación en humanos son de 10 7 por gen por generación celular y el cuerpo contiene tal vez 1013 células. Cabe pensar que todas las personas deben ser un mosai co para innumerables enfermedades genéticas. De hecho, como lo re marcó en forma memorable el profesor John Edwards, un varón normal bien podría producir la totalidad del catálogo de la OMIM en cada eyaculado. Esto no debe originar ansiedad. Si una célula en el de do meñique de una persona muta para el genotipo de enfermedad de Huntington, o una célula en el oído capta una mutación de fibrosis quística, la persona o su familia no sufren ninguna consecuencia. Só lo cuando una mutación somática conduce al surgimiento de una clo na sustancial de células mutantes existe un riesgo para todo el organismo. Lo anterior puede suceder en dos formas: ► la mutación causa proliferación anormal de una célula que en condiciones normales se replicaría con lentitud o no del todo, lo que genera una clona de células mutantes. Ésta es la forma en que se presenta el cáncer; el tema se estudia en su totalidad con más detalle en el capítulo 17. ► la mutación ocurre en un embrión temprano, afecta una célu la que es la progenitora de una fracción importante del orga nismo completo. En este caso el individuo mosaico puede mostrar signos clínicos de la enfermedad. Las mutaciones que ocurren en la línea germinal de un padre pue den causar una enfermedad hereditaria nueva en un niño. Una mu tación temprana en la línea germinal puede producir una persona que aloja una clona de células de la línea germinal mutantes (mo saicismo germinal o gonadal). Como resultado, una pareja nor mal sin un antecedente familiar puede tener más de un niño con la misma enfermedad dominante grave. La genealogía simula heren cia recesiva. Inclusive si la modalidad de herencia correcta se cono ce, es muy difícil calcular el riesgo de recurrencia para utilizarlo en la asesoría a los padres (Van der Meulen y cois., 1995). Por lo ge neral se cita un riesgo empírico (sección 4.4.4). La figura 4-8 mues tra un ejemplo de la incertidumbre que el mosaicismo introduce en la asesoría, en este caso en una enfermedad ligada a X. Los estudios moleculares pueden ser muy útiles en estas circuns tancias. A veces es posible demostrar de manera directa que un pa dre normal está produciendo una proporción de espermatozoos

Fig. 4-8. Mutación nueva en la distrofia muscular de Duchenne recesiva ligada a X. Los tres cromosomas X de la abuela se distinguieron por medio de marcadores genéticos y se muestran en azul, rosa y pardo (Ignorando la recombinación). 111, tiene X de la abuela, que adquirió una mutación en algún punto en la genealogía. Hay cuatro posibles puntos en los que pudo ocurrir: si Ilh porta una mutación nueva, el riesgo de recurrencia para todos los miembros de la familia es muy bajo; si II, es un mosaico germinal, hay un riesgo importante (pero difícil de cuantificar) para su niño futuro, pero no para sus hermanas; sí Ih fue el resultado de un espermatozoo mutante único, ella tiene el riesgo de recurrencia estándar para recesivas ligadas a X, pero sus hermanas no lo tienen; sí h fue un mosaico germinal, todas las hermanas tienen un riesgo sig nificativo, que es difícil cuantificar.

mutantes. Aunque las mujeres no pueden someterse a estudios di rectos de la línea germinal, otros tejidos accesibles, como los fibro blastos o las raíces del pelo, pueden someterse a pruebas de mosaicismo. Un resultado negativo en tejidos somáticos no descar ta mosaicismo de la línea germinal, pero un resultado positivo, au nado a un niño afectado, lo comprueba (fig. 4-9).

Las quimeras contienen células de dos cigotos separados en un mismo organismo Los mosaicos inician la vida como un óvulo fecundado único. Las quimeras resultan de la fusión de dos cigotos para formar un em brión (el inverso de la gemelación) o de la colonización limitada de un gemelo por células de un cogemelo no idéntico (fig. 4-10). El quimerismo se demuestra por la presencia en muestras de teji dos mancomunados de demasiados alelos parentales en varios locus (si sólo participara un locus, cabría sospechar mosaicismo por una mutación aislada). En ocasiones los centros de grupos sanguí neos descubren quimeras entre donadores normales y algunos pa cientes intersexuales resultan ser quimeras XX/XY. Strain y colaboradores (1998) describieron, por ejemplo, a un niño 46,XY/46,XX que fue el resultado del amalgamiento de dos em briones después de una fecundación in vitro en la que se transfirie ron tres embriones a la madre.

í.4

i

GENÉTICA DE CARACTERES MULTIFACTORIALES: TEORIA DEL UMBRAL POLIGENICO

111

In d iv id u o III-4 : h a p lo tip o : a lto rie s g o c o lo n o s c o p ia : n o rm a l DGGE: n o rm a l

i l

D I

I

0 1

Exón 14 de APC

>

W 593X T ip o s ilv e s tre

Fig. 4-9. Mosaicismo de línea germinal y somático en una enfermedad dominante. Los individuos II-2 y III-2 sufren poliposis adenomatosa familiar, una form a de cáncer colorrectal que se hereda de manera dominante y se mapea en el cromosoma 5 (MIM 175100, véase sección 17.5.3). Los padres de II-2 no están afectados. La electroforesis en gel de gradiente desnaturalizante (véase sección 18.3.2) demuestra una mutación, W593X, en el exón 14 del gen/lPC en III-2 (se observa en las bandas superiores en la pista 1 del gel). Para II-2 el gel muestra las bandas mutantes, pero sólo de manera muy débil, lo que indica que la sangre de esta persona es mosaico para la mutación. La mutación está ausente en III-4, aunque los estudios con marcadores ligados (cromosomas codificados con color, véase sección 18.5) mostraron que heredó el cromosoma de riesgo alto (azul) de su madre. El examen clínico (colonoscopia) confirmó que III-4 no tenía la enfermedad. II-2 debe ser tanto una línea germinal como un mosaico somático para la mutación. Ejemplo y gel cortesía del profesor Bert Bakker, Leiden.

4.4 G enética de c a ra c te re s m u ltifactoriales: te o ría del um bral poligénico 4.4.1 Algo de historia Cuando el trabajo de Mendel se redescubrió en 1900 ya estaba bien establecida una escuela rival de genetistas en el Reino Unido y algu na otra parte. Francis Galton, el primo notable y excéntrico de Char les Darwin, dedicó gran parte de su inmenso talento a sistematizar el estudio de la variación humana. A partir del artículo “Hereditary Talent an d Character"publicado el mismo año, 1865, como trabajo de Mendel (y aumentado en 1869 a un libro, Hereditary Genius), invir~ó muchos años en la investigación de semejanzas familiares. Galton sí dedicó a cuantificar observaciones y aplicar análisis estadísticos. Su .-jithropometric Laboratory, establecido en Londres en 1884, registró r« o , estatura en posición sedente y de pie, brazada, capacidad respi ratoria, fuerza de tiramiento y opresión, fuerza de soplido, tiempo de reacción, agudeza visual y auditiva, diferenciación de colores y juicios ie longitud de sus sujetos (quienes le pagaron tres peniques por el rrivilegio). En una de las primeras aplicaciones estadísticas comparó ios atributos físicos de padres y niños, y estableció el grado de corre cción entre familiares. Alrededor de 1900 contaba ya con un gran -òmero de conocimientos respecto a la herencia de dichos atributos v una tradición (biomètrica) de su investigación.

Cuando el trabajo de Mendel se redescubrió, surgió una con troversia. Los biometras aceptaron que los genes mendelianos po drían explicar unas cuantas anormalidades raras o desviaciones curiosas, pero señalaron que la mayor parte de los caracteres que podían ser importantes en la evolución (talla corporal, estructura, fuerza, habilidad para atrapar presas o encontrar alimento) la constituían caracteres continuos o cuantitativos y no factibles de análisis mendeliano. Puesto que todas las personas tienen estos caracteres, pero en grados distintos, no es posible definir su he rencia mediante el dibujo de genealogías y el mareaje de las per sonas que las tienen. El análisis mendeliano requiere caracteres dicótomos que se tienen o no. La controversia siguió, en ocasio nes acalorada, entre mendelianos y biometras hasta 1918. En ese año R. A. Fisher publicó un artículo de gran influencia que de mostró que los caracteres regidos por un gran número de factores mendelianos independientes (caracteres poligénicos) mostrarían con precisión la naturaleza continua, la variación cuantitativa y las correlaciones familiares descritas por los biometras. Más ade lante Falconer amplió este modelo para incluir los caracteres di cótomos. Los análisis de Fisher y de Falconer crearon la base teórica unificada para la genética humana. Las secciones siguien tes exponen sus ideas, en una forma no matemática. Puede en contrarse una descripción más rigurosa en cualquier libro de texto de genética cuantitativa, por ejemplo Falconer y Mackay, 1996 (véase lecturas adicionales).

112

CAPÍTULO CUATRO

GENES EN GENEALOGÍAS Y POBLACIONES

r U n cig o to C a m b io g e n é tic o

/

m

►.

-

Fusión o intercam bio d e células

D o s c ig o to s

/

Fig. 4-10. Mosaicos y quimeras. Los mosaicos tienen dos o más líneas celulares genéticamente distintas de un cigoto único. El cambio genético indicado puede ser una mutación gènica, un cambio crom osom ico numérico o estructural o, en el caso especial de lionización, inactivación de X. Una quimera deriva de dos cigotos, que suelen ser normales pero genéticamente distintos.

4.4.2 Teoría poligénica de los caracteres cuantitativos Cualquier carácter variable que depende de la acción aditiva de un gran número de causas independientes individualmente pequeñas mostrará una distribución normal (gausiana) en la población. La figura 4-11 presenta una ilustración muy simplificada de este he cho. Se supone que el carácter depende de alelos en un solo locus, después dos locus y a continuación tres. Conforme más locus se in cluyen, se observan dos consecuencias: ► la relación simple uno a uno entre genotipo y fenotipo desapa rece. Excepto por los fenotipos extremos, no es posible deducir el genotipo a partir del fenotipo; ► a medida que el número de locus aumenta, la distribución se ve cada vez más como una curva gausiana. La adición de una variación ambiental pequeña aplanaría la distribución de tres locus hacia una buena curva gausiana. Un concepto más complicado, que comprende dominancia y fre cuencias de gen variables, conduce a las mismas conclusiones. Co mo los familiares comparten genes, sus fenotipos se correlacionan y el artículo de Fisher de 1918 predijo el tamaño de la correlación para diferentes relaciones. Una característica muy mal entendida, tanto de los datos biométricos como de la teoría poligénica, es la regresión a la media. Sólo como ejemplo imagínese que la variación en el IQ estuviera determinada de modo genético por completo. La figura 4-12 mues

tra cómo en el modelo simplificado de dos locus, para cada clase de madres, el IQ promedio de sus niños se encuentra a la mitad del va lor de la madre y la media de la población. Esta es la regresión a la media -pero con frecuencia sus implicaciones se interpretan de modo erróneo (véase recuadro 4-3)—. Sin embargo, en este modelo simple cabe señalar una suposición oculta: que hay un apareamien to aleatorio. Para cada clase de madres se asume que el IQ prome dio de sus esposos es de 100. Por tanto el IQ promedio del niño es la mitad del IQ parental, como lo sugeriría el sentido común. En el mundo real mujeres muy inteligentes tienden a casarse con varo nes de inteligencia mayor que el promedio (apareamiento concor dante) y no cabría esperar la regresión a la mitad de la media de la población, inclusive si el IQ fuera un carácter genético puro. Una segunda suposición del modelo simplificado es que no hay dominancia: cada fenotipo de la persona es la suma de la contribu ción de cada alelo a cada locus importante. Si se introduce la domi nancia, alelos dominantes e invisibles en su fenotipo ocultarían el efecto de algunos de los genes de un padre, pero aún así pueden transmitirse y afectar el fenotipo del niño. Si se toma en cuenta la dominancia, la expectativa para el niño ya no es el valor medio pa rental. La mejor suposición respecto al efecto fenotípico probable de alelos recesivos ocultos se obtiene buscando en el resto de la pobla ción. Por consiguiente el fenotipo esperado del niño se mostraría a partir del valor medio parental hacia una media de la población. La cuantía del desplazamiento depende de qué tan importante es la do minancia para determinar el fenotipo.

4.4 ¡ GENÉTICA DE CARACTERES MÜLTIFACTORIALES: TEORÍA DEL UMBRAL. POLIGÉNICO

A) U n lo c u s

113

Aa B) D o s locus A A bb A aB b aaB B A abb aa B b

AABb A aB B

aabb i 70

C) Tres lo c u s A A bbcc A aB b c c A ab b C c aa B b C c aa b b C C aaB B cc

A A B bcc A A bbC c A aB bC c A ab b C C A aB B cc aag B C c aaBbCC

70

i

80

i. 90

..

i 100

. ___ i__ .. i__ 110

120

130

D) M u c h o s locus A A B B cc A A B bC c A A bbC C A aB B C C A aB bC C aaB B C C

A abbcc aa B b cc aab b C c a a b b cc

___L....... 80

AABB

AAB B C C A A B bC C A aB B C C

... i __ __ ! ... - __ i ... .... i.... 90

100

110

120

AABBCC

130

Fig. 4-11. Aproximación sucesiva a una distribución gausiana. Las gráficas muestran la distribución poblacional de un carácter hipotético que tiene un valor medio de 100 unidades. El carácter está determinado por los efectos aditivos (codominantes) del alelo. Cada alelo del caso superior contribuye con cinco unidades al valor y cada alelo del caso inferior resta cinco unidades. Todas las frecuencias de alelo son 0.5. A) El carácter está determinado por un locus aislado; B) dos locus; C) tres locus: la adición de una cantidad menor de variación “ aleatoria" (ambiental o poligénica) produce una curva Gaussiana D).

La herencia es la proporción de varianza debida a efectos genéticos aditivos Las curvas gaussianas sólo se especifican por dos parámetros, la media y la varianza (o la desviación estándar, que es la raíz cua drada de la varianza). Las varianzas tienen la propiedad útil de ser aditivas cuando se deben a causas independientes (recuadro 4-4). Por consiguiente la varianza total del fenotipo Vp es la su ma de las varianzas que se deben a las causas individuales de va riación: la varianza ambiental VEy la varianza VG genérica. Esta última puede descomponerse a su vez en una varianza V\ debida a efectos genéticos aditivos simples y un término VD extra debi do a efectos de dominancia. La heredabilidad (h2) de un carác ter es la proporción de la varianza total que es genética, es decir Vg/Vp. Para los criadores de animales que se interesan en aparear vacas con producciones altas de leche ésta es una medida impor tante de la forma en que un programa de apareamiento puede crear un ganado en el que el animal promedio se asemeja al me jor del momento. En sentido estricto, Vg/Vp es la heredabilidad amplia. Puesto que la varianza de dominancia no puede fijarse por apareamiento, la respuesta de selección está determinada por la heredabilidad estrecha, VAI Vp. A menudo las heredabilidades de caracteres humanos se estiman como parte de los análisis de segregación (véase sección 15.2 y cuadro 15.4). Sin embargo, de be recordarse que para muchos caracteres conductuales humanos

no es aplicable la división simple de la varianza en componentes ambiental y genético. Los padres proporcionan a sus hijos tanto sus genes como su ambiente. La desventaja genética y la desven taja social tienden a ir juntas, de modo que los factores genéticos y ambientales se correlacionan con frecuencia. Si estos dos no son independientes, V¡> no es igual a Vq + Vg; hay varianzas de interacción adicionales. Una proliferación de varianzas puede re ducir con rapidez la potencia explicativa de los modelos y en ge neral es un área difícil de trabajar. A menudo el término “heredabilidad” se comprende mal. La heredabilidad es muy diferente de la modalidad de herencia (autosómica dominante, poligénica, etc.). La modalidad de herencia es una propiedad fija de un carácter, pero la herencia no. La “hereda bilidad del IQ” es la abreviatura para “heredabilidad de variaciones en IQ”. Contrastan las dos preguntas: ► ¿hasta q u é grado es gen ético e l IQ? Ésta es una pregunta sin sentido; ► ¿qué tanto de la diferencia en el IQ entre personas en un país y un tiempo particulares se debe a sus diferencias genéticas y qué tanto a sus distintos am bientes e historias de vida? Ésta es una pregun ta importante aunque difícil de responder. La heredabilidad del IQ (CI) varía en diferentes circunstancias so ciales. Cuanto más igual es una sociedad, más alta debe ser la here-

114

O CUA! RO

GENES EN GENEALOGÍAS Y POBLACIONES

80 90 100 110 120 D e s c e n d e n c ia d e s p u é s d e a p a re a m ie n to a le a to rio

80 90 1 0 0 1 1 0 1 2 0

80 90 1 0 0 1 1 0 1 2 0

80 90 100 110 120

80 90 100 1 1 0 1 2 0

80 90 100 110 120

D istrib u ció n e n tre niños

H

I I

M

80 90 1 0 0 1 1 0 1 2 0

Fig. 4-12. Regresión a la media. El mismo carácter de la figura 4 -1 1B: media 100, determinado por alelos codominantes A, a, B y b en dos locus, todas frecuencias génicas = 0.5. Arriba: distribución en una serie de madres. En medio: distribución en niños de cada clase de madres, asumiendo apareamiento aleatorio. Abajo: distribución sumada en los niños. N ótese que: a) la distribución en los niños es la misma que la distribución en las madres; b) para cada clase de madre, la media para sus niños es la equidistante entre el valor de la madre y la media en la población (100), y c) para cada clase de niños (abajo), la media para sus madres es equidistante entre el valor en los niños y la media poblacional.

Recuadro 4-3. Dos conceptos erróneos frecuentes respecto a la regresión a la media 1) Después de unas cuantas generaciones, todas las personas serán exactamente ¡guales. 2) SI un carácter muestra regresión a la media, debe ser genético. La figura 4-12 muestra que el primero de estos conceptos es erróneo. En un modelo genético simple: la distribución total es la misma en cada generación; la regresión funciona en ambos caminos: para cada clase de niños, el promedio para sus madres es equidistante entre el valor de los niños y la media de la población. Aunque puede parecer paradójico, suele con firm arse mediante la inspección, por ejemplo, de la columna del lado derecho en la parte inferior del histograma de la figura 4-12 (niños con IQ de 120). Una cuarta parte de sus madres tiene un IQ de 120, la mitad 1 1 0 y una cuarta parte 100, lo que da un promedio de 1 1 0 .

Sin considerar la segunda de estas creencias, la regresión a la media no es un mecanismo genético sino un fenómeno estadístico puro. Sea que los determinantes de IQ sean genéticos, ambientales, o cualquier com binación de ambos, si se toma un grupo excepcional de madres (p. ej., las que tienen un IQ de 120), entonces estas madres deben haber tenido un juego excepcional de determinantes. Si se considera un segundo grupo que comparte la mitad de esos determinantes (sus niños, her manos o incluso sus padres), el fenotipo promedio en este segundo grupo se desviará de la media de la población pero cuando mucho la mitad. La genética proporciona la cifra de una mitad, pero no el principio de regresión.

4.4

GENÈTICA DE CARACTERES MULTIFACTORIALES: TEORÌA DEL UMBRAL POLIGÉNICO

115

Recuadro 4-4. Partición de varianza Varianza de fenotipo ( / P) = varianza genética (t/G) + varianza ambientai

V? ~

(Và

Heredabilidad (amplia) = V ^V ?

yG = varianza por efectos genéticos aditivos (l/A) + varianza por efectos dominantes (l/D)

Heredabilldad (reducida) = iy i/p

dabilidad del IQ. Si todas las personas tienen iguales oportunida des se eliminan varias de las diferencias ambientales entre las perso nas. En consecuencia, más de las diferencias restantes en el IQ se deberán a las diferencias genéticas entre las personas.

4.4.3 Teoría poligénica de caracteres discontinuos La mayor parte de los caracteres “poligénicos” clásicos continua mente variables, como estatura y peso, tiene poco interés para los genetistas médicos (aunque se discute la obesidad; sección 15.6.8). Resultan mucho más interesantes las innumerables enfermedades y malformaciones que tienden a presentarse en familias, pero que no muestran patrones de genealogía mendeliana. Una elemento con ceptual importante en la genética no mendeliana la proporcionó la extensión de Falconer de la teoría poligénica a caracteres dicótomos o discontinuos (los que una persona tiene o no). Falconer postuló una susceptibilidad subyacente continuamente variable. Puede tenerse o no un paladar hendido, pero cada embrión posee una cierta susceptibilidad a paladar hendido, que puede ser al ta o baja; es poligénica y sigue una distribución gausiana en la pobla ción. Aunada a la susceptibilidad poligénica, Falconer postuló la existencia de un umbral. Los embriones cuya susceptibilidad excede un valor umbral crítico desarrollan paladar hendido; aquellos cuya susceptiblidad es menor del umbral no tienen paladar hendido, inclu-

Fig. 4-13. Determinación multifactorial de una enfermedad o malfor mación. Los ángeles y los demonios pueden representar cualquier combinación de factores genéticos y ambientales. La adición de un demonio o la supresión de un ángel puede inclinar la balanza, sin que ese factor par ticular sea la causa de la enfermedad. Cortesía del profesor R. S. W. Smithells.

+ Vi

sive si sólo es un poco menor. Despojado de sutileza matemática el modelo puede representarse como en la figura 4-13. El umbral puede imaginarse como el punto neutro de la balanza. El cambio del equili brio de los factores inclina el fenotipo en un sentido o en el otro. En el paladar hendido, parecer ser intuitivamente razonable un modelo de umbral poligénico (Fraser, 1980). Todos los embriones comienzan con un paladar hendido. Durante el desarrollo tempra no, los entrepaños palatinos deben tornarse horizontales y fusio narse entre sí. Es necesario que esto ocurra dentro de una ventana de tiempo específica del desarrollo. Muchos factores genéticos y ambientales diferentes influyen en el desarrollo embrionario, de manera que parece razonable que la susceptibilidad deba ser poli génica. No es importante si los entrepaños palatinos se encuen tran y fusionan con un tiempo de ahorro suficiente o que sólo se fusionen a tiempo: si se fusionan, se forma un paladar normal y si no lo hacen, entonces resulta un paladar hendido. Por tanto hay un umbral natural superpuesto en un proceso continuamente va riable. La teoría del umbral de Falconer ayuda a explicar la forma en que los riesgos de recurrencia varían en familias. Las personas afec tadas deben tener una combinación desafortunada de alelos con susceptibilidad alta. Sus familiares que comparten genes con ellos también tendrán, en promedio, mayor susceptibilidad según la di vergencia de la media de la población en la proporción de genes compartidos. Por consiguiente los caracteres del umbral poligénico tienden a presentarse en familias (fig. 4-14). Es posible que los pa dres con varios niños afectados hayan tenido mala suerte, pero en promedio tendrán más alelos de riesgo alto que los padres que sólo tienen un niño afectado. El umbral es fijo, pero la susceptibilidad promedio, y en consecuencia el riesgo de recurrencia, aumenta con un número cada vez mayor de niños afectados. Muchos supuestos padecimientos de umbral tienen diferentes incidencias en los dos sexos. Esto implica umbrales específicos de sexo. Por ejemplo, la estenosis pilórica congènita es cinco veces más frecuente en niños. El umbral debe ser más alto para niñas que pa ra los niños y, por tanto, los familiares de una niña afectada tienen una susceptibilidad promedio más alta que los familiares de un ni ño afectado (fig. 4-15). El riesgo de recurrencia es de manera co rrespondiente más alto, aunque en cada caso el riesgo de que se afecte un hijo es cinco veces más alto si es varón (cuadro. 4-1).

4.4.4 La asesoría en padecimientos no mendelianos utiliza los riesgos empíricos En la asesoría genética para padecimientos no mendelianos los ries gos no se derivan de la teoría poligénica; son riesgos empíricos que se obtienen mediante encuestas en la población, como los que se muestran en el cuadro 4-1. Esto es en esencia distinto de los pade cimientos mendelianos, en los que los riesgos uno en dos, uno en cuatro, etc., provienen de la teoría. El efecto del antecedente fami-

116

CAPÍTULO CUATRO

j

i

GENES EN GENEALOGÍAS Y POBLACIONES

Distribución del riesgo en la población general

D istrib u ció n d e l riesgo en la p o b la c ió n g e n e ra l

Distribución del riesgo en los hermanos de niños afectados

Distribución de! riesgo en hermanos U m b ra l de la persona afectada In d e m n e n ^ A fe c ta d o -

Distribución del riesgo en los hermanos de niñas afectadas

R ies g o bajo

R ie s g o p ro m e d io en la p o b la c ió n g e n e ra l

R ie s g o p ro m e d io en tre h e rm a n o s d e p e rs o n a s a fe c ta d a s

Um brales específicos de sexo Niños Niños

R ies g o alto

Riesgo m e d io para: p o b la ció n g e n e ra l------he rm a nos de n iño s afectad os — he rm a nos de niñas afectadas —

Fig. 4-14. Modelo de umbral poligénico de Falconer para caracteres dicótomos no mendelianos. El riesgo para el padecimiento es poligénico y distribuido normalmente (curva verde). Las personas cuyo riesgo es mayor de un cierto valor umbral (el punto de equilibrio en la figura 4-13) están afectadas. Sus hermanos (curva de color lila) tienen un riesgo promedio más alto que el promedio de la población y una proporción mayor de ellos posee un riesgo que excede el umbral. Por consiguiente el padecimiento tiende a presentarse en familias.

liar también es muy distinto. Si los dos miembros de una pareja son portadores de fibrosis quística, el riesgo de que su próximo niño se afecte es de uno en cuatro. Lo anterior es cierto sin considerar cuántos niños afectados o normales hayan tenido ya (“el azar no tie ne memoria”). Si tienen un niño con un defecto del tubo neural, el riesgo de recurrencia es alrededor de 1 en 25 en el Reino Unido, pero si ya tienen dos niños afectados, el riesgo de recurrencia se aproxima a uno en dos (que quizá pueda resumirse como “a él de be concedérsele”). La procreación de un segundo niño afectado no es la causa del incremento de su riesgo de recurrencia, sino que per mitió reconocerlos como una pareja que siempre había tenido un riesgo en particular alto. Aunque un cínico diría que esto implica que el asesor es muy astuto después del acontecimiento, la práctica concuerda tanto con el conocimiento basado en la teoría del um bral como con los datos epidemiológicos, y representa lo mejor que puede ofrecerse en un estado de conocimientos imperfecto.

Fig. 4-15. Carácter poligénico con umbrales específicos de sexo. Si un carácter dícótomo no mendeliano afecta a varones de manera predominante, éste corresponde a la teoría del umbral multifactorial, que postula un umbral más bajo para varones que mujeres. Se deduce que los riesgos de recurrencia son más altos para familiares de mujeres afectadas, pero la mayoría de estos casos recurrentes la constituirán varones. Véase cuadro 4-1 para un ejemplo de datos que se ajustan a esta interpretación.

4.5

Factores que afectan las frecuencias génicas

4.5.1 Es posible que las frecuencias génicas y las frecuencias de genotipo establezcan una relación simple Un experimento meditado: escoger genes del fondo común génico En una población completa debe haber muchos alelos diferentes en un locus particular, aunque cada persona tiene sólo dos alelos, que

Riesgos de recurrencia de estenosis pilórica. Familiares de

Hijos

Hijas

Hermanos

Hermanas

Hijos de pacientes masculinos

19/296

7/274

5/230

5/242

(6.42%)

(2.55%)

(2.17%)

(2.07%)

14/61

7/62

11/01

9/101

(22.95%)

(11.48%)

(10.89%)

(8.91%)

Hijos de pacientes femeninos

Aunque más niños que niñas están afectados, el riesgo de recurrencia es más alto para familiares de una niña afectada. Los datos se ajustan a un modelo de umbral poligénico con umbrales específicos de sexo (fig. 4-15). Datos de Fuhrmann y Vogel (1976).

4.5 1 FACTORES QUE AFECTAN LAS FRECUENCIAS GÉNICASJ

pueden ser idénticos o diferentes. Es posible imaginar un fondo común gènico, que consiste en todos los alelos en el locus A en la población. La frecuencia gènica del alelo Aj es la proporción de todos los alelos A en el fondo común gènico que son A i. Considé rense dos alelos, Aj y A2 en el locus A. Asúmase que sus frecuencias génicas sean p y q respectivamente (p y q están, cada una, entre 0 v i ) . Llévese a cabo un experimento meditado: ► elíjase al azar un alelo del fondo común gènico. Hay una posi bilidad de que p sea Aj y una de que q sea A2; ► selecciónese un segundo alelo al azar. Una vez más la posibili dad de seleccionar A, es p y la posibilidad de elegir A2 es q (se supone que el fondo común gènico es suficientemente grande para que la eliminación del primer alelo no cambie de manera significativa las frecuencias génicas en el fondo común restan te). Se deduce que: • la posibilidad de que ambos alelos fueran Aj es p2; • la posibilidad de que ambos alelos fueran A2 es q ; • la posibilidad de que el primer alelo fuera At y el segundo A2 es pq. La posibilidad de que el primero fuera A2 y el segun do A[ es qp. En total, la posibilidad de seleccionar un alelo Aj y uno A2 es 2pq.

Distribución de Hardy-Weinberg La elección al azar de una persona de la población equivale a selec cionar en forma aleatoria dos genes del fondo común gènico. La posibilidad de que la personas sea AjA¡ es p2, la de que sea AjA2 es 2pq y la de que sea A2A2 es q2. Esta relación simple entre las fre cuencias génicas y las frecuencias de genotipo (la distribución de Hardy-Weinberg, véase recuadro 4-5) es aplicable siempre que se extraen del fondo común gènico dos genes de una persona de ma nera independiente y al azar. Es posible que Ai y A2 sean los úni cos alelos en el locus (en cuyo caso p + q = 1) o que haya otros alelos y otros genotipos (p + q < 1). Para locus ligados a X, los va rones, siendo hemicigotos (sólo un alelo), son A! o A2 con frecuen cias p y q respectivamente, en tanto que las mujeres pueden ser AjAj, AjA2 o A2A2 (véase recuadro 4-5).

Limitaciones de la distribución de Hardy-Weinberg Estos cálculos simples se descomponen si no se sigue la suposición subyacente de que los dos genes de una persona se captaron de ma nera independiente del fondo común gènico. En particular es un problema si no ha habido apareamiento aleatorio. El apareamiento concordante puede tomar varias formas, pero la más importante suele ser la endogàmica. Si una persona se casa con un familiar, lo hace con alguien cuyos genes se parecen a los de ella. Este hecho aumenta la posibilidad de que los niños sean homocigotos y dismi nuye la de que sean heterocigotos. Los padecimientos recesivos ra

117

ros se relacionan de manera firme con consanguinidad parental y los cálculos de Hardy-Weinberg que lo ignoren estimarán en exce so la frecuencia de portador en la población en conjunto.

Uso de la distribución de Hardy-Weinberg en asesoría genética Las frecuencias génicas o las de genotipo constituyen información esencial en muchas formas de análisis genéticos, como el análisis de enlace (sección 13.3) y el análisis de segregación (sección 15.2), y tienen importancia particular en el cálculo de los riesgos genéticos. El recuadro 4-6 presenta algunos ejemplos.

4,5.2 Las frecuencias de genotipo pueden utilizarse (con cautela) a fin de calcular los índices de mutación Los genes mutantes se crean por mutaciones nuevas y se eliminan por selección natural (recuadro 11-2). Para un nivel determinado de selección es posible calcular el índice de mutación que se reque riría para reemplazar dos genes que se perdieron por selección. Si se supone que la población presenta un equilibrio entre las tasas de pérdida y de restitución, el cálculo indica el índice de mutación que existe. Es posible definir el coeficiente de selección (s) como la posibilidad relativa de fracaso de la reproducción de un genotipo debido a selección (el tipo más idóneo en la población tiene s = 0 , un letal genético tiene s = 1). ► Para un padecimiento autosómico recesivo una proporción q‘ de la población está afectada. La pérdida de los genes de enfer medad de cada generación es sq . Esto se equilibra por la muta ción al índice de p.(l —q ) en la que p. es el índice de mutación por gen por generación. En equilibrio sq^ = (x(l —q“) o alrede dor de (si q es pequeña) p, = sq2. ► Para un padecimiento autosómico dominante raro los homocigotos son en extremo raros. Los heterocigotos ocurren con una frecuencia 2 pq (frecuencia del gen de enfermedad = p). Sólo una mitad de los genes que se perdieron a través de su fra caso reproductivo es el alelo de la enfermedad, por lo que el ín dice de pérdida genética es muy cercano a sp. Una vez más esto se equilibra mediante un índice de nuevas mutaciones de p.q", que se aproxima a p, si q es casi 1. Por consiguiente, p, = sp. ► Para una enfermedad recesiva ligada a X el índice de pérdida génica a través de varones afectados es sq, lo que se equilibra por una tasa de mutación 3p. ya que todos los cromosomas X en la población están disponibles para mutación, pero sólo un tercio de los cromosomas X que se encuentran en varones está expuesto a selección. Por consiguiente, p, = sq/3. Estos resultados se resumen en el recuadro 4-7. Las estimaciones derivadas de su empleo pueden compararse con la expectativa ge neral, de estudios en muchos organismos, de que los índices de mu tación suelen ser 10 5 a 10 ' por gen por generación.

Recuadro 4-5. Frecuencias de genotipo de equilibrio de Hardy-Weinberg para frecuencias de alelo p ^ ) y q(Az) Locus autosómico Genotipo Frecuencia

P2

Locus ligado a X Varones

Mujeres

A ,A 2

A2A2

Ai

A2

A1A1

A,A 2

2pq

q2

p

q

p2

2pq

Nótese que estas frecuencias de genotipos se observarán sea o no que A, o A2 sean los únicos alelos en el locus.

A2A2 i?

118

CAPÍTULO CUATRO

GENES EN GENEALOGÍAS Y POBLACIONES

Recuadro 4-6. La distribución de Hardy-Weinberg puede utilizarse (con cautela) para calcular frecuencias de portador y riesgos sim ples con fines de asesoram iento Un padecimiento autosómico recesivo afecta a 1 recién nacido en 10 000. ¿Cuál es la frecuencia esperada de portadores? Fenotipos:

No afectado

(el riesgo de portador del padre) x (el riesgo de portador de la nueva esposa) x 1/4 = 1 x 1/50 x 1/4 1/200

Afectado

=

Esto asume que no hay un antecedente familiar de la misma enfermedad en la familia de la nueva esposa.

Genotipos:

AA

Aa

aa

Frecuencias:

p2

2pq

p2 = 1/10 000

La ceguera a los colores rojo y verde ligada a X afecta a 1 de 12 varones británicos. ¿Qué proporción de mujeres serán portadoras y qué proporción estarán afectadas?

q2 es 1 0 " 4 y por tanto q = 10 "2 o 1/ 100. 1 en 100 genes en el locus A son a, 99/100 son A. La frecuencia de portador, 2pq, es 2 x 99/100 x 1/100, muy cerca de 1 en 50. Esto supone que la frecuencia del padecimiento no aumentó por endogamia.

Varones

Mujeres

Genotipos:

Ai

A2

A1A1

A1A2

A2A2

Si un padre de un niño afectado con los padecimientos anteriores se casa de nuevo, ¿cuál es el riesgo de que procree un niño afectado en el nuevo matrimonio?

Frecuencias:

p

q = 1/12

p2

2pq

q2

q = 1 / 1 2 , por tanto p = 11/12

Para tener un niño afectado, ambos padres deben ser portadores y el riesgo entonces es de uno en cuatro. Por consiguiente el riesgo total es:

2 pq = 2 x 1/12 x 11/12 = 22/144 q2 = 1 en 144. En consecuencia este modelo de locus único predice que 15% de las mujeres será portador y 0.7% estará afectado.

R ecuadro 4-7. Equilibrio entre mutación y selección Padecimiento autosómico recesivo*

ix = sq2

0

ijl = F(1 —f)

Padecimiento autosómico dominante

= sp

0

p. = 1/2F(1 - f )

|x = sq/3

0

ix = 1/3F(1 - f)

Padecimiento recesivo ligado a X

ix = índice de mutación por gen por generación p,q = frecuencias génicas s = coeficiente de selección f = idoneidad biológica = 1 - s F = frecuencia del padecimiento en la población *Esta fórmula proporciona un estimado muy erróneo del índice de mutación si hay ventaja del heterocigoto, véase recuadro 4-8.

4.5.3 La ventaja del heterocigoto puede ser mucho más importante que la mutación recurrente para determinar la frecuencia de una enfermedad recesiva La fórmula p, = sq2 proporciona una tasa de mutación inesperada mente alta para algunos padecimientos autosómicos recesivos; por ejemplo, la fibrosis quística (FQ). Hasta fecha muy reciente, casi nadie con FQ vivía el tiempo suficiente para reproducirse y por tanto s = 1. La FQ afecta a alrededor de 1 nacimiento en 2 000 en el Reino Unido. En consecuencia, q2 = 1/2 000 y la fórmula da p, = 5 X 10 4, que sería un índice de mutación muy alto para cualquier gen -aunque las pruebas indican que las mutaciones nue vas de FQson muy raras—. Lo anterior se deduce de la distribución étnica desigual de la FQ y la existencia de un desequilibrio de en lace potente (sección 13.5.2). El factor perdido es la ventaja del heterocigoto. Los portado res de FQ tienen, o tuvieron, cierta ventaja en la reproducción so bre los homocigotos normales. Aún se discute cuál puede ser esta ventaja. Puesto que el gen de FQ codifica un canal de cloruro en la

membrana que se requiere para que Salmonella typhi penetre a las células epiteliales, es probable que los heterocigotos sean hasta cier to punto resistentes a la fiebre tifoidea (Pier y cois., 1998). Cual quiera que sea la causa de la ventaja del heterocigoto, si Sj y S2 son los coeficientes de selección contra los genotipos AA y aa respecti vamente, entonces el equilibrio se establece (ignorando la mutación recurrente) cuando la relación de las frecuencias génicas de A y a, p/q, es s2/sj. El recuadro 4-8 ilustra el cálculo para la fibrosis quís tica y muestra que una ventaja del heterocigoto muy pequeña para observarse en encuestas poblacionales puede tener un efecto mayor en las frecuencias génicas. Merece la pena recordar que las enfermedades mendelianas con importancia en medicina son tanto frecuentes como graves. Todas también deben tener algún truco especial para permanecer comu nes ante la selección. El truco puede ser un índice de mutación en extremo alto (distrofia muscular de Duchenne), la propagación de premutaciones no patológicas (X frágil) o el inicio de síntomas des pués de la edad de la reproducción (enfermedad de Huntington); no obstante, para padecimientos recesivos importantes más a me nudo es la ventaja del heterocigoto.

4.5 ! FACTORES QUE AFECTAN LAS FRECUENCIAS GÉNICAS

1

119

Recuadro 4-8. Selección en favor de heterocigotos para fibrosis quística (FQ) Para FQ, la frecuencia de enfermedad en el Reino Unido se aproxima a 1 en 2 000 nacimientos Fenotipos:

No afectados

Afectados

Genotipos:

AA

Aa

aa

Frecuencias:

p2

2pq

q2 = 1/2 000

q2 es 5 x 10 4, por consiguiente q = 0.022 y p = 1 - q = 0.978 p/q = 0.978/0.022 = 43.73 = s2/s, Si s2 = 1 (los homocigotos afectados nunca se reproducen), s, = 0.023 La frecuencia del gen de FQ presente se mantendrá, inclusive sin muta ciones nuevas, si los heterocigotos Aa tienen en promedio 2.3% más niños sobrevivientes que los homocigotos AA.

Lecturas adicionales Falconer DS, Mackay TFC (1996) Introduction to Quantitative Genetics. Longman, Harlow

Forrest DW (1974) Francis Galton: The Life and Work of a Victorian Genius. Elek, London.

Bibliografia Fisher RA (1918) The correlation between relatives under the sup position of mendelian inheritance. Trans. Roy. Soc. 52, 399-433. Fuhrmann W, Vogel F (1976) Genetic Counselling. Springer, New York. Fraser FC (1980) The William Allan Memorial Award Address: Evolution of a palatable multifactorial threshold model. Am. J. Hum. Genet. 32, 796-813. Harper PS (2001) Practical Genetic Counselling, 5th Edn. Arnold, London. Heutink P, van der Mey AG, Sandkuijl LA ef al. (1992) A gene subject to genomic imprinting and responsible for hereditary paragangliomas maps to chromosome 11 q23-qter. Hum. Molec Genet. 1, 7-10. Jobling MA,Tyler-Smith C (2000) New uses for new haplotypes: the human Y chromosome, disease and selection. Trends Genet. 16, 356-362. Pier GB, Grout M, Zaidi T ef al. (1998) Salmonella typhi uses CFTR to enter intestinal epithelial cells. Nature 393, 79-82.

Prezant TR, Agapian JV, Bowman MO et al. (1993) Mitochon drial ribosomal RNA mutation associated with both antibiotic induced and non syndromic deafness. Nature Genet. 4, 289-294. Skaletsky H, Kuroda-Kawaguchi T, Minx PJ ef al. (2003) The male-specific region of the human Y chromosome is a mosaic of discrete sequence classes. Nature 423, 825-837. Strain L, Dean JCS, Hamilton MPR, Bonthron DT (1998) A true hermaphrodite chimera resulting from embryo amalgamation after in vitro fertilization. N. Engl. J. Med. 338, 166-169. Van der Meulen MA, van der Meulen MJP, te Meerman GJ (1995) Recurrence risk for germinal mosaics'revisited. J. Med. Genet. 32, 102-104. Viljoen D, Ramesar R (1992) Evidence for paternal imprinting in familial Beckwith-Wiedemann syndrome. J. Med. Genet. 29, 221-225. Wilkie AOM (1994). The molecular basis of dominance. J. Med. Genet. 31, 89-98.

CAPÍTULO

CINCO

Amplificación del DNA: clonación de DNA por PCR y basada en células Contenido del capítulo

122

5.1

i

CAPÍTULO CINCO

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

Im po rtancia de la clonación del DNA

Los fundamentos de la tecnología actual del DNA se basan de mo do muy amplio en dos conductas bastante diferentes para estudiar secuencias específicas de DNA dentro de una población de DNA complejo (véase fig. 5-1): ► Clonación de DNA. Deben amplificarse d e form a selectiva la secuencia o el fragmento elegido de DNA para producir un gran número de copias idénticas y el resultado es la purifica ción del producto deseado. A continuación es posible estudiar en extenso su estructura y función. ► Hibridación molecular. No se amplifica ni purifica en ningu na forma el fragmento de interés; por el contrario, se detecta de modo específico dentro de una compleja mezcla de muchas se cuencias diferentes. Antes de la clonación del DNA, el conocimiento sobre este último era en extremo limitado. La tecnología de clonación del DNA cambió todo lo anterior y revolucionó el estudio de la genética. Pa ra comprender por qué sucedió así, deben reconocerse el tamaño y la complejidad enormes de las secuencias de DNA (comparadas, por ejemplo, con las secuencias de proteínas). Las moléculas indi viduales de DNA nuclear contienen cientos de millones de nucleótidos. Cuando se aísla DNA de las células mediante métodos estándar, estas moléculas enormes se fragmentan por acción de fuerzas de desgarro, lo cual crea mezclas complejas de fragmentos de DNA aún muy grandes (50 a 100 kb de largo). Si se toma en cuenta la complejidad del DNA aislado de célu las eucarióticas típicas o incluso una procariota, el desafío fue la for ma de analizarlo. Se requería cierto método de fraccionamiento del

DNA de tal manera que pudieran purificarse las diferentes subpoblaciones de secuencias del DNA. En muchas eucariotas, un méto do inicial consistió en separar distintas poblaciones de secuencias de DNA mediante centrifugación. La ultracentrifligación en gra dientes de densidad de equilibrio (p. ej., gradientes de densidad CsCl) fracciona de forma característica el DNA de una célula eucariota en una banda mayor (la m asa d e DNA) y varias bandas me nores. Las densidades boyantes de las bandas menores de DNA difieren de la masa de DNA (y entre sí) porque están formadas por secuencias de DNA sa télite de repetición tándem, cuya composi ción de bases es diferente en grado notorio de la masa de DNA. Se encontró que las secuencias de DNA satélite participan en aspectos específicos de la estructura y función de los cromosomas. Aunque de valor e interés, los DNA satélite purificados fueron un compo nente menor del genoma y no contienen genes. ¿La clonación d el DNA ofrecía un m étodo general para pu rificar y estudiar cualquier se cuencia de DNA? La clonación de DNA exige la amplificación selectiva de un componente específico de DNA (el DNA blanco) que ocurre den tro de una población de DNA inicial grande y compleja, que pue de ser el DNA genómico total dentro de un tejido particular (o el tipo de célula) o DNA co m p lem en ta rio (cDNA) preparado a par tir del RNA total de un tejido particular. La amplificación se logra mediante una polimerasa de DNA y puede llevarse a cabo in vitro o dentro de las células.

Clonación del DNA in vitro En este caso se selecciona el DNA blanco deseado mediante ceba dores (oligonucleótidos iniciadores) que se enlazan de modo espe cífico a esta secuencia. Una vez que se enlazan al blanco los P oblación d e D N A com plejo,! p. ej., D N A genóm ico total, cD N A total d e tejido, etc.

A m p lific a c ió n espe cífica (clonación d e DNA)

C lo n a c ió n d e DNA basada en cé lu la s

..................................... 1. C élu la h u é sp e d a p ro p ia d a 2. R ep licó n 3. M e d io s d e fijació n d e D N A e x tra ñ o al rep licó n y tra n s fe re n c ia a la c é lu la h u é sp e d

M é to d o s g e n e ra le s p a ra e s tu d ia r s e c u e n c ia s d e D N A e s p e c ífic a s

D e te c c ió n e s p e c ífic a

M é to d o s

H ib rid a c ió n m o le c u la r

1. S o n d a m a rc a d a de DNA o RNA

1. P o lim e ra s a d e D N A te rm o e s ta b le 2. L a in fo rm ació n d e s e c u e n c ia p e rm ite la síntesis d e c e b a d o re s o lig o n u c leó tid o s e s p ec ífic o s

R eq u e rim ie n to s es e n c ia le s

Fig. 5-1. Métodos generales para el estudio de secuencias específicas de DNA en poblaciones de DNA complejas.

2. M edios para d etectar fragm entos a los que se en laza la sonda

5-2

1

aradores específicos de secuencia, una polimerasa de DNA ter- -estable puede crear copias adicionales de la secuencia objetivo. Las nuevas copias del DNA blanco sirven a su vez como plantillas rara elaborar más copias aún en una rea cció n en ca d en a que se de- : —úna reacción en cadena de la polimerasa (PCR, por sus siglas — inglés).

I : nación del DNA basada en células Se rijan las moléculas blanco de DNA a un tipo aislado de molécu¡ de replicón (que es capaz de replicar DNA d e manera indepenlum te dentro de una célula huésped adecuada) y se transfieren a células huésped apropiadas. De manera típica, las moléculas híbri1^5 de blanco y replicón llevan a cabo muchas rondas de replica_ de DNA (a m p lifica ció n d e DNA), después de las cuales rueden separarse las moléculas de DNA blanco amplificadas de o:ro contenido celular y asimismo de las moléculas del replicón. La clave para la clonación del DNA basado en células es que, cuando se transfieren las diferentes moléculas de blanco-replicón a las células tra n sform a ción ), cada célula sólo capta un tipo de molécula de DNA blanco-replicón y de esa manera todos los descendientes d e la cé lula contienen exactamente e l mismo tipo de moléculas blanco (clon a s d e DNA). Al desarrollar un gran número de células a partir de una colonia celular aislada es posible preparar poblaciones puras del DNA blanco deseado.

PCR: c a ra c te rís tic a s y aplicaciones básicas La PCR revolucionó la genética molecular al permitir la clonación y análisis rápidos de DNA. Desde los primeros informes que descri bieron esta nueva tecnología a mediados de la década de 1980 se utilizó en múltiples aplicaciones en investigación básica y clínica.

5.2.1 Principios de la PCR básica y la PCR de transcriptasa inversa (TI) Selección del ácido nucleico de inicio Por lo general, la PCR está diseñada para permitir la amplificación selectiva de una(s) secuencia(s) específica(s) de DNA blanco dentro de un conjunto heterogéneo de secuencias de DNA. Con frecuen cia, el DNA de inicio es DNA genómico total de un tejido particu lar o células cultivadas, en cuyo caso el DNA blanco es casi siempre una fracción minúscula del DNA de inicio. Por ejemplo, si se tiene la intención de amplificar el gen de globina (i de 1.6 kb del DNA humano (el tamaño del genoma haploide es de 3 300 Mb), la rela ción blanco:DNA de inicio es 1.6 kb:3 300 Mb o 1:2 000 000. Muchas PCR incluyen la amplificación de blancos incluso más pe queños, como exones aislados con 140 pb en promedio, y por con siguiente representan menos de 0.000005% de una población de inicio del DNA genómico humano. En el caso de secuencias blanco de DNA codificante, muchas veces el DNA de inicio puede ser cDNA total preparado al aislar RNA de un tejido o una línea celular adecuados y convertirlo a continuación en DNA con la enzima transcriptasa inversa (PCRTI). Según sea la extensión a la cual se expresa la secuencia blanco como transcritos en la población original de RNA, puede haber un enriquecimiento considerable de la secuencia blanco (cuando se compara con su representación en el DNA genómico). Sin embar

PCR: CARACTERÍSTICAS Y APLICACIONES BÁSICAS

j

123

go, bajo condiciones óptimas es posible utilizar en ocasiones la PCR-TI para amplificar secuencias blanco de tejidos en los que só lo hay un nivel de transcripción basal.

Selección de cebadores (oligonucleótidos iniciadores) Con el fin de permitir la amplificación selectiva es necesaria cier ta información previa de la secuencia de DNA de las secuencias blanco. Estos datos se utilizan para diseñar dos cebadores oligonu cleótidos (amplímeros), en condiciones óptimas de unos 18 a 25 nucleótidos de largo, que son específicos para las secuencias que flanquean a la secuencia blanco (es decir, sus secuencias de bases están representadas perfectamente en las secuencias que flanquean la secuencia blanco). En la mayor parte de las PCR, el objetivo es amplificarûna se cuencia de DNA aislada y por lo tanto es importante reducir la po sibilidad de que se enlacen los cebadores en otros sitios del DNA que no sean los deseados. Por consiguiente, es esencial evitar se cuencias repetidas de DNA y en el diseño del cebador es necesario tomar en cuenta varias consideraciones: ► composición de bases. El contenido de GC debe ser de 40 a 60% con una distribución uniforme de los cuatro nucleótidos. ► temperatura de fusión ( Tm; véase sección 6 .2.1 para su defini ción). Los valores de Tm calculados para los dos cebadores usa dos juntos no debe variar > 5°C y la Tm del producto de amplificación no diferir de las de los cebadores > 10°C. ► secuencias terminales 3'. La secuencia 3' de un cebador no de be ser una secuencia complementaria de ninguna región del otro cebador en la misma reacción. Nota: es crítica la compa tibilidad de bases correcta en el extremo 3' del cebador y pue de emplearse para asegurar que incluso es posible amplificar un alelo específico pero no otros, lo que proporciona la base de la PCR esp ecífica d e a lelo (véase recuadro 5-1). ► secuencias autocomplementarias. Deben evitarse repeticiones in vertidas o cualquier secuencia autocomplementaria > 3 pb de largo. El diseño del cebador se facilita mediante programas comercia les de computación y otros sin costo, como los disponibles en http://www.hgmp.mrc.ac.uk/GenomeWeb/nucprimer.html

Naturaleza cíclica y amplificación exponencial La PCR consiste en una serie de ciclos de tres reacciones sucesivas: ► desn atu ra liz ación , que se ajusta a una temperatura de 93 a 95°C para el DNA genómico humano. ► tem p la m ien to d e l ceb a d o r (annealing), a temperaturas casi siempre de 50 a 70°C de acuerdo con la temperatura d e fusión del dúplex esperado (por lo regular la temperatura de templa do se ajusta a unos 5°C menos respecto de la temperatura de fusión calculada). ► sín tesis d e DNA, de manera característica alrededor de 70 a 75°C. La polimerasa de DNA empleada es termoestable (necesi ta alargarse con eficiencia a 70 a 75°C y no debe afectarse de forma adversa por los pasos de la desnaturalización). Cuando existen una polimerasa de DNA termoestable y precursores de DNA adecuados (los cuatro trifosfatos de desoxinucleósido, dATP, dCTP, dGTP y dTTP), los cebadores inician la síntesis de nuevas cadenas de DNA que son complementarias a las cadenas de DNA individuales del segmento de DNA blanco.

124 | CAPÍTULO CINCO

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

► PCR específica de alelo. Se designó para am plificar una secuencia de DNA al tiempo que excluye la posibilidad de am plificar otros ale los. Se basa en la necesidad de una compatibilidad precisa de bases entre el extremo 3 ' de un cebador de PCR y el DNA blanco. Véase la figura 5-4. ► PCR-ftlu. Es un método de PCR en el que se usa un cebador especí fico para la repetición Alu, una secuencia que ocurre alrededor de una vez cada 3 kb en el DNA humano. Cuando las repeticiones Alu conti guas están orientadas en direcciones opuestas, un tipo aislado de ce bador Alu puede amplificar la secuencia intermedia (p. e¡„ cebadores A o B en la figura A de este recuadro). ► PCR anclada. Emplea un cebador específico de secuencia y un ceba dor universal para amplificar secuencias adyacentes a una secuencia conocida. El cebador universal reconoce y se enlaza a una secuencia común que se añade de modo artificial a todas las moléculas de DNA diferentes en la población de inicio, por ejemplo con la fijación covalente de un enlazador oligonucleótido de cadena doble.* ► PCR de exhibición diferencial. Una forma de PCR-TI para comparar poblaciones de mRNA expresadas de dos fuentes relacionadas de cé lulas a fin de captar genes que se expresan de form a diferencial (véa se fig. 7-16). ► PCR-DOP (PCR con cebador oligonucleótido degenerado). Se em plean de forma parcial cebadores oligonucleótidos degenerados (grupos de secuencias oligonucleótidas que se sintetizan en paralelo para que tengan la mism a base en ciertas posiciones de nucleótidos, en tanto que difieren en otras) para amplificar una variedad de DNA blancos relacionados. ► PCR de inicio por calor. Es un medio para incrementar la especifici dad de una reacción en cadena de la polimerasa (PCR). El mezclado de todos los reactivos de la PCR antes de un paso Inicial de desnatu ralización por calor ofrece más oportunidades para el enlace inespecífico de secuencias cebadoras. Con el fin de reducir esta posibilidad, se separan de form a física uno o más componentes de la PCR hasta el primer paso de desnaturalización. ► PCR inversa. Otra forma de acceso al DNA inmediatamente adyacen te a una secuencia conocida (véase PCR anclada). En este caso se digiere la población de DNA de inicio con una nucleasa de restricción, se diluye a una concentración baja de DNA y a continuación se trata con ligasa de DNA para fomentar la formación de moléculas de DNA circular mediante ligadura intramolecular. Los cebadores de la PCR se colocan de tal manera que se unen a una secuencia de DNA conoci da y en seguida inician la síntesis del nuevo DNA en una dirección que se aleja de la secuencia conocida y hacia la secuencia descono cida adyacente, lo que posibilita la amplificación de esta última. Véa se la figura B de este recuadro (X y Y son secuencias no caracterizadas que flanquean una secuencia conocida). ► PCR de rescate de Islote. Es un método especializado para amplifi car secuencias en islotes CpG. ► PCR con cebador enlazador (PCR con adaptador de ligadura). Se trata de una form a de am plificación indiscrim inada. Se digiere un compiejo de DNA de inicio con una nucleasa de restricción para producir múltiples tipos de fragmentos con el m ism o tipo de extre mo saliente. Se liga a los fragmentos un enlazador oligonucleótido de doble cadena* de secuencia conocida y con extremos salientes

similares. A continuación se lleva a cabo la PCR con cebadores que son específicos para las secuencias enlazadoras a fin de am plificar todos los fragmentos del DNA fuente flanqueados por moléculas en lazadoras. ► PCR con cebador anidado. Es una forma de incrementar la especifi cidad de la reacción en cadena de la polimerasa (PCR). Se diluyen los productos de una reacción de amplificación inicial y se emplean co mo fuente de DNA de inicio para una segunda reacción en la que se usa un grupo de cebadores diferentes, que corresponde a secuencias localizadas próximas, pero internas, a las empleadas en la primera reacción. ► PCR cuantitativa. Véase PCR de tiempo real. ► PCR-RACE. Es una forma de PCR con cebador anclado (véase an tes) para la amplificación rápida de extremos de cDNA (del inglés rapid am plificaron of cDNA ends) (véase fig. 7-12).

\

► PCR de tiempo real. Es una variante de la PCR cuantitativa en la que se usa un aparato termociclador de detección de fluorescencia para amplificar secuencias específicas de ácido nucleico y medir de ma nera simultánea sus concentraciones. Tiene dos aplicaciones princi- j pales en investigación: a) cuantificar la expresión génica (y confirmar la expresión diferencial de genes detectados mediante análisis de hi bridación de microarreglo); y b) seleccionar mutaciones y polim orfismos de nucleótido único. En laboratorios analíticos también se practica para medir la abundancia de secuencias de DNA o RNA en muestras clínicas e industriales. ► PCR-TI (PCR de transcriptasa inversa, del inglés reverse transcriptase). PCR en la que la población de inicio es mRNA y en la que se requiere un paso de transcriptasa inversa inicial para producir cDNA.

¡

j

► PCR touch-down. Es un medio para incrementar la especificidad de una reacción en cadena de la polimerasa (PCR). Puede programarse la mayor parte de los cicladores térm icos para que efectúen cur sos en los que se disminuye de manera gradual la temperatura de templado (annealing) durante el ciclo de PCR, desde un valor inicial mayor al Tm esperado hasta un valor menor de Tm. Al conservar muy alta de form a inicial la rigidez de hibridación, se evita la form ación de productos falsos y ello posibilita que predomine la secuencia es perada, ► PCR de genoma total. PCR indiscriminada en la que se emplean en extenso cebadores degenerados o se fijan enlazadores de oligonu cleótido a una población de DNA complejo y a continuación se utili zan cebadores oligonucleótidos específicos de enlazador para amplificar todas las secuencias. *N ota: se prepara un enlazador (adaptador) oligonucleótido de doble cadena al diseñar dos oligonucleótidos con secuencias complementarías. Los dos oligonucleótidos se sintetizan por medios químicos en reacciones separadas y una vez que se purifican se permite que formen pares de bases entre sí a fin de producir la secuencia de doble cadena deseada. Los enlazadores oligonucleótidos se ligan (enlazan) a una se cuencia de DNA con objeto de permitir: a) la PCR mediante un oligonu cleótido específico para un enlazador; o b) la adición de características convenientes, por ejemplo sitios de restricción para contribuir a la clona ción (véase fig. 5-10). Se insertan de rutina en vectores de clonación polienlazadores complejos que contienen varios sitios de restricción (véase sección 5.3.5).

f

5.2 i PCR: CARACTERÍSTICAS Y APLICACIONES BÁSICAS

125

Recuadro 5-1. (c o n tin u a ció n ) A)

B)

C eb a d o r B

C ebador A

R epetición Alu

DNA conocido

_______ I

(i) Digerir con nucleasa de restricción en ( r ) (ii) Circularizar m ediante ligasa de DNA (iii) Desnaturalizar, tem plar (anneaí) cebadores —> PCR

/-v 3 J L ,

1 —

X

I

A) PCR-Alu

B) PCR inversa

La orientación de los cebadores se elige de modo deliberado de tal manera que la dirección de la síntesis de la nueva cadena ocurra a partir de un cebador y se dirija hacia el sitio de unión del otro ce bador. Como resultado, las cadenas recién sintetizadas pueden ser vir a su vez como plantillas para la síntesis del nuevo DNA, lo que da lugar a una reacción en cadena con un incremento exponencial del producto (fig. 5-2). La necesidad de contar con una enzima termoestable llevó a los investigadores a aislar polimerasas de DNA de microorganismos cuvos hábitat naturales son las aguas termales. Un ejemplo inicial que se utiliza con amplitud fue la polimerasa Taq que se obtiene de Thermus aquaticus y es termoestable hasta 94°C, con una temperatura óptima de trabajo de 80°C. Sin embargo, la polimerasa Taq carece de una actividad de exonucleasa 3/_>5' adjunta para proporcionar una fu n ció n d e lectu ra d e p r u eb a s y de esa manera comparar los errores de copiado (incorporación de la base errónea) con los que ocurren dentro de las células. Como resultado, en la actualidad se usan con frecuencia enzimas alternativas con^ha actividad de exo nucleasa de lectura de pruebas 3,_>5', comó la polimerasa Pfu de Pyrococcus furiosus (Cline y cois., 1996).

5.2.2 La PCR tiene dos limitaciones importantes: tamaños cortos y elaboración baja de productos Una desventaja evidente de la PCR como método de clonación del DNA es el tamaño limitado de los productos de la amplificación. A diferencia de la clonación de DNA basada en células, en la que el límite superior del tamaño de las secuencias de DNA clonadas

puede aproximarse a 2 Mb, los productos de la PCR publicados tienen entre 0 y 5 kb de tamaño, con frecuencia en el extremo in ferior de esta escala. Aunque suele ser posible amplificar los seg mentos pequeños de DNA mediante PCR, es cada vez más difícil obtener una amplificación eficiente a medida que aumenta la lon gitud del producto deseado. Sin embargo, se han desarrollado pro tocolos de PCR de largo alcance, que proporcionan productos que tienen decenas de kilobases de longitud, como un producto de 42 kb del bacteriófago \ (véase Cheng y cois., 1994). A menudo, las condiciones modificadas incluyen una mezcla de dos tipos de polime rasas termoestables como esfuerzo para proporcionar niveles óptimos de polimerasa de DNA y actividad de exonucleasa de 3'~*5' que sir ve como un mecanismo de lectura de pruebas. También es una limitación la cantidad de material que puede clonarse en una reacción de PCR aislada, además de que requiere tiempo y es costoso repetir la misma reacción de PCR muchas ve ces con el fin de obtener grandes cantidades del DNA deseado. De igual modo, es posible que el producto de la PCR no se encuentre en una forma adecuada que permita ciertos estudios subsecuentes. Como resultado, muchas veces es conveniente clonar el producto de la PCR en un sistema de clonación basado en células para con seguir grandes cantidades de DNA y permitir una diversidad de análisis. Se usan varios sistemas de clonación en plásmidos para propagar el DNA clonado mediante PCR en células bacterianas. Una vez que se clona, puede cortarse y eliminarse el inserto mediante nucleasas de restricción apropiadas y transferirse a otros plásmidos que pueden te ner usos especializados para posibilitar la expresión que se confiere a un producto de RNA o proporcionar grandes cantidades de una pro teína. Varias polimerasas termoestables, incluida la polimerasa Taq,

126

CAPÍTULO CINCO

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

Sitio d e en lac e del c e b a d o r

5 ': 3 '-

Sitio d e en la c e del c e b a d o r B lanco S ec u en cia

i

D es n atu ralizació n p o r ca lo r

J

P erm ite te m p la r (anneal) ce b ad o res

Síntesis d e D N A

P ro d u cto p red o m in an te p o r in crem en to ex p o n en c ia l del núm ero d e co p ias

Fig. 5-2. La PCR es un método in vitro para amplificar secuencias de DNA mediante cebadores oligonucleótidos definidos. Después de identificar una secuencia por amplificar (la secuencia blanco), se diseñan cebadores oligonucleótidos para que sean complementarios de las secuencias de DNA localizadas en cadenas de DNA opuestas y a los lados de la secuencia blanco. La PCR consiste en ciclos de desnaturalización, tem plado (annealing) de cebadores y luego síntesis de DNA en la que se Incorporan los cebadores en las cadenas de DNA recién sintetizadas. El primer ciclo tiene como resultado dos cadenas de DNA nuevas (N) cuyos extremos 5 ' están fijos a la posición del cebador oligonucleótido, pero cuyos extremos 3 ' son variables (se indica con líneas punteadas). Después del segundo ciclo, las cuatro cadenas nuevas consisten en dos productos con extremos 3 ' varia bles, al igual que en el primer ciclo, aunque ahora dos cadenas de longitud fija (ambas con extremos 5 ' y 3 ') definidas por las secuencias del cebador. Después del tercer ciclo, seis de las ocho cadenas nuevas tienen la longitud fija deseada y después de unos 30 ciclos hay un incremento masivo (amplifi cación) de este tipo de producto.

5 . 2 I PCR: CARACTERISTICAS Y APLICACIONES BÁSICAS } 127

tienen actividad de transferasa de desoxinucleotidilo terminal que modifica de modo selectivo fragmentos generados mediante PCR al añadir un nucleótido aislado, por lo general adenina, a los extremos 3' de los fragmentos de DNA amplificados. Los extremos salientes resultantes pueden dificultar la clonación de los productos de la PCR y suelen utilizarse varios métodos para facilitar la clonación, que incluyen el uso de vectores con residuos T salientes en su sitio de clonación polienlazador (fig. 5-3) y el em pleo de enzimas de “pulimiento” como la polimerasa T4 o la polimerasa Pfu que pueden eliminar los nucleótidos aislados salientes. De manera alternativa, pueden modificarse los cebadores de la PCR si se diseña una extensión aproximada de 10 nucleótidos que contiene un sitio de restricción apropiado en el extremo 5'. La ex tensión del nucleótido no forma pares de bases con el DNA blan co durante la amplificación, pero con posterioridad puede digerirse el producto amplificado con la enzima de restricción adecuada a fin de generar extremos salientes para clonación dentro de un vector apropiado (véase sección 5.5.3).

lada (Li y cois., 1988)—. Se han hallado varias aplicaciones en diagnósticos, análisis de enlace genético (incluida la tipifica ción de espermatozoos únicos) y ciencia forense (es posible ti pificar mediante PCR rastros de tejidos dejados por un individuo -como un cabello aislado o células de piel descarta das- con marcadores de DNA muy polimórficos para identifi car al sujeto de origen). ► Es muy vigorosa y con frecuencia es posible amplificar DNA de tejidos o células que están mal degradados o incluidos en algún medio que dificulta aislar el DNA con los métodos es tándar. Asimismo, pueden amplificarse secuencias cortas de cantidades pequeñas de DNA degradado extraídas de tejidos descompuestos en sitios arqueológicos/históricos y es posible tener éxito en la amplificación mediante PCR de muestras de tejidos fijados en formalina (con ventajas notorias para la patología molecular y, en algunos casos, estudios genéticos de enlace). Las múltiples aplicaciones de la PCR y la necesidad de optimizar su eficiencia y especificidad llevaron a idear una gran variedad de mé todos de PCR (recuadro 5-1). Debido a la crucial importancia de la especificidad del cebador, se utilizan por lo regular varias modi ficaciones a fin de reducir las posibilidades de enlace de un cebador inespecífico (p. ej., PCR hot-start, cebadores anidados, PCR touch down 5 véase recuadro 5 - 1). La dependencia esencial del pareamiento de bases correcto en el extremo 3’ de cebadores enlazados permitió desarrollar métodos que hacen posible distinguir entre alelos que difieren tan sólo en un

5.2.3 Aplicaciones generales de la PCR Debido a su sencillez, la PCR es una técnica difundida con una gran variedad de aplicaciones que dependen en esencia de tres ven tajas principales del método: ► Muy rápido y fácil de practicar. ► Muy sensible y con la posibilidad de amplificar cantidades di minutas de DNA blanco -incluido el DNA de una célula ais

5 '-----------------------------------3' 3 '-----------------------------------5'

I

A c tiv id a d d e tra n s fe ra s a d e d e s o x in u c le o tid ilo term in al d e p o lim e ra s a te rm o e s ta b le

5' ----------------------------------- a 3' 3'A----------------------------------- 5' P ro d u c to d e P C R c o n s a lie n te A C lo n a c io n T -fi

^

—

T ra ta m ie n to co n e n zim a p a ra “p u lim ie n to ”

Fig. 5-3. Clonación de productos de la PCR en células bacterianas Con frecuencia, los productos de la PCR tienen una saliente de adenosina en sus extremos 3 ' (véase texto). El sistema de clonación T-A posee un siste ma polienlazador con salientes de timina complementarias para facilitar la clonación. Una alternativa es recortar de nueva cuenta la saliente de adenina con una enzima “ pulidora" apropiada que deja el fragmento con un extremo romo.

128

CAPÍTULO CINCO

1

5

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

10

R e g ió n c o n s e rv a d a

15

. .7777777777.^/eio

1

..........................................A le lo 2 D is e ñ o d e c e b a d o re s e s p e c ífic o s d e a le lo (n u c le ó tid o s 1 -1 7 )

I 1

5

10

15

5'

£ > 3 - C e b a d o r e s p e c ífic o d e a le lo 1 (A S P 1) 1

5

10

15

fe > 3 ' C e b a d o r e s p e c ífic o d e a le lo 2 (A S P 2)

5'

l

P C R con ASP1 o A S P 2 + ce b ad o r c o n s e rv a d o (C O N )

DNA del alelo 1 5 '.

i 3'

n n i. CON

A SP1

5

f e pero ASP2

55 7 N o a m p lific a c ió n

3' =

DNA del alelo 2

CON ASP2

f e p e ro _ASP1 3 'c

N o a m p lific a c ió n

Fig. 5-4. La PCR específica de alelo mediante el sistema ARMS depende del pareamiento de bases perfecto del extremo 3' nucleótido de los cebadores. Los cebadores oligonucleótidos específicos de alelo ASP1 y ASP2 están diseñados para que sean idénticos a la secuencia de los dos alelos sobre una región precedente a la posición del nucleótido variable, hasta este último y con término en él mismo. El ASP1 enlaza a la perfección la cadena comple mentaria de la secuencia del alelo 1 y ello hace posible la amplificación con el cebador conservado. Sin embargo, la terminal C 3 ' del cebador ASP2 es incompatible con la T de la secuencia del alelo 1, lo que imposibilita la amplificación. De igual forma, ASP2 puede enlazarse de forma perfecta al alelo 2 e iniciar la amplificación, a diferencia de ASP1.

nucleótido (PCR específica de alelo). En el difundido ARMS (sis tem a d e m u ta ción refra cta rio a la a m p lifica ción ), los cebadores se preparan con sus nucleótidos en el extremo 3 ' diseñados para formar pares de bases con el nucleótido variable que distingue los dos alelos y con la secuencia restante del cebador diseñada para complementar a la secuencia inmediatamente adyacente al nucleó tido variable. Bajo condiciones experimentales adecuadas, no se lle va a cabo la amplificación en donde el nucleótido del extremo 3' no forma perfectamente pares de bases y se distinguen en conse cuencia los dos alelos (fig. 5-4).

5.2.4 Algunas PCR se diseñaron para permitir múltiples productos de amplificación y amplificar secuencias no caracterizadas con anterioridad Las reacciones estándar de PCR/PCR-TI se basan en la necesidad del enlace del cebador muy específica a fin de permitir la amplifi cación selectiva de una secuencia blanco conocida deseada. Sin em bargo, en ocasiones es conveniente diseñar las PCR para amplificar secuencias de DNA en las que no existe información previa sobre la secuencia o es limitada.

5.3

PRINCIPIOS DE -------LA CLONACIÓN DEL DNA BASADA EN CÉLULAS I-----129 ---------------------------- ---- ----------------- ----------------------------------i

Amplificación de nuevos miembros de una familia de DNA nediante PCR-DOP

Uso de una secuencia conocida para amplificar una secuencia de DNA cercana no caracterizada

Algunas veces es posible clonar secuencias de DNA no caracteriza das antes mediante la PCR si se trata de miembros de una familia génica o de DNA repetido de los cuales se caracterizó ya cuando menos uno de ellos. Por ejemplo, se aislaron por primera vez mu chos miembros nuevos de la familia del gen de mamíferos Wnt des pués de observar que los productos de los primeros genes Wnt tenían secuencias de aminoácidos muy similares dentro de un do minio particular conservado. Esto hizo posible diseñar cebadores para esta secuencia basada en oligo n u cleótid os d egen era d os, con una mezcla en cada caso de diferentes oligonucleótidos que represen tan varios cambios de aminoácidos. La PCR ceb a d a co n oligon u cleótid o d egen era d o {PCR-DOP, por sus siglas en inglés) posibilita amplificar al mismo tiempo una diversidad de distintos genes, pero relacionados muy de cerca, incluidos genes nuevos, y a continuación fraccionarlos y purificarlos mediante clonación de DNA basada en células.

Se han ideado varias modificaciones ingeniosas con la finalidad de progresar de una secuencia de DNA de inicio conocida a una se cuencia contigua no caracterizada, sea en DNA genómico o en cDNA. En los ejemplos se incluyen PCR an clada , PCR inversa, RACE-PCR (recuadro 5-1).

Amplificación indiscriminada Si la fuente de DNA es de gran valor y tiene cantidades muy limi tadas, es posible emplear la PCR para amplificar todo el DNA me diante oligonucleótidos enlazadores de doble cadena unidos de manera covalente a las extremidades de todas las secuencias de DNA en la población de inicio. Para preparar los oligonucleótidos enlaza dores se sintetizan de manera individual dos oligodesoxirribonucleótidos diseñados para complementarse en su secuencia y ser capaces de realizar un pareamiento de bases para formar una secuen cia de DNA de doble cadena con un extremo saliente. Se digiere el DNA por amplificar con una nucleasa de restricción que produce extremos salientes similares, de tal forma que puedan unirse en sen tido covalente los enlazadores (ligarse). Los cebadores específicos de enlazador posibilitan la amplificación de moléculas de DNA blanco con enlazadores en ambos extremos. Como resultado, es posible am plificar de modo simultáneo todas las secuencias de DNA en una se cuencia iniciadora, lo que permite a m p lifica r tod o e l gen o m a en el caso del DNA genómico. Un método alternativo consiste en usar de forma extensa oligonucleótidos degenerados como cebadores de tal suerte que puedan enlazarse los cebadores a muchísimos sitios de enlace.

5 .3

Principios de la clonación del DNA basada en células

5.3.1 Generalidades de la clonación del DNA basada en células La clonación del DNA basada en células se desarrolló por prime ra vez al inicio de la década de 1970. Fue posible por el descu brimiento de endonucleasas de restricción tip o II, que son enzimas bacterianas capaces de cortar DNA en todos los sitios que contienen una secuencia de reconocimiento específica y pe queña, por lo general de 4 a 8 pb de largo. En condiciones nor males, estas enzimas sirven para proteger a las bacterias de bacteriófagos invasores al seccionar de forma selectiva el DNA extraño (véase recuadro 5-2 y la sección siguiente). La enorme ventaja que ofrecieron a los genetistas moleculares fue la de dis poner de un medio para cortar DNA en fragmentos definidos que pudieran unirse con facilidad a otros fragmentos de DNA cortados de manera similar. La esencia de la clonación del DNA basada en células es el uso de nucleasas de restricción para cortar moléculas de DNA en una población de DNA iniciador {DNA blanco) en piezas de tamaño manejable y a continuación unirlas a un replicón (cualquier se cuencia capaz de replicar DNA de manera independiente) y trans ferir las moléculas híbridas resultantes {DNA recom b in a n te) en una célula huésped apropiada que a continuación prolifera por di visión celular. Debido a que el replicón puede replicarse dentro de las células (con frecuencia hasta grandes números de copias), al igual que el DNA blanco unido, el resultado es una forma de am plificación de DNA basada en células. En la clonación de DNA basada en células hay cuatro pasos esenciales (véase fig. 5-5):

Recuadro 5-2. Endonucleasas de restricción y sistem as de modificación y restricción Los bacteriófagos que se liberan de una bacteria de una cepa particular pueden Infectar a otras bacterias de la misma cepa, pera no a las de una cepa diferente. Eso se debe a que el DNA del fago tiene el mism o patrón de modificación que el DNA de las cepas bacterianas que puede infectar; el fago se “restringe” a esa cepa de bacterias. La restricción es absoluta: algunos fagos pueden escapar a la restricción y adquirir el patrón de m o dificación del nuevo huésped. En la actualidad se sabe que la base de los sistemas de modificación y restricción incluyen dos tipos de actividad enzimática: ► Una actividad de metiiasa de DNA específica de secuencia proporcio na la base del patrón de modificación. /

► El fenómeno de restricción se basa en una actividad de endonucleasa de restricción específica de secuencia: corta DNA del fago cuyo patrón de metílación es diferente al DNA de la célula huésped. La cepa bacteriana posee una actividad de metiiasa de DNA con la m is ma especificidad de secuencia que la actividad de la nucleasa de restric ción correspondiente. Como resultado, las endonucleasas de restricción celulares no cortan el DNA de la célula huésped metilado de manera apro piada, pero pueden cortar el DNA del fago que ingresa sí no está metila do de modo adecuado. Nota: algunos plásmidos y bacteriófagos poseen genes para sistemas de modificación y restricción y pueden conferir esta especificidad a una cé lula huésped.

130 [ CAPÍTULO CINCO

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

5,3.2 Las endonucleasas de restricción permitieron cortar DNA blanco en piezas manejables que pueden unirse a moléculas vectoras cortadas de manera similar

► creación de moléculas de DNA recombinante. De forma tí pica, se producen fragmentos de DNA de tamaño apropiado al cortar con una nucleasa de restricción seguida de la unión covalente (ligadura) de los fragmentos de DNA blanco a un tipo único de molécula de replicón . La creación de DNA recombi nante se facilita si se asegura que el DNA blanco y las molécu las de replicón se corten mediante nucleasas de restricción, que producen los mismos tipos de extremo antes de unir los frag mentos de DNA blanco a las moléculas de replicón mediante la enzima ligasa de DNA;

Nucleasas de restricción tipo II En condiciones normales, las secuencias de reconocimiento de la inmensa mayoría de las endonucleasas de restricción tipo II son palíndromes (la secuencia de bases es igual en ambas cadenas cuan do se lee en la dirección 5'~*3', como resultado de un eje de simetría doble). Según sea la localización de los sitios de corte pro ducidos mediante una nucleasa de restricción, los fragmentos de re str icció n resultantes pu ed en tener;

► transformación. Las moléculas de DNA recombinante se transfieren a células huésped (a menudo células bacterianas o de levadura) en las que el replicón elegido puede replicar el DNA sin importar cuál sea el(Ios) cromosoma(s) de la célu la huésped. Los replicones empleados en clonación celular suelen denominarse moléculas vectoras porque ayudan a transportar las moléculas blanco pasajeras hacia el interior de las células y a continuación ayudan a que se repliquen den tro de ellas;

► extremos romos (los puntos de corte ocurren exactamente en el eje de simetría). ► extremos salientes (los puntos de corte no se encuentran en el eje de simetría, de tal manera que los fragmentos de restricción resul tantes poseen las llamados sa lien tes 5' o 3' (véase cuadro 5-1). Nota: los dos extremos salientes de cada fragmento son comple mentarios en su secuencia de bases y muestran la tendencia a vincularse entre sí (o con cualquier otra saliente similar comple mentaria) para formar pares de bases. Como resultado de su pro pensión a adherirse a otros extremos del mismo tipo, los extremos salientes de este tipo se conocen como extremos pegajosos.

► propagación selectiva de clonas celulares que incluye dos etapas. Al inicio, se siembran las células transformadas en placas y se las disemina en una superficie de agar con el fin de promover el crecimiento de colonias de células bien sepa radas. Todas las células en una colonia aislada son idénticas (ya que descienden sólo de una célula) y se describen como clonas celulares. De manera subsecuente, pueden tomarse de una placa colonias individuales y dejar que las células lleven a cabo una segunda etapa de crecimiento en cultivo líquido;

Las nucleasas de restricción tipo II ofrecieron dos grandes ventajas para la clonación y el análisis de DNA: ► un gru p o d efin id o d e fr a g m en to s d e DNA d e in icio. Cuando se aísla DNA de tejidos y células cultivados, el desempacamien to de moléculas de DNA voluminosas y el corte por desgarro fí sico inevitable dan por resultado poblaciones heterogéneas de

► aislamiento de clonas de DNA recombinante al reunir culti vos celulares expandidos y aislar de manera selectiva el DNA recombinante.

Ejemplos de endonucleasas de restricción de uso común (véase asimismo cuadro 6-3 para los cortadores raros). Enzima

Fuente

Corte de secuencia; N = A, C, G o T

Fragmentos de restricción con los extremos siguientes

Produce extrem os romos Alul

Arthrobacter luteus

a ag c t

5 ’ C T-----------------A G 3' 3' G A ---------- -TC 5'

T tC G Produce salientes 5’ EcoRI

Factor

Producen Pstl

Providencia stuartii

R de Escherichia coli

a

A A T TC CTTAtAG

5 ' A A T T C ----------- G 3' 3' G---------------- C T T A A 5 '

C T G C AA G A CGT C

3'

c c t c n n n n n n

4n GGAGNNNNNtNN

5' ~~------------ C C T C N N N N N N N 3 ' 3' N— ■.............. G G A G N N N N N N 5'

CCANNNN'VlNTGG G G T tN N N N N N A C C

5' N T G G— C C A N N N N N 3 ' 3 ' N N N N N A C C --G G T N

tG

5 ' g ---------------- C C---------------- G 5 '

3'

Reconoce ¡ecuencia no palindrómica M nl 1

Moraxella nonliquefaciens

Reconoce secuencia de reconocimiento bipartita BstXI

Nota: en condiciones normales, los nombres derivan de la primera letra del género y las dos primeras letras del nombre de la especie, por ejemplo Pstl es la primera nucleasa de restricción que se aisló de Providencia stuartir, véase http://rebase.neb.com/rebase/rebase.html para la base de datos REBA SE de nucleasas de restricción.

5.3

PRINCIPIOS DE LA CLONACIÓN DEL DNA BASADA EN CÉLULAS

131

OR

R e p lic o n e s h o m o g é n e o s (m o lé c u la s v e c to ra s ; O R = o rig e n d e re p lic a c ió n )

e tc . P o b la c ió n d e D N A c o m p le jo (b la n c o )

(C o lig a d u ra ) D N A re c o m b in a n te

B) < g j|> 1 - O R

< ^ 2 -° R

(1 -O R ) (2 -O R )

.

=

< g & 3 -O R

D N A c ro m o s o m ic o

(3 -O R ) D N A r e c o m b in a n te

_

_£o 1 -° R S ^ 3 -O R

C é lu la s h u é s p e d

(C o tra n s fo rm a c ió n ) T ra n s fo r m a d o r e s

C)

A m p lific a c ió n p rim a ria

< g jjg 1 -O R

< ^ j|> 1 -O R 1 -O R

S*.

S e m b r a d o e n p la c a d e a g a r n u trie n te

's * .

;

O b te n e r c o lo n ia s y p e rm itir el c r e c im ie n to a d ic io n a l en c u ltiv o líq u id o

^ ^ 1 -OR

A m p lific a c ió n s e c u n d a r ia

* < ^ 1 -OR e tc . C o lo n ia d e clo n as c e lu la re s id é n tic a s

D) > 1 -O R

> 1 -O R

P u rific a c ió n d e D N A re c o m b in a n te >

> 1 -O R

>1 -O R

C lo n a s d e D N A r e c o m b in a n te

Fig. 5-5. Los cuatro pasos esenciales para la clonación de DNA basada en células. A) Formación de DNA recombinante. Obsérvese que, además de los productos simples vector-ligadura del blanco, pueden ocurrir fenómenos de coli gadura por los cuales pueden ligarse en un mism o producto dos secuencias de DNA blanco no relacionadas (p. ej., secuencias 1 más 2 en el ejemplo de la parte inferior). OR, origen de la replicación. B) Transformación. Éste es un paso fundamental en la clonación de DNA porque en condiciones nor males las células sólo captan una molécula de DNA extraño. Sin embargo, obsérvese que algunas veces se presentan fenómenos de cotransformación, como las células que se ilustran en la parte inferior, que transforman dos moléculas de DNA diferentes (una molécula recombinante que contiene la se cuencia 1 y una molécula recombinante que posee la secuencia 3). C) Amplificación para producir numerosas clonas celulares. Éste es otro paso fundamental. Después de sembrar en la placa las células transformadas, pueden separarse colonias de clonas individuales en un plato y a continuación tomarse de forma individual y llevarse a un paso secundario de amplificación a fin de asegurar la homogeneidad de la clona. D) Aislamiento de clonas de DNA recombinante.

132

CAPÍTULO CINCO

AMPLIFICACIÓN DEL DNA: CLONACIÓN DE DNA POR PCR Y BASADA EN CÉLULAS

fragmentos de DNA de longitudes aleatorias diferentes. Al usar endonucleasas de restricción es posible convertir estas poblacio nes considerablemente heterogéneas de fragmentos de DNA rotos en grupos á t fra gm en to s d e restricción de longitudes definidas. ► Un m edio p a ra o b ten er d e fo r m a a rtificia l m olécu las d e D N A . Los fragmentos de restricción con los mismos tipos de extremo pegajoso pueden unirse con facilidad entre sí mediante una liga sa d e D N A . Por consiguiente, a fin de elaborar un DNA recombinante podría cortarse la molécula de replicón (v ecto r) y DNA blanco con el mismo tipo de nucleasa de restricción, o bien con nucleasas de restricción que producen los mismos ti pos de extremo pegajoso. Las terminales de fragmentos de restricción que tienen el mismo tipo de extremos salientes pueden relacionarse en una diversidad de diferentes formas, sea de modo /«fmmolecular (ciclización) o entre moléculas para formar concatámeros lineales o moléculas circulares compuestas. Las reacciones intermoleculares ocurren con mayor facilidad cuando las concentraciones de DNA son al

C o rte d e D N A b la n c o co n M b o l

tas. Sin embargo, a concentraciones de DNA muy bajas, las ter minales individuales en diferentes moléculas tienen menos opor tunidad de hacer contacto entre sí y se favorece la ciclización intramolecular. Por lo general, las reacciones de ligadura están diseñadas para promover la formación de DNA recombinante (mediante la ligadura de DNA blanco a DNA vector), aunque también son posibles la ciclización de vector, concatámeros vec tor-vector y la ligadura de DNA blanco con DNA blanco (véase fig. 5-6). Con la finalidad de lograr lo anterior, se tratan las mo léculas vectores de tal modo que se impida o minimice su capa cidad para llevar a cabo la ciclización.

Vectores simples para clonación en células bacterianas Durante la clonación del DNA basada en células, los fragmentos de DNA blanco deben ser capaces de replicarse dentro de las células. Puesto que carecen de un origen funcional de replicación, necesi tan unirse a un replicón (vector) que pueda replicarse dentro de la célula huésped, al margen de sus cromosomas. El vector puede te-

V e c to r d e D N A co n sitio ú n ic o B a /n H I

>GATC

>G ATC <

CTA G <

p. ej., in te rm o le cu la r; c o n c a tá m e ro s 1 > GATC <

2 1 GATC CTAG 1

B am H I

B am HI

M bo \

CTA G <

p. ej., intram olecular, cic liz a c ió n

> CTAG A)

tR N A Glu* (su p re so r á m b a r)

Mutación de un tRNA de glutamina para obtener un supresor ocre O c re

Codón

Glu 5 ' G A A 3'

5' UAA 3'

A n tic o d ó n

3' C U U 5'

3' A U U 5'

I I

I 1

tR N A

| 1

tR N A Glu

(C —>A)

tR N A Glu* (su p re so r ocre)

- ....... ....... 4 , * ^ . .

.. '

.

*7*i

......................... ’....... ”

...

-

■Ufe

Recuadro 5-4. Importancia de los sitios de secuencia m arcados (SSM)

■« Los sitios de secuencia marcados son medios importantes para mapeo porque la presencia de esa secuencia puede valorarse de manera muy conveniente mediante la reacción en cadena de la polimerasa (PCR). Casi ningún SSM es polimórfico y en genomas que se secuenciaron se cono ce con precisión la localización subcromosómica única de cada segmen to de secuencia marcado (SSM). A continuación se muestra un ejemplo de la forma en que se desarrolla el SSM a partir de una secuencia de DNA. En un genoma complejo com o el humano, las posibilidades de enlace de un cebador de 16 nucleótidos de largo a una secuencia relacionada pero diferente, aparte del blanco pretendido, no son insignificantes. Sin embar go, en condiciones normales son muy bajas las posibilidades de que am bos cebadores se enlacen a secuencias relacionadas no pretendidas que tan sólo se encontraban ambas en proximidad cercana y asim ismo en una orientación apropiada. La especificidad de la reacción puede valo rarse de manera sencilla al fraccionar el tamaño de los productos de am plificación en un gel de agarosa. Si existe un producto de PCR po tente, único, del tamaño aproximado esperado (141 pb en el ejemplo anterior), hay una excelente posibilidad de que la valoración sea espe cífica para la secuencia blanco intentada, lo que define el sitio de se cuencia marcado (SSM).

resultado células incoloras en presencia de Xgal, en tanto que las células que contienen el vector no recombinante son azules; ► selecciones basadas en tRNA supresor. Los genes tRNA supresores son mutantes y llevan una secuencia anticodón alte rada complementaria de uno de los codones de terminación normales: UAA (ocre), UAG (ám bar) o UGA (ópalo). En res puesta al codón de detención importante, el tRNA supresor inserta un aminoácido (véase recuadro 5-3). De manera carac-

1 40 5' CCCAGCGGGCCCGCGGCGCAGGGGCCCGGCGGGGCCCTGG CEBADOR A 41 5' CAGTGAGCATCAGATA — * 3' 80 GGCCGCCCGGCAGTGAGCATCAGATACAGAACCTAGACGA

81 120 ACCTAG GACCAGTACCTACAAGGTACT CTAGATGATCTAT

121 160 ACTGAGGATCCTATTCAGATCCTAGGTACCACACTGATTA

161 200 AGGATACTAGCTATACGGACATGGCATTACACCCCCGGGG 3'

•••••••••••••••• 3 5 '

TT

TT

T T T.

L 3 5'

Fig. 6-2. Marcado de DNA mediante síntesis de cadenas de DNA in vitro. A) Traslación de la muesca. La DN-asa I pancreática introduce muescas de cadena única mediante el corte de enlaces (p) fosfodiéster internos y genera un grupo fosfato 5 ' y una terminal hidroxilo 3 '. La adición de la enzima multisubunidad polimerasa I de DNA de E. coli contribuye con dos actividades enzimáticas: a) una exonucleasa 5 ' 3 ' ataca la terminal 5 ' expuesta de una muesca y elimina de modo secuencial nudeótidos en dirección 5 ' -> 3 '; b) una polimerasa de DNA añade nuevos nudeótidos al grupo hidroxilo 39 expuesto, prosigue en la dirección 5' - * 3 ', y en consecuencia reemplaza los nudeótidos eliminados mediante la exonucleasa y origina el desplazamiento lateral (traslación) de la muesca. B) M arcado cebado en form a aleatoria. La subunidad Klenow de polimerasa I de DNA de E. coli puede sintetizar nuevas cadenas de DNA radiomarcadas utilizando como plantilla cadenas de DNA separadas y cebadores exonucleótidos aleatorios.

cadas contienen nudeótidos con un radioisótopo (a menudo 32P, 33P, 35S o 3H), que pueden detectarse de modo específico en solu ción o, con mucho mayor frecuencia, dentro de un espécimen só lido (autorradiografía; véase recuadro 6 - 1). La intensidad de una señal autorradiográfica depende de la in tensidad de la radiación emitida por el radioisótopo y del tiempo de exposición, que a menudo puede ser largo (uno o más días, o aun semanas en algunas aplicaciones). En valoraciones de hibrida ción de ácido nucleico se utiliza mucho 32P porque emite partícu

las |3 de alta energía que proveen un alto grado de sensibilidad de detección. Sin embargo, tiene la desventaja de que es hasta cierto punto inestable (véase cuadro 6 - 1). La energía alta de emisión de partículas beta de 32P puede ser una desventaja en circunstancias en las que se requiere una resolu ción física fina para interpretar imágenes autorradiográficas sin am bigüedad. Por tanto en ciertos procedimientos suelen preferirse radionúclidos que emiten partículas P menos energéticas, por ejemplo, 35S y 33P en la secuenciación de DNA y la hibridación de

6.1 ! PREPARACIÓN DE SONDAS DE ÁCIDO NUCLEICO

161

In icio d e tra n s c rip c ió n c o n S P 6 . ATTTAGGTGACACTATAG.I aMt A C AAGCTT.

_i i_______ i

P ro m o to r S P 6

H /n d lll

S itio d e clo n a c ió n m ú ltip le

I

SP6

orí

am p

-fü —

w sm m m nM -

l AV

L in e a riz a r co n e n z im a d e restricció n d is tal a p ro p ia d a , p. ej., PvuW

p ro In s e rto d e D N A

P o lim e ra s a R N A S P 6 U TP — , CTP, G TP, ATP

In s e rto d e D N A TTT , T T TTTT

J L lim i» T T T T T T ttT t TT T T T T T T tT T T T .

N u m e ro s o s tra n s c rito s d e R N A m a rc a d o s

C lave: T N u c le ó tid o m a rc a d o

Fig. 6-3. Se generan ribosondas (sondas de RNA) por repetición de la transcripción de insertos de DNA clonados en vectores plásmido especializados. El vector plásmido pSP64 contiene una secuencia promotora para polimerasa RNA del fago SP6 enlazada al sitio de clonación múltiple (SCM) además de un origen de replicación (ori) y el gen de resistencia a ampicilina (amp). Después de clonar un fragmento conveniente de DNA en uno de los 11 sitios únicos de restricción de SCM, el DNA recombinante purificado se lineariza mediante un corte con una enzima de restricción en un sitio de restricción único justo distal al DNA insertado (en este ejemplo Pvu II). Luego pueden generarse transcritos de RNA marcados específicos de inserto con el uso de polimerasa de RNA SP6 y una combinación de NTR de los que cuando menos uno está marcado (en este caso UTP).

Principios de la autorradiografía Autorradiografía es un procedimiento para localizar y registrar un com puesto radlomarcado dentro de una muestra sólida, y comprende la pro ducción de una Imagen en una emulsión fotográfica. En las aplicaciones en genética molecular, la muestra sólida a menudo consiste en DNA de tamaño fraccionado o muestras de proteínas embebidas en un gel seco, fijados a la superficie de una membrana de nylon seca o un filtro de nitrocelulosa, o localizados dentro de muestras de cromatina o tejidos fijados en un portaobjetos de vidrio. Las emulsiones fotográficas son cristales de halida argéntica en suspensión en una fase gelatinosa transparente. Después una partícula (3 o un rayo -y emitido por un radionúclido pasa a través de la emulsión, los Iones de Ag+ se convierten en átomos de plata (Ag). La imagen latente resultante puede convertirse luego en otra visible una vez que la imagen se revela, un proceso de amplificación en el que cristales enteros de halida argéntica se reducen para proporcionar plata metálica. El proceso de fijación da por resultado la eliminación de cual quier cristal de halida argéntica no expuesto y produce una imagen autorradiográfica que brinda una representación bidimensional de la dis tribución del radiomarcador en la muestra original.

La autorradiografía directa consiste en colocar la muestra en contacto íntimo con una placa de rayos X, una hoja de plástico con un recubrimien to de emulsión fotográfica; las emisiones radiactivas de la muestra pro ducen áreas oscuras en la placa revelada. Este método es más adecuado para detectar radionúclidos de em isión p de potencia débil a media (p. ej., 3H, 35S, etc.). Sin embargo, no es adecuado para partículas beta de alta energía (p. ej., de 32P): estas emisiones pasan a través de la película y causan el agotamiento de la mayor parte de la energía. La autorradio grafía indirecta es una modificación en la que una sustancia química apropiada (centellador o flúor) convierte en luz la energía emitida. En un método popular se utilizan pantallas de intensificación, hojas de un cen tellador Inorgánico sólido que se colocan atrás de la placa en casos de muestras que emiten radiación de alta energía, como 32P Las emisiones que pasan a través de una emulsión fotográfica son absorbidas por la pantalla y convertidas en luz. La imagen se intensifica si se superpone con efectividad una emisión fotográfica sobre la emisión autorradiográfi ca directa.

162

CAPITULO SE IS

A)

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

t

5 '( P

□ 3' 32

A ' p

- p

C in a s a d e p o lin u c le ó tid o

®

a< p x s x p

) ^

^ 32 H 3'

& =

D N A se lec cio n ad o

B)

D ig e rir co n n u c le a s a d e res tricció n p a ra fo rm a r sa lie n te s 5 ’ (p. ej., E c o R I)

□ G

5' AA TTC C G C

□ CTTAA

3' 5'

P o lim e ra s a D N A K len o w

+

I

dATP — , d T T P TT ---------1 G A A T T I ZZZ1 C T T A A

5' A A T T C r TTAAG C

11

I

3' 5'

C o rte co n n u c le a s a d e restricció n en un sitio intern o p a ra o b te n e r fra g m e n to s d e d ife re n te s ta m a ñ o s

5' A A TTC T T A A G r... -— 11 P u rific ar

TT

G AATT CTTAA P u rific ar

C lav e: T N u cleó tid o m a rc a d o

Fig. 6-4. Marcado final de ácidos nucleicos. M arcado fin a l de oligonucleótidos con cinasa. El fosfato de la terminal 5 ' del oligonucleótido se reemplaza en una reacción de intercambio por el fosfato 7 de [-y-32P] ATP marcado con 32R El mism o procedimiento puede emplearse para marcar las dos terminales 5 ' de DNA de doble cadena. B) M arcado fin a l con rellenado. El DNA de interés se corta mediante una nucleasa de restricción apropiada para generar salientes 5 '. Las salientes actúan como un cebador para polimerasa de DNA Klenow a fin de incorporar nucleótidos marcados complementarios a las salientes. Los fragmentos marcados en un extremo sólo pueden generarse mediante el corte interno con una enzima de restricción apropiada para generar dos fragmentos de distinto tamaño que se fraccionan de tamaño con facilidad.

A)

( «adro 6 Radioisótopo

Características de radioisótopos que se utilizan con frecuencia para marcar sondas de DNA y RNA. Vida media

Tipo de descomposición

Energía de emisión

H

12.4 años

0.019 Mev

32P

14.3 días

1.710 Mev

33p

25.5 días

0.248 Mev

35S

87.4 días

0.167 Mev

6.2 ¡ PRINCIPIOS DE LA HIBRIDACIÓN DE ÁCIDO NUCLEICO

tcj idos in situ, y 3H para la hibridación cromosómica in situ. 35S y B p tienen vidas medias moderadas. 3H posee una vida media muy r::>:ongada pero no constituye una ventaja por la energía compara—imente baja de las partículas (3 que emite, que requiere tiempos de exposición muy prolongados. Los nucleótidos marcados con 3~P y 33P que se usan en las reac- : nes de marcado durante la síntesis de la cadena de DNA tienen d radioisótopo en la posición fosfato alfa, porque los fosfatos P y y ir los precursores de dNTP no se incorporan en la cadena de DNA crecimiento. Sin embargo, en el marcado final mediado por ciîsa, se emplea ATP [~y—32P] (fig. 6-4A). En nucleótidos marcados con 35S que se incorporan durante la síntesis de cadenas de DNA o RNA, el NTP o el dNTP lleva un isótopo 35S en lugar del O del pupo fosfato a . Los nucleótidos marcados con 3H portan el radiototopo en varias posiciones. La detección específica de moléculas que tienen un radioisótopo se realiza con mayor frecuencia por autoradiografía (véase recuadro 6 - 1).

Marcado y detección no isotópicos Los sistemas de marcado no isotópicos incluyen el uso de sondas no radiactivas y tienen aplicaciones amplias en una variedad de áreas Kricka, 1992). Se efectúan dos tipos principales de marcado no ra diactivo: ► marcado no isotópico directo: se incorpora un nucleótido que contiene un grupo marcado unido. Con frecuencia estos siste mas comprenden la incorporación de nucleótidos modificados que contienen un fluoróforo, un grupo químico que puede fluorescer cuando se expone a luz de cierta longitud de onda (véase fig. 6-5 y recuadro 6-2). ► marcado no isotópico indirecto, que suele caracterizarse por el acoplamiento químico de una molécula rastreadora modifi cada a un precursor nucleótido. Tras incorporarse en el DNA, los grupos rastreadores pueden unirse de modo específico me diante una molécula de afinidad, una proteína u otro ligando que tiene una afinidad muy alta por el grupo rastreador. Con jugado a la molécula de afinidad se encuentra una molécula o un grupo marcador que puede detectarse en una valoración apropiada (fig. 6 -6 ). Las moléculas rastreadoras en nucleótidos modificados deben sobresalir bastante de la estructura básica de ácido nucleico a fin de facilitar su detección por la molécula de afinidad y por consiguiente se requiere un átomo de carbono es p a cia d o r largo para separar el nucleótido del grupo rastreador.

163

Es posible conjugar una diversidad de grupos o moléculas marcado ras a moléculas de afinidad como la estreptavidina o el anticuerpo específico de digoxigenina. Abarcan varios flu o r ó fo r o s (recuadro 6 -2 ) o enzimas, como fosfatasa alcalina y peroxidasa, que posibili tan la detección mediante valoraciones colorimétricas o químicas de luminiscencia, entre otras.

6.2

Principios de la hibridación de ácido nucleico

La hibridación de ácido nucleico es una técnica fundamental en ge nética molecular. El recuadro 6-3 presenta un glosario de los térmi nos importantes a fin de ayudar a los lectores que tal vez no estén familiarizados con la terminología.

6.2.1 La hibridación de ácido nucleico es un método para identificar moléculas relacionadas en forma cercana dentro de dos poblaciones de ácido nucleico Definición y justificación El propósito usual de la hibridación de ácido nucleico es obtener información de una población de ácidos nucleicos (el blanco) que no se com prende a la perfección y que por lo general es compleja. Se logra mediante el uso de una población conocida de moléculas de ácido nucleico como una sonda con objeto de identificar ácidos nucleicos relacionados cercanamente dentro del blanco. La especificidad de la interacción entre la sonda y el blanco pro viene de la co m p lem en ta ried a d d e bases, porque ambas poblacio nes se tratan de manera tal que asegura que todas las secuencias de ácido nucleico presentes sean de cadena única. Por consiguiente, si la sonda o el blanco iniciales son de doble cadena, es necesario se parar las cadenas individuales (desn atu ra lizarlas), casi siempre por calentamiento o tratamiento alcalino. Después de mezclar las cadenas únicas de la sonda con las cadenas únicas del blanco, se permite que se “rea so cien ” (t s decir, que se fijen entre sí [rean n eal]) cadenas con secuencias de bases complementarias para formar áci dos nucleicos de doble cadena. Cuando lo anterior ocurre se for man dos tipos de productos:

Se utilizan de manera amplia dos sistemas de marcado no isotópi co indirecto:

► homodúplex: cadenas complementarias dentro de la sonda o dentro del blanco que se “reasocian” (reanneal) a fin de regene rar moléculas de doble cadena que originalm ente se encontraban en las poblaciones de la sonda o el blanco;

► el sistema biotina-estreptavidina emplea la afinidad en extre mo alta de dos ligandos: la b io tin a (una vitamina que ocurre de manera natural), que actúa como rastreador, y la proteína bac teriana estrep tavidin a , que es la molécula de afinidad. La bio tina y la estreptavidina se unen entre sí en una forma muy estrecha con una constante de afinidad de 10 l4, una de las más potentes que se conocen en biología. Pueden prepararse con fa cilidad sondas biotinadas con la inclusión de un nucleótido biotinado apropiado en la reacción de marcado (véase fig. 6-7).

► heterodúplex: un ácido nucleico de cadena única dentro de los pares de bases de la sonda con una cadena complementaria en la población blanco. El ácido nucleico de doble cadena que se forma en este caso es una combinación nueva de cadenas de áci do nucleico. Los heterodúplex definen la utilidad de una valo ración de hibridación de ácido nucleico porque el objeto total de la valoración de hibridación es usar la sonda conocida para identificar fragmentos de ácido nucleico relacionados en el blanco (fig. 6 - 8 ).

► la digoxigenina es un esferoide (que se obtiene de la planta Digitalis) contra el que se elaboró un anticuerpo específico. El an ticuerpo específico de la digoxigenina permite detectar moléculas de ácido nucleico que incorporaron nucleótidos que contienen el grupo rastreador digoxigenina (véase fig. 6-7).

A menudo las sondas son poblaciones de ácido nucleico homogé neas (p. ej., un DNA clonado específico o un oligonucleótido sin tetizado por medios químicos) y por lo general están marcadas y en solución. En contraste, las poblaciones de ácido nucleico blanco son poblaciones complejas no marcadas y suelen enlazarse a un

164

CAPITULO SEIS

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

A

B)

F u e n te lu m in o s a, p. ej., lá m p a ra d e v a p o r d e m e rcu rio

Fig. 6-5. Microscopía de fluorescencia y estructura de fluoróforos frecuentes. A) Estructura de fluoróforos. El ejemplo de la parte superior muestra fluoresceína-dUTR El grupo de fluoresceína está unido al átomo de carbono 5' de la uridina por un grupo espaciador de manera que cuando el nucleótido modificado se incorpora en el DNA, el grupo de fluoresceína es fácilmente accesible. Abajo se encuentra la estructura de la rodamina de la que se derivó una variedad de fluoróforos. B) M icroscopía de fluorescencia. El filtro de excitación es un filtro de barrera de color que en este ejemplo se eligió para dejar pasar sólo luz azul. La luz azul transmitida tiene una longitud de onda apropiada para reflejarse con el espejo dicroico (división del haz) hacia la muestra marcada que después fluoresce y emite luz de una longitud de onda más larga, en este caso luz verde. La longitud de onda más larga de la luz verde emitida significa que pasa en form a directa a través del espejo dicroico. A continuación la luz pasa a través de un segundo filtro de barrera de color que bloquea las señales fluorescentes Indeseables y deja que la emisión de fluorescencia verde deseada pase a través del ocular del microscopio. Un segundo dispositivo de división del haz también puede permitir registrar la luz en una cámara de dispositivo cargado acoplado (DCA).

6.2 I PRINCIPIOS DE LA HIBRIDACIÓN DE ÁCIDO NUCLEICO

165

5 ' ---------------------------------------------------- 3 ' 3 ' -------------------------------------------5'

Marcado de DNA ..... . con nuc eotido marcado aue . , ,4 lleva un grupo rastreador

„ Acoplam iento de grupo de r. . . afinidad y grupo marcador ■

1 9

R

9

1 ®

?

{ }

Enlace del grupo de afinidad al rastreador

l

“

“

“

“

3 ' --------------------------------------------------------------------------------------- I '

i

Clave r

Grupo rastreador

f a Grupo de afinidad

Detección del marcador mediante valoración fluorim étrica/valoración enzimàtica, etcétera

H

Marcador

Fig. 6-6. Principios generales del marcado no isotópico indirecto. Con frecuencia la proteína que el grupo rastreador reconoce es un anticuerpo específico, como en el sistema de digoxigenina, o cualquier otro ligando que tiene una afinidad muy alta para un grupo específico, como la estreptavidina cuando se utiliza biotina como rastreador (véase fig. 6-7). El marcador puede detectarse de varias maneras. Si lleva un colorante fluorescente específico, es posible detectarlo en una valoración fluorimétrica. De manera alternativa, puede ser una enzima como fosfatasa alcalina, que suele acoplarse a una valoración enzimàtica y proporciona un producto factible de medir por medios colorimétricos.

apoyo sólido. Sin embargo, algunas valoraciones de hibridación im portantes utilizan sondas no marcadas enlazadas a un apoyo sólido para interrogar poblaciones de DNA blanco marcadas en solución.

Temperatura de fusión y rigor de la hibridación La desnaturalización de sondas de DNA de doble cadena suele lo grarse calentando una solución del DNA marcado a una tempera tura lo bastante alta para romper los enlaces de hidrógeno que unen entre sí las dos cadenas complementarias de DNA. La energía ne cesaria para separar dos cadenas perfectamente complementarias de DNA depende de varios factores, en especial: ► lo n g itu d d e la ca d en a : los homodúplex largos contienen un gran número de enlaces de hidrógeno y se requiere más energía para separarlos; como por lo general el procedimiento de mar cado produce sondas de DNA cortas, este aspecto es insignifi

cante por arriba de una longitud original (es decir, anterior al marcado) de 500 pb; ► com p o sición d e bases: los pares de bases GC tienen un enlace más de hidrógeno que los pares de bases AT. En consecuencia las cadenas con un porcentaje de composición GC alto son más difíciles de separar que las que tienen una composición de GC de un porcentaje bajo; ► a m b ien te q u ím ico: la presencia de cationes monovalentes (p. ej., iones Na+) estabiliza el dúplex, en tanto que ciertas molécu las muy polares, como la fo r m a m id a (H-CO-NH3+) y la u rea (H-jN -C O -N H j ), actúan como desnaturalizantes quími cos: desestabilizan el dúplex al alterar los enlaces de hidrógeno entre pares de bases . Una medida útil de la estabilidad de un dúplex de ácido nucleico es la temperatura de fusión ( Tm). Ésta es la temperatura que co rresponde al punto medio en la transición de la forma de doble ca-

166

CAPÍTULO SEIS

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

Sistemas de marcado y detección con fluorescencia El marcado fluorescente de ácidos nucleicos se desarrolló en la década de 1980 y su gran valor se demuestra en muchas aplicaciones distintas, que incluyen hibridación cromosómica in situ, hibridación in situ de tejidos y secuenciación automatizada de DNA. Los marcadores fluorescentes pueden usarse en el marcado directo de ácidos nucleicos incorporando un nucleótido modificado (con frecuencia 2 ’ desoxiuridina 5 ' trifosfato) que contiene un fluoróforo apropiado, un grupo químico que fluoresce cuando se expone a una longitud de onda luminosa específica. Los fluoróforos populares que se emplean en el marcado directo comprenden: fluore sceín a, un colorante fluorescente verde pálido; rodam ina, un colo rante fluorescente rojo, y am ino m etilcum arina. un colorante fluorescente azul (véase fig. 6-5A). Asimismo, pueden utilizarse sistemas de marcado indirecto mediante los cuales nucleótidos modificados que contienen un grupo rastreador (como biotina o digoxigenina) se incorporan en ácido nucleico (véase fig. 6- 6) y luego el grupo rastreador se enlaza en forma específica mediante una molécula de afinidad (como estreptavidina o un anticuerpo específico a digoxigenina) al que se fija un fluoróforo, por ejemplo, ácido acético am inom etilcum arina (AAMC), isotiocianato de fluoresceína (ITCF) u otros derivados de la fluoresceína e isotiocianato de tetrametilrodamina (ITCTR) u otros derivados de la rodamina. La detección del fluoróforo en sistemas de marcado directo o indirecto se efectúa pasando un haz de luz de una fuente luminosa adecuada (p. ej., una lámpara de vapor de mercurio en microscopía de fluorescencia, un láser de argón en la secuenciación automatizada de DNA) a través de

dena a la de cadena única. Esta transición puede seguirse de modo conveniente si se mide la densidad óptica (DO) del DNA. Las ba ses de los ácidos nucleicos absorben con potencia luz ultravioleta (UV) de 260 nm. Sin embargo, la adsorción por DNA de doble ca dena es bastante menor que la de los nucleótidos libres. Esta dife rencia, el llamado efecto hipocrómico, se debe a interacciones entre los sistemas de electrones de bases adyacentes, que provienen de la forma en que bases adyacentes se apilan en paralelo en una doble hélice. Por tanto, si el DNA dúplex se calienta de manera gra dual, habrá un incremento de la luz que se absorbe a 260 nm (la DO260) hacia el valor característico de las bases libres. La tempera tura a la que se halla un punto medio en el cambio de la densidad óptima se considera entonces la Tm (véase fig. 6-9). En genomas de mamíferos, con una composición de bases apro ximada de 40% de GC, el DNA se desnaturaliza con una Tm cer cana a 87°C bajo condiciones más o menos fisiológicas. La Tm de híbridos perfectos formados por DNA, RNA o sondas oligonucleótidas puede determinarse según la fórmula que se presenta en el cuadro 6-2. A menudo se eligen condiciones de hibridación que permitan promover la formación de heterodúplex y la temperatura de hibridación suele ser hasta 25°C menor que la Tm. No obstan te, después de la hibridación y la eliminación del exceso de sondas pueden realizarse lavados de hibridación bajo condiciones más rígi das para alterar todos los dúplex además de los que se encuentran entre secuencias relacionadas de manera muy cercana. Los heterodúplex sonda-blanco poseen una termodinámica muy estable cuando la región de la formación dúplex contiene ba ses perfectamente compatibles. Las incompatibilidades entre las dos cadenas de un heterodúplex reducen la Tm: para sondas norma les de DNA, cada 1% de incompatibilidad reduce la Tm alrededor de 1°C. Aunque los heterodúplex sonda-blanco no suelen ser tan

un filtro de color apropiado (filtro de excitación) diseñado para transm itir luz a la longitud de onda de excitación deseada. En sistemas de m icros copía de fluorescencia esta luz se refleja sobre la muestra marcada con fluorescencia en un portaobjetos para m icroscopio por medio de un es pejo dicroico, que refleja luz de ciertas longitudes de onda en tanto per mite que la luz de otras longitudes de onda pase de modo directo a través de él. A continuación la luz excita el fluoróforo para que fluoresca y al ha cerlo emite luz de una longitud de onda un poco más larga, la longitud de onda de emisión. La luz emitida por el fluoróforo regresa y pasa directa mente por el espejo dicroico, a través de un filtro de barrera apropiado, y después se transmite al ocular del microscopio, y también puede captu rarse con una cámara de DCA (dispositivo cargado acoplado). A conti nuación se indican las longitudes de onda de emisión y excitación máximas de fluoróforos usuales: Fluoróforo

Color

Excitación máxima (nm)

Emisión máxima (nm)

AMCA Fluoresceína

Azul

399

446

Verde

494

523

CY3

Rojo

552

565

Rodamina

Rojo

555

580

Rojo Texas

Rojo

590

615

estables como las sondas homodúplex reasociadas (reannealed), es posible tolerar un grado considerable de incompatibilidad si la re gión total de complementariedad de bases es larga (> 100 pb; véa se fig. 6 - 10 ). El incremento de la concentración de NaCl y la disminución de la temperatura reducen el rigor de la hibridación y mejoran la es tabilidad de hetereodúplex incompatibles. Ello significa que pue den identificarse miembros comparativamente divergentes de una familia multigénica o de otra familia de DNA repetido por hibri dación si se utiliza como sonda un miembro específico de la fami lia. Además puede emplearse como sonda una secuencia génica de una especie a fin de identificar homólogos en otra especie divergen te, a condición de que la secuencia se conserve de modo razonable durante la evolución. También es posible elegir condiciones para maximizar el rigor de la hibridación (p. ej., disminuir la concentración de NaCl e in crementar la temperatura), con objeto de fomentar la disociación (desnaturalización) de heterodúplex incompatibles. Si la región de complementariedad de bases es pequeña, como en las sondas de oligonucleótidos (casi siempre 15 a 20 nucleótidos), pueden elegirse condiciones de hibridación de tal índole que una incompatibilidad aislada torna inestable un heterodúplex (véase sección 6 .3 . 1).

6.2.2 Las cinéticas de reasociación de DNA se definen mediante el producto de la concentración de 0NA y el tiempo (C0t) Cuando se desnaturaliza DNA de doble cadena (p. ej., por calor) y se permite que la complementariedad de cadenas únicas se asocie de nuevo (reasocie) para formar DNA de doble cadena, la rapidez

6.2

PRINCIPIOS DE LA HIBRIDACIÓN DE ÁCIDO NUCLEICO

CH, OH 3 CH

E s p a c ia d o r C 1 1

O II

•H.

O II

I

II

O

3ÍH OH

> / C H = C H - C H 2- N H - C - ( C H 2) 5- N H - C - C H 2

N

167

G ru p o ra s tre a d o r d e d ig o x ig e n in a

CH

-C H ,

I

D ig o xig en in a-11 -d U T P |

«N? ' c - cV I

I

G ru p o r a s tre a d o r d e b io tin a

OH H

E s p a c ia d o r C 1 6

O H„

..

N

X

I

C "H

H

L»

NH

\

/

C H -C H

/ \

II

CH

B io tin a -1 6 -d U T P

C —C"

I

C

HN

\

w C H = C H - C H 2- N H - C - ( C H 2) 3- N H - C - ( C H 2) 3- N H - C - ( C H 2)4- C H

® ® ® -c h 2

I

O II

I

s

/

CH C la v e : E n la c e p o te n c ia l d e h id ró g e n o en p a re a m ie n to d e ba se s c u a n d o se in c o rp o ra en d o b le h é lic e

OH H

Fig. 6-7. Estructura de nucleótidos modificados con digoxigenina y biotina. Obsérvese que los grupos digoxigenina y biotina de estos ejemplos están unidos al átomo de carbono 5 ' de la uridina de dUTP mediante grupos espaciadores que consisten respectivamente de un total de 11 átomos de carbono (digoxigenina-11-UTP) o 16 átomos de carbono (biotina-16-dUTP). Los grupos digoxigenina y biotina son grupos rastreadores: tras su incorporación en un ácido nucleico se enlazan mediante ligandos específicos que contienen un marcador unido, como un fluoróforo.

con que las cadenas complementarias se “reasocian” depende de la concentración inicial del DNA. Si la concentración de secuencias complementarias de DNA es alta, se reducirá el tiempo que se re quiere para que cualquier molécula de DNA de cadena única en cuentre una cadena complementaria y forme un dúplex. Cinética de reasociación es el término que se usa para medir la rapidez a la que son capaces de encontrarse entre sí moléculas complementarias de cadena única y formar un dúplex. Existen dos parámetros prin cipales: la concentración de inicio (C0) de la secuencia específica de DNA en moles de nucleótidos por litro y el tiempo de reacción (í) en segundos. Si se toma en cuenta que el ritmo de reasociación es proporcional a C0 y t, el valor C0t (que en ocasiones se denomina valor cot) es una medida útil. El valor CBt también varía según la temperatura de reasociación y la concentración de cationes mono valentes. Como resultado, es usual emplear el valor de referencia fi jo: una temperatura de reasociación de 65°C y una concentración [Na+] de 0.3 M de NaCl. Casi todas las valoraciones de hibridación utilizan un exceso de ácido nucleico blanco comparado con el de la sonda a fin de esti mular la unión de la sonda con el blanco. Esto se debe a que la son da suele ser homogénea y con frecuencia consiste en un tipo aislado de molécula de DNA o molécula de RNA clonada, pero por lo ge neral el ácido nucleico blanco es heterogéneo y comprende, por ejemplo, DNA genómico o RNA celular total. En el último caso la

concentración de cualquier secuencia puede ser muy baja y en con secuencia dar lugar a un ritmo de reasociación lento. Por ejemplo, si en una Southern blot se utiliza un gen de globina (3 clonado como sonda para identificar secuencias complementarias en el DNA ge nómico humano, este último se encontrará en una concentración muy baja (el gen de globina (3 es un ejemplo de una frecuencia de copia única y en este caso sólo representa 0.00005% del DNA ge nómico humano). Por tanto es necesario usar varios microgramos de DNA blanco para impulsar la reacción. En contraste, algunas otras secuencias están muy repetidas en el DNA genómico (véase cap. 9) y esta concentración muchísimo mayor de DNA produce un tiempo de reasociación rápido. Como la cantidad de ácido nucleico blanco que enlaza una son da depende del número de copias de la secuencia reconocida, la in tensidad de la señal de hibridación es proporcional al número de copias de la sustancia reconocida: genes con copia única dan señales de hibridación débiles, secuencias de DNA muy repetidas propor cionan señales muy potentes. Si una sonda particular es heterogé nea y contiene una secuencia de interés de copias bajas (como un gen específico), mezclada con una secuencia de DNA repetida muy abundante, la señal potente del DNA repetido ocultará por com pleto la señal de hibridación débil que se obtiene con la secuencia de copias bajas. Sin embargo, este efecto puede evitarse mediante la h ib rid a ció n d e co m p eten cia (véase recuadro 6 -3 ).

168

CAPÍTULO SEIS

HIBRIDACIÓN DE ACIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

Glosario de hibridación de ácido nucleico (para métodos individuales, véase el recuadro 6-4) Hibridación de oligonucleótido específica de alelo (OEA). Se utilizan sondas de oligonucleótidos cortas de ca. 20 nucleótidos de largo especí ficas para alelos individuales bajo condiciones de hibridación rígidas en las que la incompatibilidad de una base impide la hibridación satisfacto ria. Véase figura 6-11. Asociación (anneal). Dos ácidos nucleicos de cadena única que compar ten suficiente complementariedad de bases formarán un dúplex de DNA de doble cadena. Asociar significa permitir que se formen enlaces de hi drógeno entre dos cadenas únicas y en consecuencia tiene significado opuesto a desnaturalizar. Complementariedad de base. Grado al que las secuencias de dos ácidos nucleicos de cadena única pueden form ar un dúplex de DNA mediante el pareamiento de bases Watson-Crick (sección 1.2.1). Hibridación de competencia ( = hibridación de supresión). Reacción de hibridación en la que una sonda que contiene algunas secuencias de DNA repetidas sufre un paso de prehibridación para bloquear el acceso a se cuencias repetidas en la sonda. Esta última se desnaturaliza primero y se permite que se reasocie en presencia de una población de DNA no mar cada que se enriqueció con DNA repetido: como resultado los elementos repetidos dentro de la sonda se eliminan con efectividad por fijación a se cuencias de DNA repetidas complementarias y dejan disponibles sólo las secuencias no repetidas. Desnaturalizar. Separar las cadenas individuales de un DNA dúplex de doble cadena mediante la rotura de los enlaces de hidrógeno entre ellas (por calentamiento o tratamiento con un desnaturalizante químico, como formamida). Hibridación de fluorescencia in situ (HFIS). Cualquier reacción de hibri dación in situ en la que se marcan ácidos nucleicos por fijación de gru pos químicos que pueden fluorescer bajo ciertas longitudes de onda. Heterodúplex. DNA de doble cadena que se form a cuando se permite que dos secuencias de cadena única con complementariedad de bases par cial se asocien (anneal). Los heterodúplex pueden surgir en diferentes for mas: ► heterodúplex alélicos. La desnaturalización seguida del enfriamiento de una muestra de DNA diploide única o una mezcla de muestras de DNA de diferentes individuos permitirá que cadenas complementarias de dos alelos que defieren un poco en la secuencia de DNA formen dúplex compatibles casi a la perfección; ► heterodúplex paralogos. La desnaturalización seguida del enfria miento de una muestra de DNA aislada de una célula eucariota com pleja también puede originar la reasociación entre secuencias de DNA relacionadas no alélicas como los miembros diferentes relacionados en form a cercana de una familia de genes o de una familia de DNA re petido no codificado; ► heterodúplex interespecificos. Muestras de DNA desnaturalizado de especies con genes relacionados hasta cierto punto cercanos, por ejemplo, humano y ratón, se mezclan y se permite que cadenas úni cas se reasocien (reanneal).

Homodúplex. DNA de doble cadena que se forma cuando se permite que dos secuencias de cadena única con complementariedad de bases per fecta se asocien (anneal). Valoración de hibridación. Una reacción de prueba en la que se utiliza un ácido nucleico conocido (la sonda) para buscar secuencias relacionadas en un conjunto heterogéneo de secuencias de DNA (el blanco). En una valoración de hibridación estándar la sonda es marcada y por lo general en solución, en tanto que el blanco no se marca y suele enlazarse a un apoyo sólido. En la hibridación inversa sucede lo contrario. Hibridación in situ. Una reacción de hibridación en la que una sonda se híbrida a ácidos nucleicos de células o cromosomas que se montaron en un portaobjetos de vidrio, por ejemplo, DNA desnaturalizado de crom oso mas en metafase (hibridación cromosómica in situ, sección 2.4.2) o RNA preparado de cortes de tejido (hibridación de tejido in situ). Véase sección 6.3.4. Temperatura de fusión ( r j . Medida de la estabilidad de un dúplex de ácido nucleico, es la temperatura que corresponde al punto medio en la transición de formas de cadena doble a cadena única. De manera conve niente, esta transición puede seguirse midiendo la densidad óptica del DNA a una longitud de onda de 260 nm. Véase figura 6-9. Sonda. Población de ácido nucleico conocido que se usa para interrogar una población heterogénea compleja de ácido nucleico en una valoración de hibridación. Originalmente puede ser de doble cadena, pero a fin de que actúe com o una sonda tiene que desnaturalizarse para obtener cade nas únicas. Aunque por lo general la sonda es marcada y en solución, véase valoraciones de hibridación inversa. Reasociar. Asociar de nuevo (reannef) después de un paso de desnatu ralización previo. Cinéticas de reasociación. Ritmos a los que se reasocian cadenas de DNA complementarias. Las cadenas de DNA muy repetido se reasocian con rapidez; las secuencias de copia única lo hacen con lentitud. Valoración de hibridación inversa. Una valoración en la que el blanco se marca y por lo general se encuentra en solución en tanto que la sonda no se marca y suele estar enlazada a un apoyo sólido. Los ejemplos inclu yen valoraciones dot-blot inversa e hibridación de microarreglo. Hibridación de sustracción. Método basado en hibridación para identifi car secuencias de ácido nucleico que se sabe que existen en una pobla ción (la población plus) pero que no se encuentran en otra población relacionada en form a cercana (la población m inus). La hibridación se di seña para que tenga la población ( - ) en gran exceso y en consecuencia actúe como un DNA impulsor, lo que asegura que todas las secuencias relacionadas en la población ( + ) se eliminen como heterodúplex y deja las secuencias deseadas que se encuentran sólo en la población ( + ) . Blanco. Población heterogénea compleja de ácido nucleico que se inte rroga en una valoración de hibridación mediante un ácido nucleico cono cido, a menudo homogéneo. Por lo general no marcado y enlazado a un apoyo sólido pero en las valoraciones de hibridación inversa los blancos están marcados y en solución.

6.2

PRINCIPIOS DE LA HIBRIDACIÓN DE ACIDO NUCLEICO

169

un

rm D N A b la n c o |

Sonda de D N A j

(M e z c la d e d ife re n te s fra g m e n to s d e D N A )

(P o r lo g e n e ra l h o m o g é n e o y m a rc a d o )

D e s n a tu ra liza r

1112

M e z c la r y p e rm itir rea so c iac ió n

(reanneal)

n n

r rm

mi D N A b la n c o re a s o c ia d o

(reannealed)

H e te ro d ú p le x s o n d a -b la n c o

2112

ITTI

S o n d a D N A re a s o c ia d a

(reannealed)

C lave: T M a rc a d o

Fig. 6-8. La valoración de hibridación de ácido nucleico requiere la formación de heterodúplex entre sondas de ácido nucleico de cadena única marcadas y secuencias complementarias dentro de un ácido nucleico blanco. Se considera que la secuencia de la sonda se relaciona con firmeza a con un segmento central de uno de los muchos tipos de moléculas de ácido nucleico en el blanco. El mezclado de la sonda y el blanco desnaturalizados produce una sonda reasociada (reannealed)-sonda homodúplex (abajo a la derecha) y homodúplex blanco-blanco (abajo a la izquierda), pero también heterodúplex formados entre el DNA sonda y cualquier molécula de DNA blanco que se relacione en form a importante en cuanto a la secuencia (centro abajo). Si se dispone de un método para eliminar el DNA sonda que no está enlazado al DNA blanco, es posible identificar con facilidad los heterodúplex mediante métodos que pueden detectar el marcador.

6.2.3 Es posible utilizar una gran variedad de valoraciones de hibridación de ácido nucleico

Fig. 6-9. La desnaturalización de DNA ocasiona un incremento de ia densidad óptica. D0SS y DOqs indican la densidad óptica del DNA de cadena única (SS) y DNA de cadena doble (DS) respectivamente. La diferencia entre ambas constituye el efecto hipocrómico (véase texto).

Aunque en los experimentos iniciales de hibridación de ácido nu cleico se empleaba la hibridación en solución, que incluía el mezcla do de soluciones acuosas de sonda y ácidos nucleicos blanco, la concentración muy baja de secuencias de copia única en genomas complejos significaba que los tiempos de reasociación eran inevita blemente lentos. Un medio que se usa mucho para aumentar la ra pidez de la reasociación consiste en incrementar de modo artificial la concentración total de DNA en la solución acuosa al eliminar moléculas de agua (p. ej., con la adición de concentraciones altas de polietilenglicol). Una alternativa a la hibridación en solución que facilita la de tección de moléculas reasociadas consiste en inmovilizar el DNA blanco en un apoyo sólido, como una membrana de nitrocelulosa o nylon, al que se enlaza con facilidad DNA de cadena única. La fi jación de la sonda marcada al DNA blanco inmovilizado puede se guirse luego eliminando la solución que contiene la sonda de DNA libre, lavando en forma extensa la membrana y secándola como preparación para la detección.

170

CAPI 11 LO SEIS

Cuadro

6 -2 .

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

Ecuación para calcular Tm.

Híbridos

Tm(°C)

DNA-DNA

81.5

+

16.6(log10[Na+] a)

+

0.41 (%GCb) - 500/L0

DNA-RNA o RNA-RNA

79.8

+

18.5(log10[Na+] a)

+

0.58(%GCb)

+

11,8(%GCb)2 - 820/L0

oligo-DNA u oiigo-RNA:d Para

<

20 nucleótidos

(/„) 22 + 2

Para 20 a 35 nucleótidos

1.46

(/„)

a0 para otro catión monovalente, pero sólo es preciso en los límites de 0.01 a 0.4 M. bSólo preciso para 30 a 75% de GC. °L = longitud de dúplex en pares de bases. doligo = oligonucleótido: /„ = longitud efectiva del cebador = 2 x (núm. de G + C) + (núm. de A

+ T).

Nota: para cada 1% de formamida, la Tm se reduce alrededor de 0.6° C, en tanto que la presencia de 6 M de urea reduce la Tm alrededor de 30°C.

Ésta el base de las valoraciones de hibridación de ácido nuclei co estándar que se utilizan en la actualidad. Sin embargo, en fecha más reciente también se popularizaron las valoraciones de hibri dación inversa. En estos casos la población de la sonda no está marcada y se fija al apoyo sólido, en tanto que el ácido nucleico blanco se marca y se presenta en solución acuosa. Por consiguiente cabe señalar que la distinción entre sonda y blanco no se basa en es pecial en cuál es la población marcada y cuál es la población no marcada. Por el contrario, la consideración importante es que el DNA blanco debe ser la población compleja, comprendida de modo imperfecto, que la sonda (cuya identidad molecular se conoce) in tenta interrogar. Según la naturaleza y forma de la sonda y el blan-

Sonda de DNA: convencional

Sonda o lig o n u c le ó tid a

TTTTTTTTTTTT E s ta b le

ZZZZZMZZZZI E s ta b le

E s ta b le a rigor d e h ib rid ació n re d u c id o

p e rfe c ta

In c o m p a tib ilid a d ú n ic a (p. ej., alélica)

co, es posible diseñar una variedad muy amplia de valoraciones de hibridación de ácido nucleico (recuadro 6-4).

6.3

Valoraciones de hibridación de ácido nucleico m ediante sondas de DNA clonado para seleccionar poblaciones de ácido nucleico no clonado

Las múltiples aplicaciones en genética molecular incluyen obtener una clona individual de DNA y usarla como sonda de hibridación para seleccionar la presencia de secuencias relacionadas dentro de un blanco complejo de DNA o RNA no clonado. En ocasiones la valoración se restringe a sólo verificar la presencia o ausencia de se cuencias relacionadas con la sonda. En otros casos es posible obte ner información útil del tamaño de las sustancias complementarias, su localización subcromosómica o sus localizaciones dentro de teji dos o grupos de células específicos.

E s ta b le

6.3.1 En la hibridación dot-blot, un método rápido de detección, suelen emplearse sondas de oligonucleótidos específicas de alelo In e s ta b le a rig o r d e h ib rid ació n alto

2 0 % d e in c o m p a tib ilid a d (p. ej., s e c u e n c ia s d e c o d ific a c ió n d e genes hum anos y d e ratón)

Fig. 6-10. La hibridación de ácido nucleico puede identificar secuencias blanco considerablemente divergentes de una sonda de ácido nucleico convencional o idénticas a una sonda de oligonucleótidos.

El procedimiento general de dot-blotting consiste en obtener una solución acuosa del DNA blanco, por ejemplo, DNA genómico to tal humano, colocar manchas en una membrana de microcelulosa o de nylon y después permitir que se seque. La técnica variante de slot-blotting comprende colocar con pipeta el DNA a través de una hendidura individual en una plantilla apropiada. En ambos métodos se desnaturalizan las secuencias del DNA blanco ya sea por exposición previa a calor o exposición del filtro que las contie ne a un álcali. Las secuencias de DNA blanco desnaturalizadas in móviles ahora en la membrana se exponen a una solución que contiene secuencias de cadena única de la sonda marcadas (con fre cuencia se marca con 32P a fin de optimar la detección). Tras per mitir que transcurra el tiempo suficiente para la formación de heterodúplex sonda-blanco, la solución de la sonda se decanta y la membrana se lava para eliminar el exceso de sondas que puedan ha berse enlazado en forma inespecífica al filtro, que a continuación se seca y expone a una placa autorradiográfica.

6.3

I

VALORACIONES DE HIBRIDACIÓN DE ÁCIDO NUCLEICO MEDIANTE SONDAS DE DNA

171

Valoraciones de hibridación de ácido nucleico estándar e inversa VALORACIONES ESTÁNDAR

Sonda marcada en solución

Blanco no marcado enlazado en apoyo sólido

Dot blot (fig. 6-11)

Cualquier DNA o RNA marcado pero con frecuencia un oligonucleótido

Población de DNA o RNA complejo; no fraccionada por tamaño, pero manchada directamente en la membrana

Southern blot (fig. 6-12 para el método; figs. 7 - 9 ,18-12B y 18-12C para ejemplos)

Cualquiera

A menudo DNA genómico complejo (pero pueden ser clonas de DNA individuales); digerido con nucleasa de restricción y fraccionado por tamaño, luego transferido a membrana

Northern blot (fig. 6-13)

Cualquiera

Población de RNA complejo (p. ej., RNA celular total o poli A + RNA) que se fraccionó por tamaño y a continuación se transfirió a una membrana

Hibridación cromosomica in situ (p. ej., figs. 2-16 a 2 -1 8 ,1 4 -1 2 )

Por lo general una clona genómica marcada

DNA dentro de cromosomas (con frecuencia en metafase) de células lisadas en un portaobjetos para microscopio

Hibridación tisular in situ (fig. 6-15)

Por lo general una ribosonda u oligonucleótido antisentidos marcados

RNA dentro de las células de cortes de tejido fijados en un portaobjetos para microscopio

Colony blot (fig. 6-16)

Cualquiera

Colonias de células separadas después de sembrarlas en placa de agar y después transferidas a una membrana

Levantamiento de placa

Cualquiera

Colonias bacterianas infectadas por fago separadas luego de sembrarlas en una placa de agar y transferirlas a una membrana

Valoración de hibridación de clona en rejilla (fig. 6-17)

Cualquiera

Clonas manchadas robóticamente en una membrana en arreglos geométricos

VALORACIONES INVERSAS

Blanco marcado en solución

Sondas sin marcas enlazadas a un apoyo sólido

Dot blot inversa

DNA complejo

Oligonucleótidos manchados en una membrana

Microarreglo de DNA o de oligonucleótidos presintetizados

DNA complejo

Clonas de DNA u oligonucleótidos manchados robóticamente en un portaobjetos para microscopio

DNA complejo

Oligonucleótidos sintetizados en vidrio

(fig. 6-19) Microarreglo de oligonucleótidos fig. 17-18)

-

Una aplicación útil de dot-blotting comprende la distinción en tre alelos que difieren por la sustitución inclusive de un nucleótido ; slado. Para efectuarla se elaboran sondas con oligonucleótido esr»ecífico de alelo (OEA) a partir de secuencias que abarcan el sitio iriable del nucleótido. Por lo general las sondas OEA tienen 15 a 20 nucleótidos de largo y suelen emplearse bajo condiciones de hir ridación a las que el dúplex de DNA entre sonda y blanco es esta ble sólo si la com plem entariedad de bases entre ellos es perfecta: es suficiente una incompatibilidad aislada entre la secuencia de la son da v el blanco para tornar inestable el heterodúplex corto (fig. 6 - 10 ). C¿si siempre esto incluye diseñar los oligonucleótidos de tal manera q je ocurran diferencias de un nucleótido entre los alelos en un seg mento central de la secuencia oligonucleótida, lo que en conse cuencia maximiza la inestabilidad termodinámica de un dúplex ^compatible. Esta discriminación puede usarse para una variedad propósitos de investigación y diagnóstico. Aunque el OEA puede emplearse en la hibridación convencional Southern blot (véase más idelante), es más conveniente utilizarlo en valoraciones dot-blot véase fig. 6 - 11 ). Otro método dot blotting con OEA recurre a una técnica dot rlotting inversa. Esto significa que las sondas oligonucleótidas no están marcadas y se encuentran fijas a un filtro o una membrana en tinto que el DNA blanco está marcado y se proporciona en solu

-

ción. Se considera que el enlace positivo del DNA blanco marcado a un oligonucleótido específico en la membrana indica que el blan co tiene esa secuencia específica. Tanto este método como las téc nicas de microarreglo de DNA relacionadas tienen muchas aplicaciones diagnósticas.

6.3.2 Las hibridaciones Southern blot y Northern blot detectan ácidos nucleicos cuyo tamaño se fraccionó mediante electroforesis en gel Hibridación Southern blot En este procedimiento el DNA blanco se digiere con una o más endonucleasas de restricción cuyas secuencias de reconocimiento sue len ser de 4 a 6 pb de largo, lo que genera fragmentos que tienen varios cientos o miles de pares de bases de longitud. Los fragmen tos de restricción se fraccionan de tamaño mediante electroforesis en gel de agarosa, se desnaturalizan y transfieren a una membrana de nitrocelulosa o nylon para hibridación (fig. 6-12). Durante la electroforesis de fragmentos de DNA, que tienen una carga negati va por los grupos fosfato, se repelen del electrodo negativo hacia el positivo y se tamizan a través del gel poroso. Los fragmentos de DNA más pequeños se mueven más rápido. La rapidez de migra-

172

CAPITULO SEIS

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

N o rm a l

H e te ro c ig o to H o m o c ig o to d e c é lu la fa lc ifo rm e

ßAßs

ßAßA

ßs ßs

Dot b lo t

;

H ib rid a c ió n ß A -A S O

5' TG

ACT

CCT GAG

GAG

AAG

TC

3'

‘ H f S ín te sis d e O E A

|N O R M A L | [3A 5 ' G T G C A C C a d e n a d e s e n tid o

G iù CCT GAG

CTG ACT

GAG

AAG

TCT

10 G C C ---------------3 '

M u ta c ió n d e c é lu la fa lc ifo rm e

S E C U E N C IA S G E N IC A S

[M U T A N T E I ß S 5 'G T G CAC C a d e n a d e s e n tid o

CTG

ACT

CCT GTG Val

GAG

AAG

TCT

G C C ................. 3'

S ín te s is d e O E A

ß S-ASO 5 '

TG ACT

CCT

gH g

GAG

AAG

TC

3'

H ib rid a c ió n Dot b lo t

o

qA qS

ßAßA N o rm al

ßs ßs

H e te ro c ig o to H o m o c ig o to d e c é lu la fa lc ifo rm e

Fig. 6-11. La hibridación dot-blot de oligonucleótido específica de alelo (OEA) puede identificar individuos con la mutación de célula falciforme. El dot blot esquemático de la parte superior muestra el resultado del sondeo con un OEA específico para el alelo de globina beta normal (p A-0EA; que se muestra justo abajo). Los resultados son positivos (círculos negros) en individuos normales y heterocígotos, pero negativos en homocigotos de célula falciforme (círculo de guiones, blanco). La dot blot de la parte inferior muestra el resultado del sondeo con un OEA específico para el alelo de globina (3 de célula falciform e ((3S-0EA; se muestra justo arriba) y en este caso los resultados son positivos para homocigotos y heterocígotos de célula falciforme, pero negativos para individuos normales. El p A-0EA y el |3S-0EA se diseñaron para que tuvieran 19 nucleótidos de largo en este caso elegidos de los codones 3 a 9 de secuencias del gen de globina (iA y p s de sentido respectivamente rodeando el sitio de mutación de células falciformes. El último es una sustitución de nucleótido único (A - * T) en el codón 6 en el gen de globina p, que resulta en una sustitución GAG (Glu)-KBIG (Val) (véanse secuencias medias).

ción de fragmentos entre 0.1 y 30 kb de largo depende de su lon gitud, pero muy poco de la composición de bases. Por tanto los fragmentos de estos límites de tamaño se fraccionan de tamaño en un sistema de electroforesis en gel de agarosa convencional. Una aplicación importante de la hibridación Southern blot en genética de mamíferos es el uso de una sonda para identificar se cuencias relacionadas que pueden pertenecer al mismo genom a (ade más de los miembros de una familia de genes o secuencias de DNA relacionados en términos evolutivos) o a otros genom as (p. ej., un gen ortólogo, que es un equivalente directo del gen que se utiliza co mo sonda). Una vez que se demuestra que una sonda recién aisla da se relaciona con otras secuencias no caracterizadas, puede intentarse aislar los otros miembros de la familia mediante la selec ción de genotecas d e DNA genóm ico (sección 5.3.4). Asimismo, la selección puede realizarse en muestras de DNA genómico de dife rentes especies (una z o o b lo t) con objeto de identificar secuencias

conservadas entre diferentes especies (véase fig. 7-9). Como las se cuencias de codificación están comparativamente muy bien conser vadas, éste es un medio para identificar DNA codificante.

Hibridación Northern blot La hibridación Northern blot es una variante de la Southern blotting en la que el ácido nucleico blanco es RNA no digerido en lu gar de DNA. Una utilidad principal de este método es obtener información de los patrones de expresión de genes específicos. Una vez que se clona un gen, puede emplearse como sonda e hibridarse contra un Northern blot que contiene, en diferentes sendas, mues tras de RNA aisladas de una variedad de tejidos distintos (véase fig. 6-13). Es posible que los datos obtenidos proporcionen informa ción respecto a la gama de tipos de células en los que el gen se ex presa y la abundancia relativa de transcritos. Además, al revelar

6.3 j VALORACIONES DE HIBRIDACIÓN DE ÁCIDO NUCLEICO MEDIANTE SONDAS DE DNA

D N A b la n c o

173

S onda de DNA

D ig e rir c o n e n d o n u c le a s a d e res tricció n

A ñ a d ir m a rcad o r, p. ej., m a rc a d o r ra d ia c tiv o (*)

A p lic a r a fo s o s in d ivid u ale s en un gel d e a g a ro s a

í

M ig ra c ió n

D e s n a tu ra liza r p o r c a lo r

P es o m o le c u la r a lto P eso m o le c u la r b a jo D e s n a tu ra liza r en álcali

H ib rid a r a D N A b la n c o in m o v iliza d o

A p lic a r a u n a m e m b ra n a d e n itro c e lu lo s a o nylon M e m b ra n a

*

T ran sferir D N A

G el

■ f a la m e m b ra n a L a v a r el exceso de sonda de DNA A p lic a r p la c a d e ray o s X P la c a M e m b ra n a

Fig. 6-12. La hibridación Southern blot detecta fragmentos de DNA blanco que se fraccionaron de tamaño mediante electroforesis en gel.

transcritos de diferentes tamaños, puede brindar pruebas de distin tas isoformas (p. ej., resultantes de promotores alternativos, sitios de empalme, sitios de poliadenilación, etc.).

6.3.3 La electroforesis en gel de campo pulsado extiende la hibridación Southern al incluir la detección de moléculas de DNA muy grandes La electroforesis en gel de agarosa estándar puede resolver fragmen tos de DNA de tamaño limitado, de 100 pb a unas 30 kb, como resultado del efecto d e tamizaje, las moléculas de DNA pasan a tra vés de poros en el gel de agarosa y las pequeñas pueden migrar con mayor rapidez por los poros. Sin embargo, por arriba de un cierto tamaño de fragmento de DNA, el efecto de tamizado ya no es efi caz y la resolución de fragmentos de DNA mayores de 40 kb es en extremo limitada. Ya que muchos genes de mamíferos y otras uni dades de secuencia funcionales son muy grandes, se requieren mé todos de electroforesis alternativos para separar fragmentos de DNA muy grandes. La electroforesis en gel de campo pulsado (EGCP) es una modificación más reciente de la electroforesis en gel de agarosa que puede resolver fragmentos de DNA de un tamaño que varía de

unas 20 kb a varios Mb de largo. Aunque las moléculas de DNA muy grandes incluidas en cromosomas de mamíferos —casi siempre de cientos de Mb de longitud— no pueden separarse por tamaño con este método, se sabe que nudeasas de restricción especializa das cortan DNA de vertebrados muy rara vez y producen fragmentos de restricción grandes que pueden separarse por tamaños mediante la electroforesis en gel de campo pulsado (EGCP). Estas enzimas, que también se conocen como en d on u clea sa s d e restricció n co r ta d ora s raras, a menudo identifican secuencias de reconocimiento abundantes en GC que contienen uno o más dinucleótidos CpG. Puesto que el dinudeótido CpG se observa con poca frecuencia en DNA de vertebrados, el DNA humano y los DNA de otros vertebra dos tienen comparativamente pocas secuencias de reconocimiento de enzimas de restricción que cortan las secuencias que contienen CpG (cuadro 6-3). El DNA genómico preparado no suele ser adecuado para EGCP porque los procedimientos relacionados con la lisis de célu las y la purificación del DNA producen fuerzas de desgarro que causan una fragmentación considerable del DNA. En lugar de ello, el DNA se aísla en una forma que permita reducir al mínimo la ro tura artificial de las moléculas grandes y luego se digieren con en donucleasas de restricción cortadoras raras apropiadas. Para

174

CAPÍTULO SEIS

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

LLI LU

_l

Z>

de la técnica recurren a un campo eléctrico único pero con rever siones periódicas de la polaridad ( electro fo resis en g e l d e in versión d e cam po), o rotación periódica del gel o los electrodos. En general cada uno de los diferentes métodos es el principio de un campo eléctrico discontinuo de modo que las moléculas de DNA se fuerzan de manera intermitente a cambiar su conformación y di rección de migración durante su paso a través del gel. El tiempo que una molécula de DNA requiere para alterar su configuración y reorientarse por sí misma en la dirección del nuevo campo eléctri co depende por completo del tamaño; por tanto pueden fraccionar se con eficiencia fragmentos de DNA hasta de varios Mb de tamaño, inclusive DNA intacto de cromosomas de levadura com pletos (Schwartz y Cantor, 1984).

6.3.4 Sondas de hibridación in situ se hibridan para desnaturalizar DNA de una preparación de cromosomas o RNA de un corte de tejido fijado en un portaobjetos de vidrio Hibridación cromosómica in situ

Fig. 6-13. La hibridación Northern biot se usa para valorar los patrones de expresión gruesos de un gen. El Northern blotting consiste en fraccionar de tamaño muestras de RNA total [o mRNA poll(A)+ purificado], transferir a una membrana e hibridar con una sonda de ácido nucleico marcada apropiada. El ejemplo muestra el empleo de una sonda cDNA marcada del gen FMR1 (síndrome de retraso mental por X frágil). Se detectaron concentraciones más altas en el cerebro y el testículo (4.4 kb), con expresión decreciente en placenta, pulmones y riñones respectivamente. Se encuentran múltiples transcritos más pequeños en el corazón. Reproducido de Hinds y col. (1993) con autorización de Nature Publishing Group.

preparar DNA de peso molecular alto se mezclan muestras de célu las, por ejemplo, glóbulos blancos, con agarosa fundida y después se transfieren a fosos en un formador de bloques y se dejan enfriar. Como resultado las células quedan atrapadas en bloques sólidos de agarosa (fig. 6-14). Se remueven los bloques de agarosa y se incu ban con enzimas hidrolíticas que se difunden a través de los poros pequeños en la agarosa y digieren componentes celulares, pero de jan casi intacto el DNA cromosómico de peso molecular alto. A continuación pueden incubarse bloques individuales que contienen DNA de peso molecular alto purificado en un amortiguador que incluye una endonucleasa de restricción cortadora rara. Con objeto de separar por tamaño los fragmentos de restricción grandes incluidos dentro de los bloques de agarosa, estos últimos se colocan en fosos en un extremo de un gel de agarosa contenido en un aparato de EGCP. Como en la electroforesis en gel convencio nal, el DNA de carga negativa se repele del electrodo negativo y mi gra en el campo eléctrico. Sin embargo, durante una carrera de EGCP la orientación relativa d el g e l y el campo eléctrico se altera de manera periódica, p o r lo general m ediante el ajuste de un interruptor para proporcionar pulsos de potencia breves, activando alternativa m ente dos campos orientados en form a diferente (fig. 6-14). Variantes

Un procedimiento simple para marcar genes y otras secuencias de DNA consiste en hibridar una sonda de DNA marcada apropiada contra DNA cromosómico que se desnaturalizó in situ. Para efec tuarlo se hace una preparación de cromosomas en un portaobjetos para microscopio que se seca al aire (con frecuencia cromosomas en metafase o prometafase de linfocitos de sangre periférica o líneas de células linfoblastoides). El tratamiento con ribonucleasa (RN-asa) y proteinasa K produce DNA cromosómico purificado en forma parcial, que se desnaturaliza al exponerlo a formamida. Se dispone entonces de DNA desnaturalizado para hibridación in situ con una solución añadida que contiene una sonda de ácido nucleico marca da, recubierto con un cubreobjetos. Según la técnica particular que se utiliza, el bandeo cromosómico de los cromosomas puede arre glarse antes o después del paso de hibridación. Como resultado, la señal obtenida tras eliminar el exceso de sonda puede correlacionar se con el patrón de bandeo cromosómico con objeto de identificar un mapa de localización para las secuencias de DNA que la sonda reconoce. El uso de técnicas de h ib rid a ció n d e flu o r es cen cia in si tu (HFIS) revolucionó la hibridación cromosómica in situ (véase sección 2.4.2).

Hibridación de tejidos in situ En este procedimiento se hibrida una sonda marcada contra RNA en cortes de tejido (Wilkinson, 1998). Los cortes se elaboran de te jido embebido en parafina o congelado por medio de un criostato y luego se montan en un portaobjetos de vidrio. La mezcla de hibri dación que incluye la sonda se aplica al corte en el portaobjetos y se protege con un cubreobjetos de vidrio. Por lo general la mezcla de hibridación tiene una concentración de formamida de 50% a fin de disminuir la temperatura de hibridación y minimizar los proble mas de evaporación. Aunque se utilizan cDNA de doble cadena como sondas, se pre fieren las sondas de RNA complementario de cadena única (ribosondas): la sensibilidad de las sondas iniciales de cadena única suele ser más alta que la de las sondas de doble cadena, quizá porque una proporción de la sonda de doble cadena desnaturalizada se renaturaliza para formar una homodúplex de sondas. Las ribosondas de cRNA que son complementarias al mRNA de un gen se conocen

6.3

VALORACIONES DE HIBRIDACIÓN DE ÁCIDO NUCLEICO MEDIANTE SONDAS DE DNA

I

175

Cuadro 6 3. Ejemplos de endonucleasas de restricción “cortadoras raras”. Enzima

Origen

Corte de secuencia; CG = CpG; N = A, C, G o T

Sma 1

Serratia marcescens

CCCGGG

78

SssHil

Bacillus stearothermophilus

GCGCGC

390

Sacli

Streptomyces lividans

CCGCGG

390

Sffl

Streptomyces fimbriatus

GGCCNNNNNGGCC

400

Atoa

Norcadia otitidis-caviarum

GCGGCCGC

Tamaño de fragmento promedio esperado (kb) en DNA humano3

9 766

‘ Asumiendo 40% de G + C y una frecuencia de CpG 20% de la esperada.

S an gre^

R eunir } — g ló b u lo s b la n c o s

A g a ro s a fu n d id a

T ran sferir la m e z c la a c a v id a d e s en un m o ld e p a ra fo rm a r b lo q u e s y p e rm itir q u e el a g a r s e so lid ifiq u e

In a c tiv a r p ro te in a s a K; la var p a ra elim in ar , d e s e c h o s ce lu la res D ig e rir co n

DNA de peso m o le c u la r a lto a tra p a d o

n u c le a s a d e res tricció n c o rta d o ra rara

I

±m

V © E2 I

In c u b a r en p ro te in a s a K y SDS

E 1 0

C élu la s a tra p a d a s

__ i___

©

E2

N

© < i E1

I

P o ro en a g a ro s a

Insertar bloques

In te rru p to r p e rió d ic o (pulsación) d e e n e rg ía e n tre p a re s d e e le c tro d o s (E1 y E2)

en fo s o s d e gel d e a g a ro s a

M ig ra c ió n n e ta

Fig. 6-14. Fraccionamiento de DNA de peso molecular alto de células hematológicas mediante electroforesis en gel de campo pulsado.

como ribosondas antisentido y pueden obtenerse mediante clona ción de un gen en la orientación inversa en un vector apropiado co mo pSP64 (fig. 6-3). En estos casos la polimerasa fago sintetizará transcritos marcados de la cadena de DNA opuesta a la que en con diciones normales se transcribe in vivo. Los testigos útiles para estas reacciones incluyen ribosondas de sentido que no deben hibridarse a mRNA excepto en los casos raros en que las dos cadenas de DNA de un gen se transcriben. El marcado de sondas se realiza con radioisótopos seleccionados, en especial 35S, o mediante marcado no isotópico. En el primer ca so la sonda hibridada se visualiza por procedimientos autorradiográ-

ficos. A menudo la localización de los granos de plata se observa só lo con microscopía de campo oscuro (no se permite que llegue luz directa al objetivo; en su lugar, los rayos de luz que iluminan se di rigen de un lado de manera que sólo penetra luz dispersa en las len tes del microscopio y la señal aparece como un objeto iluminado contra un fondo negro). Sin embargo, la microscopía de campo brillante (en la que la imagen se obtiene por transmisión directa de la luz a través de la muestra) proporciona una detección de señal más adecuada (véase fig. 6-15). El marcado con fluorescencia es un mé todo de marcado no isotópico popular y la detección se efectúa por microscopía de fluorescencia (véanse recuadro 6-2, fig. 6-5).

176

,o

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

6.4 Valoraciones de hibridación m ediante el uso de DNA blanco clonado y m icroarreglos Algunas de las técnicas descritas en la sección anterior (p. ej„ la hi bridación Southern blot y la hibridación dot-blot) también se em plean para estudiar tanto DNA clonado como DNA no clonado. Sin embargo, las técnicas que se describen en las dos secciones si guientes se usan para analizar DNA clonado. En una tercera sec ción se describen tecnologías de microarreglos muy potentes desarrolladas en fecha más reciente.

6.4.1 La hibridación colony blot y la de levantado de placa son métodos para seleccionar colonias o placas bacterianas separadas Como se describe en la sección 5.3.5, suele ser posible seleccionar e identificar colonias de bacterias u otras células huésped apropiadas que contienen DNA recombinante por la capacidad del inserto para inactivar un gen vector marcador (p. ej., galactosidasa @, o un gen de resistencia a antibióticos). No obstante, si el DNA recombi nante apropiado contiene una secuencia de DNA que se relaciona muy de cerca con una sonda de ácido nucleico disponible puede detectarse en forma específica por hibridación. En el caso de células bacterianas utilizadas para propagar plásmidos recombinantes se permite que las colonias de células crezcan en una superficie de agar y luego se transfieren por contacto de superficie a una membrana de nitrocelulosa o nylon, un proceso que se conoce como blotting co lony (manchado de colonias) (véase fig. 6-16). De otra manera la mezcla de células se disemina en una membrana de microcelulosa o

nylon colocada en la parte superior de la superficie de agar nutrien te y se permite que se formen colonias directamente en la parte su perior de la membrana. En cualquiera de los métodos, la membrana se expone después a álcali para desnaturalizar el DNA antes de hibridarlo con una sonda de ácido nucleico marcada. Tras la hibridación, se elimina la solución sonda, el filtro se la va en forma extensa, se seca y se envía para autorradiografía con una placa de rayos X. La posición de las señales radiactivas poten tes se relaciona contra una placa maestra que contiene el patrón ori ginal de colonias a fin de identificar las que contienen DNA relacionado con la sonda. A continuación puede tomarse y ampli ficarse de manera individual el cultivo antes de la extracción y pu rificación del DNA recombinante. Puede realizarse un proceso similar cuando se utilizan vectores fago. Las placas que se forman después de la lisis de células bacte rianas por fago contendrán partículas residuales de fago. Se coloca una membrana de nitrocelulosa o nylon en la parte superior de la placa de agar en la misma forma que la anterior y cuando se remue ve de la placa constituye una copia fiel del material fago en las placas, un método llamado levantamiento de placa. El procesamiento subsecuente del filtro es idéntico al del esquema que se muestra en la figura 6-16.

6.4.2 Los arreglos de alta densidad en rejillas de clonas de células transformadas o clonas de DNA incrementaron de modo considerable la eficiencia de la selección de genotecas de DNA La creación de genotecas de DNA complejo demandó métodos más eficientes de selección de clonas. En lugar de sólo sembrar las colonias de células en una placa en un plato para cultivo celular y

Fig. 6-15. La hibridación de tejida in situ proporciona patrones de expresión gánica de alta resolución. El ejemplo muestra el patrón de hibridación producido mediante una ribosonda antisentido de cadena pesada de miosina p marcada con 35S contra un corte transversal del tejido de un embrión de ratón de 13 días. Las áreas oscuras representan un marcado potente, notable en los ventrículos del corazón. Proporcionada por el doctor David Wilson, University of Newcastle upon Tyne, UK.

6.4 ! VALORACIONES DE HIBRIDACIÓN MEDIANTE EL USO DE DNA BIANCO CLONADO

177

M e m b ra n a n itro c e lu lo s a /n y lo n C o lo c a r la m e m b ra n a en la p a rte s u p e rio r d e a g a r q u e c o n tie n e co lo n ia s b a c te ria n a s s e p a ra d a s In v ertir la m e m b ra n a y c o lo c a rla s o b re n u e v a s u p e rfic ie d e ag ar; p e rm itir q u e las co lo n ia s reg e n ere n en la p a rte s u p e rio r del filtro

P e rm itir la re c u p e ra c ió n d e c é lu la s o rig in ale s

\ P la c a m a e s tra / \ ¡

C re c im ie n to en cu ltivo Id e n tific a r en líq u id o I co lo n ia s / p o s itiva s y p a s a rla s a A cu ltivo en líq uido

, P I \

R é p lic a d e l filtro en a g a r n u e vo Q u ita r la m e m b ra n a co n c o lo n ia s unidas; s u m e rg irla en s o lu c io n e s su ces iva s a) D e s n a tu ra liza n te b) N e u tra liza r c) L a var d) S e c a r/fija r D N A

P la c a d e . rayos X

1. H ib rid a r con s o n d a m a rc a d a

2. L a var 3. A u to rra d io g ra fía

D N A b a c te ria n o fija d o a la m e m b ra n a

Fig. 6-16. La hibridación colony blot consiste en replicar colonias en una membrana durable antes de la hibridación con una sonda de ácido nucleico marcado. Este método se usa para Identificar colonias que contienen DNA recombinante, debería disponerse de una sonda marcada.

transferirlas a una membrana en el colony blotting estándar se pre firió tomar colonias individuales y transferirlas a membranas gran des en el formato de un a rreg lo en rejilla d e a lta densidad. El proceso de generar arreglos se simplificó mucho con la apli cación de dispositivos robóticos para enrejado que permitió au tomatizar la realización del manchado necesario colocando con pipetas las clonas dispuestas en platos de microtítulo en coordena das lineales predeterminadas en una membrana. Los filtros de clo nas de alta densidad resultantes permitieron la selección rápida y eficiente de genotecas (véase fig. 6-17) y posibilitaron copiarlas y distribuirlas a numerosos laboratorios en todo el mundo.

dad de miniaturización y automatización (Schena y cois., 1998). Aunque es una reminiscencia de los arreglos basados en filtros, la construcción de microarreglos incluye procedimientos muy distin tos. Por lo general las superficies relacionadas son portaobjetos de un microscopio de vidrio tratados por medios químicos en lugar de las membranas porosas, aunque en fecha más reciente se observa una tendencia a utilizar sustratos más porosos, por ejemplo, super ficies de vidrio recubiertas con nitrocelulosa, como esfuerzo para enlazar más DNA e incrementar la sensibilidad. Existen dos tipos muy distintos de tecnología de microarreglo según las diferencias en la forma en que se generan y llevan muestras de ácido nucleico a los microarreglos:

6.4.3 La tecnología de microarreglos de DNA extendió muchísimo la potencia de la hibridación de ácido nucleico

► microarreglos de ácidos nucleicos presintetizados. En este caso los ácidos nucleicos que se encuentran en los microarreglos se sintetizaron antes (con frecuencia consisten en conjuntos de clonas de DNA diferentes pero en principio pueden ser conjun tos de oligonucleótidos sintetizados con anterioridad). Aquí la construcción del microarreglo significa que se manchan clonas

Los microarreglos de DNA recién desarrollados mejoraron la tec nología de valoración por hibridación gracias a su enorme capaci

178

CAPÍTULO SEIS

HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

Fig. 6-17. Los filtros de hibridación de clonas en rejilla facilitaron el mapeo físico del genoma humano. La figura ilustra la autorradiografía de una membrana que contiene clonas de YAC humanos (es decir, DNA total de clonas de levadura individuales que contienen YAC humanos). La membrana alberga un total de 17 664 clonas que se colocaron en arreglos en rejilla de una unidad rejilla de 6 x 6 clonas. Las señales de hibridación incluyen señales débiles de todas las clonas con una sonda marcada con 35S de DNA de levadura total aunadas a señales potentemente hibridantes obtenidas con una sonda de cromosoma del sexo único marcada con 32P (DXYS646). Fotografía original del doctor Mark Ross, Sanger Centre, Cambridge. Reproducida de Ross y Stanton (1995) En: Current Protocols in Human Genetics, Vol. 1, este material se utilizó con autorización de Wiley-Liss, Inc., una subsidiaria de John Wiley & Sons, Inc.

de DNA o de oligonucleótidos individuales en sitios separados en la superficie de un portaobjetos para microscopio, especifi cados mediante coordenadas x,y precisas en una parrilla miniaturizada (fig. 6-18A). Aunque la alta precisión en el suministro de las muestras requiere dispositivos de pintado por contacto robóticos muy complicados, pueden encontrarse instrucciones detalladas para preparar este tipo de dispositivos en http://cmgm.stanford.edu/pbrown/mguide/ ► microarreglos de oligonucleótidos sintetizados in situ. Este método lo propuso por primera vez por la compañía Affymetrix y casi siempre comprende una combinación de tecnología de fotolitografía de la industria de semiconductores con la quími ca de síntesis de oligonucleótidos. En este caso se ensamblan in situ muchos miles de oligonucleótidos distintos en la superficie de un portaobjetos de vidrio, en una serie de pasos de síntesis secuenciales que incluye la adición de un nucleótido a la vez. El proceso requiere el acoplamiento covalente de mononucleótidos a una molécula enlazadora que termina con un grupo pro tector fotolábil (fig. 6-18B).

Se usa una fotomáscara para determinar las posiciones que reaccio nan con la luz: una abertura en la fotomáscara en un sitio particu lar admitirá luz de una fuente luminosa externa, destruyendo los grupos protectores fotolábiles. A continuación se utiliza una reac ción química de acoplamiento para añadir un tipo particular de nu cleótido al nuevo sitio desprotegido y el proceso se repite con una máscara diferente, pero las posiciones ocultadas por la máscara se protegerán de la luz. En esta forma es posible construir secuencias de oligonucleótidos específicas en sitios predeterminados según el ordenamiento de orificios cortados en el fotolitógrafo que se em plea para ese paso de síntesis. La similitud con la producción de chips de silicón condujo a popularizar el uso del término chip de DNA para los microarreglos de este tipo. A causa de la compleja tecnología necesaria para producirlos, los chips de DNA deben ad quirirse de compañías especializadas. Como en el dot-blotting inverso (sección 6.3.1), las tecnologías del microarreglo de DNA operan con un método de hibridación de ácido nucleico inverso. La son d a es el grupo de ácidos nucleicos no marcados fijada al microarreglo. Aunque resulta complejo, la son da es la cantidad conocida y se utiliza para interrogar el b la n co que a pesar de consistir en ácidos nucleicos marcados en solución se de riva de fuentes de las que se desea información. La reacción de hibridación puede llevarse a cabo una vez que se construye o compra un microarreglo, y se aísla una fuente de ácido nucleico a investigar. El blanco se marca con un flu o r ó fo r o y se de ja que entre en contacto con el microarreglo, lo que permite que se formen heterodúplex de sonda-blanco, después de lo cual el lavado por hibridación reduce al mínimo al marcador no enlazado de ma nera específica. En la mayor parte de las hibridaciones de microa rreglos se utilizan dos fluoróforos, por lo general Cy3 (excitación de canal verde) y Cy5 (excitación de canal rojo). Tras la hibridación, el marcado fluorescente enlazado se detecta con un ex plorador lá ser de alta resolución y el proceso de explora ción incluye adquirir una imagen de ambos fluoróforos para elaborar una imagen de relación. El patrón final de hibridación se obtiene me diante el análisis de la señal emitida de cada punto en el arreglo con un p rogra m a d e com p u ta d ora d e im á gen es digita les que convier te la señal en una paleta de colores según su intensidad (fig. 6-19). Aunque la tecnología para establecer microarreglos de DNA se desarrolló sólo hasta fecha muy reciente, ya tiene numerosas aplica ciones importantes y se espera que su efecto en investigación biomédica y métodos diagnósticos futuros sea profundo. Las principales aplicaciones comprenden: ► selecció n d e expresión. El enfoque de la mayor parte de los es tudios actuales basados en microarreglos es la vigilancia de los niveles de expresión de RNA (Granjeaud y cois., 1999), que pue de realizarse con microarreglos de clonas de cDNA (fig. 6-19) o de oligonucleótidos específicos de gen (por lo general prepa rados mediante síntesis de oligonucleótidos in situ; véase figs. 17-18 y 19-6, y sección 19.3.3). ► selecció n d e v a ria ción d e DNA. Para este propósito general se requieren microarreglos de oligonucleótidos y se diseñaron va rias aplicaciones. La nueva secuenciación del genoma mitocondrial humano mediante microarreglos de DNA fue una prueba satisfactoria del poder de esta tecnología para estimar la varia ción de secuencias a gran escala en individuos (véase fig. 7-4). También tiene un potencial enorme para valorar la presencia de mutaciones en genes de enfermedad conocidos. Además se efec túan grandes esfuerzos para identificar y catalogar marcadores de polimorfismo de nucleótido único (PNU) humanos.

6.4

VALORACIONES DE HIBRIDACIÓN MEDIANTE EL USO DE DNA BLANCO CLONADO

j

179

A)

B) F U E N T E L U M IN O S A

F o to m á s c a ra G ru p o s p ro te c to re s fo to lá b ile s

S IN T E S IS

O b le a d e vidrio

u>1 w 0) c co

A G C T

C T T C

A C C G

T C G A

P a s o s d e fo to o c u lta c ió n y síntesis re p e tid o s

Fig. 6-18. Preparación de microarreglos de DNA de oligonucleótidos. A) Manchado robótico para la elaboración de microarreglos de DNA. Izquierda: un robot para microarreglos en forma de mesa que contiene 160 portaobjetos con cuatro placas del microtítulo, dos estaciones para lavado y el secador. Derecha: escáner láser que muestra la mesa óptica, abastecedores de energía para los láser y enfriamiento con tubo fotomultipllcador, la etapa Ludí y lentes (véase Cheung y cois., 1999 para mayores detalles). El micromanchado de muestras mediante el robot puede realizarse por contacto físico entre las agujas de manchado y la superficie sólida (de jn portaobjetos para microscopio) con un método de chorro de tinta (ink-jetting) que se utiliza en las imprentas estándar (la muestra se carga en una Doquilla en miniatura equipada con una piezoeléctrica ajustada y se usa una corriente eléctrica para expulsar una cantidad precisa de líquido del chorro -acia el sustrato). Fotografías proporcionadas por Aldo Massimi, Raju Kucherlapati y Geoffrey Childs del Albert Einstein College of Medicine. Reimpresas de Cheung y cois. (1999) Nature Genet. 21 (Suppl.), 15-19, con autorización de Nature Publishing Group. B) Preparación de un microarreglo de oligonucleótidos combinando fotolitografía y síntesis in situ de oligonucleótidos. Estos últimos se sintetizan in situ en pasos secuenciales comenzando :ssde un mononucleótido 3 ' que está anclado a la superficie de una oblea de vidrio. La fotolitografía comprende la modificación de la oblea de vidrio con grupos protectores fotolábiles que pueden eliminarse cuando se exponen a la luz y el uso de fotomáscaras construidas con cuidado que permiten que pase luz a través de ellas hacia coordinadas espaciales seleccionadas cuidadosamente. En las áreas de la oblea que reciben la luz que pasa a ravés de la fotomáscara, la eliminación de los grupos protectores fotolábiles permite un nuevo paso de síntesís. En este ejemplo se muestra el í::D lam iento de timidina junto con un grupo fotolábil protector.

180 i CAPÍTULO SEIS j HIBRIDACIÓN DE ÁCIDO NUCLEICO: PRINCIPIOS Y APLICACIONES

9 0

• •

4

O 9

* •» >

• & :a

»

«

>0

o

o«

4#

o

a -

-O *oo ®í590

-

»

5 9

0 3

Ö

o

^ 9 9 9 W^9

O» >5» *

«

*» ■ ■ ■ '■ 0 d 9 ’J O «

9 9 -i 9 9 ^

-

9

9

9

9

»o

9 9>

19 ■ » m e»

9

*j

*»

m m m

1 ♦

#

di

a

- V

Q

0

9

o 9 « «• •

9 -. o • •?

2

9* < » m ,>

9

■ ■í * ,

* mm

9« -

*• :.■ '•> - ¿ 9

9 +

... 3Oa

O

9 *

'•« 9 9

9

■.-) 9

•# ^ >

» 9 A

m m 9 m

■ «

•

O «

; » ••*

«

-3

v

9 •

>

9 •■ ■« 9 <

»

4» * «

■

*j> •

«9

-■»

" O

a o O :¿9

- « * . . •» ” * .< 2» • .. # » ■ * « » 9 ■■ i 6* c Edn. IRL Press, Oxford.

CAPÍTULO

SIETE

,

Análisis del DNA y estructura variación y expresión génicas Contenido del capítulo

182

.1

CAPITI LO SIETE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Secuenciación y genotipificación de DNA

Los individuos de una especie portan diferencias genéticas, mu chas de las cuales pueden tener consecuencias importantes. Por tanto, si bien fue fundamental comprometer tanto esfuerzo a los proyectos del genoma, aún serán de interés el mapeo y la secuen ciación de DNA de individuos dentro de una especie, en especial la humana, y la tipificación de la variación del DNA (genotipi ficación) . Aun cuando los métodos tradicionales de mapeo y secuencia ción o físicos a gran escala serán útiles para obtener nuevas secuen cias del genoma, los superarán técnicas más potentes, por completo automatizadas, para establecer la estructura del DNA, de manera directa o en la búsqueda de variaciones génicas. La hibridación de microarreglos basada en oligonucleótidos, por ejemplo, permite la nueva secuenciación (resecuenciación) del DNA de individuos una vez que se establece una secuencia de referencia.

7.1.1 La secuenciación estándar de DNA incluye la síntesis enzimàtica de DNA mediante terminadores de cadena didesoxinucleótidos específicos de bases Aunque los métodos clínicos para la secuenciación del DNA aún tienen ciertas aplicaciones (Maxam y Gilbert, 1980) (p. ej., secuen ciación de oligonucleótidos; véase sección 7.2.4), la vasta mayoría de la secuenciación actual de DNA utiliza un método enzimàtico desarrollado por Freed Sanger, quien obtuvo un segundo premio Nobel (el primero lo recibió por el desarrollo de la secuenciación de proteínas). En el método de secuenciación didesoxi, el DNA se proporciona en forma de cadena tínica (véase recuadro 7-1 ) y actúa como plantilla para formar una cadena de DNA complementaria nueva in vitro mediante una polimerasa de DNA apropiada. Hay cuatro reacciones paralelas, cada una de la cuales contiene los cua tro dNTP aunados a una proporción pequeña de uno de los cuatro didesoxinucleótidos (ddNTP) análogos que servirán como un terminador de cadena específico de bases.

Recuadro 7-1. Producción de plantillas de secuenciación de DNA de cadena única Las plantillas de cadena única para secuenciación de DNA pueden ob tenerse mediante: ► la elaboración de DNA recombinante de cadena única utilizando vec tores de clonación especializados como M13 o fagómides, un méto do que se utiliza con amplitud; véanse sección 5.5.1 y fig. 5-18. Aqui la síntesis de DNA complementario se ceba mediante un cebador de secuenciación universal que es complementarlo de la secuencia del vector que flanquea el sitio de clonación y también puede emplearse para cebar la síntesis de nuevas cadenas para cualquier recombinan te de cadena única que se produzca por medio de ese vector (véase fig. Inferior Izquierda);

► secuenciación de ciclo (también llamada secuenciación de am pli ficación lineal). Como la PCR estándar, la secuenciación de ciclo usa una polimerasa de DNA termoestable y un formato de desnaturaliza ción del ciclo de temperatura, asociación (annealing) y síntesis de DNA. La diferencia radica en que en la secuenciación de ciclo sólo se emplea un cebador e incluye un terminador de cadena ddNTR El uso de sólo un cebador significa que el producto se acomoda de manera lineal, a diferencia del Incremento exponencial del producto durante la PCR estándar (véase fig. inferior derecha).

5' I

3'C

i

3' I 5' D esnaturalizar por calor y asociar (anneal) el ce b ad o r único

51

Inserto o

o o W 0

1

Puede utilizarse un cebador de secuenciación universal a fin de secuenciar muchos DNA de plantilla diferentes

3'í

□ 5'

l

Síntesis d e D N A en presencia de cuatro d N T P aunados a un d d N T P * y polim erasa de D N A term oestable

La secuenciación del ciclo incluye la amplificación lineal mediante un cebador aislado para iniciar la síntesis de DNA

7.1 | SECUENCIACIÓN Y GENOTIPIFICACIÓN DE DNA

Los ddNTP se relacionan muy de cerca con los dNTP normajs : sólo difieren en que carecen de un grupo hidroxilo en la posición te. carbono 39 así como en e l carbono 29 (fig. 7-1). Puede incorpo-use un didesoxinucleótido en la cadena de DNA en crecimiento si formar un enlace fosfodiéster entre su átomo de carbono 59 y el :jrbono 39 del nucleótido incorporado con anterioridad. Sin emr irgo, como los ddNTP carecen del grupo hidroxilo 39, cualquier idNTP que se incorpore en una cadena de DNA en crecimiento zo puede participar en el enlace fosfodiéster en su átomo de carbo no 39 y por consiguiente originará la terminación súbita de la sín tesis de la cadena. La cadena de DNA en crecimiento se marca mediante el asegu-¿miento del marcado de uno de los cuatro dNTP o del cebador con jji grupo radioisótopo o un fluoróforo característico. Al establecer .ma concentración de ddNTP mucho más baja que su análogo dNTP normal, habrá una competencia entre una molécula específi ca de ddNTP y un exceso de moléculas análogas de dNTP para in fusión en la cadena de DNA en crecimiento -si se incluye un cNTP, la extensión de la cadena continúa, pero a veces se incorpo ra un ddNTP y da lugar a la terminación de la cadena-. En conse cuencia cada reacción es una reacción parcial porque la terminación ¿e la cadena ocurrirá de manera aleatoria en una de las posibles elec;iones para un tipo específico de base en cualquier cadena de DNA. Puesto que el DNA en una reacción de secuenciación de DNA casi siempre es una población de moléculas idénticas, cada una de las cuatro reacciones específicas de base generará un conjunto de —aginemos de DNA marcados. Los fragmentos de DNA sintetiza dos en cada una de las cuatro reacciones abarcarán una gama de ta maños diferentes. Tienen un extremo 59 común pero extremos 39 ■.ariables (el extremo 59 se define por el cebador de secuenciación; los extremos 39 son variables porque la inserción del ddNTP selec cionado ocurre en form a aleatoria en una de las múltiples posicio nes distintas que aceptarán esa base específica) (véase fig. 7-2). Los fragmentos que difieren de tamaño incluso en un nucleóti do aislado pueden fraccionarse de tamaño en un g e l d e p olia crila -

183

m ida desnaturalizante (un gel que contiene una concentración al ta de un agente desnaturalizante -como urea 8 M - que asegura que el DNA que migra permanezca de cadena única). Con anterioridad en las reacciones de secuenciación de DNA se utilizaba el marcado con radioisótopos como 35S o 33P y después de exponer el gel de se cuenciación secado a una placa de rayos X, la secuencia se leía ma nualmente siguiendo las bandas sucesivas en la autorradiografía. Los métodos de secuenciación de DNA automatizados superaron este problemático método.

7.1,2 Secuenciación automatizada de DNA y resecuenciación basada en microarregios Secuenciación automatizada de DNA La secuenciación automatizada de DNA utiliza el m arcado con fluorescencia-, el DNA se marca mediante la incorporación de un cebador o dNTP que porta un flu oró fo ro (un grupo químico capaz de fluorescer; véase sección 6.1.2). El uso de diferentes fluoróforos en las cuatro reacciones específicas de base significa que, a diferen cia de la secuenciación convencional de DNA, todas las cuatro reacciones pueden cargarse en una sola línea. Durante la electroforesis, un monitor detecta y registra la señal de fluorescencia confor me el DNA pasa a través de un punto fijo en el gel (fig. 7-3A). Esto proporciona un rendimiento en forma de perfiles de intensidad pa ra cada uno de los diferentes fluoróforos de colores al tiempo que la información se guarda electrónicamente (fig. 7-3B). Si se sabe que la secuencia de DNA es codificante, el producto obtenido pue de traducirse de inmediato en diferentes marcos de lectura a fin de deducir una secuencia polipéptida. Aunque muchos secuenciadores automatizados de DNA recurren a la electroforesis en planchas de gel de acrilamida, en la secuenciación de DNA de alta productividad se emplean secuenciadores capilares en los que las muestras de DNA migran a través de tubos capilares de vidrio largos muy delgados que se llenaron con el gel (véase Meldrum, 2000). Es posible lograr un mayor grado de automatización si se evita la necesidad de gel en moldes grandes.

NH,

Nueva secuenciación mediante hibridación de microarregios HC HC ® ® ® — o -c h 2

v

\

mi

Fig. 7-1. Estructura de un didesoxinucleótido, 2 ,3' didesoxi CTP (ddCTP). N ota: el grupo hidroxilo unido al carbón 3 ' en nucleótidos normales es reemplazado por un átomo de hidrógeno (se muestra en el cuadro sombreado).

Una vez que las secuencias se establecieron, en principio pueden usarse como secuencias de rtferencia con objeto de ayudar a diseñar oligonucleótidos para secuenciación de DNA basada en hibridación. Ello comprende la síntesis de oligonucleótidos in situ en una super ficie de vidrio para que actúe como una sonda de hibridación a fin de estudiar el DNA a secuenciar (véase sección 6.4.3 para el princi pio de microarregios de oligonucleótidos). La nueva secuenciación (resecuenciación) puede efectuarse mediante la hibridación de microarreglos en una forma muy automatizada con una productividad que excede con mucho la de la secuenciación automatizada del DNA. Un caso de estudio incluyó la “resecuenciación” de DNA mitocondrial de 16.5 kb (mtDNA) (Chee y cois., 1966; véase fig. 7-4), pero la secuenciación a muy gran escala por hibridación de microarreglos implica grandes desafíos técnicos.

7.1.3 Genotipificación básica de polimorfismos de sitio de restricción y número variable de polimorfismos de repetición tándem Dos tipos básicos de polimorfismo son factibles de genotipificarse por medio de métodos simples: polimorfismos de sitio de restricción

184 | CAPÍTULO SIETE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Plantilla de DNA d e caden a única

+20 5' ■ -

+1

CGAATGCTCAGGCCATCATC.

IIIIIIIIIIIIII I5' Síntesis de ! DNA nuevo !

C ebador n n u c le ó tid o s d e la rg o

r e a c c ió n ] ( t e r m in a c p n c jd A T P )

!

*

i AG AGTAG 3' ÁG TCCG G TAG TAG ACGAGTCCG GTAGTAG

c : t :

L o n g itu d d e l D N A s in te tiz a d o n n 5' n n

+ + + +

2 5 13 16

F r a c c io n a m ie n to s e g ú n e l ta m a ñ o n + 20 = G n + 19 = C n + 18 = T n + 17 = T

r e a c c ió n ( t e r m in a c o n d d C T P )

n + 16 = A n + 15 = C

.C G G T A G T A G c CCGG TAG TAG c 3' . C G A G T C C G G T A G T A G t: C TTAC GAG TCCG G TAG TAG c

n n 5' n n

+ + + +

9 10 15 19

n + 14 = G n + 13 = A n + 12 = G n + 11 = T

r e a c c ió n ( t e r m in a c o n d d G T P )

n + 10 = C . GTAG c „ GTAGTAG c 3' , GGTAGTAG c . G TCCG G TAG TAG c , GAGTCCGGTAGTAG= G C TTAC GAG TCCG G TAG TAG c

n n n 5' n

+1 + 4 + 7 + 8

n + 12 n + 14 r? + 20

[T i r e a c c ió n ( t e r m in a c o n d d T T P

. TAG l . TAG TAG : 3' . T CCGG TAG TAG : .T A C G A G T C C G G T A G T A G c TTAC G AG TCCG G TAG TAG :

n n 5' n n n

+ 3 + 6 + 11 + 17 +18

n +

9 = C

n +

8= G

n+

7 = G

n+

6 = T

n +

5 = A

n +

4 = G

n+

3 = T

n+

2 = A

n +

1 = G

Fig. 7-2. La secuenciación de dldesoxi DNA se basa en la incorporación aleatoria de termlnadores de cadena específicos de base durante la sínte sis de DNA in vitro. El cebador de secuenciación se enlaza de manera específica a una región 3 ' de la secuencia deseada de DNA y ceba la síntesis de una cadena de DNA complementaria en la dirección indicada. Se llevan a cabo cuatro reacciones específicas de base paralelas, cada una de ellas con los cuatro dNTP y con un ddNTR La competencia para la incorporación en la cadena de DNA en crecimiento entre un ddNTP y su análogo dNTP normal produce una población de fragmentos de diferentes longitudes. Los fragmentos tendrán un extremo 5 ' común (definido por el cebador de secuenciación) pero extremos 3 ' varia bles según se haya insertado un didesoxinucleótido (que se muestra con un círculo lleno arriba). Por ejemplo, en la cadena de reacción específica A la ex tensión ocurre hasta que se incorpora un nucleótido ddA (se muestra como A con un círculo rojo lleno arriba). Esto dará lugar a una población de fragmentos de DNA de longitudes n + 2, n + 5, n + 13, n + 16 nucleótidos, etc., cuyo fraccionamiento de tamaño, como se muestra a la derecha, pro ducirá la secuencia siguiente de n = 1 a n + 20, GATGATGGCCTGAGCATTCG, que es el complemento inverso de la secuencia que se muestra en la par te superior izquierda.

7.1 i SECUENCIACIÓN Y GENOTIPIFICACIÓN DE DNA

185

Computadora

Salida

Lá ser

D e te c to r

© B) 450 460 470 480 490 500 510 520 ATTCACACTTG AGTAACTCG CTATCCATTTCTTCCAATG TCTCTTCAG CCATCATGTCTTCTATCTCTG TG TCGG A

Fig. 7-3. Secuenciación automatizada de DNA con cebadores fluorescentes. A) Principios de la secuenciación automatizada de DNA. Los cuatro productos de reacción se cargan en hileras únicas de gel de electroforesis o en capilares de gel únicos. Se utilizan cuatro colorantes fluorescentes separados como marcadores para las reacciones específicas de base (el marcador puede incorporarse mediante su fijación a un ddNTP específico de base o su unión al cebador y teniendo cuatro grupos de cebadores que correspon den a las cuatro reacciones). Durante la electroforesis se enfoca un haz láser en una posición específica constante en el gel. Conforme los fragmentos de DNA individuales migran después de esta posición, el láser causa la fluorescencia de los colorantes. La fluorescencia máxima ocurre a diferentes lon gitudes de onda para los cuatro colorantes, la inform ación se registra por medios electrónicos y la secuencia interpretada se almacena en una base de datos de computadora. B) Ejemplo de producción total de secuencia de DNA. Se muestra una producción típica de datos de secuencia como una su cesión de perfiles de intensidad específicos de colorante (y por tanto específicos de base). El ejemplo que se ilustra muestra una secuencia de cDNA :e l gen polihomeótico humano recién identificado PHC3 (Tonkin y cois., 2002). Datos proporcionados por la doctora Emma Tonkin, Institute of Human Genetics, University of Newcastle upon Tyne, UK.

>N'P) y polimorfismos de número variable de repetición tándem ~.'NTR). En el recuadro 7-2 se describen varios polimorfismos de rivados.

Genotipificación de polimorfismos de sitio de restricción (SNP) En el estudio de la susceptibilidad a enfermedades frecuentes a me nudo se emplean polimorfismos de nucleótidos únicos (SNP) co mo marcadores y para detectarlos se diseñó una variedad de métodos automatizados de genotipificación de alto rendim iento (véa se recuadro 18-2). Un subgrupo de SNP origina una pérdida o una ganancia de un sitio de restricción (polimorfismos de sitio de res tricción o SNP) y con frecuencia se tipifican a pequeña escala por métodos de genotipificación simples. En el pasado los SNP se tipificarían mediante hibridación Southem con una sonda cercana para detectar el fragmento de restricción iterado y cuando este tipo de valoración se usaba los SNP se descrir :an como polimorfismos de longitud de fragmentos de restricción

(RFLP; véase fig. 7-5A para el principio general). Sin embargo, en la actualidad es más sencillo emplear un método basado en PCR para tipificar un SNP: se diseñan cebadores a partir de secuencias que flanquean el sitio de restricción polimórfico y el producto amplifica do se corta con la enzima de restricción apropiada y se fracciona de tamaño mediante electroforesis de gel de agarosa (fig. 7-6).

Genotipificación de polimorfismos de número variable de repetición tándem (VNTR) El polimorfismo microsatélite es un tipo de VNTR en el que el tama ño del arreglo y el de las repeticiones tándem son cortos (véase recuadro 7-2 para nombres alternativos) y por tanto resulta conveniente llevar a cabo la tipificación mediante PCR. Los cebadores se diseñan a partir de secuencias que se sabe que flanquean un locus microsatélite específico, lo que permite la amplificación mediante PCR de alelos cuyos tamaños varían por unidades integrales repetidas (fig. 7-7). A continuación los productos de la PCR pueden fraccionarse de tamaño mediante

186

CAPÍTULO SIETE } ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

C)

A)

3 46 0 g —> a

-O H 13 708

W B jg assafr* 1 cm

3 460 4 2 1 6 - t t - ( 16 569 pb jÜ

1 »

¿ B S J

11778

100 jim

B)

4 2 1 6 t^ c

i *» ** I t u '"

m . * v *s t

'

í* l

I

*

.

.. • i.." .« .,. •*

l>

13 7 0 8 ^ —> a

...

••• w" . . }** 11 778

«• * • . • V*

l

1 mm

Fig. 7-4. Nueva secuenciación (resecuenciación) del genoma mitocondrial mediante hibridación de microarreglo chip-oligonucleótido único. A) Imagen del arreglo hibridado a 16.6 kb del RNA blanco mitocondrial (hilera L) aunado a un mapa del genoma de mtDNA. B) Una porción del patrón de hibridación amplificado. C) Capacidad del arreglo para detectar y leer diferencias de base única en una muestra de 16.6 kb. Dos secuencias blanco dife rentes se hibridaron en paralelo a distintos chips. Los patrones de hibridación se compararon para las cuatro posiciones diferentes en la secuencia. El gru po superior de cada par muestra la hibridación de una secuencia de referencia y el inferior indica el patrón generado por una muestra tomada de un paciente con neuropatía óptica hereditaria de Leber. Se detectaron con claridad tres mutaciones patógenas conocidas en los nucleótidos 3 460, 4 216 y 13 708. Para comparación, el cuarto grupo del conjunto muestra una región alrededor de la posición 11 778 que es idéntica en las dos muestras. Reimpreso con autorización de Chee y cois. (1996). Science 274, 610-614, American Association for the Advancement of Science.

electrofbresis en gel de poliacrilamida. En condiciones normales la PCR incluye un precursor nucleótido radiactivo o fluorescente que se incorpora en los productos de la PCR pequeños y facilita su detec ción. Los productos de la PCR se desnaturalizan antes de la electroforesis para asegurar el fraccionamiento de alelos de tamaño adecuado. La figura 7-8 muestra un ejemplo del uso de un microsatélite (CA)n Los polimorfismos de VNTR minisatélite suelen tipificarse me diante hibridación Southern. El DNA se digiere con una(s) enzima(s) de restricción que se sabe que corta(n) en sitios de flanqueo cercanos a la secuencia VNTR importante. Esto produce un frag mento de restricción que contiene el VNTR aunado a la secuencia única de DNA vecino. Una sonda obtenida de la última secuencia

puede detectar la variación de longitud como un polimorfismo de longitud de fragmento de restricción (RFLP) (véase fig. 7-5B).

7.2

Id en tificación de genes en DNA clonado y e s tab lecim ien to de su estru ctu ra

La identificación de genes en DNA clonado se basa en la valoración de las propiedades específicas del gen. Dos características principa les permiten distinguir el DNA de los genes del DNA que no tie nen una función de codificación: d) conservación evolutiva total alta

7.2 ! IDENTIFICACIÓN DE GENES EN DNA CLONADO Y ESTABLECIMIENTO DE SU ESTRUCTURA

187

Recuadro 7-2. C lases com unes de polimorfismo de DNA susceptibles a m étodos simples de genotipificación Como se detalla en el capítulo 11, una variación del DNA puede ocurrir a diferentes niveles. En ocasiones se observan grandes cambios, como duplicaciones, inserciones, deleciones y transposiciones de kilobases, y aun extensiones de DNA de tamaño megabase, algunas de las cuales se relacionan con enfermedades. Sin embargo, los cambios más frecuentes en la secuencia de DNA incluyen sustituciones, inserciones y deleciones de nucleótidos únicos. No suelen relacionarse con una enfermedad a me nos que alteren una secuencia de codificación o una secuencia regula dora importante. Una variación del DNA se describe com o p o lim o rfism o si es lo bastante frecuente en una población para que pueda explicarse por una mutación recurrente (véase sección 11.1). Los polim orfism os que pueden genotipificarse de manera simple corresponden a dos clases básicas: ► SNP (polimorfismos de nucleótido único). Un SNP es un polim or fism o que se origina por el cambio de un nucleótido aislado. Suele va lorarse mediante secuenciación del DNA (secciones 7.1.1; 7.1.2) o valoraciones de extensión del cebador (recuadro 18-2); ► polimorfismo VNTR (número variable de repeticiones tándem). Un polim orfism o que surge por inestabilidad en un arreglo de repeticio nes tándem que causa un cambio en el número de unidades de repe tición. Aunque es un término general que incluye polim orfism o de VNTR microsatélite y VNTR minisatélites (véase más adelante), a me nudo se utiliza con laxitud para indicar la clase minisatélite.

e b) expresión para dar transcritos de RNA. En la inmensa mayoría de los casos los transcritos de RNA se someten a empalme (splicing, corte y unión) y se traducen para dar polipéptidos (y en consecuen cia se distinguen por tener m arcos d e lectu ra abiertos [MLA] lar gos). Además con frecuencia los genes de vertebrados se relacionan con islotes CpG (véase recuadro 9-3). Estas características posibili taron el desarrollo de una variedad de métodos para identificar ge nes DNA de vertebrados clonados (Monaco, 1994).

Métodos de rutina para identificar genes Una vez que se dispuso de clonas de DNA genómico, los genes se de finieron mediante métodos simples como primer recurso. A fin de es tudiar las pruebas de expresión, los métodos estándar incluyen selección de genotecas de cDNA (sección 5.3.5), la realización de PCR-RT (sección 5.2.1) y sondas de prueba hibridantes contra Nort hern blots (fig. 6-13). Después las valoraciones de expresión suelen ex tenderse a valoraciones de hibridación in situ contra RNA en cortes de tejido (fig. 6-15). El método alternativo para buscar la conserva ción evolutiva solía confiar en la zooblot para identificar secuencias muy conservadas a través de una gama de especies (véase fig. 7-9). En fecha más reciente, la búsqueda de homología de bases de datos de se cuencia se constituyó en un medio importante para identificar genes: si una secuencia de prueba se relaciona de manera cercana con alguna otra secuencia de codificación hay una buena posibilidad de que tam bién sea una secuencia codificante (véase recuadro 7-3). Además de los métodos de rutina para identificar genes, se uti lizan dos procedimientos más especializados: atrapamiento de exón mediante valoración artificial de empalme (splicing) de RNA y se lección del cDNA.

Algunas subclases derivadas de las clases anteriores de polimorfismos son: ► SNP (polimorfismo del sitio de restricción). Un SNP es un subgrupo de SNP en el que el cambio en el nucleótido causa pérdida o ga nancia de un sitio de restricción. Se tipifica mediante PCR o, de manera alternativa, hibridación Southern, en cuyo caso el polim orfis mo también puede describirse como un RFLP (véase abajo); ► RFLP (polimorfismo de longitud de fragmento de restricción). Un polim orfism o que produce un cambio en la longitud de un fragmento de restricción y se tipifica mediante hibridación Southern. Puede pre sentarse en dos formas: • como resultado de un SNP (véase antes); • como resultado de variación de la longitud de un fragmento de res tricción que contiene un arreglo VNTR moderadamente largo de repeticiones tándem. Los sitios de restricción de flanqueo no cambian, pero la longitud entre ellos puede aumentar o dism inuir según el número de unidades repetidas. ► VNTR microsatélite [también llamado polimorfismo de repetición tándem corto (PRTC) o polimorfismo de repetición de secuencia simple (PRSS)]. Un tipo de VNTR en el que son pequeños tanto el arreglo (por lo general de 100 pb) como la unidad repetida, casi siem pre de 1 a 4 nucleótidos de largo; véase también la sección 9.4.3; ► VNTR minisatélite (a menudo se abrevia de manera confusa como VNTR). En este caso el tamaño del arreglo es más o menos largo y con frecuencia la unidad repetida tiene 9 a 65 pb de longitud; véase también sección 9.4.2.

7.2.1 El atrapamiento de exón identifica secuencias expresadas mediante una valoración artificial de empalme (splicing) de RNA El empalme (corte y unión) de RNA comprende la fusión de secuen cias exónicas a nivel del RNA y la excisión de secuencias intrónicas. Los espliceosomas son capaces de realizarlo in vivo mediante el reco nocimiento de ciertas secuencias en los límites exón-intrón: una se cuencia donadora d e em palm e en la unión entre un exón y su intrón corriente abajo (3 ’), y una secuencia aceptora d e em palm e en la unión entre un exón y su intrón corriente arriba (5') (véase fig. 1-15). Un cósmide u otra clona de DNA genómico apropiada que contiene un exón interno flanqueado por secuencias intrónicas contendrá en con secuencia el donador de empalme funcional y secuencias aceptoras. Es posible identificar exones en DNA genómico clonado me diante la subclonación de DNA en un vector de expresión apropia do y su transfección a una línea de células eucariotas apropiada en la que el DNA insertado se transcribe en RNA y el RNA transcri to se somete a empalme (corte y unión) de RNA. Estas técnicas se conocen como atrapamiento de exón (a menudo se denominan am plificación de exón si se utiliza una PCR para recuperar los exones y una copia de cDNA del RNA cortado y unido [empalmado]). Por ejemplo, en el método de Church y colaboradores (1994) el DNA se subclona en un vector de expresión plásmide pSPL3 (fig. 7-10A) que contiene un minigén artificial que puede expresarse en una célula huésped apropiada. El minigén consiste en: un segmento del genoma del virus simiano 40 (SV40) que comprende un origen de replicación aunado a una secuencia promotora potente; dos exones competentes de empalme separados por un intrón que contiene un sitio de clonación múltiple, y un sitio de poliadenilación SV40.

188

CAPÍTULO SIETE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

SV40 produce un transcrito de RNA que por lo general se empal ma para incluir los dos exones del minigén. Sin embargo, si el DNA clonado dentro del intrón intermedio contiene un exón fun cional, los exones extraños pueden empalmarse a los exones que se encuentran en el minigén del vector. Después de elaborar una co pia de cDNA por medio de transcriptasa inversa, las PCR que uti lizan cebadores específicos para secuencias del exón vector deben distinguir entre el empalme normal y el empalme que incluye exo nes en el inserto de DNA (véase fig. 7-10B).

A)

A le lo s

7.2.2 La selección de cDNA identifica secuencias expresadas en clonas genómicas mediante la formación de heterodúplex V a lo ra c ió n

a ) d ig e rir c o n n u c le a s a d e re s tric c ió n R b ) fra c c io n a r d e ta m a ñ o e n g e l c ) h ib rid a r c o n s o n d a m a rc a d a

A le lo s

(x + y) o x , y

G e n o tip o s

x + y

mmmm X + y

y x a, a

a, b

b, b

B)

Los alelos v arían en los n ú m e ro s de rep eticione s tá nde m

A le lo s

(c o m o e n A a rrib a )

T a m añ os d e a le lo : x + y + (n x re p eticione s) en la q u e n es v a ria ble

Fig. 7-5. Tipificación de un RFLP mediante una valoración basada en hibridación. A) Tipificación de un RFLP tipo PCR. Éste es el tipo usual de RFLP y se debe a una alteración menor de la secuencia de DNA que causa pérdida (o ganancia) del sitio de restricción. Este tipo de polimorfismo es más fácil de tipificar mediante una valoración de PCR; véase figura 7-6. B) Tipifica ción de un RFLP tipo VNTR Sólo se utiliza una valoración de hibridación si la expansión y la contracción de la VNTR incluyen cambios de longitud importantes. De otra manera se emplea una valoración tipo PCR.

El DNA recombinante se transfecta en células COS que, como se explica en la sección 5.6.3, permiten que cualquier DNA circu lar que contiene un origen de replicación SV40 se replique de mo do independiente del DNA celular. La transcripción del promotor

El método de selección de cDNA implica hibridar un DNA com plejo clonado, como el inserto de un YAC, a una mezcla compleja de cDNA, como los insertos de todas las clonas de cDNA en una genoteca de cDNA (Lovett, 1994). El principio que sustenta la téc nica es que los cDNA afines (cognate) correspondientes a los genes que se encuentran dentro del YAC se enlazarán de preferencia con el DNA del cromosoma artificial de levadura (YAC); varias rondas de hibridación deben conducir al enriquecimiento enorme de las secuencias deseadas de cDNA, lo que permite identificar los genes correspondientes. Se requiere un bloqueo considerable de secuen cias de DNA repetidas. Los primeros métodos que se usaron inmovilizaban los YAC, pe ro las técnicas más modernas emplean una reacción de hibridación en solución y métodos de captura de biotina-estreptavidina (véase fig. 7-11). Como todos los sistemas que se basan en expresión, el método depende de niveles apropiados de expresión génica (los cD NA afines [cognate] no deben ser muy raros en la población de ini cio). Además es posible que se pasen por alto genes que contienen exones muy cortos porque los heterodúplex que se formaron con cDNA afines tal vez no posean la estabilidad suficiente. Otro pro blema es que los cDNA pueden enlazarse a seudogenes que mues tran un grado alto de homología con los genes funcionales afines.

7.2.3 Obtención de secuencias de cDNA de longitud completa: grupos de clonas superpuestas y amplificación PCR-RACE Una prioridad inicial en la definición de la estructura génica con siste en obtener una secuencia de cDNA de longitud completa y de finir los sitios de inicio y terminación de la traducción y el (los) sitío(s) de poliadenilación.

Definición de grupos de clonas superpuestas Un método inicial para obtener una secuencia de cDNA de longi tud total consistió en seleccionar una variedad de diferentes genotecas de cDNA y a continuación mapear la extensión de las superposiciones de los insertos de clonas positivas (por secuencia ción o por mapeo basado en PCR/hibridación). Como resultado se estableció una serie de clonas de cDNA superpuestas, un conti guo de clona de cDNA (para un ejemplo, véase el contiguo para el cDNA de fibrosis quística en Riordan y cois., 1989). La secuen ciación completa o seleccionada de una clona definirá una secuen cia consenso que puede proporcionar una secuencia de cDNA de longitud completa.

7.2 j IDENTIFICACION DE GENES EN DNA CLONADO Y ESTABLECIMIENTO DE SU ESTRUCTUR \

189

R A lelo 1

..ninnai

8 I

R

A lelo 2

i * ' X — um iliai

l

(1) A m p lific a r

(2) C o rta r el p ro d u c to d e la P C R co n e n z im a d e res tricció n R

I (3) F ra c c io n a r d e ta m a ñ o m e d ia n te ele c tro fo re s is en gel

I ----------- a + b

. ........ . . K A le lo s

1 ,1

2 ,2

1 ,2

C lave:

n

S itio d e la n u c le a s a d e res tricció n

Fig. 7-6. Los polimorfismos de sitio de restricción pueden tipificarse fácilmente mediante PCR como una alternativa a las valoraciones de RFLP laboriosas. Los alelos 1 y 2 se distinguen por un polim orfism o que altera la secuencia de nucleótidos de un sitio de restricción específico para la nucleasa de restric ción R. El alelo 1 posee el sitio, pero el alelo 2 tiene un nucleótido(s) alterado X, X ' y en consecuencia carece de él. Pueden diseñarse cebadores de PCR a partir de secuencias que flanquean el sitio de restricción para elaborar un producto corto. La digestión del producto de la PCR con enzima R y el frac cionamiento de tamaño pueden conducir a la tipificación simple para los dos alelos.

PCR-RACE para extender cDNA de cadena corta Aunque la PCR-RT puede ayudar a definir transcritos, una varian te de la PCR-RT, la técnica RACE (amplificación rápida de extre mos de cDNA), tiene eficacia particular para extender secuencias cortas de cDNA a fin de lograr un cDNA de longitud completa (Forman y cois., 1988). La PCR-RACE es una modificación de la PCR de anclaje de la reacción en cadena de la polimerasa de transcriptasa inversa (RT-PCR). Su justificación es amplificar secuencias entre una región aislada caracterizada con anterioridad en el mRNA (cDNA) y una secu en cia d e an cla je acoplada a los extremos 5' o 3'. Se diseña un cebador (a partir de la secuencia interna conoci da) y el segundo cebador se elige de la secuencia de anclaje impor tante (véase fig. 7-2).

7.2.4 Mapeo de sitios de inicio de transcripción y definición de límites exón-intrón Con frecuencia se localizan secuencias reguladoras importantes cer ca de los sitios de inicio de transcripción. Aunque es posible que la PCR-RACE 5' permita rescatar secuencias correspondientes al ex

tremo 5' de un mRNA (y por consiguiente, el sitio de inicio de la transcripción), se utilizan de preferencia dos métodos principales para definir el sitio de inicio transcripcional: protección de nuclea sa S 1 y extensión del cebador. La estructura exón-intrón puede de terminarse mediante la referencia de la secuencia de cDNA contra las secuencias de clonas de DNA genómicas afines (cognate). Des pués puede intentarse terminar la caracterización del gen a nivel genómico mediante la secuenciación de regiones promotoras, secuencias de flanqueo 5' y 3', y secuencias de intrón.

Protección de nucleasa S1 La endonudeasa SI es una enzima obtenida del moho Aspergillus oryzae que corta RNA y DNA de cadena única pero no moléculas de cadena doble. Para mapear el sitio de inicio de transcripción de un gen se requiere una clona de DNA genómico que se piensa que contiene el sitio de inicio. A continuación la clona de DNA se di giere con una endonudeasa de restricción apropiada para generar un fragmento que se espera que contenga el sitio de inicio de trans cripción. Como se muestra en la figura 7-13A, la hibridación al mRNA afín y la digestión con nucleasa S 1 definen la distancia del

190

©

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Usar cebadores de PCR P1, P2 para am plificar alelos en muestras de DNA genómico 40 bp .................... .. A lelo 1 = (C A )16

P2

CA] CAICA CA CA CA C ACA CA CA CA CA CA CA CA CA GTIGTIGT GT GTlGT GT GT g t Ig t i g t I g t íg t . g t GTlGT

P1

40 pb P ro d u c to d e la P C R = 8 0 + 3 2 = 1 1 2 pb P2

M ----------

A elo 2 = (C A )i CA CA CA CA CA CA U A U A (JA UA CAjCA CA CA GT GT GT GT GT GT ftT ftT P J P,T GTÍGT GT GT

— P1

------- ► P ro d u c to d e la P C R = 8 0 + 2 8 = 1 0 8 p b

A lelo 3 = (C A )n

P2

P1 P ro d u c to d e la P C R = 8 0 + 2 2 = 1 0 2 p b (2 ) Desnaturalizar productos de la PCR y fraccionar de tam año mediante electrofosis en gel de poliacrilamida @ A u to rra d io g ra f ía

Fig. 7-7. Se utiliza PCR para tipificar polimorfismos de repetición tándem cortos (PRTC). El ejemplo ilustra la tipificación de un marcador microsatélite, en este caso un polim orfism o de repetición de dinucleótido (CA)/(TG) que tiene tres alelos como resultado de una variación en el número de las repeticiones (CA)/(TG). En la autorradiografía cada alelo está representado por una banda superior mayor y dos “ bandas sombreadas” menores (véase fig. 7-8). Los individuos A y B tienen los genotipos (entre paréntesis) siguientes: A(1,3); B(2,2).

sitio de inicio de la transcripción a partir del extremo no marcado del fragmento de restricción. Cuando se requiere una localización más precisa puede secuenciarse el fragmento de DNA marcado en el heterodúplex mediante un método químico de secuenciación de DNA (véase Maxam y Gilbert, 1980). Cabe señalar que, en gran parte en la misma forma, también puede utilizarse el mapeo con nucleasa SI con objeto de mapear otros límites entre DNA codifi cante y no codificante, como los límites de exón-intrón (véase más adelante) y el extremo 3' de un transcrito.

mentos del cDNA y utilizarse en secu en ciación cíclica d e l DNA con clonas genómicas desnaturalizadas conforme la secuenciación de DNA forma plantillas (véase recuadro 7-1). La secuencia obte nida debe cruzar un límite exón-intrón, a menos que el exón sea muy grande, en cuyo caso quizá se requieran cebadores de secuen ciación adicionales. Por supuesto, una vez que se secuenció un ge noma, lo único que se requiere es una referencia cruzada de clonas cDNA contra la secuencia genómica disponible.

Extensión dei cebador

7 .3 Estudio de la expresión génica

El método es muy similar al de la protección de nucleasa SI. En es te caso el fragmento de restricción elegido debe ser más corto que el mRNA y la saliente se llena mediante transcriptasa inversa (fig. 7-13B). Como con el mapeo con nucleasa SI, es posible localizar con más precisión el sitio de inicio de transcripción si se recurre al método de secuenciación química de Maxam y Gilber (1980) a fin de secuenciar la cadena de DNA marcada.

Determinación de la organización exón-intrón Aunque no todos los genes humanos tienen intrones (véase cuadro 9-5), cuando se encuentran suelen ser grandes en comparación con los exones. La presencia de intrones suele inferirse por el mapeo comparativo de clonas genómicas y de cDNA afines. Una vez que la secuencia completa del cDNA se establece, es posible diseñar ce badores de secuenciación según se requiera a partir de varios seg

7.3.1 Principios de la selección de expresión La selección de expresión puede realizarse a diferentes niveles y uti lizarse una diversidad de tecnologías distintas. El blanco lo consti tuyen transcritos de RNA o proteínas. En la expresión proteínica aún suelen emplearse anticuerpos muy específicos, pero los trans critos de RNA pueden seguirse por diferentes tipos de métodos. Por lo general incluyen hibridación molecular con una sonda de ácido nucleico antisentido específica o cierta variante de la reacción PCR-RT. Sin embargo, se diseñaron algunos métodos alternativos ingeniosos como el SAGE (análisis seriado d e expresión g é n ica ), que rastrea grandes números de transcritos individuales siguiendo marcadores de secuencia corta representativos (véase sección 19.3.2), Los parámetros importantes en la expresión génica son el origen del material de estudio, la resolución de expresión y el ren dimiento (véase fig. 7-14).

7.3 I ESTUDIO DE LA EXPRESIÓN GENICA

191

Origen del material de estudio

Fig. 7-8. Ejemplo de tipificación para una repetición CA. El ejemplo muestra la tipificación de miembros de una familia grande con el marcador (CA)/(TG) D17S800. Las flechas de la izquierda indican la banda superior (principal) que se observa en diferentes alelos 1-7. Ob sérvese que los alelos individuales presentan una banda superior poten te seguida de dos “ bandas sombreadas" inferiores, una de intensidad intermedia justo subyacente a la banda superior potente y una que es muy débil y se localiza inmediatamente abajo de la primera banda som breada. Para los individuos indicados, los genotipos (entre paréntesis) son los siguientes: 1(3,6); 2(1,5); 3(3,5); 4(2,5); 5(3,6); 6(2,5); 7(3,5); 8(3,6); 9(3,5); 10(5,7); 11(3,3); 12(2,4); 13(3,3); 14(3,6); 15(3,3); 16(3,4). Obsérvese también que en el último caso la banda media es particular mente intensa porque contiene tanto la banda principal para el alelo 4 co mo la banda sombreada principal para el alelo 3. Se piensa que el principal mecanismo que origina la producción de bandas sombreadas en repeticiones tándem de dinucleótidos es el pareamlento erróneo de cadena deslizada (véase sección 11.3.1) (Hauge y Litt, 1993).

El material de estudio puede variar mucho. Con frecuencia se pre paran extractos de RNA/cDNA o proteínicos sin refinar, pero en otros casos la expresión se muestrea en cortes de tejidos o aun en embriones complejos fijados de una manera que permita conservar la morfología original in vivo. La expresión también puede estu diarse en células vivas en cultivo de tejido (pero siempre queda la duda de lo representativas que son en relación con el mismo tipo de células in vivo). En organismos experimentales vivos en los que los tejidos son ópticamente transparentes, es posible rastrear la ex presión génica con ayuda de marcadores fluorescentes. Los métodos recientes de microdisección con captura láser comprenden el uso de láser a fin de microdisecar tejidos para pro ducir poblaciones celulares puras de fuentes como biopsias de teji dos y tejidos teñidos, inclusive células aisladas (véase Schutze y Lahr, 1998; Simone y cois., 1998). Estos adelantos permitirán en focar una diversidad de análisis de expresiones génicas en células aisladas o en poblaciones celulares homogéneas que serán más re presentativas del estado in vivo de las líneas celulares.

Resolución de la expresión génica Algunos métodos se diseñaron sólo para rastrear la expresión gruesa de genes en extractos de RNA o de proteínas. Estos patrones de expresión de resolución baja suelen intentarse como un método de primer paso. Además de ser capaces de muestrear la expresión en diferentes tejidos, pueden brindar información útil del tamaño del producto y las posi bles isoformas. En contraste, es posible obtener una expresión de alta resolución mediante métodos que rastrean patrones de expresión den tro de una célula, o en grupos de células y tejidos con una organización espacial representativa de la organización normal in vivo.

SHOX2

SHOX ■o e cD sr'H CCI£rOCLÜ>00

i i

X

—

23 kb

—

23 kb

—

9.4 kb

—

9.4 kb

—

6.6 kb

—

6.6 kb

—

4.4 kb

—

4.4 kb

—

2.3 kb

2.3 kb

—

2.0 kb

2.0 kb

Fig. 7-9. La hibridación zooblot identifica secuencias conservadas en términos evolutivos. Algunos genes muestran una conservación extraordinaria a través de las especies; en otros es menor, inclusive el que se ilustra aquí. El gen SHOX humano se loca liza en la región seudoautosómica m ayor en la punta de Xp/Yp (fig. 12-15). Es un locus para algunos síndromes de estatura baja que se caracterizan por anorma lidades esqueléticas y pueden contribuir de manera importante al síndrome de Turner. Aunque se conserva en una diversidad de mamíferos distintos, los roedores carecen de él (véase panel derecho, líneas a la izquierda) como resultado de la deleción del gen en el pasado evolutivo, quizás en una etapa temprana del linaje que condujo a roedores. La secuenciación reciente del genoma de ratón confirmó la ausencia de un homólogo de SHOX. El gen SH0X2 autosómico relacionado está mucho más conservado (panel izquierdo). Reproducido de Clement-Jones y cois. (2000) Human Molec. Genet. 9 ,696, con autorización de Oxford University Press.

192

SIE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Recuadro 7-3. Investigación de homología en b ases de datos Se diseñaron programas de computadora potentes con objeto de buscar ba ses de datos de secuencias de ácido nucleico y proteínas para compatibili dad de secuencia significativa (homología de secuencia) con una secuencia de prueba en investigación. Los que más se utilizan son los diferentes pro gramas BLAST y FASTA (véase Ginsburg, 1994 y el cuadro de abajo).

_________ ________________

Programa

Compara

FASTA

Una secuencia nucleótida con una base de datos o una secuencia de aminoácidos con una base de datos de secuencias proteínicas.

TFASTA

Una secuencia de aminoácidos con una base de datos de secuencia de nucleótidos traducida en los seis mar cos de lectura Una secuencia nucleótida con una base de datos de se cuencia nucleótida Una secuencia nucleótida traducida en los seis marcos de lectura con una base de datos de secuencia proteínica Una secuencia cDNA/EST con bases de datos de se cuencias cDNA/EST Una secuencia de aminoácidos con una base de datos de secuencia de proteínas Una secuencia de aminoácidos con una base de datos de secuencia de nucleótidos traducida en los seis mar cos de lectura

BLASTIN BLASTX EST BLAST BLASTP TBLASTN

TGGCA G G A G C T ★**★■***★★★★ *-k-k★*★*

G AT A TTA TC A C TG G A G C C

***

****

Nota: puesto que el diseño de programas comparables como FASTA y BLASTN es distinto, pueden brindar resultados diferentes (véase Gins burg, 1994). Todos los programas anteriores son accesibles a través de la Internet de diversos centros, como el US National Center for Biotech nology Information (http://www.ncbi.nih.gov/) y el European Bioinformatics Institute (http://www.ebi.ac.uK/) Los programas como BLAST y FASTA utilizan algoritmos para identificar ali neamientos de secuencia óptimos y por lo general muestran la producción total como una serie de comparaciones a manera de pares entre la secuen cia de prueba (secuencia de interrogación) y cada secuencia relacionada que identifica el programa en la base de datos (secuencias tema). Pueden seguirse diferentes métodos para calcular las alineaciones de se cuencia óptimas. Por ejemplo, en alineaciones de secuencia de nucleótidos el algoritmo diseñado por Needleman y Wunsch (1970) busca maximizar el número de nucleótidos compatibles. En contraste, en otros programas, com o el de Waterman y cois. (1976), el objetivo es reducir al mínimo el número de incompatibilidades. Las comparaciones de alineamientos de secuencia a manera de pares son comparativamente simples cuando las secuencias de estudio son compatibles de manera muy cercana y tienen longitudes similares, de preferencia idénticas. Cuando las dos secuencias que se comparan son muy diferentes entre sí, y en especial cuando hay diferencias claras en la longitud a causa de deleciones/inserciones, quizá se requiera un gran esfuerzo para calcular la alineación óptima (véanse los siguientes renglones).

Q

G A T T T T A T G A C T G G A G C C T G A -A G G A G C T

G A TA TTA TC A C TG G A G C C TG G C A G G A G C T

★★★ *★★★

★★★★★★★★★★

*

G A T T T T A T G A C T G G A G C C T -G A A G G A G C T

Dificultad en las alineaciones de secuencias. En este caso las secuencias de dos nucleótidos se relacionan claramente pero en la secuencia GGC que se muestra en la parte superior hay incertidumbre en cuanto a la mejor alineación con la secuencia GA correspondiente en la secuencia inferior. Si la secuencia que se investiga es de codificación, entonces pueden aña dirse alineamientos de secuencias de nucleótidos mediante alineamientos paralelos de secuencias de aminoácidos utilizando el marco de lectura de traducción supuesto para la secuencia de codificación. Esto se debe a que hay 20 aminoácidos diferentes pero sólo cuatro nucleótidos distintos. Las alineaciones de secuencias de aminoácidos a manera de pares también pueden apoyarse en las subclases químicas de aminoácidos. Las sustitu ciones conservadoras son cambios de nucleótidos que ocasionan el cam bio de un aminoácido pero en las que el nuevo aminoácido está relacionado químicamente con el aminoácido sustituido y casi siempre pertenece a la misma subclase (recuadro 11-3). Como resultado, los algoritmos que se

emplean para comparar secuencias de aminoácidos por lo general recurren a una matriz de calificación en la que se disponen pares de calificaciones en una matriz 20 x 20 donde las más altas concuerdan con aminoácidos idénticos y aquellos que son de carácter similar (p. e j„ isoleucina y leucina) y las calificaciones más bajas se asignan a aminoácidos que son de un carácter diferente (p. ej., isoleucina y aspartato; véase Henikoff y Henikoff, 1992). La producción total típica proporciona dos resultados totales por porcentaje de secuencia relacionada, que a menudo se denominan % de identidad de secuencia (compatibilidad de residuos idénticos sólo) y % de similitud de secuencia (compatibilidad tanto de residuos idénticos com o de los relacionados químicamente; véase el grupo abajo).

Calificación = 58.2 bits (125), esperada = 9e-08 Identidades = 39/120 (32%), positivas = 57/120 (47%), vacios = 9/120

(7%)

Interrogación : 1

AKLLIKHDSNIGIPDVEGKIPLHWAANHKDPSAVHTNRCILDAAPTESLLNWQDYEGRTP 60

Tema: 548 Interrogación : 61

A + LL++HD+ + G PLH A +H + + V+ +L + W Y TP AELIEHDAHPNAAGKNGLTPLHVAVHHNN-- LDIVKLLLPRGGSPHSPAWNGY---TP 601 LHFAVADGNLTWDVLTSY-ESCNITSYDNLFRTPLHWAALLGHAQIVHLL1ERNKSGTI 119 LHA

Tema: 602

+

V

L

Y

S

N

S

+

TPLH AA GH + + V LLL + + G +

LHIAAKQNQIEVARSLLQYGGSANAESVQGV— TPLHLAAQEGHTEMVALLLSKQANGNL 659

Identidad de secuencia y similitud de secuencia. La producción de BLASTP es resultado de la interrogación de la base de datos de proteínas Swiss-prot con una secuen cia de interrogación de aminoácidos de 165-283 de la proteina inversina recién identificada. La secuencia tema que aquí se muestra es una secuencia de anquirina de eritro cito de ratón. El programa considera no sólo la identidad de secuencia (39 de las 120 posiciones, o 32%, tiene residuos idénticos en las dos secuencias; que se muestran con letras rojas), sino también la similitud de secuencia (indicadas aquí como “positivas") en la que 19 posiciones adicionales tienen aminoácidos químicamente similares (se señalan con + ),

7.3

(1)

A)

x y

ESTUDIO DE LA EXPRESIÓN GÉNICA

B)

193

I

scm

— t n SD

SA lia

Patrón de em palm e I

SD

SA llb

Patrón d e em palm e lia + llb

ID

cDNA

P ro d u c to d e la P C R

i I

■)

II

E xó n a tra p a d o 1. 2. 3. 4. 5.

F ra g m e n to d e c lo n a d e D N A g e n ó m ic o en sitio d e c lo n a c ió n m ú ltip le (S C M ) T ra n s fe c ta r a c é lu la s C O S E xp re sió n d e l p ro m o to r S V 4 0 - » p ro d u c to d e R N A A islar R N A y u sarlo c o m o p la n tilla p a ra e la b o ra r c D N A A m p lific a r en P C R c o n c e b a d o re s e s p e c ífic o s p a ra e x o n e s en el v e c to r

Fig. 7-10. Atrapamiento de exón mediante el vector pSPL3. A) Vector plásm ide pSPL3. Este vector “en lanzadera” puede propagarse en £ coli (por medio del origen de replicación orí y la selección para resistencia a ampicilina) y en células COS de mono (mediante el origen de replicación funcional SV40) (Church y cois., 1994). El vector pSPL3 contiene un minigén (en negro): la transcripción ocurre del promotor SV40 y el RNA experimenta empalme controlado por la maquinaria de empalme de RNA de la célula hués ped, lo que resulta en la fusión de las dos secuencias de exón del vector. B) Patrones de em palm e (co rte y unión). El patrón normal de empalme que se observa cuando se presentan exones del vector está indicado por el patrón de empalme I. Si un fragmento de DNA genómico clonado en un pSPL3 con tiene un exón con un donador de empalme funcional (DE) y secuencias aceptares de empalme (AE), puede ocurrir un patrón de empalme diferente (lia + llb). Los dos patrones de empalme (corte y unión) pueden distinguirse a nivel del cDNA utilizando varios cebadores de PCR específicos de vector, y el fraccionamiento del tamaño en geles suele conducir a la recuperación del exón amplificado del DNA genómico.

Rendimiento de la expresión génica

Hibridación Northern blot

Algunos métodos están diseñados para obtener datos de expresión de sólo uno o un número muy pequeño de genes a la vez (expre sión de rendim iento bajó). Otros pueden rastrear al mismo tiempo la expresión de muchos genes al mismo tiempo y en algunos casos en los que un proyecto de genoma identificó todos los genes de un organismo suele ser posible conducir la selección d e expresión d el genom a com pleto (véase sección 19.3).

Este método proporciona patrones de expresión de resolución bajos mediante la hibridación de un gen o una sonda de cDNA a RNA to tal o extractos de RNA total o RNA poli(A)+preparados de diferen tes tejidos o líneas celulares. Como el RNA se fracciona de tamaño en un gel, es posible estimar el tamaño de los transcritos. La presen cia de múltiples bandas de hibridación en una línea puede indicar la existencia de isoformas de diferente tamaño (véase fig. 6-13).

7.3.2 Análisis de expresión génica basado en hibridación: del análisis de un gen aislado a la selección de la expresión del genoma completo La selección tradicional de la expresión basada en hibridación ha tenido un rendimiento bajo, enfocada al análisis de transcritos de RNA de uno o sólo unos cuantos genes a la vez, pero la resolución puede variar de baja a alta. Sin embargo, en fecha reciente los aná lisis de expresión génica basados en microarreglos anunciaron un nuevo tipo de rendimiento muy alto de análisis de la expresión de resolución baja que permite el muestreo simultáneo de transcritos de RNA de miles de genes a la vez.

Hibridación in situ de tejidos Por lo general se obtienen patrones de expresión espacial de alta resolu ción de RNA en tejidos y grupos de células mediante hibridación in situ de tejidos. Los tejidos suelen congelarse o embeberse en cera y lue go se seccionan con un micrótomo para obtener cortes muy delgados (p. ej., 5 micrones de grosor) que se montan en un portaobjetos para microscopio. La hibridación de una sonda apropiada específica de gen al tejido en el portaobjetos puede brindar luego imágenes de la expre sión detalladas representativas de la distribución del RNA en el tejido de origen (véase fig. 6-15). A menudo los tejidos utilizados incluyen los embrionarios que poseen la ventaja de que su tamaño en miniatura per mite seleccionar la expresión de muchos tejidos en un mismo corte.

194

CAPÍTULO SIETE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

N u m e ro sa s c lo n a s d e DNA en g e n o te c a s de cD N A

C lo n a de D N A g e n ó m ic o (YAC, c ó s m id e , etc.)

wwwwvw^HI /wwwwvwvw-HSSI

I

D ig e rir c o n c o rta d o re s d e 4 pb Lig a r e n la za d o re s ( ¡ S i )

V e c to r

BVlMMMMMMM H gÂ M M A M A M A A

In s e rta r

-■^WO vW vAAAAAMM

/V W W W W íW i

PCR mediante cebadores específicos de ((§)) enlazador marcados con biotina

V e cto r

| Insertos de PCR con Í L cebadores específicos de vector

/wwwwwvwfi >=>-

g-vA/WVMMAMM

HHHHHHHHhAAAAAAAA/v

1

fW tM AAAAA/

# -■ 4 -

I 2 } 3 e tc é te ra

H ib rid a r d e s p u é s de b lo q uje e a rr '^ / r ereppee tic io n e s

N u evo c ic lo

N r is / r®

/~ T \

%

3

3

C u en tas p a ram a g n é tica s cu b iertas con e strap tivid in a Im án

^

* *

Captura de todos los fragmentos marcados con biotina C a p tu ra de c u e n ta s co n im án E lusión y a m p lific a c ió n c o n PCR m e d ia n te c e b a d o re s e s p e c ífic o s de v e c to r cD N A

Fig. 7-11. Selección de cDNA mediante captura de cuentas magnéticas. El método se basa en la formación de heterodúplex entre cadenas únicas de una clona de DNA genómico única (con el número 1) y una población de cD NA compleja, como los insertos de una genoteca de cDNA (numerados 1 ,2 ,3 , etc.). Las cadenas de DNA genómico se marcan con un grupo biotina (uni do a cebadores de PCR que se incorporan durante la amplificación). La reacción de hibridación favorecerá la formación de heterodúplex que incluyen las clonas de cDNA afínes con la clona de DNA genómico. En este ejemplo se consideran afines la clona 1 de DNA genómico y la clona 1 de cDNA, es decir, contienen secuencias comunes que permiten que cadenas en sentido opuesto se enlacen entre sí para form ar un heterodúplex. Los productos de la hibri dación con un grupo biotina (inclusive heterodúplex DNA genómico-cDNA) se enlazarán a cuentas paramagnéticas recubiertas con estraptavidina y pue den eliminarse de otros componentes de la reacción mediante un imán. A continuación las cuentas separadas pueden tratarse a fin de eludir las moléculas que contienen biotina y, por medio de cebadores de PCR específicos para las secuencias vectores que flanquean el cDNA, es posible amplificar el cDNA enlazado. Esta población se envía para ciclos de hibridación adicionales con objeto de enriquecer el cDNA deseado.

7.3 j ESTUDIO DE LA EXPRESIÓN GENICA

5 ' P C R -R A C E

3 ' P C R -R A C E

A A A A A A A -------- A „

3'

- A A A A A A A -------- A „

5'

\

3'

3'

5'

3' < -

5'

195

I

I

R T con ce b ad o r d e an claje -------------------A A A A A A A ----------K

V

5' -

3'

I

5' -

I

3' A A A A A A A -

3'

5'

D esnaturalizar; asociar ce b ad o r d e an claje y exten d er

D esnaturalizar; asociar ce b ad o r d e anclaje ^ ----------------- A A A A A [»««««««] 3'

3%

I

T ran sfera sa term inal y dA TP ------------------------ A A A A A A A ----------A „

^

___ 5 '

5 I

3'

5'

^ ----------------- A A A A A ¡ « « « 3 3 '

I

-A A A A A A A -------- A „

3 '-

D esnaturalizar; asociar cebad or interno d e sentido

3'

R T con cebad or Interno antisentido

3' AAAAAAA

: ____ ]5 '

i

P C R con cebad ores interno y d e anclaje | -------------------A A A A A f ^ ^ l 3'

AAAAAAA-

□ --------------------T T T T T B3USS3 5 '

AAAAA

I

D esnaturalizar; asociar ce b ad o r prim ario y ex tender

TTTTT P C R con cebad ores interno y d e an claje AAAAA TTTTT

■ ■

3' 5'

Fig. 7-12. La PCR-RACE puede facilitar el aislamiento de secuencias de los extremos 5' y 3' del cDNA. Una etapa preliminar en la PCR-RACE incluye la introducción de una secuencia mediante una form a de mutagenesis añadida 5 ' (véase sección 5.5.3). A) 3 PCR-RACE. Se utiliza un cebador de inicio antisentido con una secuencia de extensión 5 ’ específica (secuencia de anclaje, con frecuencia > 15 nucleótidos de largo) que se incorpora al transcrito cDNA en el paso de transcriptasa inversa. Luego se emplea un cebador interno en sentido para generar una segunda cadena corta que termina en una secuencia complementaria a la secuencia de anclaje original. Después se inicia la PCR usando el cebador interno en sentido y un cebador de secuencia de anclaje. B) 5 PCR-RACE. En este caso se emplea un cebador interno antisentido para cebar la síntesis de una plantilla de mRNA (rojo) de una primera cadena parcial de cDNA (negro). Se añade una poli(dA) al extremo 3 ' del cDNA usando transferasa term i nal. La síntesis de la segunda cadena se ceba con un cebador en sentido con una secuencia de extensión específica (andador). Esta cadena se emplea como plantilla para un paso adicional de síntesis con el cebador interno para producir una copia complementaria de la secuencia de anclaje. A continua ción puede efectuarse la PCR con cebadores de secuencia interna y de anclaje.

196

CAPITULO SIETE : ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

A)

5'

B) 7 -32P ( • )

5'

y -32P (• )

C in a s a d e p o lin u c le ó tid o

3'

3 ' ----------

5'

C in a s a d e p o lin u c le ó tid o

*--------M e z c la r con R N A to tal 3' -

-------- * 5

5 '-

3'

AAAAA 3'

N u c le a s a S1 3 '5 '-

RT + dNTP

3' 5'E le ctro fo res is d e s n a tu ra liz a n te ; a u to rra d io g ra fía

M e z c la r con R N A to tal -----------• 5 ' A A A A A 3'

• 5' -A A A A A 3 ' E le ctro fo res is d e s n a tu ra liza n te ; a u to rra d io g ra fía

Fig. 7-13. El sitio de inicio de la transcripción puede mapearse mediante protección de nucleasa S1 o valoraciones de extensión del cebador. A) Valoración de protección de nucleasa S1. Se sospecha que un fragmento de restricción del extremo 5 ' de un gen clonado contiene el sitio de inicio de transcripción. Se marca terminalmente en los extremos 5' y luego se desnaturaliza y mezcla con el RNA total de las células en que se piensa que el gen im portante está expresado. El mRNA afín puede hibridar la cadena DNA antisentido para formar un heterodúplex RNA-DNA. El tratamiento subsecuente con nu cleasa S1 produce el corte progresivo de la secuencia de DNA 3 ' saliente hasta el punto en que el DNA se híbrida al extremo 5 ' del mRNA. El fraccionamiento de tamaño en un gel de electroforesis desnaturalizante permite identificar la diferencia de tamaño entre el DNA original y el DNA después del tratamiento con nucleasa S1. B) Valoración de extensión del cebador. En este caso se elige de modo deliberado que el fragmento de restricción que se sospecha contie ne el sitio de inicio de la transcripción sea pequeño. La hibridación con un mRNA afín dejará el mRNA con un extremo 5 ' saliente. El DNA puede servir co mo un cebador para que la transcriptasa inversa (RT) extienda su extremo 3' hasta alcanzar el extremo 5 ' del mRNA. El aumento de tamaño después del tratamiento con transcriptasa inversa (+R T) comparado con el que tenía antes del tratamiento (-R T ) mapea el sitio de inicio de la transcripción. Con am bos métodos puede lograrse un mapeo más preciso si el DNA se secuencia después del tratamiento con S1 o transcriptasa inversa (RT).

Hibridación in situ de montaje total Una extensión de la hibridación in situ de tejidos es el estudio de la expresión en un embrión completo. La hibridación in situ de monta je total es un método popular para rastrear la expresión durante el desarrollo en embriones completos a partir de organismos vertebrados modelo. Por las dificultades éticas y prácticas para efectuar análisis equivalentes de genes humanos, suele confiarse en la extrapolación de análisis realizados en embriones de ratón (véase fig. 7-15). La cantidad hasta cierto punto alta de tejido disponible significa que el método es más o menos sensible y la automatización de la técnica incrementó su popularidad.

Perfil de expresión génica de células únicas El empleo de sondas marcadas de manera apropiada permite ras trear secuencias de RNA específicas dentro de células aisladas a fin de identificar los sitios de procesamiento, transporte y localización citoplásmicos de RNA. La hibridación fluorescente in situ (FISH)

cuantitativa y la microscopía digital de imágenes posibilitan inclu sive observar transcritos de RNA o aislados in situ (Femino y cois.. 1998). Un refinamiento adicional recurre a combinaciones de dife rentes tipos de sondas de oligonucleótidos marcadas en múltiples sitios con una diversidad de fluoróforos con espectros distintos. Ello permitió rastrear de manera simultánea los transcritos de múl tiples genes (Levsky y cois., 2002).

Selección de la expresión a gran escala mediante microarreglos La capacidad para preparar oligonucleótidos de alta densidad o m i croarreglos de clonas de cDNA en superficies de vidrio transforme las selecciones de la expresión génica (véase sección 6.4.3 para los procedimientos generales). En algunos genomas que ya se secuenciaron por completo existe la posibilidad de seleccionar la expresión del genoma completo y por tanto vigilar al mismo tiempo la expre sión de cada gen aislado en un organismo (véase sección 19.3).

7.3 I ESTUDIO DE LA EXPRESIÓN GÈNICA

RNA

P R O T E ÍN A

R E S O L U C IÓ N

R E N D IM IE N T O

EJEM PLO S

Alta

Bajo

Hibridación in situ d e tejido H ibridación in situ celular

B aja

Bajo

H ibridación N orthern blot Hibridación dot blot d e R N A P C R -R T Valoración d e protección d e ribonucleasa

B a ja

A lto

Hibridación de microarreglo de DNA Exhibición diferencial Análisis seriado de expresión génica (SAGE)

A lta

Bajo

Inm unocitoquím ica M icroscopia d e inm unofluorescencia

B aja

B ajo

Inm unoblotting (w estern blotting)

B aja

Alto

Electroforesis con gel 2 -D Esp ectrom etría d e m a sa

197

Fig. 7-14. El mapeo de expresión puede efectuarse a diferentes niveles. Rendimiento se refiere al número de genes/proteínas que pueden estudiarse a la vez.

7.3.3 Análisis de expresión génica basados en PCR: PCR-RT y exhibición diferencial de mRNA Como se describe en la sección 5.2, las grandes ventajas de la PCR son su rapidez, sensibilidad y sencillez. Aunque no es adecuada pa ra aportar patrones de expresión espaciales (p. ej., como lo hace la hibridación in situ de tejidos), suele proporcionar patrones de ex presión gruesos, rápidos, que pueden ser valiosos.

Reacción en cadena de ia polimerasa de transcriptasa inversa (PCR-RT) convencional La PCR de transcriptasa inversa (PCR-RT; véase sección 5.2.1 para el principio básico) puede brindar una cuantificación gruesa de la expresión de un gen particular (útil en tipos de células o tejidos cu yo acceso en gran cantidad no es fácil, p. ej., embriones humanos tempranos en etapa preimplantación; véase Daniels y cois., 1995). La sensibilidad extrema de la PCR implica que también es posible utilizar la PCR-RT para estudiar la expresión en células aisladas. Además la PCR-RT puede ser útil para identificar y estudiar dife rentes isoformas y un transcrito de RNA. Por ejemplo, pueden pro ducirse diferentes isoformas de mRNA mediante empalme (corte y unión) alternativo e identificar cuándo cebadores específicos de exón reconocen productos de amplificación extra además de los pro ductos esperados (para un ejemplo, véase Pykett y cois., 1994).

Exhibición diferencial de mRNA El uso de cebadores de PCR parcialm ente degenerados (cebadores en los que la elección de bases en ciertas posiciones es deliberada

mente flexible) permite diseñar formas modificadas de PCR-RT que pueden rastrear la expresión de muchos genes al mismo tiem po. Una de estas técnicas es la exhibición diferencial de mRNA. Se utiliza un cebador oligo(dT) m odificado que en su extremo 3' tiene un nucleótido único diferente (es decir, A, C o G pero no T) o un dinucleótido distinto (como CA). Como resultado se unirá a la cola poli(A) de un subgrupo d e mRNA (Liang y cois., 1993). Por ejemplo, si el oligonucleótido TTTTTTTTTTTCA (=TnCA) se utilizó como cebador, cebará de modo preferencial la síntesis de cDNA a partir de los mRNA en que el dinucleótido TG precede a la cola poli (A). El cebador corriente arriba suele ser una secuencia corta arbitra ria (con frecuencia de 10 nucleótidos de largo) pero a causa de la incompatibilidad, en especial en el extremo 59, puede unirse a mu chos sitios más de los esperados para un decámero. Los patrones de amplificación resultantes están diseñados en forma deliberada para producir una escalera compleja de bandas cuando se fraccionan de tamaño en un gel de poliacrilamida largo (fig. 7-16). A diferencia de las selecciones del microarreglo de DNA, la ex hibición diferencial de mRNA es un medio para vigilar al mismo tiempo la expresión de múltiples genes en los que las identidades de los genes que se rastrean no se establecieron con anterioridad. Por consiguiente, en lugar de seleccionar la expresión de genes conoci dos, es un simple método de selección de la expresión. Su principal uso suele darse en estudios de expresión génica comparativa para identificar la forma en que la expresión génica se altera cuando se comparan dos orígenes (p. ej., la comparación de dos tipos de cé lulas en diferentes etapas fisiológicas o del desarrollo). Es posible que esto permita identificar un subgrupo pequeño de genes cuyos patrones de expresión son distintos entre los tipos celulares.

198

CAPITULO SIETE

j

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Una vez que se enlaza a su blanco, el anticuerpo primario es enla zado a su vez por un reactivo secundario que se conjuga con un grupo rastreador. Un reactivo secundario usual es la proteína A, una proteína que se encuentra en la pared celular de Staphylococcus aureus. Por razo nes que se desconocen, la proteína A se enlaza con firmeza a sitios en las regiones constantes segunda y tercera de la porción Fe de la cadena pesada de Ig. Como alternativa es posible utilizar un anticuerpo secun dario (un anticuerpo formado contra un anticuerpo primario). Los grupos rastreadores típicos pueden ser un fluorocromo (sección 6 . 1.2 ), una enzima (p. ej., peroxidasa de rábano picante, fosfatasa alca lina, galactosidasa (3, etc.) o bien oro coloidal. Los sistemas de detec ción directa tienen la desventaja de requerir la conjugación de una gran variedad de anticuerpos primarios a moléculas rastreadoras, en tanto que los sistemas indirectos ofrecen el uso de anticuerpos secundarios de afinidad purificada disponibles en el comercio. Los sistemas de detec ción y marcado para su empleo con métodos específicos de rastreo de la expresión proteínica se delinean en el cuadro 7-1.

Inmunoblotting (Western blotting)

Fig. 7-15. Montaje com pleto en hibridación in situ. El ejemplo muestra la expresión Pax9 en un embrión de ratón E9.5 (día 9.5 embrionario = 9.5 días poscoito). La expresión es evidente en la re gión craneofacial (CF; en lo que se desarrollará hacia mesénquima na sal), las bolsas faríngeas (PP), las somitas (S) y la yema de la cola (T). Fotografía proporcionada por el doctor Heiko Peters, Institute of Human Genetics, Uníversity of Newcastle upon Tyne, UK.

7.3.4 En las selecciones de expresión de proteínas suelen utilizarse anticuerpos muy específicos Por su diversidad y sensibilidad exquisitas en la detección de proteí nas, los anticuerpos tienen múltiples aplicaciones en investigación y su potencial terapéutico es considerable (véase sección 21.3.4). Aun que de manera tradicional los anticuerpos se aislaban mediante la inmunización de animales, ahora se usan cada vez más anticuerpos genéticamente manipulados por ingeniería (véase recuadro 7-4). Por lo general se emplean anticuerpos para detectar proteínas por dife rentes métodos y es posible recurrir a sistemas de marcado distintos.

Sistemas de marcado y detección de anticuerpos Los anticuerpos pueden marcarse en diferentes formas y, como en el marcado y la detección de ácido nucleico, es posible utilizar anticuer pos en sistemas de detección directa o indirecta. En los métodos de detección directa, el anticuerpo purificado se marca de manera apro piada con una molécula rastreadora (p. ej., fluoresceína, rodamina, biotina, etc.; véase también la sección 6 . 1.2 ) y luego se usa de mane ra directa para enlazar la proteína blanco. En los sistemas de d etec ción indirecta el anticuerpo primario se emplea como una molécula intermedia y no se une de modo directo a un grupo marcado.

Este método está diseñado para seguir la expresión gruesa de pro teínas mediante extractos celulares que se fraccionan de acuerdo con el tamaño. Lo anterior suele lograrse por medio de SDS-PAGE unidim ensional, una forma de electroforesis en gel de poliacrilamida (^>oliíJcrylamide gel dectrophoresis) en la que la mezcla de pro teínas extraídas se disuelve primero en una solución de sulfato sódico de dodecilo (SDS), un detergente aniónico que altera casi todas las interacciones no covalentes en proteínas naturales. Asi mismo se añaden mercaptoetanol o ditiotreitol para reducir enlaces de disulfuro. Después de la electroforesis es posible observar las proteínas fraccionadas tiñendo con un colorante adecuado (p. ej., azul Coomassie) o un colorante argéntico. También pueden emplearse geles PAGE tridimensionales: la prime ra dimensión incluye enfocamiento isoeléctrico, que es la separación según la carga en un gradiente de pH, y la segunda dimensión, en ángulos rec tos con la primera, comprende el fraccionamiento de tamaño median te SDS-PAGE (véase Stryer, 1995). En este caso las proteínas fraccionadas se transfieren (blotted, manchan) a una hoja de nitrocelulosa y luego se exponen a un anticuerpo específico (véase fig. 7-17).

Inmunocitoquímica (inmunohistoquimica) Esta técnica se relaciona con el estudio del patrón total de expresión a nivel proteínico, dentro de un tejido o de otra estructura multice lular. En consecuencia puede considerarse como el equivalente en las proteínas de los métodos de hibridación in situ de tejidos que se utilizan para seleccionar la expresión de RNA. Como en el último caso, los tejidos casi siempre se congelan o embeben en cera y des pués se seccionan en cortes muy delgados con un micrótomo antes de montarse en un portaobjetos. Se permite que un anticuerpo es pecífico apropiado se una a la proteína en el corte de tejido y esto puede proporcionar datos de la expresión susceptibles de relacionar con la tinción histológica de cortes de tejido vecino (fig. 7-18).

Microscopía de inmunofluorescencia Este método se emplea cuando se investiga la localización subcelula rá t una proteína de interés. Un colorante fluorescente adecuado, como fluoresceína o rodamina, se acopla al anticuerpo deseado, lo que permite localizar la proteína importante dentro de la célula por medio de microscopía de fluorescencia (véase fig. 6-5B).

7.3 ! ESTUDIO DE LA EXPRESIÓN GENICA

199

B)

A)

T||A

P oblación heterogénea de mRNA

I

T||C

II

T||G

II

10 11 12 16 10 11 12 16 10 11 12 16

I

A A A A A A ..A , A A A A A A ...A n A A A A A A ...A n

I

T ranscriptasa inversa con c e b a d o r oligo(dT) m od ifica do, p. ej., TIIG

------------------- \C¡AAAAAA...An ------------------ G T T T T T T T T T T T

i k

A m p lifica ció n de PCR con TIIG y c e b a d o r nu cle ótido 10 arb itrario , p. ej., TCGATACAGG

TCG ATACAG G AGCTATG TCC -

-C A A A A A A A A A A -G T T T T T T T T T T T

I

m m m '

E lectroforesis en gel de po lia crilam id a

Fig. 7-16. La exhibición diferencial de mRNA es un método de PCR-RT modificado para explorar la expresión génica multiplex. A) Representación esquem ática. El RNA total de dos o más tipos de células se transcribe inversamente con un cebador oligo (dT) modificado (en este ejemplo, TTTTTTTTTTTG o T ^G para abreviar), que debe cebar de manera preferencial la síntesis de cDNA a partir de la secuencia de mRNA en la que una C precede a la cola poli(A). La amplificación se realiza con un cebador arbitrario y los productos se fraccionan de tamaño en un gel de poliacrilami da. Las diferencias en las bandas de amplificación entre las fuentes de RNA que se comparan (A y B) indica la expresión diferencial. B) Una aplicación: identificación de genes que se expresan en forma diferencial en distintas etapas del desarrollo del corazón del ratón (días embrionarios 10 , 1 1 , 1 2 y 16). Se usaron tres grupos de condiciones de reacción, con un cebador T ^G en cada caso y uno de los tres cebadores arbitrarios diferentes AP1, AP2 y AP3. La figura muestra una sección del gel en la que puede observarse el cambio de intensidad en varias bandas en diferentes etapas del desarrollo. Un cam bio en particular notable (indicado por la flecha) resultó ser globlna p. Fotografía proporcionada por Andy Curtis y David Wilson, University of Newcastle upon Tyne, UK.

200

CAPÍTULO SIETE

ANÁLISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Recuadro 7-4. Obtención de anticuerpos MÉTODOS TRADICIONALES PARA OBTENER ANTICUERPOS Por tradición los anticuerpos contra productos génicos humanos se ob tienen mediante la inyección repetida de animales apropiados (p. e j„ roe dores, conejos, cabras, etc.), con un inmunógeno adecuado. A menudo se utilizan dos tipos de inmunógeno: ► péptidos sintéticos. Se observa la secuencia de aminoácidos (dedu cida de la secuencia conocida de cDNA) y se diseña un péptido sin tético (con frecuencia de 20 a 50 aminoácidos de largo). La idea es que, cuando se conjuga con una molécula adecuada (p. e j„ hemocianina adherente de ajuste perfecto), el péptido adopta una conforma ción semejante a la del segmento correspondiente del polipéptido natural. Aunque este método es hasta cierto punto simple, el éxito pa ra generar anticuerpos específicos apropiados está lejos de ser segu ro y resulta difícil predecirlo; ► proteínas de fusión. Un método alternativo consiste en insertar una secuencia apropiada de cDNA en un gen bacteriano modificado in serto en un vector de clonación de expresión apropiado. El razona miento es que se producirá un mRNA híbrido que se traducirá para proporcionar una proteína de fusión con una región terminal N deri vada del gen bacteriano y el resto proveniente del gen insertado (véase figura). A pesar de que la secuencia bacteriana terminal N suele diseñarse para ser muy corta, puede conferir ciertas ventajas. Por ejemplo, suele brindar una secuencia de señal a fin de asegurar la secreción de la proteína de fusión hacia el medio extracelular, lo que simplifica su purificación y puede proteger la proteína extraña de su degradación dentro de la bacteria. Como la proteína de fusión contiene la totalidad, o casi, de la secuencia polipéptida deseada, la probabilidad de producir anticuerpos específicos puede ser razona blemente alta. Si el sistema inmunitario de los animales respondió, deben secretarse an ticuerpos específicos hacia el suero. El suero rico en anticuerpos (anti suero) que se reúne contiene una mezcla heterogénea de anticuerpos, elaborados por un linfocito B diferente [porque los reordenamientos del gen de inmunoglobulina son específicos de célula y también de tipo ce lular (linfocito B), véase sección 10.6]. Los diferentes anticuerpos reco nocen distintas partes (epitopos) del inmunógeno (antisuero policlonal). Sin embargo, es posible elaborar una preparación homogénea de anti cuerpos al propagar una clona de células (originalmente derivadas de un linfocito B). Como las células B tienen un período de vida limitado en cultivo, es pre ferible establecer una línea celular inmortal: las células que producen an ticuerpo se fusionan con células derivadas de un tum or de célula B inmortal. A partir de la mezcla heterogénea resultante de células híbridas se seleccionan las que tienen tanto la capacidad para elaborar un anti cuerpo particular como la propiedad de multiplicarse de manera indefini da en cultivo. Estos hibridomas se propagan como clonas individuales, cada una de las cuales puede proporcionar una fuente permanente y es table de un tipo aislado de anticuerpo monoclonal (Ame). Los métodos anteriores para elaborar anticuerpos no siempre garantizan la producción de anticuerpos específicos adecuados. Un método alterna tivo para rastrear la expresión subcelular de una proteína de interés con siste en utilizar un anticuerpo obtenido con anterioridad a fin de seguirlo como resultado de su enlace a un epitopo acoplado de modo artificial (marcado de epitopo). En este procedimiento se genera un producto de DNA recombinante acoplando una secuencia que codifica un epitopo, pa ra el que se dispone del anticuerpo obtenido antes, a la secuencia de co dificación de la proteína de interés en form a muy similar a la figura, excepto que en este caso el sistema vector está diseñado para expresar se en células de mamíferos u otras células en las que se pretende inves

tigar ia expresión. La expresión de este producto en las células deseadas puede vigilarse por medio del anticuerpo específico para la marca del epi topo con objeto de rastrear la proteína. A continuación se muestran los marcadores de epitopos que más se utilizan.

Secuencia del marcador

Origen

Localización Acm

DYKDDDDK

FLAG sintético

Terminal N, C

Anti-FLAG M1

EQKLISEEDL

c-Myc humano

Terminal N, C

9E10

Terminal N

Ac Marcador T7

MASMTGGQQMG G enT710 QPELAPEDPED

Proteína D de HSV Terminal C

Ac Marcador HSC

RPKPQQFFGLM

Sustancia P

Terminal C

NC1/34

YPYDVPDYA

Influenza HA1

Terminal N, C

12CA5

Flag[Q33], virus de herpes simple, HSV. ANTICUERPOS POR INGENIERÍA GENÉTICA Los anticuerpos generados por los métodos clásicos anteriores provie nen de animales. Sin embargo, una vez que los diversos genes de inmu noglobulina se clonaron fue factible utilizar la tecnología de corte y ligadura de DNA para generar nuevos anticuerpos, inclusive tanto anti cuerpos parcialmente humanizados com o anticuerpos plenamente hu manos (véase sección 21.3.4). Por ejemplo, ratones transgénicos se

SCM

Í

C lo n a d e c D N A e n S C M (s itio d e c lo n a c ió n m ú ltip le ) y e x p re s a r

|3 -g a l p ro te ín a X N m— m P ro te ín a d e fu s ió n

c

Con frecuencia las proteínas de fusión se diseñan como inmunógenos para formar anticuerpos

7.3 1 ESTUDIO DE LA EXPRESIÓN GÉNICA ; 201

manipularon mediante ingeniería para que contuvieran locus de inmunoglobulina humana a fin de permitir la producción in vivo de anticuerpos plenamente humanos. Es posible que los métodos recientes eviten por completo la necesidad de recurrir a la tecnología de hibridoma e inmunización. La potente te cn olo gía de exhibición de lago permite elaborar un repertorio casi ilimitado de anticuerpos humanos con especificidades contra antígenos extraños y propios (véase Winter y cois., 1994). La esencia de este método es que los segmentos génicos que codifican las secuencias variables de cadena pesada y ligera del anticuerpo se clonan y expresan en la superficie de un bacteriófago filamentoso, y los fagos raros se seleccionan de una pobla ción compleja mediante el enlace con un antígeno de interés (véase sec ción 19.4.6 para una explicación completa).

Cuadro

El vector plásmide que aquí se muestra tiene un origen de replicación (ori) y un gen de resistencia a la ampicilina (ampR) diseñado para crecer en E. coli. El sitio de clonación múltiple (SCM) se localiza justo adyacente a un gen lacZ que puede codificar galactosidasa p y la transcripción del pro motor lacZ (P,ac) ocurre en la dirección que la flecha muestra. Se clona una secuencia de cDNA de un gen de interés (gen X) en una orientación apropiada dentro del sitio de clonación múltiple (SCM). La expresión del promotor lacZ dará por resultado una proteína de fusión galactosidasa beta-X que puede producirse en grandes cantidades y utilizarse como un inmunógeno para estimular la producción de anticuerpos a la proteína X. Una alternativa popular consiste en usar proteínas de fusión GST, en las que la transferasa de glutatión S se acopla a la proteína de interés y la proteína de fusión puede purificarse con facilidad mediante cromatogra fía de afinidad con el empleo de columnas de glutatión y agarosa.

Marcado y detección de anticuerpo para rastrear la expresión proteínica.

Marcador

Método de detección

Aplicación

Yodo-125

Placa de rayos X

Inmunoblotting

Enzima

Sustrato cromógeno detectado a simple vista

inmunoblotting; inmunocitoquímica

Biotina

Avidina o estreptavldina acoplada a diversos marcadores

Inmunoblotting; inmunocitoquímica

Fluorocromo

Microscopía de fluorescencia (fig. 6-5B)

Inmunocitoquímica; microscopía de inmunofluorescencia

1

2

C

3

4

5

C

6

7

8 - 4 0 0 kD a

D istro fin a (blot)

-

200

-

100

M io s in a (aell B)

Fig. 7-17. Inmunoblotting (Western blotting) detecta proteínas que se fraccionaron de tamaño en un gel de electroforesis. 1

2

C

3

4

5

C

6

7

8 - ,4 0 0 kD a

D istrofin a (blot)

-

-

M io s in a

(□en

200

100

Inmunoblotting consiste en detectar polipéptidos después del fraccio namiento de tamaño en un gel de poliacrilamida y transferirlos (“blotting”, manchado) a una membrana. Este ejemplo ilustra su aplicación en la detección de distrofina con el uso de dos anticuerpos. El anticuerpo Dy4/6D3 es especifico para el dominio de bastón y se generó con un inmunógeno de proteína de fusión (véase recuadro 7-4). El anticuerpo Dy6/C5 es específico para la reglón terminal C y se generó a partir de un inmunógeno péptido sintético. Reproducido de Nicholson y cois. (1993) con autorización de BMJ Publishing Group. Fotografía proporcionada por Louise Anderson (antes Nicholson), University of Newcastle upon Tyne, UK.

202

CAPÍTULO SIETE i ANALISIS DEL DNA Y ESTRUCTURA, VARIACIÓN Y EXPRESIÓN GÉNICAS

Estudios ultraestructuraIes La microscopía electrónica brinda una resolución aún más alta de la localización intracelular de un producto génico o de otra molé cula. Por lo general el anticuerpo se marca con una partícula electrodensa, como esferas de oro coloidal.

7.3.5 Los marcados autofluorescentes de proteínas constituyen un medio potente para rastrear ia localización subcelular de proteínas La proteína verde fluorescente (PVF) es una proteína de 238 ami noácidos que se identificó primero en la medusa Aequoria victoria. Proteínas similares se expresan en muchas medusas y al parecer ori ginan la luz verde que emiten y son estimuladas por la energía que se obtiene después de la oxidación de luciferina u otra fotoproteína (véase Tsien, 1998). Cuando el gen de PVF se clonó y tranfectó en células blanco en cultivo, también se marcó la expresión de PVF en células heterólogas por la emisión de luz fluorescente verde. Esto significa que la PVF es una p roteín a a u tofluorescen te; puede actuar por sí misma como un fluoróforo funcional. Por estas razones suele ser útil como rastreador único, ya que no requiere otros agentes, co mo anticuerpos, cofactores, sustratos enzimáticos, etc. Como resul tado, es posible seguir con facilidad la PVF mediante microscopía convencional y de fluorescencia confocal, y se constituyó en un medio popular para rastrear la expresión de genes en animales (véa se sección 20.3.1).

Fig. 7-19. El marcado con la proteína verde fluorescente constituye un medio potente para rastrear la expresión de proteínas. Este ejemplo muestra una célula HeLa viva transfectada en forma transito ria que expresa una proteina de la enfermedad de Batten marcada con PVF. CLN3 se clonó en el vector de expresión de PVF, pEPVF-N1, de manera que produjo una proteína constituida por la proteina de la enfermedad de Bat ten con una secuencia de PVF acoplada a su terminal C (un marcador PVF). Esta célula es un ejemplo de una proporción pequeña de células HeLa que expresan CLN3P/PVF en un patrón vesicular punteado distribuido en la totalidad del citoplasma. Estos análisis, y otros, indican que la pro teina de la enfermedad de Batten es una proteína integral de la membrana de Golgi. Reproducido de Kremmidiotis y cois. (1999) Hum. Mol. Genet. 8,523-531, con autorización de Oxford University Press.

Fig. 7-18. Inmunocitoquímica. En este ejemplo se seleccionó la expresión de tubulina p en un corte transversal de cerebro de un embrión de ratón de 12.5 días. El sistema de detección de anticuerpo utilizado identificó la expresión como una reacción de color pardo basada en peroxidasa de rábano picante/3,3' diaminobencidina. La histología subyacente se reveló mediante contra tinción con azul de toluidina. Abreviaturas: LV, ventrículo lateral; D, dien cèfalo; R protuberancia. Fotografia proporcionada por Steve Lisgo, Institute of Human Genetics, University of Newcastle upon Tyne, UK.

Las aplicaciones de mayor éxito y popularidad suelen usar la PVF como un marcador en una proteína de fusión en la que se aco pla la proteína cuya expresión se rastreará. En estos casos el objeti vo principal es investigar la localización subcelular de la proteína en investigación. La PVF en sí misma no se localiza de manera especí fica dentro de las células: en casi todos los tipos de células la fluores cencia de la PVF al parecer está diseminada de modo homogéneo en la totalidad del núcleo, el citoplasma y procesos celulares distales. Es posible recurrir a la ingeniería genética para producir vectores que contienen una secuencia de codificación de PVF dentro de la que una secuencia de codificación para una proteina, X, no caracteriza da puede clonarse. El producto de fusión PVF-X resultante puede transfectarse en células blanco adecuadas, como células de mamífe ros cultivadas, y la expresión de la proteína de fusión PFV-X vigilar se a fin de rastrear la localización subcelular de la misma. Véase la figura 7-9 para un ejemplo del rastreo de la expresión de la protei na producida por CLN3, el gen relacionado con la enfermedad de Barten, una afección neurodegenerativa de la niñez.

PARTE DOS

Genoma humano y su relación con otros genomas 8

P royectos d e l gen o m a y orga n ism os m od elos

207

9

O rgan ización d e l gen o m a hu m an o

239

10

Expresión g èn ica h u m an a

275

11

In estab ilid ad d e l gen om a hum ano: m u tación y reparación d e l DNA

315

12

L ugar d e l h om b re en e l á rb o l d e la vid a

351

CAPÍTULO

OCHO

Proyectos del genoma y organismos modelos Contenido del capítulo

CAPÍTULO OCHO

.1

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Im p o rtan cia pionera de los proyectos del genom a

8.1.1 Los proyectos del genoma prepararon el camino para los estudios sistemáticos del universo interno Después de muchos siglos de investigación se integró un conoci miento aproximado, cuando menos de las partes más accesibles del universo externo. La escala es impresionante y algunos conceptos están desde luego fuera de la experiencia normal del hombre (¡co mo las 13 dimensiones que en la actualidad se piensa que existen!). Sin embargo, también hay un universo interno (dentro del hombre) que en buena medida aún no se explora y tiene asimismo una esca la extraordinaria (la complejidad del cerebro humano es un ejem plo útil: alrededor de 1011 neuronas y 1015 interconexiones). Hasta fecha reciente, las exploraciones del universo interno del hombre eran modestas y de escala limitada. La aplicación del mi croscopio al estudio de las células y las estructuras subcelulares pro porcionó una vía importante hacia este mundo interno; a ella le siguieron adelantos pioneros en bioquímica y a continuación bio logía molecular y celular. Hoy en día, al inicio de un nuevo mile nio, se cuenta con el equilibrio para pasar de estas investigaciones iniciales a un plano por completo superior. Ahora es posible llevar a cabo una exploración seria y sistemática del universo interno del hombre. El factor que allanó el camino para esta nueva fase del descubri miento fue el Proyecto del Genoma Humano (PGH), una labor en verdad internacional. Comenzó de forma oficial en 1990 y fue el primer “proyecto grande” de la biología, con un tiempo proyec tado de 15 años. El PGH y otros proyectos de genomas buscaron por primera vez conocer las instrucciones químicas precisas que de finen a los organismos vivientes, las secuencias completas del geno ma (el g en o m a se refiere al corpus total de las diferentes moléculas de DNA; véase el glosario de genómica en el recuadro 8-1). Para muchos científicos, esto fue el equivalente en biología de la tabla periódica; toda la materia puede reducirse a una tabla periódica de elementos, pero a un nivel más alto; así, todo ser viviente puede re ducirse a una tabla periódica de genes.

Objetivos del Proyecto del Genoma Humano (PGH) La principal justificación del PGH fue adquirir información funda mental sobre la constitución genética que podría ampliar el cono cimiento científico básico de la genética humana y el papel de diversos genes en la salud y la enfermedad. Desde que se publicó en 1981 la secuencia pequeña (16.5 kb) del DNA mitocondrial huma no (mtDNA) (véase sección 9.1.2), el principal objetivo del PGH fue secuenciar el genoma nuclear, inmensamente más grande (cer ca de 3 000 Mb). Como un primer paso para lograrlo, se requerían mapas genéticos humanos de alta resolución que sirvieran como una estructura central (armazón) para construir mapas físicos de gran precisión, hasta culminar en el mapa físico final, la secuencia completa del genoma humano. Además del objetivo primario de mapear y secuenciar el geno ma nuclear humano, el PGH previo desde el principio varios pro yectos auxiliares: ► d esa rro llo d e tecn o lo g ía s y h erra m ien ta s a p rop ia d a s. Esto incluía desarrollo de los métodos de mapeo genético y físico, tecnología de secuenciación del DNA, diseño y elaboración

de bases de datos e informática para análisis de secuencias, et cétera; ► p r o y e cto s d e l g en o m a p a r a cin co o rga n ism os m od elos: la bac teria E. coli, la levadura Saccharomyces cerevisiae, el gusano re dondo Caenorhabditis elegans, la mosca de la fruta Drosophila melanogaster y el ratón. En este caso, el objeto fue doble: pro porcionar información abundante necesaria para estos organis mos modelos y asimismo pruebas y casos para practicar y depurar las diversas tecnologías y herramientas que fueran ne cesarias para el proyecto del genoma humano; ► efecto s éticos, lega les y sociales. Una parte importante del cos to total se dedicó a este componente fundamental, pero fácil de pasar por alto. Alrededor del año 2003 se habían logrado los objetivos de la secuen ciación del genoma humano y los genomas de los cinco organismos modelos iniciales y se disponía de las secuencias a través de internet. Durante el curso del PGH se iniciaron otros proyectos de genomas para una amplia variedad de otros organismos modelos y hacia ma yo de 2003 se habían determinado las secuencias del genoma de otros 140 organismos (véase sección 8.4). Los estudios auxiliares adicionales se preocuparon de la extensión de la variación de la se cuencia dentro del genoma humano.

8.1.2 Se espera que los beneficios médicos y científicos de los proyectos del genoma sean enormes Para muchos biólogos y genetistas humanos, el PGH fue una mi sión histórica. Un justificación mayor aún fueron los beneficios médicos anticipados (Collins y McKusick, 2001; Subramanian y cois., 2001; Van Ommen, 2002). Para trastornos hereditarios que dependen de un gen aislado mayor es factible el diagnóstico amplio prenatal y presintomático de afecciones en individuos con riesgo de tener un gen de la enfermedad. Además, se utiliza la información sobre la estructura génica para valorar el modo en que funcionan genes individuales y la forma en que se regulan. Esta información proporciona explicaciones que se requieren con urgencia para procesos biológicos en seres humanos. Tam bién cabía esperar que proporcionara una estructura para el de sarrollo de nuevos tratamientos de enfermedades y extender los métodos terapéuticos actuales. Se espera que la aplicación a gran escala de la selección de mutaciones represente un cambio radical en la conducta para el cuidado médico: pasar del tratamiento de una enfermedad avanzada a la prevención d e la anormalidad, con base en la identificación del riesgo individual (m ed icin a p e r so n a lizada) . Sin embargo, aunque estas posibilidades son fascinantes, es posible que haya dificultades inesperadas para comprender con precisión y amplitud la manera en que funcionan y se regulan al gunos genes (las precauciones precedentes son en realidad el len to progreso para predecir la estructura de las proteínas a partir de la secuencia de aminoácidos y la falta de conocimientos sobre la> formas precisas en que se coordina la regulación de la expresión del gen de globina, décadas después de obtenerse las secuenciasde importancia). Además, los trastornos de gen único que serían los blancos más fáciles para desarrollar terapéuticas novedosas son muy raros; las alteraciones más comunes son multifactoriíles y representan grandes desafíos. Por consiguiente, aunque loi datos obtenidos en el proyecto del genoma humano tendrán de modo inevitable un valor médico, es posible que algunas de las

8.1

Recuadro 8-1. Glosario de

IMPORTANCIA PIONERA DE LOS PROYECTOS DEL GENOMA

209

genóm ica i

CentiMorgan (cM): unidad de distancia en un mapa genético (véase más adelante); en el genoma humano IcM corresponde más o menos a una distancia en el mapa físico de 1 Mb. CentiRay (cR): unidad de distancia en un mapa híbrido por radiación (véase más adelante). Clona: las clonas de DNA son poblaciones de moléculas de DNA idénti cas que se purificaron mediante métodos de clonación basados en célu las (sección 5.3.1) o por PCR (sección 5.2.1). Contiguo: serie de clonas de DNA que contienen insertadas moléculas de DNA derivadas de regiones próximas y superpuestas de un cromosoma; véase recuadro 8-5. Marcador de DNA: término general para una secuencia de DNA que se colocó, o puede situarse, en un mapa genético (si se trata de marcado res polimórficos; véase más adelante) o un mapa físico (en el caso de todos los marcadores). Islote de CpG: tira corta de DNA abundante en GC, con frecuencia < 1 kb, que contiene dinucleótidos CpG no metilados frecuentes. Los islo tes de CpG tienden a marcar los extremos 5 ' de genes; véase recuadro 9-3. genoteca de DNA: conjunto de clonas de DNA que tiene com o fin re presentar de fo rm a colectiva una población de inicio de DNA. Para una genoteca de DNA genómico, el DNA de inicio es el DNA total de una población celular determinada (que muestra poca variación entre los diferentes tipos de células); cuando se trata de una genoteca de cD NA, el DNA de inicio es cDNA preparado mediante transcriptasa inver sa de RNA de cadena única de un tejido especifico (con una variación muy considerable en el cDNA de diferentes tejidos); véase secciones 5.3.4 y 5.3.5 para la form a en que se preparan y seleccionan las genotecas. EST (marcador de secuencia expresado): un STS expresado (sitio de secuencia marcado: véase más adelante) que se obtiene al seleccionar de modo aleatorio una clona de cDNA para secuenciación y el diseño de cebadores específicos a fin de amplificar de manera particular mediante PCR el fragmento correspondiente de DNA genómico. Mapa genético: es un mapa que se basa en el rastreo de la herencia de fenotipos, marcadores polim órficos, o ambos, a través de generaciones; los locus polim órficos están colocados relativamente entre sí con base en la frecuencia con que se recombinan durante la meiosis; la unidad de dis tancia es 1 centiMorgan (1 cM) que indica una posibilidad de recom bi nación del 1 %. Genoma: nombre colectivo para las diferentes moléculas de DNA que se encuentran en las células de una especie particular; en seres humanos el genoma comprende 25 moléculas de DNA diferentes: un tipo único de DNA mitocondrial y 24 moléculas de DNA nuclear diferentes (véase sec ción 9.1.1). Sin embargo, debido a que la cantidad de DNA en el núcleo es tan grande, a menudo se utiliza de manera general el término genoma para referirse al grupo de moléculas de DNA nuclear (denominado con mayor precisión genoma nuclear: con frecuencia, el DNA mitocondrial se describe como genoma mitocondrial)

aplicaciones médicas relevantes requieran aún un tiempo consi derable para desarrollarse. A medida que se transita hacia la era posgenoma se han emprendido enormes esfuerzos internacionales para determinar la forma en que la secuencia del genoma humano puede espe cificar a una persona y cómo se relaciona el DNA de otros or ganismos con el del hombre y sus biologías. La información

Mapeo de célula híbrida: pueden asignarse marcadores de DNA humano a una localización cromosómica o subcromosómica específica mediante grupos de diferentes células híbridas que contienen un complemento total de cromosomas de una especie de roedor (hámster o ratón) y un subgrupo variable de cromosomas humanos o fragmentos de cromosomas huma nos rotos medíante exposición a rayos X (híbridos por radiación; véase recuadro 8-4). Marcador microsatélite: es una variedad de marcador de DNA que se emplea de modo habitual, en buena medida porque los marcadores de es te tipo puede ser muy polim órficos; véase figuras 7-7 y 7-8. Mapa físico: es un mapa que proporciona información sobre la estructu ra lineal de moléculas de DNA; el mapa físico más detallado es la secuen cia de nucleótidos. Marcadores polimórficos: los marcadores polim órficos (genéticos) son secuencias de DNA que muestran variación entre los individuos y se usan para elaborar mapas genéticos de acuerdo con la form a en que se segregan alelos en fam ilias grandes. Los marcadores pueden loca lizarse dentro de las secuencias de codificación u otros componentes génicos, pero se hallan sobre todo en el DNA no codificante. Los m ar cadores que se utilizan con frecuencia son microsatélites y SNP, aun que con anterioridad se empleaban RFLP e incluso polim orfism os proteínicos. Mapa híbrido por radiación (HR): es un mapa de un genoma en el cual los STS se interrelacíonan según sea la frecuencia con que se separan mediante roturas cromosómicas inducidas por radiación. La frecuencia se valora tras analizar un grupo de líneas de células híbridas (ser humano-hámster) que contienen diferentes patrones de fragmentos cromosómicos humanos generados de modo inicial por exposición a rayos X. La unidad de distancia del mapa es 1 centiRay (1 cR), que indica una posi bilidad de 1 % de que ocurra una rotura entre dos locus. RFLP (polimorfismo de longitud de fragmento de restricción): es un ti po de marcador de DNA que se usó en extenso con anterioridad, pero con muy poca frecuencia en la actualidad porque no suele ser muy polim órfico y no es fácil tipificarlo; véase la sección 7.1.3. SNP (polimorfismo de nucleótido único): los SNP suministran un tipo de marcador de DNA que se ha empleado cada vez más. Ocurren con gran frecuencia en el DNA-y pueden tipificarse con facilidad mediante métodos automatizados, lo que hace posible analizar al mism o tiempo enormes cantidades de muestras; véase la sección 7.1.3 y el recuadro 18-2 don de se describe la forma en que se tipifican los polim orfism os de nucleó tido único (SNP). STS (sitio de secuencia marcado): cualquier secuencia corta (por lo ge neral < 500 pb) representada de manera única en un genoma y para la cual se diseñan cebadores que permiten la amplificación especifica de esa secuencia mediante PCR (véase recuadro 5-4). Los STS se obtenían al secuenciar de manera aleatoria los extremos de clonas genómicas y por consiguiente muchas veces no eran polim órficos, pero se sabe que un subgrupo de STS es polim órfico, incluidos los marcadores microsa télites (véase antes).

sobre la secuencia obtenida por el estudio de la estructura de genomas (genómica convencional) ha facilitado el camino pa ra la aparición de otros métodos a gran escala que permitan in vestigar la función de los genomas (g e n ó m ic a fu n c io n a l) y la manera en que se vinculan entre sí los diferentes genomas ( g e n ó m ica c o m p a r a tiv a ). Estos temas se comentan en el capítulo 19 y la sección 12.3.

210

CAPITULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

8.2

Fundam ento y organización del Proyecto del Genoma Hum ano

8.2.1 Los polimorfismos de DNA y las nuevas tecnologías de clonación de DNA allanaron el camino para la secuenciación del genoma humano Desde mediados de la década de 1950 se contaba ya con un mapa físico muy general del genoma humano -un mapa citogenético ba sado en la distinción de los cromosomas por tamaño y forma-. Con la finalidad de progresar hacia mapas físicos muy detallados se re quirieron nuevas medidas. Un problema principal fue que parecía imposible el objetivo inicial de obtener un mapa genético humano —que actuara como una estructura central para construir mapas físi cos detallados-. En lugar de ello, los genetistas humanos se limita ban a vigilar, a medida que se elaboraban desde hacía décadas, los m apas g e n é tico s típ ico s de Drosophila y el ratón, que después se depuraban de forma continua. Los mapas genéticos habituales se basan en gen es. Se elaboran al cruzar diferentes mutantes para determinar si los genes de dos locus están ligados o no. Sin embargo, nunca podría lograrse un ma pa genético humano común porque la frecuencia del matrimonio entre dos individuos que sufren diferentes trastornos genéticos es cada vez más pequeña. Sin un mapa genético que proporcionara puntos de fijación era difícil imaginar cómo diseñar mapas físicos detallados de todos los cromosomas. Un punto decisivo fue el reconocimiento cada vez mayor, a fines de la década de 1970, de que mucha (en realidad la gran mayoría) de la variación de secuencias en el genoma humano ocurría fuera de los genes y podía valorarse. La variación que se había estudiado hasta entonces se enfocó a continuación en polimorfismos de proteínas. Sólo fue factible estudiar unos cuantos marcadores de proteínas por que el DNA de codificación es una fracción muy pequeña (2%) del genoma y no propensa a variaciones (porque es esencial en sentido funcional y está muy conservada en la evolución). En contraste, la inmensa mayoría del > 98% del DNA humano que no es codifi cante no está bien conservado y es muy susceptible a cambios de la secuencia de DNA. A finales de la década de 1970 se dispuso por primera vez de métodos para valorar la variación d el DNA (mediante la selección para p o lim o rfism o s d e lo n g itu d d e l fr a g m en to d e restricció n o RFLP-, recuadro 8-1). Por último, se tornó una posibilidad la idea de construir un mapa genético humano atípico y amplio (Botstein y cois., 1980). Desde esa fecha en adelante, los genetistas humanos elaborarían mapas de enlace genético cada vez más detallados me diante marcadores de DNA que se dispersaran al azar en la totali dad del genoma humano. Tras llevar a cabo pruebas para observar si en estudios de familias se segregaban juntos alelos específicos de dos o más marcadores, fue factible asignar marcadores de DNA a un gr u p o d e u n ión particular. Fue posible a su vez asignar grupos de unión individuales a cromosomas específicos mediante el mapeo físico de uno o más de los marcadores constituyentes (p. ej., al se ñalar un marcador e hibridarlo en una preparación de cromosomas en metafase [véase figs. 2-16 y 2-17] o al utilizar grupos de células híbridas [véase sección 8.3.2]). Otra necesidad básica fue el desarrollo de tecnologías de clona ción de DNA potentes que posibilitaran ensamblar clonas que con tenían grandes piezas de DNA (g e n o te ca s d e DNA d e in serto gra n d e). Los insertos de las clonas se habían creado mediante frag

mentación aleatoria del genoma, pero fue posible estudiarlos para observar los marcadores de DNA particulares que contenían y ve rificar si compartían marcadores con insertos en otras clonas. De ser así, las clonas tenían con frecuencia insertos de DNA superpues tos y fue posible producir mapas ordenados de clonas de DNA de acuerdo con la superposición entre los insertos de DNA, los llama dos co n tigu o s d e clonas.

8.2.2 El Proyecto del Genoma Humano se llevó a cabo en grandes centros de genoma con capacidades de secuenciación de alto rendimiento Organización del Proyecto del Genoma Humano Si bien el U.S. Human Genome Project proporcionó el impulso inicial para el proyecto del genoma humano consolidado pública mente, otros países desarrollaron con rapidez sus propios proyectos de genoma humano. Centros en el Reino Unido y Francia se apre suraron a distinguirse y en fecha más reciente hubo contribuciones considerables de centros en otros países, de forma notable Japón y Alemania. Con objeto de coordinar los diferentes esfuerzos nacio nales, se estableció en 1988 la Human Genome Organization (HUGO, Organización d el Genoma Humano) con libertad para fa cilitar el intercambio de recursos de investigación, fomentar el de bate público y asesorar en relación con las implicaciones de la investigación del genoma humano (McKusick, 1989). Debido a la gran escala del proyecto, la tecnología necesaria pa ra la secuenciación del genoma humano se concentró en unos cuantos centros de genoma muy grandes con capacidades de se cuenciación en proporciones industriales (fig. 8-1). La secuencia ción de DNA basada en el marcado fluorescente automatizado se constituyó en la norma y el advenimiento de la secu en cia ció n d e DNA basada en ca p ila res (sección 7.1.2) proporcionó un refuer zo muy necesario para la secuenciación de alto rendimiento. Para el PGH cinco grandes centros se encargaron de la mayor parte de la

Fig. 8-1. Secuenciación de DNA a gran escala en el Wellcome Trust Sänger Institute. El Wellcome Trust Sänger Institute, en Hinxton, Reino Unido, ha sido el contribuyente independiente principal del Proyecto del Genoma Huma no patrocinado de forma pública al que puede tenerse acceso en http://www.sanger.ac.uk

8.2

FUNDAMENTO Y ORGANIZACIÓN DEL PROYECTO DEL GENOMA HUMANO

211

........... " ............... FISH Híbridos de células somáticas Híbridos por radiación

Ensamble de contiguos

Unión de m últiples puntos (C EPH , etc.)

Unión: Lods, homocigosidad de pares de hermanos

M a p a d e arm azón m a rcad o r-m arca d o r

Localización inicial del gen de enfermedad Clave:

M apa genético

M apa físico

U_____ £

Inform aciones

—

M é to d o s físicos

------- M é to d o s g enéticos

M a p a del g e n o m a hum ano

S ec u en cia ció n

O

á

Identificación gènica

» J8

N ube negra

Fig. 8-2. Medidas y métodos científicos utilizados en el Proyecto del Genoma Humano. El principal impulso científico para este proyecto se inició con el aislamiento de clonas genómicas y cDNA humanas (mediante clonación basada en cé lulas o PCR). A continuación se emplearon para construir mapas genéticos y físicos de alta resolución antes de obtener el mapa físico final, es decir, la secuencia completa de nucleótidos de las 3 000 Mb del genoma nuclear. De manera inevitable, el proyecto interactuó con la investigación sobre el tra peo e identificación de genes de enfermedades humanas. Además, proyectos auxiliares incluyeron el estudio de la variación genética (el Proyecto de Di versidad del Genoma Humano; sección 8.3.7), proyectos de genoma para organismos modelos (sección 8.4) e investigación sobre implicaciones éticas, legales y sociales. Los datos obtenidos se canalizaron hacia bases de datos de mapeo y secuencias que permitieron el acceso y análisis de da tos electrónico rápidos. EST, marcador de secuencia expresado; STS, sitio de secuencia marcado.

secuencia, el Wellcome Trust Sanger Institute del Reino Unido y cuatro centros de Estados Unidos: The Whitehead Institute^Massachussetts Institute of Technology en Massachusetts, Washington University, DoE Joint Genome Institute y Baylor College of Medicine. Al interactuar con los anteriores y algunos otros grandes centros se creó una red mundial de laboratorios pequeños que trataban sobre todo de mapear e identificar genes de enfermedades y de manera característica se enfocaron en regiones subcromosómicas muy es pecíficas (véase fig. 8 -2 ). La comunicación entre la red de centros del genoma y los labo ratorios adjuntos se basaba (y aún ahora) en la comunicación elec trónica. La necesidad de manejar y almacenar la enorme cantidad de datos sobre secuenciación que se producían con rapidez obligó a desarrollar grandes bases de datos electrónicas que, cuando me nos para los esfuerzos de mapeo y secuenciación patrocinados de forma pública, son accesibles a través de internet. Puede conducir se así el análisis desde terminales de computadora remotas en todo el mundo. Según fuera el origen de los datos de información, se dis puso de dos tipos de bases de datos:

► centrales d e depósito para alm acenar datos sobre mapeo y secuen ciación producidos de manera global. Décadas antes de iniciar se el proyecto del genoma se establecieron bases de datos de secuencias de DNA y proteínas universales, pero hasta fecha más reciente se formaron bases de datos de mapeos específicas d e especie especializadas, como la G enom e d a ta b a se ( GDB Base de datos del genoma), una base de datos de mapas diri gida en particular a almacenar datos sobre mapeo humano (n ota : existe una nomenclatura específica para nombrar los segmentos de DNA y ios genes en diferentes especies; véase las lecturas adicionales y el recuadro 8-2 para la terminología en seres humanos). ► bases de datos para almacenar información producida a nivel local. A fin de mejorar su eficiencia, los grandes centros de secuencia ción de genoma almacenaron los datos obtenidos en sus labora torios en bases de datos especializadas. A diferencia de la entrada de datos, es libre el acceso a los datos a través de la red de los centros de genoma patrocinados de forma pública.

212

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

8.3

Cómo se m apeó y secuenció el genom a humano

El Proyecto del Genoma Humano se proyectó para 15 años, de 1990 a 2005, pero el progreso fue más rápido de lo esperado. Se desarrollaron mapas genéticos antes del tiempo previsto y se fa cilitó la etapa final de la secuenciación del DNA a gran escala por los adelantos en secuenciación de DNA basada en fluorescencia automatizada y el impulso adicional que resultó de la competen cia con una compañía privada, Celera. Alrededor del año 2003 estaba disponible para todos a través de internet una secuencia esencialmente terminada. Véase el recuadro 8-3 acerca de los años en que se consiguieron algunos de los principales aconteci mientos.

8.3.1 Los primeros mapas genéticos humanos útiles se basaron en marcadores microsatélites La verificación al inicio de la década de 1980 de que ya era asequi ble la elaboración de un mapa genético humano amplio suscitó es fuerzos de consideración para diseñar uno. El primero de esos mapas se publicó en 1987 y se basó sobre todo en p o lim o rfism o s d e lo n g itu d d e l fr a g m en to d e restricción (RFLP). A pesar de su heroico logro, el mapa de RFLP tuvo limitaciones notorias: el espaciamiento promedio entre los marcadores era considerable y, más importante aún, los marcadores de RFLP no son muy informativos (sólo dos alelos) y no es tan fácil tipificarlos.

Con posterioridad se desplazó la atención hacia la elaboración de mapas con m a rca d o res m icro sa télites, cuya ventaja es la de ser muy informativos, fáciles de tipificar y se dispersan en la totali dad del genoma (véase sección 9.4.3 y figs. 7-7 y 7-8). En el transcurso de otros cinco años, los investigadores del laboratorio Généthon en Francia publicaron el primer mapa de enlace del ge noma humano basado en microsatélites (Weissenbach y cois., 1992) y dos años después un consorcio internacional publicó un mapa mejorado, basado en esencia en microsatélites con una den sidad de marcadores alta, cerca de un marcador cada centimorgan (cM) (Murray y cois., 1994). El mapa genético humano de alta resolución publicado en 1994 satisfizo el primer objetivo científico del Proyecto del Genoma Hu mano e hizo posible ahora una estructura central importante para desarrollar mapas físicos detallados de todos los cromosomas. A partir de entonces, el principal enfoque del PGH sería desarrollar y depurar mapas físicos que condujeran al mapa físico final, la se cuencia completa de DNA de cada cromosoma (véase sección 8.3.2). Pese a ello, el mapeo genético del genoma humano conti nuó en dos direcciones esenciales: ► d ep u ra ción d e m apas m icrosatélites. En la actualidad, el mapa más detallado es el elaborado por el grupo genético deCODE en Islandia, que incluyó la tipificación de 5 136 marcadores mi crosatélites en 146 familias, con un total de 1 257 acontecimien tos meióticos (Kong y cois., 2002). ► d esa rro llo d e m apas d e p o litn o rfism o d e n u cleó tid o ú n ico (SNP) (sección 8.3.7).

Recuadro 8 2. G e n e s humanos y nomenclatura del segm ento de DNA La nomenclatura que se utiliza la decidió el comité de momenclatura de HUGO. A los genes y seudogenes suele asignárseles símbolos de dos a seis ca racteres. Las secuencias de seudogenes se indican con una P después del símbolo importante del gen. En secuencias de DNA anónimas, el convenio es utilizar D ( = DNA) seguida de 1-22, X o Y a fin de indicar la localización cromosómica, a continuación S para un segmento único, Z para una fam i lia de DNA repetido específica de cromosoma o F para una familia de DNA de múltiples locus, y finalmente un número de serie. La letra E después del número de una secuencia de DNA anónima indica que se sabe que se expresa la secuencia. Símbolo

Interpretación

CRYB1

Gen para polipéptido (3-1 cristalino

GAPD

Gen para deshidrogenasa de gliceraldehído 3-fosfato

GAPDL7

Gen 7 parecido a GAPD, estado funcional desconocido

GAPDP1

Seudogen GAPD 1

AK1

Gen para cinasa de adenilato, locus 1

AK2

Gen para cinasa de adenilato, locus 2

PGK1*2

Segundo alelo en el locus PGK1

B3P42

Punto de rotura número 42 en el cromosoma 3

DYS29

Segmento único de DNA número 29 en el cromosoma Y

D3S2550E

Segmento único de DNA número 2 550 en el cromosoma 3, se sabe que se expresa

D11Z3

Número 3 de la familia de DNA repetido específico del cromosoma 11

DXYS6X

Segmento de DNA en el cromosoma X, con una homología conocida en el cromosoma Y, y que representa el 6o. par XY homólogo por clasificar

DXYS44Y

Segmento de DNA en el cromosoma Y, con un homólogo conocido en el cromosoma X, 44o. par XY homólogo

D12F3S1

Segmento de DNA en el cromosoma 12, primer miembro de la familia 3 de múltiples locus

DXF3S2

Segmento de DNA en el cromosoma X, segundo miembro de la familia 3 de múltiples locus

FRA16A

Sitio frágil A en el cromosoma 16

8.3 I CÓMO SE MAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

213

Recuadro 8-3. Principales acontecim ientos en el mapeo y secuenciación del genoma humano 1956: Se determinó el primer mapa físico del genoma humano; la m icros copía de luz de tejido teñido revela que las células del hombre contienen 46 cromosomas, con un total de 24 tipos diferentes de ellos. 1977: Fred Sanger y sus colaboradores en Cambridge, Reino Unido, pu blicaron el método de secuenciación de didesoxi-DNA, que aún es la ba se de la tecnología de secuenciación de DNA actual más de un cuarto de siglo después. 1980: Botstein y cois., (1980) advirtieron que era posible construir un ma pa genético mediante un grupo de marcadores de DNA aleatorios (RFLP). 1981: Fred Sanger y cois., publicaron la secuencia completa del DNA mitocondrial humano (véase sección 9.1.2). 1984: Reunión en Alta, Utah, patrocinada de manera parcial por el U.S. Department of Energy (DoE) para valorar los métodos de detección y ca racterización de mutaciones y proyectar tecnologías futuras. Una conclu sión principal fue que se requería un programa de secuenciación de grandes dimensiones, complejo y caro, para detectar mutaciones con una gran precisión. 1987: El U.S. Department of Energy Report on a Human Genome Initiative considera tres objetivos principales: creación de mapas físicos depu rados de cromosomas humanos; desarrollo de tecnologías de apoyo y facilidades para la investigación del genoma humano; y expansión de las redes de comunicación y capacidades de computación y bases de datos. 1988: Los U.S. National Institutes of Health (NIH) establecen una Office of Human Genome Research (conocida más adelante como National Center fo r Human Genome Research) a fin de coordinar las actividades sobre genoma de NIH en cooperación con otras organizaciones estadou nidenses. La Human Genome Organization (HUGO) se estableció en el mism o año para coordinar esfuerzos internacionales y tiene la libertad de facilitar el intercambio de recursos de investigación, fomentar el debate

8.3.2 Los primeros mapas físicos de alta resolución del genoma humano se basaron en contiguos de clonas y referencias de sitios de secuenciación marcados (STS) Métodos generales en el mapeo físico del genoma humano Aunque en la elaboración de diferentes mapas genéticos humanos se utilizaban distintos tipos de marcadores, hubo un principio sub yacente común, los marcadores se tipificaron en miembros de una variedad de familias de múltiples generaciones y se introdujeron los datos en la computadora para buscar marcadores con alelos de cosegregación. El mapeo físico es diferente porque son posibles mu chos tipos distintos de mapa (véase cuadro 8-1). El primer mapa físico del genoma humano se basó en bandeo cromosómico y se ob tuvo hace más de 40 años (véase fig. 2.14 para ver un ejemplo mo derno de un mapa de bandeo cromosómico). Si bien la resolución es burda, los mapas citogenéticos propor cionaron un armazón general muy útil para ordenar las secuencias de DNA humano mediante hibridación in situ y los puntos de rocura citogenéticos definidos suministraron herramientas para el mapeo adicionales. De igual modo, se generaron m apas d e restric ció n d e lím ites la rgos al emplear nucleasas de restricción de corte ra ro, por ejemplo, para producir un mapa de restricción NoA de 2 1 q (Ichikawa y cois., 1993). No obstante, en el contexto del PGH, el primer mapa físico de alta resolución del genoma humano fue po

público y asesorar sobre las implicaciones de la investigación del geno ma humano (McKusick, 1989). 1990: Lanzamiento oficial del Proyecto del Genoma Humano (PGH) des pués de autorizar un proyecto de tres mil millones de dólares para 15 años en Estados Unidos. 1991: Se establece la Genome Database (GDB), una reserva para datos sobre el mapeo del DNA humano. 1992: Jean Weissenbach y cois., del laboratorio Généthon de Francia pu blican el primer mapa de enlace genético humano amplio basado en mar cadores microsatélites (Weissenbach y cois., 1992). 1993: Daniel Cohén y cois., del laboratorio Généthon de Francia publican un mapa físico de primera generación del genoma humano, basado en In sertos de clonas de DNA grandes (Cohén y cois., 1993). 1995: Eric Lander y colegas del Whitehead Institute/Massachusetts Institute of Technology publican el primer mapa físico detallado del genoma humano, basado en sitios de secuenciación marcados (Hudson y cois., 1995). 1998: Un consorcio internacional dirigido por investigadores del Sanger Centre de Inglaterra (Deloukas y cois., 1998) publica el GeneMap '98, el primer mapa razonablemente amplio de marcadores basados en genes. 1999: Un consorcio internacional dirigido por investigadores del Sanger Centre, Inglaterra, publica la primera secuencia completa de un crom oso ma humano, el cromosoma 22 (Dunham y cois., 1999). 2001: Publicación de esquemas de trabajo generales acerca de la secuen cia del genoma humano (que comprende alrededor de 90% de la secuen cia total) por un consorcio internacional de investigadores patrocinados con recursos públicos y por una compañía privada, Celera (International Human Gene Sequencing Consortium, 2001; Venter y cois., 2001). 2003: Se termina la secuencia del genoma humano.

sible tras establecer g e n o te ca s d e clo n a s d e DNA g e n ó m ico me diante clonas de DNA basadas en células (véase en la sección 5.3.4 los principios generales). Una vez que se dispuso de ellas, fue facti ble seleccionar las genotecas con la finalidad de identificar clonas individuales que pudieran agruparse a continuación en grupos de clonas con insertos originados del mismo cromosoma y región subcromosómica. Por último, sería posible organizar las clonas en grupos que abarcaran regiones subcromosómicas grandes y al final cromo somas completos. Para preparar genotecas de clonas de DNA genómico fue habi tual comenzar con una línea celular permanente (linfoblastoide) pa ra proporcionar una fuente continuamente renovable de una población celular homogénea. Después de aislar el DNA genómico de la línea celular con métodos estándar, se corta el DNA con una nucleasa de restricción y se clona en un vector apropiado a fin de preparar la genoteca de DNA genómico de elección. Por lo general, los intentos iniciales usaban vectores lambda y cósmido para crear genotecas con insertos entre 15 y 40 kb (sección 5.4.2). Los inser tos de clonas podían seleccionarse (al inicio mediante hibridación con una clona de cDNA pequeña aislada de forma previa, pero en fecha más reciente con PCR) y a continuación mapearse con facili dad a una región subcromosómica mediante h ib rid a ció n crom osóm ica in situ (véase figs. 2-16 y 2-17; nota: el mapeo de clonas de cDNA mucho más cortas mediante su hibridación a cromosomas de metafase fue mucho más difícil a nivel técnico que mapear grandes clonas genómicas y casi nunca se intentó).

214

CAPÍTULO OCHO i PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Cuadro 8-1. Es posible utilizar diferentes tipos de mapas físicos para trazar el mapa del genoma nuclear humano. Tipo de mapa

Ejemplos/metodología

Resolución

Citogenético

Mapas de bandeo cromosómico

Una banda promedio tiene varios Mb de DNA

Mapas de punto de rotura cromosómica

Grupos de células híbridas somáticas que contienen frag mentos de cromosomas humanos derivados de transloca ción o deleción cromosómicas naturales

La distancia entre puntos de rotura cromosómicos adyacentes en un cromosoma suele tener varios Mb

Mapas de híbridos por radiación (HR) monocromosómícos

La distancia entre puntos de rotura tiene con fre cuencia muchos Mb

Mapas de HR del genoma completo

La resolución puede ser tan alta como 0.5 Mb

Mapa de restricción

Mapas de restricción de cortador raro, p. e j„ mapas Not\

Varios cientos de kb para mapas de restricción de cortador raro

Mapa de contiguo de clona

Clonas YAC superpuestas

El inserto promedio de YAC tiene varios cientos de kb de DNA

Clonas cósmidas superpuestas

El inserto cósmido promedio es de 40 kb

Mapa de STS (sitio de secuen cia marcado)

Requiere información de secuencia previa de clonas orde nadas de tal modo que puedan ordenarse los sitios de se cuencia marcados (STS)

Es posible menos de 1 kb. pero los mapas estándar de STS tienen resoluciones de decenas de kb

Mapa de EST (marcador de secuencia expresado)

Requiere secuenciación de cDNA y a continuación otra vez mapeo de los cDNA para otros mapas físicos

La resolución promedio del genoma nuclear humano es - 9 0 kb

Mapa de secuencia de DNA

Secuencia completa de nucleótidos de DNA cromosómico

1 pb

En las primeras genotecas de DNA genómico humano, la in mensa mayoría de las clonas era anónima (porque se desconocía la identidad de su DNA insertado) y carecía de mapeo. De modo gra dual se caracterizaron cada vez más clonas de cDNA diferentes, lo que permitió identificar las clonas de DNA genómicas correspon dientes (afines) y en seguida mapearse en regiones subcromosómicas (fue más fácil caracterizar clonas de cDNA porque tenían insertos cortos que podían secuenciarse con relativa rapidez y las genotecas eran menos complejas, con tipos particulares de clonas que a menudo predominaban por expresión génica diferencial, por ejemplo, transcritos de globina en muestras de sangre). Con objeto de ayudar a mapear clonas de DNA genómico hu mano, se desarrollaron métodos adicionales, entre ellos los si guientes: ► en riq u ecim ien to d e l DNA d e in icio. En lugar de usar DNA del genoma completo, se purificaron cromosomas individuales mediante cito m etría d e flu jo con los mismos principios em pleados para fraccionar células en un seleccionador celular FACS. Tras reunir suficientes números de un tipo particular de cromosoma, se crearon g e n o te ca s d e DNA esp ecífica s d e cr o m osom a (Davies y cois., 1981). Además, los procedimientos de m icro d isecció n cro m o sóm ica hicieron posible elaborar ge notecas de DNA a partir de DNA aislado de una región subcromosómica específica (Ludecke y cois., 1989). ► m a p eo d e célu la h íb rida . Después de secuenciar un tramo cor to al final de una clona genómica se diseñó una valoración de PCR para esta secuencia específica y a continuación se utilizó para tipificar un grupo de células híbridas ideadas para carecer de ciertos cromosomas o regiones subcromosómicas humanos (véase recuadro 8-4).

► u n ión g e n é tica a un fragmento de DNA colocado con anterio ridad en el mapa físico mediante una de las diversas técnicas de mapeo descritas.

Mapa físico dei genoma humano basado en cromosomas artificiales de levadura (YAC) Al inicio del Proyecto del Genoma Humano en 1990, las genote cas de DNA genómico disponibles contenían insertos hasta de 40 kb de largo (clonas cósmidas), que en la inmensa mayoría de los ca sos eran anónimos y no estaban mapeados en gran parte. Debido al tamaño muy grande del genoma humano, una genoteca cósmida, con un tamaño de inserto promedio de unos 40 kb, requeriría va rios cientos de miles de clonas diferentes a fin de asegurar una pro babilidad alta, que se aproximara al 100 %, de que el genoma se representara en la genoteca. Seleccionar estas genotecas complejas a fin de aislar clonas individuales y organizar estas últimas en grupos relacionados eran labores atemorizantes. Para reducir el problema de seleccionar números inmensos de clonas y facilitar su organización en grupos relacionados resultaban atractivos los sistemas de clonación que ofrecían insertos de tama ños muy grandes. Se desarrollaron métodos novedosos con la fina lidad de lograr este objetivo y se obtuvieron cromosomas eucariotas artificiales. El sistema cromosómico se basó en cromosomas de le vadura lineales en los que se sabía que sólo eran indispensables se cuencias muy pequeñas para la función del cromosoma. Mediante la purificación de estas secuencias y tras combinarlas a continua ción con fragmentos de DNA humano grandes fue posible hacer moléculas híbridas que contenían insertos humanos del tamaño de megabases, pero que se comportaban aún como cromosomas en

8.3

CÓMO SE MAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

215

Recuadro 8-4. Mapeo de células híbridas PRINCIPIOS BÁSICOS DE HÍBRIDOS DE CÉLULAS SOMÁTICAS Bajo ciertas condiciones experimentales es posible inducir la fusión entre sí de células cultivadas de diferentes especies, lo cual crea híbridos de células somáticas. Para propósitos de mapeo humano, las células híbri das se preparan de manera característica al fusionar células humanas con células de roedores (ratón o hámster). Los productos iniciales de la fusión se denominan heterocariones, porque las células contienen un nú cleo humano y otro de roedor. Por último, los heterocariones prosiguen hacia la mitosis y se disuelven las dos envolturas nucleares. Más adelan te se unen entre sí los cromosomas humanos y de roedor en un solo nú cleo. Estas células híbridas son inestables. Por razones desconocidas, la mayor parte de los cromosomas humanos no se replica en rondas sub secuentes de división celular y se pierde. Esto da lugar al final a una va riedad de líneas celulares híbridas más o menos estables, cada una de las cuales contiene un juego completo de cromosomas de roedor además de unos cuantos tipos de cromosomas humanos (véase la primera figura del recuadro). En esencia, los cromosomas humanos se pierden en forma aleatoria, pero pueden controlarse mediante selección. Es posible emplear grupos de células híbridas con diferentes subgrupos de cromosomas humanos para mapear un gen o una secuencia de DNA humano de un cromosoma humano específico. Sin embargo, es más efi ciente usar grupos de híbridos monocromosómicos (células que sólo contienen un tipo aislado de cromosoma humano), que representan en conjunto todos los 24 tipos de cromosomas humanos (Cuthbert y cois., 1995). Para formar un híbrido monocromosómíco se exponen células hu manas de donador a colcemida, lo que causa que se divida el juego de cromosomas en paquetes subnucleares menores (m icro núcleos). La centrifugación subsecuente puede precipitar la formación de m icrocélulas que consisten en un micronúcleo aislado con un anillo delgado de ci toplasma, rodeado por una membrana plasmática intacta. Se fusionan las microcélulas con células de roedor receptoras (fusión microcelular) a fin de generar híbridos, algunos de ellos con un cromosoma humano aisla do (véase, por ejemplo, Warburton y cois., 1990). HÍBRIDOS POR RADIACIÓN También es posible mapear un gen o una secuencia de DNA humano a una localización subcromosómica mediante grupos de híbridos por ra diación, células híbridas que contienen fragmentos de cromosomas hu manos integrados con un juego completo de cromosomas de roedor. Los fragmentos de cromosomas humanos se generan al someter las células del donador a una dosis letal de radiación que provoca roturas cromosómicas (el tamaño promedio del fragmento depende de la dosis de radia ción). Después de radiar las células del donador se fusionan con células del roedor receptor y se usa un sistema de selección para tomar las cé lulas del receptor que captaron algunos de los fragmentos cromosómicos del donador (véase Walter y cois., 1994). Con anterioridad se utilizaban grupos de híbridos por radiación mono cromosómicos en los que la linea celular donadora era un híbrido monocromosómico: en este caso se integrarían fragmentos del tipo aislado de cromosoma humano a fragmentos de los cromosomas de roedor rotos en el juego de cromosomas de roedor de la célula receptora (Cox y cois., 1990). Se superaron por grupos de híbridos por radiación del genoma completo en los que el donador es una célula diploíde humana normal radiada (Walter y cois., 1994). En cualquier híbrido, sólo se integra una pro porción de las piezas de los cromosomas humanos rotos y, por consiguien te, los diferentes híbridos poseen distintas fracciones del genoma humano integrado en el juego de cromosomas del roedor receptor. Un mapa híbrido por radiación (HR) puede elaborarse al tipificar un gru po de híbridos con un juego de marcadores de DNA humano. Debido a que los híbridos individuales tienen diferentes subgrupos del genoma hu mano pero superpuestos, se encuentran los distintos marcadores en

C é lu la h u m a n a

C é lu la d e rató n o h á m s te r

P é rd id a a le a to ria d e c ro m o s o m a s h u m an o s S ó lo u n o s c u a n to s c ro m o s o m a s hum anos

J u e g o c o m p le to d e c ro m o s o m a s d e ro e d o r

H íb rid o d e c é lu la s o m á tic a e s ta b le

P rin cip io de híbridos de células som áticas. algunos híbridos aunque no en otros. Aunque el patrón de integración de los fragmentos es sobre todo aleatorio, marcadores individuales propor cionan patrones de tipificación relacionados si se localizan com o vecinos cercanos en un cromosoma particular. El principio de un mapa híbrido por radiación recuerda el análisis de enlace meiótico (cap. 13): cuanto más cerca se encuentren entre si dos secuencias de DNA en un crom o soma, más baja es la probabilidad de que se separen por la ocurrencia al azar de un punto de rotura entre ellas. La frecuencia de rotura cromosómica entre dos marcadores puede definirse por un valor o, análogo a la frecuencia de recombinación en el mapeo meiótico. El valor o varía de ce ro (los dos marcadores nunca se separan) a 1.0 (los dos marcadores siempre se separan). Al igual que en el mapeo meiótico, theta subestima la distancia entre mar cadores que están muy apartados en el mismo cromosoma, en este ca so debido a que la célula puede captar dos marcadores en fragmentos separados. Una estimación más precisa la proporciona una función de mapeo de HR, D = — ln(1 —o), que es análogo a la función de mapeo Haldane que se utiliza en el análisis de enlace meiótico (sección 13.1). D se mide en centiRays (cR) y depende de la dosis de radiación, de tal manera que se contrasta contra el número de rads. Por ejemplo, una dis tancia de 1 cRgooo entre dos marcadores representa una frecuencia de 1 % de rotura entre ellos después de exponerse a 8 000 rads de rayos X. En el Proyecto del Genoma Humano son en particular im portantes dos grupos de híbridos por radiación. El grupo Genebridge 4 consiste en 93 híbridos por radiación ser hum ano-criceto con un tamaño promedio del fragmento humano de 25 Mb y 32% de retención de cualquier secuen cia humana particular en cada híbrido. Los laboratorios pueden mapear

216

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Recuadro 8-4. (con tinuació n) cualquier STS desconocido al calificar los híbridos 93 Genebridge y com parar el patrón con los patrones de marcadores mapeados antes, que se conservan en un servidor central (figura, parte inferior). Un se gundo grupo ser humano-criceto, el Grupo Stanford G3, se llevó a ca bo tras utilizar una dosis de radiación más alta, de tal manera que el tamaño promedio del fragmento humano fue más pequeño. Los 83 hí

bridos en G3 tienen un promedio de 16% de retención del genoma hu mano, con un tamaño promedio del fragmento de 2.4 Mb. Por consi guiente, puede utilizarse G3 para un mapeo más fino. Es posible tener acceso a los impresionantes resultados del uso a gran escala de estos grupos en http:w w w.ncbi.nlm .nih.gov/genem ap98/ (Deloukas y cois., 1998).

Fusionar con células TK hám ster

Dosis letal de Fibroblastos humanos normales

radiación

^

Células con cromosomas fragm entados

w

de

C élulas híbridas (TK+)

Mapeo de HR en laboratorio periférico

S TS por m apear S eleccionar 100 a 200 híbridos diferentes (cada uno conserva 25 a 3 0 % del g enom a hum ano en fragm entos pequeños) C rom osom as de ratón que contienen fragm entos d e D N A hum ano integrados (■)

PCR am plifica STS en cada híbrido

Igualar patrón

H ibridar con STS m apeados conocidos

Base de datos sobre servidor central

Localización

Mapeo de híbrido por radiación.

células de levadura, los llamados cromosomas artificiales de leva dura (YAC; véase la sección 5.4.4 para más detalles). Las genotecas de YAC con un tamaño promedio de inserto, por ejemplo de 1 Mb, requerirían cerca de 12 000 a 15 000 clonas sólo para ser razonablemente representativas del genoma humano y ten drían la ventaja de permitir incluir en una clona aislada genes gran des (aunados a grupos de genes u otros segmentos funcionales). Con base en este razonamiento, Daniel Cohén y colaboradores del laboratorio CEPH de París elaboraron un mapa del genoma huma no basado en YAC, el primer mapa físico de alta resolución más o menos detallado (Cohén y cois., 1993). De manera subsecuente, el mismo grupo publicó un mapa de YAC actualizado que incluía tal vez 75% del genoma humano y consistía en 225 contiguos con un tamaño promedio de 10 Mb (Chumakov y cois., 1995). El principio subyacente en los mapas de YAC (y todos los otros mapas físicos basados en clonas), es ordenar las clonas en la genote ca a partir de la región subcromosómica de origen para los insertos de DNA. El mapa se construye al definir grupos de clonas en las

que el inserto de DNA deriva de una región subcromosómica común y en los que el inserto de DNA de cualquier clona se superpone en el inserto de DNA de algunas otras clonas en el grupo de clonas. Esto significa que la región subcromosómica relevante está repre sentada por una disposición lineal de clonas superpuestas en parte sin dejar ningún intersticio. Este grupo contiguo de secuencias de DNA clonadas se denomina contiguo de clona (véase recuadro 8-5).

Mapa del sitio de secuencia marcado (STS) del genoma humano de alta resolución La precisión de los mapas de contiguo de clona depende en esencia del grado al cual el DNA de la clona insertado representa en reali dad la secuencia genómica original. A pesar de que el mapa de YAC humano fue un logro impresionante, hubo áreas considerables del genoma no representadas en el mapa y una limitación inherente notable: muchas veces los DNA insertados no eran representacio nes fieles del DNA genómico. Los insertos grandes de YAC son

8.3

i

CÓMO SE MAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

propensos a reordenamientos (que incluyen pérdida de secuencias internas) y se observó un problema de consideración con el q u im erism o (en el que una célula aislada transformada contenía dos o más piezas de DNA humano de porciones no contiguas del geno ma, a menudo de diferentes cromosomas, como resultado de coli gadura o cotransformación; véase respectivamente figs. 5-5A y 5-5B). Para prevenir posibles problemas consecutivos a la falta de fidelidad de insertos de la clona, las medidas de mapeo físico del PGH insistie ron, asimismo, en la necesidad de elaborar mapas basados en sitios de secuencia marcados (STS; véase recuadro 5-4). Con una densidad su ficientemente alta de STS notables podía evitarse el problema de la inestabilidad del inserto en genotecas de YAC: un gran número de STS significaría que la cobertura física de cualquier región problema podría restablecerse con rapidez al tipificar STS de otros tipos de clonas (BAC, Pl, PAC, etc.). Con base en este razonamiento, Eric Lander y colabo radores del Whitehead Institute of Biomedical Research and Massachusetts Institute of Technology publicaron el logro sobresaliente de un mapa de STS humano con más de 15 000 STS y un espaciamiento promedio de menos de 200 kb (Hudson y cois., 1995). El mapa de STS humano fue un mapa físico integrado en el cual los STS se utilizaron para tipificar: a) un grupo de célu las híbridas p o r ra diación humanas (véase recuadro 8-4); y b) la genoteca CEPH YAC. Los marcadores de los STS fueron de dos tipos, no polimórficos y polimórficos. Los marcadores STS no polimórficos incluyeron STS derivados mediante la secuenciación aleatoria de clonas genómicas y a continuación se elaboraron cebadores de PCR de regiones no repetidas y STS seleccionados de secuencias de cDNA (con cebadores correspondientes a secuencias no separadas por un intrón), los llama dos m arcadores d e secu en cia expresados o EST (véase sección 8.3.4). Los marcadores de STS polimórficos consistieron en esencia en marcadores microsatélites, a la mayoría de los cuales los había utiliza do el grupo Généthon en el mapeo genético humano. El mapa de STS publicado por Hudson y colaboradores (1995) proporcionó un esquema físico extenso del genoma humano y, de bido a que incluía más de 2 400 EST, suministró asimismo un ma pa génico humano embrionario. En adelante, el enfoque del proyecto del genoma humano sigue dos direcciones: creación de mapas génicos (transcritos) de alta resolución y uso del mapa de STS existente a fin de proporcionar una estructura para construir contiguos de clonas mediante clonas de cromosomas artificiales bacterianos (BAC).

8.3.3 La etapa final del Proyecto del Genoma Humano dependió en vital medida de los contiguos de clonas BAC/PAC Métodos de secuenciación Debido a que los insertos de YAC no son con frecuencia represen taciones fidedignas del DNA de inicio original, se requerían mapas de contiguos de clonas del genoma humano de segunda generación con objeto de suministrar el DNA humano clonado a secuenciar. Se seleccionaron cromosomas artificiales BAC y P l (PAC) como sistemas de clonación porque si bien el tamaño de sus insertos (100 a 250 kb) es mucho más pequeño que los de YAC, esta desventaja es más que superada por la mayor fidelidad del inserto (véase sec ción 5.4.3). Por consiguiente, podría utilizarse como plantilla físi ca para secuenciación una variedad de diferentes BAC humanos y en menor grado genotecas de cromosomas artificiales Pl (PAC). El método de secuenciación que se usó en el Proyecto del Ge noma Humano consolidado se basó en secuenciación en escopeta

217

zo jerárquica (en contraste, Celera empleó una medida de secuen ciación en escopetazo del genom a completo; véase fig. 8-3). Secuen ciación en escopetazo significa que se corta de manera aleatoria un DNA de inicio en fragmentos pequeños, de modo característico mediante sonicación seguida de reparación del extremo y los frag mentos resultantes se clonan en un vector a partir del cual es posi ble preparar DNA recombinante de cadena única con facilidad y usarse de forma directa en la secuenciación (véase recuadro 7-1). En el método de secuenciación en escopetazo jerárquica, el DNA uti lizado para secuenciación en escopetazo son los insertos purificados de clonas de BAC individuales que se colocaron con precisión en un mapa físico; en contraste, la secuenciación en escopetazo del genoma completo comprende la secuenciación en escopetazo de manera di recta del DNA genómico aislado (fig. 8-3). La base de la metodología de secuenciación usada en la secuen ciación del genoma humano fue el método de dideoxisecuenciación que desarrollaron hace un cuarto de siglo Fred Sanger y colaboradores. Aunque no había cambiado el método subyacente, se introdujeron varios adelantos en la eficiencia al automatizar va rios aspectos de la generación de secuencias y el análisis de datos. El desarrollo de secuenciadores de DNA automatizados basados en marcado fluorescente y después secuenciadores capilares (véase sec ción 7.1.2) permitió rendimientos de secuenciación mucho más al tos. Varios programas de computadora especiales ayudaron a la interpretación y ensamble de secuencias, en especial el PHRED (que analiza trazos de secuencias crudas y proporciona una califica ción de calidad en cada posición de base a fin de indicar con un gra do de confianza que la llamada base asignada es correcta) y el PHRAP (que ensambla secuencias crudas en contiguos de secuen cias tras seleccionar secuencias superpuestas compartidas por dos o más clonas independientes en escopetazo).

El problema con el DNA repetido El ensamble de secuencias de clonas individuales para identificar superposiciones (y por consiguiente reconstruir la secuencia del genoma) depende de modo decisivo de una suposición importan te: las secuencias superpuestas están representadas de form a singular dentro del genoma. Sin embargo, una fracción muy grande (cerca de 50%) del genoma humano se integra con DNA repetido (sec ciones 9.4 y 9.5). Se conocían bien clases de DNA entremezcladas muy repetidas, por ejemplo las repeticiones LINE-1 y Alu y, en consecuencia, se evitaron siempre que fue posible cuando se bus caban pruebas de superposiciones importantes entre las secuencias de clonas. A pesar de las precauciones anteriores, resultarían problemáticas áreas muy ricas en secuencias repetidas conocidas, en tanto que otra preocupación era la de repeticiones de números de copias bajas no iden tificadas con anterioridad (una preocupación muy real ya que de ma nera subsecuente se encontró que una fracción valorable del genoma había sufrido duplicación segmentaria, con secuencias que abarcaban decenas de kilobases y en ocasiones cientos de kilobases presentes en dos o más regiones del genoma; véase sección 12.2.5). Cuando me nos en el PGH, el método de clonación en escopetazo jerárquica fa cilitó el ensamble de secuencias, en tanto que el de clonación en escopetazo del genoma completo utilizado por la compañía privada Celera implicaba grandes demandas en potencia de computación y los críticos argumentaron que si se empleaba en el aislamiento esta me dida, estaba condenada a fracasar por la complejidad y el alto conte nido de repeticiones en el genoma humano (véase recuadro 8 -6 ).

218

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Recuadro 8-5. Mapeo físico mediante formación de contiguos de clonas La elaboración de genotecas de DNA genómico incluye una digestión de restricción parcial del DNA por clonar controlada de manera cuidadosa. De forma característica, la enzima que se emplea para producir fragmen tos de restricción del DNA de inicio es Mbo\ que identifica una secuencia de reconocimiento de 4 pb (IGATC) y cabría esperar que, en promedio, cortara el DNA una vez cada 300 pb. En lugar de exponer el DNA de ini cio a concentraciones muy bajas de la enzima y por períodos cortos, só lo se corta un número muy pequeño del total de sitios de restricción disponibles. Por ejemplo, cuando se preparan genotecas de BAC, el ta maño del fragmento de clonación deseado tiene alrededor de 200 kb y a fin de lograrlo deben cortarse menos de 1% de los sitios Mbo\ disponi bles para corte.

tados por millones de copias idénticas del par original de moléculas de DNA cromosómico. Sin embargo, cuando se someten a digestión por restricción parcial, se cortan de manera aleatoria las moléculas de DNA. En consecuencia, para cualquier región subcrom osómica determinada, el millón de moléculas importantes revela diferentes patrones de corte de sitio de restricción (véase figura, parte superior). Como resultado de la digestión por restricción parcial, se generan frag mentos diferentes que poseen secuencias superpuestas derivadas de la misma región subcromosómica. Aunque los fragmentos individuales se clonan en diferentes células huésped, es posible identificar clonas con in sertos superpuestos al seleccionar similitudes entre los insertos de distin tas clonas y definir al final un juego de clonas con insertos superpuestos de tal manera que está representada toda la secuencia original de DNA en la región cromosómica, sin vacíos, dentro de los insertos de este grupo de clonas, un llamado contiguo de clona (véase figura, parte media).

El DNA de inicio se consigue de millones de células diploides y por lo tan to cada uno de los 23 tipos originales de molécula de DNA humano (que corresponden a los 23 tipos diferentes de cromosomas) están represen

DNA de inicio: una población de m oléculas de DNA

1

C orte parcial (aquí = una vez cada 15 sitios en promedio)

Fragm entos su p erp u e sto s ---------» Clona en diferentes células Dibujo superior. Generación de fragmentos de DNA superpuestos mediante corte de restricción parcial.

Dibujo en medio. Un contiguo de clona (una serie de clonas con insertos de DNA superpuestos de modo parcial).

TG F a

MAD

327

AN X IV

2115

2113

291

21 1

2109

2112

145

EGR ACTA3 2116 2114

90 H10

HKZ

286

967b10■ 432a12

-( )----- ( h 973c8 -

682g6 -

-< h 772h3 -

-< )----- ( h

792f4 850q4 — • -

—------ ( h -i )----- ( h

747f5 — * 941 g 2 — • 7 6 3 h 1 0 — • ---------( ) -

-i h -i h

D ibujoinferior. Ejemplo de un contiguo de STS eneilcrom osom a2. Los marcadores en la parte superior incluyen STS de genes (TGFa, MAD, etc.) y asimismo marcadores anónimos (D2S327, D2S2115, etc., que se abre vian aquí al eliminar el prefijo D2S). Las clonas son de YAC y los paréntesis indican ausencia de STS esperado, con mayor probabilidad com o resulta do de reordenamientos internos del cromosoma artificial de levadura (YAC).

8.3

••• • ;. - w

• ' -

•

CÓMO SE MAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

' C- • ' . Í Í W ’ ;

í,

y, ' • 1

-- '•

• •-- - ' '

219

'•

Recuadro 8 5. (c o n tin u a c ió n ) Las clonas con insertos superpuestos pueden identificarse en diferentes formas. En el caso del mapa de YAC humano (sección 8.3.2) se recono cieron las clonas superpuestas mediante hibridación clona con clona (con una sonda formada a partir de un YAC para hibridar opuesta a las otras clonas YAC) o una huella digital de clona (tras comparar clonas para observar si comparten patrones característicos de espaciamiento de secuencias repetidas o sitios de restricción particulares). En fecha más

A)

reciente, el método preferido ha sido el mapeo del contenido de STS. como se demostró en el mapa STS publicado por Hudson y colaborado res (1995). En este caso, todas las clonas se tipifican para la presencia de cada uno de un grupo de marcadores de sitio de secuencia marca do y a continuación se segregan en grupos, sea que las clonas conten gan dos o más marcadores de STS específicos en común (véase figura, dibujo inferior).

Escopetazo jerárquico

B)

Escopetazo de genoma completo

G enom a

C o n tig u o d e clo n a s d e in s erto g ra n d e

F ra g m e n ta c ió n a le a to ria

S e c u e n c ia c ió n y e n s a m b le

Y

T

1

A n c la je

E n s a m b le d e l g e n o m a

Fig. 8-3. Diferentes medidas de secuenciación en escopetazo para secuenciar el genoma humano. A) Secuenciación en escopetazo jerárquica. Se fragmenta el DNA genómico humano mediante digestión por restricción parcial y los fragmentos de restricción grandes resultantes se clonan en vectores BAC a fin de generar una genoteca de clonas de cromosomas artificiales bacterianos (BAC). Las clonas de BAC se organizan en contiguos grandes tras tipificar todas las clonas mediante marcadores STS a fin de identificar clonas con insertos super puestos. Los insertos de clonas de BAC seleccionados se clonan y secuencian en escopetazo. Los fragmentos secuenciados de un BAC se ensamblan a continuación para dar la secuencia de BAC y se integran secuencias completas de BAC con objeto de eliminar superposiciones. B) Secuenciación en escopetazo del genoma completo. En este caso, se envía de modo directo DNA genómico aislado para clonación y secuenciación en escopetazo y las piezas secuenciadas se ensamblan en contiguos grandes que abarcan megabases. Adaptado de Waterston y cois., Proc. Nati. Acad. Sci. USA 2002; 99, p. 3713, con autorización de la National Academy of Sciences, USA.

8.3.4 Los primeros mapas de genes humanos de alta densidad se basaron en marcadores de secuencias expresados (EST) Al inicio del PGH se discutió con amplitud la decisión de abarcar la totalidad (secuenciación de tres mil millones de bases) o enfocar se primero en una fracción muy pequeña que representaba la se cuencia del DNA de codificación, que era con mucho la parte más interesante y de relevancia médica. Quienes apoyaron la secuencia ción del genoma completo predominaron al final en la discusión y resaltaron que podría ser difícil encontrar todos los genes (algunos genes pueden tener una expresión muy restringida) y que cierto DNA no codificante posee importancia funcional, por ejemplo en el caso de elementos reguladores y secuencias esenciales para la fun

ción cromosómica. No obstante, en los años iniciales del proyecto, los intereses comerciales competidores tornaron una prioridad el hallazgo de genes. Un método inicial incluyó la secuenciación a gran escala de secuencias cortas en las regiones no traducidas 3' (RNT) de clo nas de cDNA que se habían seleccionado de modo aleatorio de una diversidad de genotecas de cDNA humano (Adams y cois., 1991). Estas secuencias cortas se describieron como marcadores de secuencia expresados (EST) porque, al igual que para los si tio s d e secu en cia m a rca d o s más generales, la secuencia permitía diseñar una valoración específica de PCR para la secuencia expre sada (las secuencias genómicas que especifican secuencias de RNT 3' están separadas de manera menos común por intrones que el DNA codificante y en consecuencia los cebadores de PCR de un

220

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Recuadro 8 - 6 . Cooperación, com petencia y controversia en proyectos del genoma Cooperación y competencia en proyectos de genomas patrocinados de forma pública Debido a su escala, los proyectos de genomas son empresas mayores. En muchos casos hubo loables intentos de cooperación: com partir recur sos entre diferentes centros y laboratorios, subdivisión acordada de dife rentes labores del proyecto, etc. El proyecto del genoma de la levadura fue un excelente ejemplo que incluyó la cooperación muy organizada en tre distintos centros europeos que se extendió de forma subsecuente a la cooperación en el análisis funcional. En otros casos suelen ser obvias las tensiones com o resultado de la feroz competencia entre diferentes labo ratorios y la duplicación desperdiciada de esfuerzo, por ejemplo en el pro yecto del genoma de E. coli. En este caso se desarrolló una carrera de competencia entre estadounidenses y japoneses que condujo a un final muy cerrado: el laboratorio estadounidense depositó su secuencia en el GenBank una semana antes que el grupo japonés. Tensiones entre los sectores público y privado: patentes génicas Las diferentes prioridades de los sectores público y privado provocaron puntos de tensión en los proyectos del genoma. Un área inicial de dispu ta se relacionó con las patentes génicas. El primer problema se presen tó en 1991, cuando el U.S. NIH solicitó las patentes de más de 7 000 fragmentos de clonas de cDNA del cerebro humano, cuyas secuencias se habían establecido como parte de un ejercicio de mapeo de EST condu cido por Craig Venter. Este intento se encontró con la amplia oposición de la comunidad-científica, en especial porque no se sabía nada sobre las funciones de las secuencias expresadas. Bajo presión, la oficina estadou nidense de patentes rechazó las solicitudes. Surgió por primera vez una nueva pregunta importante: ¿guién es el propietario del genoma huma no? (véase Thomas y cois., 1996). Así, a muchas personas la idea del monopolio comercial de lo que es tan sólo la herencia genética del hom bre les pareció alarmante y ofensiva. Con posterioridad, Venter dejó los NIH para establecer un nuevo institu to con respaldo comercial, el Institute of Genome Research, adoptó una conducta fabril para la secuenciación de EST y reunió en poco tiempo el m ayor banco de datos sobre genes humanos del mundo. En abril de 1994 la compañía farmacéutica SmithKIine Beecham invirtió 80 millones de libras esterlinas para un interés exclusivo en la base de datos de Ven ter y anunció a los científicos que sólo podrían tener acceso a él si acep taban conceder los primeros derechos a cualquier descubrimiento patentable. Una vez más, la posibilidad de una corporación que intenta ba monopolizar el control de una gran parte del genoma humano expre sado alarmó a la comunidad científica. Muchos pensaron que podría solicitarse la patente después de identificar la función de un gen, pero no antes. Se otorgaron miles de patentes por secuencias de DNA humano en las que la secuencia se vinculó con alguna característica funcional

EST de una RNT 3’ amplifican con frecuencia la secuencia espe cífica en una muestra de DNA genóm icó). Más adelante se extendió la secuenciación a los extremos 5' de clonas de cDNA y por último se obtuvieron secuencias de los extremos de cientos de miles de clo nas de cDNA humanas. Después de obtener un gran número de EST humanos (por grupos de investigación privados y patrocinados con medios públi cos), la labor siguiente fue comenzar a colocarlos en mapas físicos del genoma humano. Esto incluyó la tipificación de contiguos de YAC para la presencia de EST individuales o la selección de grupos de h íb rid o s p o r ra d ia ció n de ser humano-criceto (véase sección 8.3.2 y asimismo recuadro 8-4 para la descripción del principio de híbridos por radiación). Con anterioridad se había obtenido me-

(véase Thomas y cois., 1996), pero en octubre de 1998 la oficina esta dounidense de patentes concedió la primera patente para una secuen cia de EST (a Incyte Pharmaceuticals). Como lo describió Knoppers (1999), el problema de la patentabllídad del genoma humano aún es un problema. Tensiones entre los sectores público y privado: secuenciación del genoma También existen controversias acerca de la secuenciación del genoma patrocinado en form a privada. Los esfuerzos de secuenciación del geno ma humano y de ratón por Celera se establecieron en una competencia intensa con los proyectos patrocinados de forma pública fundados mu cho antes. De manera audaz, Celera afirmó en 1999 que su técnica de escopetazo del genoma completo (véase texto y fig. 8-3) podría produ cir un bosquejo de la secuencia del genoma humano en dos años, lo cual superaba la medida más lenta de mapeo y secuenciación clona por clo na del PGH patrocinado con recursos públicos. Asi, se publicaron de modo simultáneo los informes del PGH y Celera y ello anunció el logro de esquemas de secuencias del genoma humano (International Human Genome Sequencíng Consortium, 2001; Venter y cois., 2001). Sin embargo, nunca fue una carrera igual, porque en todas las etapas Celera declinó poner a disponibilidad con facilidad y libertad sus datos (se negó el acceso externo a su inform ación e incluso cuan do se terminaron exigió elevados cargos por suscripción y los datos no dejaron de ser restringidos). En sorprendente contraste, los laboratorios patrocinados de form a pública se habían comprometido a poner a dis posición de inmediato y ampliamente la nueva inform ación sobre se cuencias (con actualizaciones cada 24 horas en internet). Al igual que cualquiera otro, Celera tuvo acceso continuo y libre a los da tos de secuenciación del DNA que provenían del PGH público y, de mane ra desvergonzada, capturó bloques muy considerables de los datos de secuencia del genoma humano disponibles, los reprocesó y alimentó los datos resultantes en su recopilación personal. Como resultado, el esfuer zo de secuenciación de Celera parasltó en extensa medida los datos públi cos generados. Sí se toma en cuenta que la técnica de Celera se basaba en el método de escopetazo del genoma completo más difícil, se suscitó un enorme escepticismo en cuanto a que la secuencia del genoma huma no publicada por Venter y colegas (2001) fuera en alguna forma una vin dicación de la técnica de escopetazo del genoma completo. En cambio, Waterston y colaboradores (2002) proporcionaron datos que indicaban que la secuencia de Celera publicada por Venter y colegas (2001) no era una secuencia independíente del genoma humano en lo absoluto (ya que gran parte de los datos sobre secuencia de Celera resultó de la captura y reempacamiento de grandes cantidades de la secuencia del proyecto del genoma humano [PGH]).

diante estudios de hibridación una distribución cromosomica ge neral de los genes humanos (fig. 8-4), pero la colocación de un gran número de EST en mapas físicos fue el primer método sistemático para construir un mapa gènico humano. El dato del mapeo se integró en relación con el mapa genético humano y luego se cruzó para referencia con mapas de bandas citogenéticas de los cromosomas. Con el fin de definir un grupo d e genes no redundante, se intentó integrar información del ma peo en los diferentes EST, como en el caso del sistema UniGen (http://www.ncbi.nlm.nih.gov/UniGene/). Schuler y colaboradores (1996) y Deloukas y colegas (1998) editaron los primeros mapas de genes humanos razonablemente amplios. En el último caso se pu blicaron posiciones en el mapa de lo que se estimaba (de manera in-

8.3

CÓMO SE iMAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

221

correcta) que eran 30 000 genes humanos y en esa época se pensa ba que representaban un poco menos de la mitad del total del catá logo de genes humanos. Sin embargo, la secuenciación del genoma humano proporcionó una sorpresa inesperada (véase sección si guiente).

8.3.5 El esquema de la secuencia del genoma humano sugirió 30 000 a 35 000 genes humanos, pero es difícil estimar un total preciso Antes de secuenciarse el genoma humano, las predicciones sobre el número total de genes humanos (basadas en extrapolaciones de una diversidad de grupos de datos limitados) oscilaban entre 60 000 y 100 000 genes. Después de publicarse en el año 2001 los esquemas de secuencias, la estimación revisada arrojó una cifra sorprendente por baja, tal vez sólo cercana a 30 000 a 35 000 genes. Con apenas 50% más genes que C. elegans, un gusano largo de 1 mm que sólo tiene 959 células somáticas, se había infligido otro golpe al orgullo humano, tal vez incluso más contundente que la p a r a d o ja d e l va lo r Cestablecida desde hacía mucho tiempo (el contenido de DNA celular no siempre se relaciona con la complejidad funcional; algu nos tipos de amebas tienen en notable proporción más DNA por célula que el hombre; véase cuadro 3-1).

6

7

8

13

14

15

19

20

9

21

10

11

12

16

17

18

22

Dificultades en el establecimiento del número preciso de genes humanos Aun en el año 2003, después de secuenciar en esencia todo el ge noma humano, todavía no se conocía con seguridad el número de genes del hombre, aunque las estimaciones más recientes (Ensembl build 29) sugieren un total cercano a 30 000 o tal vez incluso me nor de esa cifra (véase las comparaciones de ser humano-ratón en el artículo del M ouse Genome Sequencing Consortium, 2002). Con objeto de comprender la dificultad para estimar el número preci so de genes, es instructivo considerar cómo se definen los genes. Tal y como se detalla en la sección 7.2, sólo existen dos criterios específicos de genes esenciales: transcripción a RNA y prueba de secuencias conservadas durante la evolución. Sin embargo, identi ficar por medios experimentales todos los genes con base en cual quiera de estos criterios es muy difícil a nivel práctico por las siguientes razones: ► aunque muchas veces la investigación de secuencias de transcri tos relacionados suele ser compensadora (Camargo y cois., 2002), es posible que en las genotecas de cDNA disponibles no se interpreten bien los genes que se expresan en valores muy bajos, que tienen localizaciones celulares y etapas de desarrollo infrecuentes, o ambas cosas; ► puede ser difícil identificar los genes que codifican RNA no traducidos cuando no existe un marco de lectura abierto valorable. Como resultado de lo anterior, a menudo se pasan por alto genes si se utilizan sólo métodos experimentales; así, cuando se publicó el esquema de las secuencias del genoma humano había un apoyo ex perimental tal vez para sólo 11 000 genes; los otros se predijeron mediante computadoras (a n á lisis in silico). Los programas basa dos en computadoras usados para identificar genes (Zhang, 2002) comparan una secuencia de prueba con otras secuencias génicas co nocidas (selección de homología) e intentan identificar exones (programas de predicción de exón):

Fig. 8-4. Mapa inicial de la distribución de genes humanos de la totalidad del genoma. Casi todos los genes humanos se vinculan con islotes CpG (véase re cuadro 9-3). Se marcó una fracción de un islote CpG humano purifica do con un colorante rojo Texas y se híbrido en cromosomas humanos en metafase (Craig y Bickmore, 1994). Las reglones cromosómicas de replicación tardía (en especial inactivas en sentido transcripcional) se muestran en verde (como resultado de la incorporación de bromodesoxiurldina [BrdU] marcada con isotocianato de fluoresceina). Las regio nes amarillas (superposición de señales roja y verde) indican regiones de replicación tardía abundantes en genes (o, estrictamente, islotes CpG). Las reglones del genoma de replicación temprana con pocos ge nes son invisibles (ya que no se contratiñen), al igual que ios centrómeros (en los que no tiene acceso el anti-BrdU). En ciertos cromosomas (p. ej., cromosoma 22) se encuentra una cantidad génica abundante (que se muestra con el color rojo de la fracción del islote CpG marcada), en tanto que otros (p. ej., cromosomas 4 ,1 8 , X, Y) tie nen muy pocos genes. Adaptado de Craig y Bickmore, Nature Genet. 1994;7:376-381, fig. 1, con autorización de Nature Publishing Group.

► in vestigación d e h om ología con tra bases d e d atos d e secu en cia. Para cualquier secuencia de prueba puede compararse la compatibilidad de la secuencia de nucleótidos con todas las se cuencias de nucleótidos en bases de datos disponibles y tal vez pueden equipararse secuencias de polipéptidos traducidas contra todas las secuencias de proteínas conocidas (véase cuadro 8-2 y recuadro 7-3). A medida que se añaden más y más secuencias a las bases de datos de secuencias, se constituyen en un medio en particular eficaz para identificar secuencias que se conservaron durante la evolución, lo que representa una indicación de man tenimiento de la función;

222

CAPÍTULO OCHO ! PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Cuadro 8-2. Principales bases de datos electrónicas que sirven como depósitos de secuencias de nucleótidos o proteínas. Tipo de base de datos

Base de datos Localización

SECUENCIA DE NUCLEÓTIDOS

GenBank

Conservada por el U.S. National Center for Biotechnology Information (NCBI) en U.S. National Institutes of Health (NIH)

http://www.ncbi.nlm.nih.gov

EMBL

Conservada por el European Bioinformatics Institute (EBI) en Hlnxton, cerca de Cambridge, Reino Unido

http://www.ebi.ac.uk

DDBJ

Conservada por el National Institute of Genetics, Japón, en Mishima, Shizouka

http://www.ddbj.nig.ac.jp/

SWISSPROT

Secuencias de proteínas con anotación de alta calidad. Conservada en colaboración conjunta en el Swiss Institute of Bioinformatics, Ginebra, y el European Bioinformatics Institute (EBI), Hinxton, Reino Unidos

http://ca.expasy.org/sprot/ http://www.ebi.ac.uk/swissprot/

TREMBL

Traducciones de secuencias de codificación de la base de datos EMBL no depositadas aún en Swiss-Prot

http://www.ebi.ac.uk/trembl/ http://ca.expasy.org/sprot/

PIR

Conservada en colaboración conjunta por U.S. National Bio medical Research Foundation (NBRF), Georgetown; Japan International Protein Information Database, en Japón (JlPID); y Munich Information Center for Protein Sequences (MIPS). Disponible en muchos sitios a nivel mundial.

http://pir.georgetown.edu/ http://www.ddbj.nig.ac.jp/ http://mips.gsf.de/ http://www.hgm p.m rc.ac.uk/

SECUENCIA DE PROTEÍNAS

► p rogra m a s d e p r ed icció n d e exón. En algunos programas sólo se emplea información sobre la secuencia informada, como el difundido programa GENSCAN (véase Burge y Karlin, 1997). Otros usan como referencia la selección basada en homología conservadora. Sin embargo, hasta la fecha incluso el mejor de estos programas, como GENSCAN, sólo ha resultado modera damente satisfactorio para reconocer exones cuando se compa ra con genes cuyas organizaciones exónicas estaban establecidas con anterioridad. Las comparaciones cruzadas por especies su ministraron otro medio importante para identificar exones, ya que a diferencia de la mayor parte de las secuencias del genoma, los exones tienden a conservarse bien durante la evolución (véa se p. ej., Batzoglou y cois., 2000); ► progra m a s d e com p u ta dora in tegrados p a ra en co n tra r genes. Se han diseñado varios programas de computadora que usan ba ses de datos basados en homología de secuencia general junto con programas ideados para identificar elementos y exones relaciona dos con genes. Por lo general se producen en la forma de gráficas. Los programas comunes son N1X (http://www.hgmp.mrc.ac.uk/ Registered/Webapp/nix/; véase fig. 8-6 para el rendimiento de este programa) y G enotator (véase http://www.fruitfly.org/"nomi/ genotator/genotator-paper.html). A pesar del valor de las predicciones de genes y exones basadas en computadora, aún existen problemas en la estimación del número de genes humanos, que incluyen predicciones mayores y menores. Por ejemplo, puede ocurrir una predicción mayor cuando grupos de genes al parecer separados son en verdad diferentes partes de un so lo gen muy grande, o efecto de artefactos de cDNA (por la forma en que se elaboran las genotecas de cDNA, algunos cDNA no empal mados en apariencia son artefactos consecutivos al cebamiento de cadenas complementarias por vías oligo(dA) en DNA genómico). La predicción m enor suele ocurrir por la dificultad para encontrar ge nes con exones muy pequeños y expresión restringida y hallar y con firmar genes que codifican RNA no traducido.

URL

8.3.6 Etapas finales del Proyecto del Genoma Humano: anotación de genes y ontología génica A medida que la secuenciación del genoma humano llegaba a la fase fi nal, se dedicaron grandes esfuerzos al desarrollo de nuevos programas de computadora que permitieran buscar información en las cantidades enormes del genoma humano en una forma sistemática y fácil de uti lizar. El diseño inteligente de buscadores de genoma como E nsem bl (desarrollado en colaboración entre el Wellcome Trust Sanger Institute y el European Bioinformatics Institute) proporciona interfáses gráficas para seleccionar información del genoma de cromosomas individuales y regiones subcromosómicas. Quienes lo usan pueden na vegar con rapidez en la secuencia de un cromosoma humano seleccio nado, pasar de una gran escala a la escala de nucleótidos e identificar genes y exones, RNA y proteínas vinculadas. Un elemento central de la navegación son las herramientas de cambios (click-over) que hacen posible una miríada de conexiones con otras bases de datos y progra mas (incluidos los enlaces directos a otras secuencias del genoma en sambladas, en especial el genoma de ratón) y que permite a quienes lo emplean avanzar a través de una información solicitada (véase http://www.ensembl.org/ y fig. 8-5). Conforme se desarrolla cada vez más información sobre genes y otras unidades funcionales, se dispone de una anotación génica más informativa y precisa, en actualizacio nes frecuentes y periódicas de los buscadores generales del genoma. Otro adelanto importante es la ontología génica, en la que se de sarrollan vocabularios sistemáticos y jerárquicos a fin de definir la fun ción de los genes. El Gene Ontology (GO) Consortium incluyó la colaboración entre investigaciones que estudian genomas humanos y otros para desarrollar un sistema común de definición de la función génica que pueda aplicarse a todos los organismos (Gene Ontology Consortium, 2000, 2001; véase asimismo http://www.geneontology. org/). El uso de un vocabulario común posibilitará investigar a través de múltiples proteínas y especies para características comunes. El Ge ne Ontology Consortium desarrolló tres ontologías separadas -proceso biológico, com ponente celular y fu n ción molecular—para describir los

8.3

CronsoM 3

i l,.,i

..1 .

CÓMO SE MAPEÓ Y SECUENCIÓ EL GENOMA HUMANO

223

~ H iíT K Z ir ir ~ ~ ~

Banda del croraosoüia 3 1

g27.1

17!. « 11b

181. «3 Hb

(cont iguoos) flarcadores

D3S34I2

D3S247Í

SFNlêí

C3S43Í8

D3S1MÍ

0K3111 D3S3423

Genes l «W K 7t HBEUB l ftTPli6 I GENES EHSftlBL PREDICHOS (CONOCIDOS!

genes

179.48 Hb

Longitud

179.49 Hb

179.50 Hb

l HCCCÍ

ll » l« « 4 2

L53ÍNT5

LKLHL6

I GENES ENSfitIBL PREDICHOS (NUEUOS)

179.51 Hb

179.52 Hb

179.53 Hb

179.54 Hb

179.55 Hb

179.56 Hb

179.57 Hb

■*»----------------------------------------------- 108. 00 Kb-----------------------------------------------«

Niiwro ife caradtarfat ia*s efe TOSÍ m

NCBI

»'*m > de ceroRtíPÍstiraB li-484H&

I GEHES EHSflTfflL PREDICHUS (NUEUOS)

Fig. 8-5. Las interfases gráficas en la búsqueda general de Ensembl genome permiten navegar con facilidad a través de cromosomas individuales en secuencias genómicas ensambladas. La búsqueda general de Ensembl genome (http://www.ensembl.org) se desarrolló por una colaboración entre el Wellcome Trust Sanger Institute y el European Bioinformatics Institute y permite una búsqueda general por cromosoma para varias secuencias genómicas ensambladas, Incluidas la humana y la del ratón. Después de seleccionar de forma inicial el cromosoma 3 humano, se eligió una región subcromosómlca que abarcaba el borde 3q26.333q27.1 mediante clicks en un ideograma de cromosómico (que se muestra con el cuadro rojo abierto en el dibujo de la parte superior). Se muestra la reglón seleccionada expandida, en el dibujo de la parte media, definida como la región de 1 Mb de 179.03 a 180.03 Mb. El cuadro rojo abierto en el di bujo de la parte media es un segmento de 100 kb (179.48 a 179.58 Mb) y se muestra en una imagen aumentada en el dibujo de la parte inferior, que ¡lustra gen, exón, RNA, estructura proteínica, etcétera.

224

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

productos génicos y ello permite la anotación de propiedades mole culares a través de especies. Cada vocabulario está estructurado como gráficas acíclicas dirigidas, en las que cualquier término puede tener más de un parentesco o ninguno, uno o más descendientes. Esto en riquece mucho más los intentos para describir la biología de lo que sería posible con una gráfica jerárquica. En la actualidad, el vocabu lario de la GO posee más de 11 000 términos que con el tiempo ten drán, todos, definiciones estrictas para su uso.

8.3.7 Son importantes los análisis de la variación de secuencias del genoma humano para la investigación antropológica y médica Al inicio, el Proyecto del Genoma Humano se concibió para obte ner la secuencia de nucleótidos de un conjunto de fragmentos de DNA humano clonados que llegaba en total a uno o unos cuantos genomas haploides. Lo que no consideró fue la diversidad genética de los seres humanos. De modo subsecuente, se consideró conve niente la información sobre esta última en diferentes contextos: ► an tropología . La información debe ser útil en investigación an tropológica e histórica en el rastreo de los orígenes humanos, movimientos de población prehistóricos y estructura social.

► an á lisis fo ren se. La precisión de las pruebas basadas en DNA que se llevan a cabo para identificar personas o confirmar rela ciones biológicas cercanas ( p e r fil d e DNA) depende, en parte, del conocimiento de la forma en que varían los marcadores diagnósticos de DNA de una población a la siguiente. ► in vestiga ció n m édica. Las enfermedades comunes son multifactoriales y puede ser frustrante y difícil identificar los genes subyacentes (véase cap. 15). En fecha reciente se consagró un esfuerzo enorme a la identificación de variantes genéticas que pueden explicar diferencias entre poblaciones humanas respec to de la mayor susceptibilidad a anomalías particulares o, de hecho, la resistencia comparativa a ciertas afecciones.

Proyecto de Diversidad del Genoma Humano La idea de una esfuerzo global para el estudio de la diversidad de la secuencia del genoma humano, el Proyecto de Diversidad del Ge noma Humano (HGDP, por sus siglas en inglés) lo propusieron Cavalli-Sforza y colaboradores (1991). El énfasis se dirigió de mane ra predominante a la necesidad de reunir muestras de DNA de un gran número de grupos étnicos. Sin embargo, aunque apoyado por HUGO, este proyecto ha tenido enormes dificultades (véase Greely,

GRAIL/Prom TSSW /Promotor GENSCAN/Prom I I! I I I

Fex

Hexon MZEF Genemark GRAIL G enefl rider Gen F GENSCAN G enes F Gen HMM BLAST/trembl

I I

4-4 -

i l 4 -ti i

1

-H h

I

-M

g— m -

-M -H -

-4—1— 1-

GENSCAN/p o i i a d e n i la c ¡ 6 n G enes F /p o i i a d e n i la c ión GRflIL /p o I i a d e n i Iac ión BLAST/ecolí BLA ST/vector ílasker reP*t

ü I

Ü4-

I

I

I

I ■■

I

E x p lo r a c ió n de tRNR-SE

1

I I

I fi

■ I

Fig. 8-6. Hallazgo de genes mediante análisis de secuencias genómicas basado en computadora. Este ejemplo muestra el análisis NIX (véase texto) de una secuencia CAP de una región del cromosoma 12q24.1 que incluye el locus de la enfermedad de Darier. El tamaño de nucleótido de la región se ilustra con la barra en la parte inferior. El análisis incluye el uso de programas para buscar elementos relacionados con genes como secuencias promotoras (triángulos verdes invertidos en la parte superior), sitios de poliadenilación (triángulos invertidos de color ocre) y diversos programas de predicción de exón (GRAIL, GENSCAN, etc.). Las homologías importantes con otras secuencias a niveles de nu cleótidos y proteínas se indican con los cuadros para los diversos programas B LA S ! Datos proporcionados por Víctor Ruiz-Perez y Simón Cárter, University of Newcastle upon Tyne, UK.

8.4 1 PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

2001). Desde el inicio estuvo acosado por una falta conspicua de pa trocinio. Mientras que el principal objetivo de este proyecto fue tan sólo reconocer marcadores para grupos étnicos y seguir los orígenes de la migración y los linajes ancestrales humanos, no fue tan persua sivo el caso para obtener fondos a gran escala. El HDGP también ha estado perseguido por controversias. En algunos casos, los investigadores visitaron poblaciones huma nas aisladas en los límites de la supervivencia, obtuvieron mues tras con rapidez sin tomar tiempo para explicar su importancia y a continuación las dejaron sin comunicación ulterior, o muy po ca. Si bien quienes lo proponen se refieren a la necesidad de sal vaguardar la herencia cultural del hombre, los críticos suelen utilizar de manera agotadora términos como gen ética d e helicóp tero para referirse a la conducta insensible de entrada rápida y sa lida rápida practicada con frecuencia para obtener muestras.

Mapas de polimorfismo de nucleótido único (SNP) Si bien los marcadores microsatélites muy polimórficos están distri buidos en la totalidad del genoma, no son susceptibles en particular de tipificación automatizada y sólo ocurren alrededor de una vez ca da 30 kb. Los p o lim o rfism o s d e n u cleó tid o ú n ico (SNP) no son muy polimórficos (de forma característica sólo dos alelos), pero pue den tipificarse con facilidad mediante automatización y ocurren con mucha frecuencia en el genoma, en promedio alrededor de una vez cada kilobase en el genoma humano (véase sección 7.1.3 y recuadro 18-2 para la descripción de la forma en que se tipifican). Como re sultado, los mapas de SNP humanos encontraron aplicaciones im portantes en la elaboración de mapas genéticos, incluso de más alta resolución que eran necesarios para investigar regiones cromosómicas que se esperaba que incluyeran genes de enfermedades comunes. En 1999 se inauguró el In tern a tio n a l SNP C onsortium L td como una sociedad no lucrativa entre Wellcome Trust y alrededor de una docena de compañías privadas, sobre todo farmacéuticas. En el transcurso de dos años proporcionó un mapa de SNP humano con un total de 1.42 millones de SNP, que equivalen aproximadamen te a un SNP cada dos kilobases (Grupo Internacional de Trabajo del Mapa de SNP, 2001). En la actualidad se llevan a cabo grandes esfuerzos a fin de mapear genes para enfermedades comunes me diante mapas de SNP de alta densidad y se ha concedido asimismo un interés comercial a las aplicaciones fa rm a co gen ó m ica s.

8.3.8 Sin las salvaguardas apropiadas, el Proyecto del Genoma Humano podría conducir a la discriminación contra portadores de genes de enfermedades y también al resurgimiento de la eugénica Cualquier adelanto científico importante conlleva el temor de la ex plotación. El PGH no es la excepción y los beneficios percibidos del proyecto también tienen su lado oscuro. Cuando se conozcan todos los genes humanos y pueda detectarse una gran cantidad de mutacio nes que se acompañen de una enfermedad, se obtendrá un enorme beneficio para dirigir la prevención de anormalidades a los individuos con genes de la afección demostrados. Pese a ello, podría usarse la misma información para discriminar a esas personas. Por ejemplo, existe la genuina y difundida preocupación de que las compañías de seguros pudieran exigir pruebas de selección genética a gran escala para la presencia de genes que confieren susceptibilidad a trastornos comunes, como diabetes, afecciones cardiovasculares, cánceres y va

225

rios trastornos mentales. En consecuencia, a las personas por comple to sanas pero portadores de estos alelos adjuntos de enfermedad po dría negárseles los seguros de vida o médicos. Por supuesto, esta discriminación sólo se llevaría a cabo a pequeña escala por el momen to; un hecho que es alarmante para muchos es la posibilidad de discriminación de un porcentaje muy grande de personas en la so ciedad. Asimismo, es esencial preservar el derecho de las personas a no saber. Un principio ético fundamental en todas la asesoría y las pruebas genéticas es que la información genética sólo debe generarse en respuesta a una solicitud explícita de un paciente adulto del todo informado. Otra área problemática es el aspecto del determinismo biológi co y si el conocimiento amplio de los genes humanos fomentaría una revisión de la eugénica, esto es, la aplicación del apareamiento selectivo u otras técnicas genéticas a fin de “mejorar” las calidades humanas (Garver y Garver, 1994). En años pretéritos, los movi mientos eugénicos negativos en algunos países (incluidos Estados Unidos y Alemania) discriminaron a individuos que se juzgaban in feriores en alguna forma y se los forzó a esterilizarse. Existe de igual modo la preocupación con la m ejo ría g e n é tica a fin de seleccionar de manera positiva cualidades hereditarias que se juzgan conve nientes (véase Etica en el recuadro 3 del cap. 21). En reconocimien to de los problemas anteriores, el U.S. Human Genome Project (Proyecto del Genoma Humano Estadounidense) dedicó grandes recursos para apoyar proyectos de investigación sobre los efectos ético, legal y social (véase, p. ej., http://www.nhgri.nih.gov/ELSI).

8.4

Proyectos de genom as para organism os m odelos

El mapeo del genoma humano no fue el único enfoque científico del Proyecto del Genoma Humano; desde un principio se reconoció con claridad el valor de secuenciar los genomas de cinco organismos mo delos fundamentales y desde entonces la lista se tornó sustancial. Incluye una amplia variedad de microorganismos microbianos unicelulares y asimismo varios microorganismos modelos multicelula res, muchos de ellos en particular adecuados para análisis genético. En parte, la secuenciación de genomas más pequeños se considera también como piloto para la secuenciación a gran escala del genoma humano. Alrededor de mayo de 2003 estaban terminados los genomas de más de 140 microorganismos (o casi concluidos; véase http://wit.integratedgenomics.com/GOLD/; http://www2.ebi.ac.uk/genomes/).

8.4.1 Existe una enorme diversidad de proyectos de genoma procariotas Diversidad de proyectos de secuenciación del genoma procariota Desde hace mucho tiempo se estableció una diversidad de modelos procariotas (véase recuadro 8-7). De manera característica, los ge nomas procariotas son pequeños (con frecuencia sólo una o unas cuantas megabases) y en especial factibles de una secuenciación comparativamente rápida, que dio por resultado el pronto desarro llo de muchos proyectos de genoma procariota. Alrededor de ma yo de 2003 se habían secuenciado ya los genomas de un total de 122 procariotas diferentes (16 archaea y 106 bacterias) y se encon traban en curso los de otros 342 (23 archaea, 319 bacterianos) (véa se, asimismo, Doolittle, 2002).

226

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

El primer genoma procariota terminado (en 1995) fue el geno ma de H aem ophilus in flu en z a e de 1.83 Mb. Fue un hecho sobre saliente: la primera vez que se secuenciaba el genoma de un organismo que vive con libertad (véase Tang y cois., 1997). Más ade lante se logró una diversidad de otros primeros', el genoma de la en tidad autónoma autorreplicante más pequeña (M ycoplasm a genitaliu m en 1995), el primer genoma archaeal (M eth a n ococcu s ja n n a sch ii en 1996) y a continuación el logro relevante de la secuencia completa del genoma de E. c o li de 4.6 Mb (véase Pennisi, 1997). La lista de organismos procariotas cuyos genomas ya se secuenciaron muestra diferentes prioridades. En algunos casos, el impul so se centró en comprender las relaciones evolutivas entre diferentes microorganismos, como en los genomas de archaea (véase Olsen y Woese, 1997) y en Mycoplasma genitalium en comprender lo que constituye un genom a mínimo, que es el genoma celular más peque ño conocido (que en la actualidad se sabe que sólo tiene 470 ge nes). En otros casos, como en E. coli y Bacillus subtilis, la prioridad fue tan sólo una investigación básica más amplia sobre microorga nismos experimentales comunes. Para muchos investigadores el premio mayor ha sido E. coli, la bacteria estudiada de modo más in tenso. Como hecho sorprendente, si se toma en cuenta la enorme cantidad de investigación previa, casi el 40% de los 4 288 genes identificados de manera inicial no tenía función conocida y se constituyeron en el objeto de una investigación intensiva. Sin em bargo, para muchos otros microorganismos, la principal motiva ción para secuenciar el genoma es su trascendencia médica.

Proyectos del genoma procariota relacionado con enfermedades En algunos casos se eligieron procariotas para la secuenciación del genoma por sus vínculos conocidos con enfermedades crónicas (véase Danesh y cois., 1997) o porque se sabía que eran agentes cau sales de enfermedad (véase cuadro 8-3). Además de obtener un co nocimiento más completo de estos microorganismos, cabe esperar que la nueva información conduzca a medios diagnósticos más sen sibles y nuevos objetivos para establecer fármacos/vacunas.

De los 6 340 genes, alrededor del 7% especifica RNA no traducido. Aunque es uno de los organismos estudiados de manera más inten sa, 60% de sus genes no tenía una función determinada por medios experimentales cuando se publicó por primera vez la secuencia. No obstante, fue factible demostrar que una fracción valorable de los ge nes de levadura posee un homólogo mamífero identificable y por consiguiente sólo en alrededor del 25% de los genes de la levadura no hubo indicio alguno sobre su función (Botstein y cois., 1997). La conclusión satisfactoria de este proyecto dio paso en la actualidad a análisis funcionales a gran escala (véase cap. 19).

Proyecto del genoma de Schizosaccharomyces pombe La levadura de fisión es otro hongo unicelular que desde hace mu cho tiempo se ha convertido en un microorganismo modelo prefe rido (véase recuadro 8-7). Wood y colaboradores (2002) publicaron la secuencia completa de 13.8 Mb y reveló un total de 4 824 genes que codifican proteínas. Los datos mostraron una gran diferencia entre los genomas de S. cerevisiae y S. pombe, incluidos cientos de genes que se encuentran en S. Pombe, pero al parecer no en S. cere visiae y viceversa, diferencias en el número de intrones (4 700 en S. pom be comparados con sólo 275 en S. cerevisiae) y elementos transponibles (muy pocos en S. pom be cuando se comparan con S. cere visiae), etcétera.

Proyecto del genoma de Plasmodium falciparum El informe de Gardner y colaboradores (2002) de la secuenciación del genoma de P falciparum fue otro acontecimiento de importan cia: era la primera vez que se secuenciaba el genoma de un parásito eucariota. P. falciparum es el parásito mortífero del paludismo y la publicación simultánea del genoma completo de su huésped, el mosquito A nophelesgambiae (véase sección 8.4.4), ofrece una nue va dimensión en la batalla contra el paludismo, con frecuencia un padecimiento mortal que causa la muerte de un millón de personas cada año, sobre todo en el África subsahariana.

Otros proyectos de genomas de protistas 8.4.2 El proyecto del genoma de S. cerevisiae fue el primero de muchos proyectos de genomas protistas exitosos Los p ro tista s son eucariotas unicelulares, un término que incluye a animales unicelulares (p rotoz oa rios), hongos celulares y plantas unicelulares. Se efectuó una diversidad de proyectos del genoma protista, en algunos casos por la necesidad de comprender microor ganismos modelos básicos y en otros como medio para combatir una anomalía causada por protozoarios patógenos.

Proyecto del genoma de Saccharomyces cerevisiae La levadura con gemación S acch a rom yces cer ev isia e es un hongo unicelular y desde hace mucho tiempo es un microorganismo mode lo eucariota favorito, en parte porque es muy susceptible al análisis genético (recuadro 8-7). Consorcios europeos y estadounidenses secuenciaron sus 16 cromosomas y Goffeau y colegas (1996) publica ron la secuencia completa. Esto representó otro acontecimiento importante en biología: la primera secuencia completa de una célula eucariota. Los datos indican que los genes de levadura están agrupa dos de forma estrecha y espaciados en promedio una vez cada 2 kb.

Los otros proyectos de genomas de protistas incluyen los del geno ma de varios protozoarios patógenos relacionados con infecciones parasitarias en el hombre. En casi todos los casos, son sustanciales los tamaños del genoma, de manera característica de 30 a 90 Mb (véase cuadro 8-3). Además, se desarrollaron proyectos de genoma para otros microorganismos bien estudiados y que son factibles de análisis bioquímico/genético, incluidos los mohos A spergillus nid u la n s y N eurospora crassa.

8.4.3 El proyecto del genoma de Caenorhabditis elegans fue el primer proyecto de un genoma animal terminado Proyecto del genoma de Caenorhabditis elegans Aunque es un organismo simple, sólo alrededor de 1 mm de largo, C. elegans se ha considerado como un modelo importante del desa rrollo y también fue útil para modelar otros procesos relevantes pa ra las células humanas (véase recuadro 8 - 8 ). Debido al gran tamaño de su genoma (casi 100 Mb), el proyecto del genoma de C. elegans también se considera como el modelo piloto más importante para

8.4

PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

Una diversidad de organismos unicelulares es en particular adecuada pa ra análisis genéticos y bioquímicos y ofrece las relevantes ventajas de tiempos de generación en extremo rápidos, facilidad de cultivo a gran es cala, etc. Aunque relacionados de modo muy distante con el hombre en términos evolucionistas, tienen ventajas para estudiar múltiples factores científicos y médicos. Los beneficios para genetistas humanos e investi gadores médicos incluyen nuevas informaciones sobre una extensa va riedad de áreas de investigación, algunas con aplicaciones médicas claras, entre ellas las siguientes: ► Función génica y procesos celulares: durante la evolución se conser varon de manera extraordinaria muchas actividades celulares centra les de crucial im portancia. Es posible obtener información sobre la forma en que funcionan los diversos genes de mamíferos y la natu raleza de los procesos celulares esenciales, como la biogénesis de los ribosomas, el control del ciclo celular, el transporte a través de la membrana, la función de polimerasa, etc., si se estudian genes y pro cesos equivalentes en organismos unicelulares; ► Patogenia: se sabe que muchos microorganismos unicelulares cau san enfermedades y durante años la medicina ha luchado con fre cuencia para encontrar fármacos u otros tratamientos eficaces apropiados. Mediante la determinación de los genomas completos de estos organismos patógenos y el estudio de la base molecular exac ta de la forma en que causan afección cabría esperar nuevas informa ciones sobre la manera de abordar a los m icroorganism os patógenos; ► Evolución: los análisis de secuencia proporcionan el medio más útil para comprender la forma en que los microorganismos se relacionan entre sí. Por consiguiente, si bien el análisis de secuencias de rRNA proporcionó el camino para establecer la división fundamental en tres reinos de vida mayores: archaea, bacterias y eucariotas (recuadro 12-4), sin duda alguna la comparación completa de las secuencias genómicas suministrará informaciones adicionales importantes; véa se también la figura 1 2 -22. BACTERIAS Desde hace mucho tiempo, una m ultiplicidad de bacterias, no patóge nas en condiciones normales, se toma com o modelo de m icroorganis mos, en especial Escherichia cotí en form a de bastón, que vive en el intestino del hombre y otros vertebrados (es una relación simbiótica: contribuye a sintetizar la vitam ina K y las vitaminas del complejo B que el hombre absorbe). Gracias a los estudios intensivos durante décadas, ha sido posible obtener más conocim ientos de E. co li que de cualquie ra otro tipo de célula y la m ayor parte del conocim iento sobre los me! canísm os fundamentales de la vida, incluidas la replicación, la transcripción de DNA, la síntesis de proteínas, etc, proviene de estudios de este m icroorganism o. Además, por supuesto, diversas bacterias patógenas causan enferme dades de gravedad variable. Entre ellas se encuentran las cepas de E. co li, que ocasionan infecciones en el hombre, incluidas meningitis, sep ticemia e infecciones de vías urinarias e intestinales. Un ejemplo notorio es E. coli 0157:H7 que, com o resultado de la adquisición de una se cuencia particular de bacteriófago en años pretéritos, se m odificó de modo genético para producir una toxina. En algunos casos, esta última produce hemorragia intensa que puede ser m ortal en niños pequeños o personas de edad avanzada; en otros pacientes suele provocar insufi ciencia renal. Se iniciaron diversos proyectos de genoma com o intento para obtener las secuencias completas de microorganism os patógenos (véase cuadro 8-3).

227

ARCHAEA En la categoría Archaea se incluyen procariotas cuya form a semeja de manera superficial a las bacterias, pero se diferencian de estas últimas en una etapa muy temprana de la evolución. De modo inicial se encon traron en ambientes poco comunes, a menudo extremos: temperaturas muy altas en aguas termales y cerca de grietas de respiraderos en ma res profundos, aguas con pH o salinidad extremos, lodazales de panta nos carentes de oxígeno, depósitos profundos de petróleo bajo la tierra y el fondo de océanos. Sin embargo, en la actualidad se sabe que habi tan ambientes más familiares, como suelos y lagos, y se han encontra do en el tubo digestivo de vacas, termitas y vida marina en donde producen metano. Los sistemas m etabólicos y de conversión de energía de archaea son similares a los de las bacterias, pero los sistemas utilizados para tratar y procesar inform ación genética (replicación, transcripción, traducción de DNA) se relacionan de modo más estrecho con los de eucariotas, en comparación con sus correspondientes bacterianos. No se sabe que ar chaea se vincule con enfermedades y el principal interés en el estudio de sus genomas radica en su posición como un reino muy separado de i otras form as de vida; por consiguiente, la atención se centra en cono cer más sobre la form a en que evolucionaron para ser tan diferentes. LEVADURAS (HONGOS UNICELULARES) Las levaduras son hongos unicelulares y también eucariotas. Son com u nes en hojas y flores de plantas, suelo y agua salada y asimismo se en cuentran en la superficie de la piel y el intestino de animales de sangre callente, en donde pueden vivir de form a simbiótica o com o parásitos. De manera característica, se replican por gemación en lugar de fisión bina ria: el citoplasma y el núcleo en división de la célula original se continúan al principio con la yema, o levadura hija, antes de depositarse la nueva pared celular para separar a ambas. Las levaduras han resultado valiosos m icroorganism os modelos por que se sabe que se conservó en sum o grado una diversidad de m olé culas fundamentales, desde las levaduras hasta los mamíferos. Como hecho Im portante, se halló que las versiones humanas de varios ge nes del ciclo celular y reparación de DNA de levaduras participan de form a directa en la división de células humanas. El mal funcionam ien to suele conducir a cáncer o defectos del nacim iento. La actividad norm al de estos genes se estudia con m ayor facilidad en células de levaduras, que se manipulan en el laboratorio. Esto proporciona informaciones de im portancia sobre sus m ecanism os en seres humanos, que ayudan a realizar experimentos directos en tipos de células más com plicadas. En consecuencia, el estudio del control de la división celular en levaduras es esencial para la salud humana a fin de com prender muchos trastornos clínicos. Por lo general, las levadu ras no causan enfermedades, pero algunas levaduras patógenas -e n particular las especies C andida- constituyen un problem a de salud común. ► Saccharomyces cerevisiae es una levadura de gemación que desde hace mucho tiem po es im portante en la elaboración de pa nes y cerveza. Debido a que es simple y fácil de desarrollar, se tra ta de un organism o favorito para investigación básica y uno de los eucariotas estudiados de manera más extensa. En parte por una al ta frecuencia de recom binación no hom ologa, ha sido muy recep tivo a análisis genéticos. Por lo regular se usa com o modelo para estudiar varios aspectos de biología celular, incluidos el control del ciclo de la célula, el transporte de proteínas y la regulación transcripcional.

continúa en la página siguiente

:

; j

228

CAPITOLO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Recuadro 8-7. (co n tin u ació n ) ► Schizosaccharomyces pombe es una levadura de fisión y con un tiempo de generación rápido (dos a cuatro horas). Sólo hasta fecha más reciente se estudió bastante, en especial como un modelo del con trol (existe una fase G2 precisa del ciclo) y la diferenciación del ciclo celular. Se relaciona de forma distante con S. cerevisiae y en algunos aspectos de la estructura de los cromosomas y el procesamiento del RNA se vincula de modo más próximo con eucariotas más altos que S. cerevisiae. ► Candida albicans se encuentra de manera natural en la boca de per sonas sanas, pero puede causar irritación y en ocasiones infecciones debilitantes en individuos cuyo sistema inmunitario no es tan activo como el normal; provoca algodoncillo vaginal y bucal, exantema del pañal y otras anomalías. PROTOZOARIOS (ANIMALES UNICELULARES) Los protozoarios son un grupo grande de animales unicelulares (no fotosintéticos) que incluyen amebas, flagelados y ciliados (que se desplazan con la ayuda de seudópodos, flagelos y cilios, respectivamente) y otros microorganismos con ciclos de vida complejos. Tienen interés para inves tigadores biomédicos como modelos de diversas facetas de la biología ce lular y del desarrollo y asimismo porque muchos son parásitos que causan enfermedades. Los últimos pueden ser huéspedes de bacterias patógenas (que ocasionan afecciones como la enfermedad de los legionarios, salmonelosis, tuberculosis, y otras) o producen anormalidades directas: ► Entamoeba histolytica: una ameba parasitaria que provoca enferme dad gastrointestinal grave. ► Tripanosomas: parásitos flagelados que producen la fiebre tropical conocida como enfermedad del sueño. ► Giardia: un parásito flagelado que causa diarrea grave. ► Plasmodium: provoca el paludismo. ► Toxoplasma: produce afecciones digestivas y daño de órganos in ternos. Como modelos de biología celular y del desarrollo, el principal interés se enfocó en Dictyostelium discoldeum, una llamada ameba social: aun-

la secuenciación a gran escala del genoma humano. El éxito del pro yecto del genoma lo consiguieron Wellcome Trust Sanger Institute y la Washington University School of Medicine (Consorcio de Secuen ciación de C. elegans, 1999). Fue otro logro de trascendencia que proporcionó por primera vez las instrucciones genéticas para un ani mal multicelular (m etaz oario). En el proyecto del genoma de C. elegans se publicó de forma inicial un total de casi 19 OOO genes que codifican polipéptidos y más de 1 000 genes que codifican moléculas de RNA no traduci das, lo que proporcionó un espaciamiento promedio de un gen cada 5 kb. Al parecer, ocurre un número sorprendentemente grande de genes como parte de o p ero n es en los que se transcriben genes individuales que forman parte de transcritos de RNA multigénicos grandes. A la fecha, tras la aparición del informe inicial, la comparación con secuencias publicadas de alguna otra parte re veló que casi uno de cada tres de los genes de C. elegans recién identificados mostraba similitudes con genes conocidos con ante rioridad y 12 000 de los genes que codifican polipéptidos no te nían una función conocida y casi todos eran genes predichos sin confirmación experimental. De los 19 000 genes que codifican polipéptidos publicados, só lo se dispone de prueba experimental de apoyo para tan sólo 9 000

que es típico su crecimiento en la forma de células separadas e indepen dientes, las células pueden interactuar para form ar estructuras multice lulares cuando se someten a condiciones adversas como la inanición. Hasta 100 000 células producen señales entre sí al liberar el cAMP quimioatrayente y se congregan unas y otras mediante quim iotaxis para fo r mar un montículo rodeado por una matriz extracelular. Este mecanismo para generar un microorganismo multicelular difiere de form a radical de los pasos iniciales de la embriogénesis de los metazoarios. Sin embar go, los procesos subsecuentes dependen de la comunicación intercelu lar tanto en Dictyostelium com o en metazoarios. Este microorganismo es singular para estudios de citocinesis, motilldad, fagocitosis, quim io taxis, transducción de señales y aspectos del desarrollo, com o selección celular, formación de patrón y determinación del tipo de célula. Muchas de estas conductas y mecanismos bioquímicos celulares no existen o son menos accesibles en otros organismos modelos. Aún no se investigan los ciliados de manera tan extensa como las otras clases de protozoarios. El único ciliado al que se concedió más atención es Tetrahymena, un microorganism o de agua dulce que habita por lo ge neral en corrientes, lagos y estanques; en la actualidad se considera un proyecto de genoma para Tetrahymena thermophila (véase Turkewitz y cois., [2002]). Tetrahymena tiene células grandes (40 a 50 ^.m a lo largo de su eje anteroposterior) y, al igual que otros ciliados, las células po seen una variedad notable de estructuras celulares muy complejas y es pecializadas. Como es típico de los ciliados, el aparato nuclear de Tetrahymena está constituido por dos tipos de núcleos diferentes desde el punto de vista estructural y funcional, un fenómeno que se conoce co mo dim orfism o nuclear. El m icronúdeo es la línea germen, es decir, al macena información genética para la progenie sexual. Es diploide y contiene cinco pares de cromosomas. El macronúcleo (MAC) es el nú cleo somático, esto es, el núcleo se expresa de form a activa durante la multiplicación vegetativa y no se transmite a la progenie sexual DNA de MAC conocido. Tetrahymena es un modelo bien establecido para biolo gía celular y del desarrollo y el principal interés se relaciona con la m o tilldad de células redondas, los reordenamientos de DNA programados por el desarrollo, la secreción regulada, la fagocitosis y la conservación y función del telómero.

J

casos; los casi 10 000 genes predichos restantes sólo se identifica ron mediante análisis de secuencia basados en computadora. Aná lisis subsecuentes para estudiar estos genes en busca de pruebas de transcritos de RNA correspondientes sugirieron que cuando menos 80% de los genes predichos por computadora era auténtico, lo que llevó a Reboul y colegas (2001) a concluir que C. elegans tiene cuando menos 17 300 genes. En la actualidad se realizan grandes esfuerzos para investigar la función específica de genes y programas de mutagénesis química a gran escala que intentan producir un gran número de fenotipos mutantes.

8.4.4 Los proyectos del genoma de metazoarios se enfocan sobre todo en modelos del desarrollo y enfermedades El éxito del proyecto de secuenciación de C. elegans anunció una era nueva y confiable. Para contribuir a los escasos proyectos de genomas animales de larga duración (p. ej., D. melanogaster) se desa rrolló una plétora de nuevos proyectos con diferentes motivaciones: ► investigación básica (p. ej., el deseo de conocer por completo modelos valiosos del desarrollo);

8.4

PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

229

Cuadro 8 -3 . Guerras contra gérmenes: ejemplos de proyectos de genomas para microorganismos patógenos (véase las lecturas adicionales para obtener fuentes en internet). Microorganismos

Tamaño del genoma (número de cromosomas)

Enfermedad concomitante

Bacillus anthracis Bordetella pertussis Borrelia burgdorferi Chlamydia pneumoniae Chlamydia trachomatis Clostridium difficile. Helicobacter pylori Mycrobacterium leprae Mycrobacterium tuberculosis Ricketssia prowazekii Salmonella typhi Treponema pallidum Vibrio cholerae Yersinia pestis

4.5 Mb (1) 3.88 Mb (1) 0.95 Mb (1) 1.0 Mb (1) 1.7 Mb (1) 4.4 Mb (1) 1.67 Mb (1) 2.8 Mb (1) 4.4 Mb (1) 1.1 Mb (1) 4.5 Mb (1) 1.1 Mb (1) 2.5 Mb (1) 4.38 Mb (1)

Carbunco Tosferina Enfermedad de Lime Afección respiratoria; cardiopatía coronaria Tracoma, una causa principal de ceguera Diarrea relacionada con antibióticos; colitis seudomembranosa Úlceras pépticas Lepra Tuberculosis Tifus Fiebre tifoidea Sífilis Cólera Peste

Protozoarios Leishmania m ajor Plasmodium falciparum Trypanosoma brucei Trypanosoma cruzi

33.6 Mb (36) 23 Mb (14) 54 Mb (22)a 87 Mb (> 4 2 )

Leishmaniasis Paludismo Tripanosomosis africana (enfermedad dei sueño) Tripanosomosis americana (enfermedad de Chagas)

Bacterias

Organizada en la forma de 1 1 pares.

► comercial (p. ej., proyectos de genoma para granjas de animales).

Proyecto del genoma de Anopheles gambiae

► médicos (p. ej., comprender modelos de enfermedad y la pato genia secundaria a nematodos parasitarios o bien originada por vectores de enfermedades como mosquitos, los portadores del paludismo).

Anopheles gam biae es un mosquito que disemina el parásito mortal del paludismo, Plasmodium falciparum . Con el patrocinio propor cionado sobre todo por el U.S. NIH-NIAID y el Ministerio Francés de Investigación, se secuenció el genoma de Anopheles gam biae me diante una colaboración entre Celera Genomics, el centro nacional francés de secuenciación Génoscope y el Institute for Genome Re search (TIGR), en asociación con varios grupos de investigación de universidades (Holt y cois., 2002 ). Su secuencia se publicó de forma simultánea con la de Plasmodium falciparum (véase sección 8.4.2) y ofreció una nueva dimensión en la lucha contra el paludismo.

Proyecto del genoma de D. melanogaster Este proyecto se condujo al principio en gran parte como una co laboración entre la University of California en el Berkeley laboratory y un consorcio de laboratorios europeos, pero después se incorpo ró una importante compañía privada, Celera. La secuencia publica da por Adams y colaboradores (2000) no fue la secuencia completa del genoma, de 165 Mb, sino la de casi toda la porción eucromática de alrededor de 120 Mb en la que reside la inmensa mayoría de los genes. La versión 3.0 publicada en agosto-septiembre de 2002 eliminaba la mayor parte de los intervalos en la secuencia de eucromatina (http://www.fruitfly.org/sequence/index.html). El informe inicial de la secuencia del genoma de Drosophila in cluyó 13 601 genes que codifican polipéptidos, con una densidad génica de alrededor de uno por 9 kb. La cifra baja de genes fue una sorpresa cuando se comparó con los 19 000 genes que codifican polipéptidos de C. elegans, que se publicó primero, un organismo más simple con tal vez sólo 10% del número de células de D. m e lanogaster. Con la finalidad de relacionar D. melanogaster con espe cies de Drosophila, relacionadas de forma más distante, en fecha reciente se iniciaron otros proyectos de genoma, en particular el proyecto de D. pseudoobscura.

Proyecto del genoma del ratón (Mus musculus) Debido a diversas características, el ratón proporciona el modelo de genoma más importante para el proyecto del genoma humano (véa se recuadro 8 - 8 ) y se esperaba que tuviera en esencia el mismo nú mero de genes. Los esfuerzos para la secuenciación del genoma del ratón patrocinada con recursos públicos se iniciaron en 1999 y al principio se planeó obtener un esquema de la secuencia hacia el año 2005. Sin embargo, cuando la compañía privada Celera anunció en tonces su intención de secuenciar el genoma del ratón en dos años, se llevaron a cabo esfuerzos conjuntos para acelerar el esfuerzo pú blico de secuenciación. Con ese fin se formó el Mouse Genome Sequencing Consortium (MGSC) con los U.S. National Institutes of Health y el U.K.’s Wellcome Trust en asociación con tres compañías privadas (GlaxoSmithKline, Merck Genome Research Institute y Affymetrix, Inc.). El esfuerzo de secuenciación de MGSC se delegó

230

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Recuadro 8 - 8 . Animales multicelulares m odelos para com prender el desarrollo, las enferm edades y la función génica Se recurre a una amplia variedad de modelos animales multicelulares pa ra conocer los procesos básicos del desarrollo y la biología celular, con objeto de comprender la función génica y como modelos de enfermeda des, El espectro es amplio, desde gusanos y moscas invertebrados has ta diferentes especies de peces, ranas, aves y mamíferos; véase Hedges (2002) y asimismo las figuras 12-23 y 12-24 para conocer la filogenia. CAENORHABDITIS ELEGANS (GUSANOS REDONDOS)

► sistema nervioso. Existe un diagrama completo de Interconexiones del sistema nervioso: se conocen todas las 302 neuronas y las unio nes entre ellas. C. elegans también posee genes para la mayor parte de los componentes moleculares conocidos del cerebro de vertebra dos. En tanto que muchos científicos piensan que el cerebro humano es tan complejo que nunca se tendrá la esperanza de comprenderlo por completo, el conocimiento del sistema nervioso simple de C. ele gans proporcionará mucha información y será importante conocer los genes de C. elegans para entender su sistema nervioso. ► envejecimiento. Se estudia con facilidad porque el gusano se desa rrolla a partir de una célula hasta la form a de crecimiento completa en el transcurso de tres días y sólo sobrevive dos semanas. Se han identificado numerosas mutaciones en C. elegans que dan por re sultado prolongaciones notorias del periodo de vida y algunos m u tantes viven cinco veces más tiempo que los gusanos de tipo silvestre.

C. elegans es un nematodo o gusano redondo (en comparación con los gusanos planos y los segmentados). Los gusanos redondos superan en número a todas las otras criaturas complejas del planeta, se encuentran casi en cualquier parte del mundo templado y prosperan en el suelo. Pue den vivir libremente (C. elegans) o como parásitos. Los gusanos redon dos infestan a mil millones de seres humanos y diseminan enfermedades, que incluyen la ceguera de los ríos y la elefantiasis, y devoran cosechas.

► apoptosis. Los genes que participan en la apoptosis (muerte celular programada) suelen conservarse bastante y se comprendió bien el patrón de apoptosis en el desarrollo de C. elegans (al principio se for ma un total de 1 090 células en el hermafrodita, pero 131 células es tán programadas para m orir durante el desarrollo). DROSOPHILA MELANOGASTER

C. elegans tiene 1 mm de largo. Hay dos sexos: masculino (XO) y hermafrodita (XX), una hembra modificada que es el sexo predominante. Al producir espermatozoos y huevos puede fecundarse y dar por resultado homoclgosidad para alelos. El macho se desarrolla por la pérdida ocasio nal de uno de los dos cromosomas X del hermafrodlta y éste se aparea de preferencia con machos, según estén disponibles. El linaje celular es Invariable y hay 959 células somáticas en el hermafrodlta y 1 031 en el macho adultos. C. elegans es un modelo importante del desarrollo, puede cultivarse con facilidad en el laboratorio (en placas de agar con alimentación de bacte rias o en cultivo líquido) y es muy susceptible de análisis genéticos. En el último caso, además de los métodos estándar de knocking out de la fun ción génica a nivel del DNA, es posible lograr la inactivación temporal de la expresión de genes específicos mediante tecnología de RNA de inter ferencia (RNAi). En este método, el investigador inyecta en el oocito RNA de doble cadena para el gen de interés. El RNA de doble cadena inactiva la expresión del gen homólogo y los fenotipos mutantes que resultan pue den examinarse para buscar indicios de la función génica (véase sección 20 .2 .6 ). Varias características determinan que C. elegans sea un buen organismo modelo para estudios de biología del desarrollo y otros relacionados: ► estudios de expresión. Debido a que C. elegans es transparente du rante todo su ciclo de vida, es posible unir el gen de proteína verde fluorescente (PVF\ véase recuadro 20-4) con un gen de C. elegans y utilizarse para encontrar el sitio en donde se expresó el gen en el gu sano. ► estudios de linaje. La transparencia de C. elegans hace posible ob servar y seguir cada célula durante el desarrollo. Como resultado, y debido a la invariabilidad del linaje celular, se conoce el linaje exacto de cada célula de C. elegans -inform ación que se desconoce en to dos los otros organismos multicelulares.

La mosca de la fruta se llama así por su inclinación por la fruta descom puesta. Tiene un ciclo de vida corto, es en particular dócil para análisis genéticos com plicados y se ha estudiado en extenso durante muchas décadas. Se ha analizado de manera sistemática un gran número de mutantes y obtenido una cantidad inmensa de inform ación sobre la fun ción génica (véase Perrimon [1998] para hallar un resumen de los nue vos adelantos en el estudio de la función génica). Una diversidad de características y conductas contribuyó al mapeo genético y el análisis funcional:

8.4 I PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

231

Recuadro 8 - 8 . Animales multicelulares modelos para comprender el desarrollo, las enfermedades y la función génica (c o n tin ú a ) ► cromosomas polilenos. Son cromosomas de interfase de 2 mm de largo que se encuentran en las células de las glándulas salivales en las etapas larvarias. Son característicos porque se producen por replicación repetida sin separarse hacia núcleos hijos y el resultado es un juego de 1 024 copias de DNA dúplex, único en condiciones nor males, dispuestas lado a lado como las pajillas para beber dispues tas en una caja. Debido a esta amplificación paralela del DNA, los cromosomas politenos son únicos entre los cromosomas de interfa se porque son visibles al m icroscopio de luz. Como resultado de su configuración extendida, permiten localizar con precisión (decenas de

métodos genómicos comparativos en estas tres especies proporcionan una ventana notable sobre la evolución del genoma de vertebrados. ► Pez cebra (Brachydanio rerio)

kilobases) puntos de rotura cromosómicos y detectar con exactitud clonas de DNA mediante hibridación in situ. ► elem ento P. Este elemento transponible de Drosophila permite varios tipos de manipulación experimental, entre ellos mutagénesls (véase Spradling y cois., 1995) y transgénesis (véase sección 20.2.2). La recombinación desigual entre Insertos de elemento P adyacentes tam bién puede ocasionar deleclones precisas. ► mediante el sistema GAL4-UAS de expresión génica condicional es po sible restringir la expresión espacial y temporal de transgenes. Son fac tibles selecciones de mutagénesis a gran escala y en fecha reciente se empleó tecnología de RNAi (véase antes) a fin de inactivar en forma transitoria genes específicos. En muchos casos (tal vez dos tercios de los 12 000 genes de Drosophila) la pérdida de la función no da lugar a un fenotipo mutante, pero la expresión errónea del transgén suele pro porcionar indicios sobre la función génica al producir fenotipos negati vos dominante/dominante. Las selecciones de una generación para supresores/intensificadores de fenotipos mutantes dominantes pueden identificar genes que ¡nteractúan. Es posible usar el sistema de recombinasa flp-frt de la levadura para inducir clonas mitóticas y formar así placas homocigotas que permiten observar los fenotipos de mutacio nes recesivas letales en etapas tardías del desarrollo. También puede utilizarse la recombinación mitótica en la selección de una generación a fin de calificar los fenotipos mutantes en clonas y recuperar mutacio nes letales que afectan el desarrollo ulterior. Aunque Drosophila es un invertebrado y tal vez el número de genes de Drosophila representa sólo la mitad de los genes humanos, existen no obstante ciertas similitudes notables entre los genes humanos y los de Drosophila. Gran parte de la diferencia en el número de genes se debe a fenómenos de duplicación génica que dan por resultado familias de ge nes más grandes en seres humanos y una proporción grande de genes de Drosophila tiene homólogos humanos, Incluidos los genes subyacen tes de muchos trastornos genéticos y los de cáncer. El nivel de homolo gía posibilita tener éxito en la selección electrónica para reconocer cDNA humanos correspondientes a genes mutantes de Drosophila (Banfi y cois., 1996). Muchos de los genes muy bien conservados tienen funciones im portantes en el desarrollo temprano que, en términos comparativos, se comprende bien en Drosophila y muchas de las vías relevantes en el de sarrollo inicial y en algunos otros procesos similares cruciales están esencialmente conservadas, desde Drosophila hasta mamíferos. Como resultado, puede emplearse Drosophila como un sistema modelo para ex plorar la función génica y los patrones de interacción de genes que tienen importancia directa para sistemas humanos. PECES Por lo general se emplean como modelos diferentes peces, en especial el pez cebra, que es un modelo excelente del desarrollo y cada vez más im portante de enfermedades, el pez soplador por su genoma muy compac to y, en fecha más reciente, medaka, otro gran modelo de desarrollo. Los

El pez cebra es un pequeño animal de agua dulce originario de ríos en la India y común en la actualidad en acuarios de todo el mundo. Tiene un tiempo de generación corto y en cada apareamiento produce una gran cantidad de huevos. Es un modelo principal del desarrollo de vertebrados: la fecundación es externa, de tal manera que son accesibles todos los as pectos del desarrollo y el embrión es transparente, lo que facilita identifi car mutantes del desarrollo. Los genes de importancia en el desarrollo de vertebrados suelen estar muy bien conservados y por consiguiente los genes que controlan el desarrollo humano tienen en condiciones norma les ortólogos reconocibles en el pez cebra. Las selecciones de mutagé nesls a gran escala proporcionaron un gran número de mutantes del desarrollo valiosos y algunos de ellos se emplean como modelo de tras tornos humanos (véase recuadro 20-6). Se ha usado asimismo la tecno logía de interferencia de RNA (véase antes) a fin de inactivar genes específicos. ► Pez soplador, como Takifugu rubripes rubripes (véase abajo) y Tetraodon nigroviridis (véase más adelante).

Tiene valor sobre todo en genómica comparativa (sección 12.3). El pez soplador posee un genoma muy compacto, casi con el mismo número de

232 j CAPITULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

R ecuadro 8 8. A n im a le s multicelulares m odelos ______________ fu n c ió n génica (co n tin ú a)

para com prender el desarrollo, las enferm edades y la

genes que los mamíferos, comprim ido en un genoma de sólo casi una séptima parte del tamaño de los genomas humano o del ratón. La con servación de exones y secuencias reguladoras importantes ayuda a iden tificar equivalentes humanos mediante mapeo comparativo (véase Clark, 1999).

► Medaka El medaka (Oryzias latipes) es un pez de agua dulce pequeño y ovíparo que se encuentra de manera predominante en Japón. Es un modelo de desarrollo cada vez más importante relacionado de form a distante con el pez cebra (los dos separados de un ancestro común tal vez hace más de 110 millones de años). Al igual que el pez cebra, es muy adecuado para los análisis genéticos y embriológicos, con un tiempo de generación cor to (dos a tres meses), cepas endogámicas, mapas genéticos, transgéne sis, atrapamiento de intensificadores y disponibilidad de células madre (Wlttbrodt y col., 2002). Los fenotipos recuperados de selecciones del desarrollo en medaka y el pez cebra señalan un espectro no superpuesto de fenotipos embrionarios y letales. POLLO

Las manipulaciones experimentales com unes en em briones de pollo incluyen m aniobras quirúrgicas e injerto de tejidos; transferencia gé nica mediada por retrovirus; electroporación de em briones en desa rrollo y cultivo em brionario. Además, el pollo sum inistra un sistema único para el estudio de procesos celulares: la línea de c élu las DT40. Las células DT40 del pollo continúan la diversificación de sus genes de inm unoglobulina y, com o hecho único entre las líneas de células de vertebrados disponibles, pueden llevar a cabo recom blnación hom o loga a un índice que se aproxima al de la recom binacíón ilegítim a. Co mo resultado, es posible efectuar en la línea celular cultivada deleción génica dirigida y análisis de m utación con relativa conveniencia. Se han logrado rápidos adelantos en transgénica de pollo, tecnología de célula madre (CM) em brionaria y criopreservación de esperma, célu las de blastodisco, células germen prim ordiales y células madre em brionarias (ME). Estas tecnologías más recientes harán posible la creación de sistem as basados en pollos para crear modelos de enfer medades humanas. XENOPUS (RANA AFRICANA CON GARRAS) La rana africana adquirió su nombre (xenopus, es decir, pata extraña) por las garras afiladas en los dedos de sus patas traseras membranosas fuer tes y grandes. Desde hace mucho tiempo es un modelo favorito de desa rrollo embrionario y biología celular; son accesibles todas las etapas del desarrollo y el tamaño comparativamente grande de los huevos y embrio nes muy tempranos facilita las micromanipulaciones, incluidos las microinyecciones (mRNA, anticuerpos y oligonucleótidos antisentido), injertos de células y experimentos de marcado. A mediados de la década de 1990 (véase Beck y Slack, 2001) se desarrollaron métodos potentes para gene rar embriones transgénicos y se han planeado selecciones para mutagénesis impresionantes para X. tropicalis.

El pollo tiene varias ventajas com o m odelo del desarrollo. Del m ism o modo que los mamíferos, las aves son amniotas (el embrión tiene membranas am nióticas) y su desarrollo se asemeja muy de cerca al de los mamíferos. Sin embargo, mientras que un em brión de mamífero depende de la madre para su nutrición (con intercam bio a través de la placenta), los embriones de aves no tienen placenta y por consiguien te son sistemas de autodesarrollo. Debido a que el em brión de pollo se desarrolla fuera del cuerpo, es accesible en todas sus etapas. Además de obtenerse con facilidad, el em brión del pollo tiene la ventaja de ser grande y relativamente transparente, lo que permite llevar a cabo con facilidad manipulaciones m icroquirúrgicas delicadas. En consecuen cia, representa un excelente sistema en el que es posible com binar es tudios moleculares con embriología habitual (véase Brown y cois., 2003). Fotografía de Amaya y cols., Trends Genet 1998;14:253-255, © Elsevier. ► Xenopus laevis (izquierda en la fotografía anterior) X. leavis tiene un tiem po de generación prolongado de uno a dos años y puede inducirse para que produzca a la vez 300 a 1 000 huevos, que son grandes (1 a 1.3 m m ). Ha resultado un gran modelo para estable cer los m ecanism os de las decisiones tempranas de destino, el patrón del plan básico del cuerpo y la organogénesis. Las contribuciones en biología celular y bioquím ica incluyen trabajo básico sobre replicación crom osóm ica, ensamble de crom atina y nuclear, componentes del c i clo celular, elementos citoesqueléticos y vías de señalamiento. X. lae vis tiene un genoma alotetraploide (se duplica un número muy elevado de genes com o resultado de un fenómeno de duplicación del genoma que ocurrió tal vez hace 30 millones de años, aunque muchos de los genes duplicados de manera original se perdieron desde entonces) y una desventaja notoria es que no ha sido fácil llevar a cabo análisis ge néticos.

8.4

PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

255i ^

Recuadro 8 8 . A n im a le s multicelulares m odelos para com prender el desarrollo, las enferm edades y la f u n c ió n gènica (con clusión) ► Xenopus tropicalis (derecha en la fotografía anterior) La rana X. tropicalis más pequeña tiene un tiem po de generación com parativamente corto ( < 5 meses) y puede inducirse para que produz ca 1 000 a 3 000 huevos a la vez, aunque más pequeños que los de X. laevis. Se relaciona desde el punto de vista evolutivo m uy de cerca con esta últim a, pero tiene un genoma diploide y es más dócil para los análisis genéticos. RATÓN

Es el organismo modelo que se consideró más importante para el pro yecto del genoma humano (véase Melsler, 1996). Es la especie de mamí fero con la genética más desarrollada y es un modelo del desarrollo de mamíferos que se utiliza con amplitud. Su tamaño pequeño y tiempo de generación corto hicieron posibles programas de mutagénesis a gran es cala y cruzamientos genéticos extensos, además de que varias caracte rísticas contribuyen al mapeo génico y de fenotipos (véase recuadro 14-2). En virtud del nivel de conservación de secuencias comparativa mente alto entre las secuencias de codificación humanas y del ratón, ca si todos los genes humanos tienen un homólogo en el ratón fácil de identificar. Están conservados segmentos cromosómlcos grandes entre el ratón y el hombre (figs. 14 -7 ,1 4 -8 ) y, por consiguiente, si se mapea a una gran resolución una región del genoma de ratón es posible utilizar la información para formular predicciones sobre la región ortóloga del ge noma humano (y viceversa). Esto es en particular relevante en Investiga ción médica porque el ratón ortólogo y las mutantes humanas suelen mostrar fenotipos similares, de tal manera que la clonación posicional de

a tres de los principales centros relacionados con el proyecto del ge noma humano: Wellcome Trust Sanger Institute, Whitehead Insti tute/MIT y Baylor College of Medicine. En abril del 2001, Celera anunció que su proyecto rival de secuenciación del ratón había proporcionado una cobertura seis veces mayor del genoma de ratón, incluidas las secuencias de tres cepas de ratón: 129Xl/SvJ, DBA/2J y A/J. No se dispuso libremente de los datos de la secuencia de Celera; por el contrario, se restringió el acceso a los que estuvieron preparados para pagar los elevados honorarios de suscrip ción. En mayo del 2002, el MSGS anunció que había completado un campo siete veces mayor del genoma del ratón C57BL/6J terminado en 96% y que pudo consultarse de inmediato en internet, antes de pu blicarse un artículo convencional en una revista en diciembre del 2002 (Mouse Genome Sequencing Consortium, 2002). Se dispuso de otras versiones de los datos de secuencia del ge noma del ratón como resultado del Ensembl proyect, una colabo

un gen de enfermedad en una especie puede tener una gran im portancia para la otra especie (sección 14.3.5). La capacidad para desarrollar rato nes con modificaciones genéticas predeterminadas de la línea germen (mediante tecnología transgénica y blancos génicos en células madre embrionarias) es un medio potente para estudiar la expresión y función génicas y crear modelos de enfermedades humanas en el ratón. Véase el capítulo 20 para más detalles. RATA

Las ratas, mucho más grandes que los ratones, son desde hace muchos años el mamífero de elección para análisis fisiológicos, neurológicos, far macológicos y bioquímicos. También pueden proporcionar sistemas ge néticos modelos para trastornos vasculares y neurológicos humanos complejos, com o hipertensión y epilepsia (por diversas razones no exis ten modelos de ratón para estas afecciones). No obstante, el análisis ge nético en ratas de laboratorio está mucho menos avanzado que en ratones, en parte debido al costo relativamente alto de los programas de apareamiento de ratas y la dificultad actual para modificar la línea germen de ratas mediante blancos génicos. Sin embargo, en fecha reciente se elaboraron mapas genéticos y físicos de alta resolución y en la actualidad se dispone de la secuencia genómlca.

ración entre el European Bioinformatics Institute y el Wellcome Trust Sanger Institute (http://www.ensembl.org/Mus musculus), a través de la University of California en Santa Cruz (http://genome.ucsc.edu/cgi-bin/hgGateway?db=mm2). Los datos de la estruc tura inicial de la secuencia sugirieron que el ratón tenía el mismo número de genes que el hombre (cerca de 30 000 o un poco me nos de esta cifra; véase Mouse Genome Sequencing Consortium, 2 00 2 ), pero con algunas diferencias interesantes (véase sección 12.4.1). Además de proporcionar datos importantes sobre los ge nes del ratón y la estructura de su genoma, los datos también han sido valiosos en la definición de la variación de la secuencia y en genóm ica comparativa. Por ejemplo, ha resultado muy útil la com paración con la secuencia del genoma humano para definir se cuencias muy conservadas (no sólo la codificación del DNA sino asimismo secuencias reguladoras y otras) y conocer la evolución del genoma (sección 12.3.2).

234

CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

Otros proyectos del genoma de metazoarios (véase cuadro 8-4)

► P ro yecto s d e l g en o m a d e la m osca. Además de Drosophila y proyectos del mosquito (sección 8.4.4), se inició asimismo un proyecto de genoma para la a b eja que es interesante por: a) sus instintos sociales potentes y caracteres conductuales únicos (útil para los neurobiólogos); b) su importancia en la salud hu mana (las posibles consecuencias relevantes de las picaduras de abeja y como modelo para resistencia a los antibióticos, inmu nidad, reacciones alérgicas, etc.; y c) su importancia para la co munidad agrícola como polinador.

► P royectos d e l gen o m a d e aves. El primero en la lista es el p o llo por su importancia como modelo de desarrollo (recuadro 8 - 8). ► P royectos d e l g en o m a d e p eces. Hacia fines del año 2002 se había obtenido la mayor parte de la secuencia genómica de dos especies de p e z sop la d or, un modelo de un genoma de verte brados compacto y del p ez cebra, un modelo del desarrollo y cada vez más importante de enfermedad y función genica (véa se cuadro 8-4 y recuadro 8 - 8 ). ► P royectos d e l gen o m a d e la rana. Como se detalla en el recua dro 8 - 8 , el X enopus es un modelo excelente del desarrollo y se estableció el compromiso de secuenciar el genoma de Xenopus tropicalis, que es más tratable desde el punto de vista genético que Xenopus laevis, que se ha estudiado más.

► P ro yecto s d e l g en o m a d e gu sa n os. Además de los proyectos para nematodos que viven libremente (el proyecto terminado de C. elegans [sección 8.4.3] y el proyecto más reciente para se cuenciar una especie relacionada de modo distante, C. briggsae [véase sección 12.3.2]), se desarrolló un importante proyecto de colaboración entre el Wellcome Trust Sanger Institute y la University of Washington y la University of Edinburgh a fin de

Cuadro 8-4, Proyectos de genomas de metazoarios importantes (animales multicelulares) (véase las lecturas adicionales para obtener fuentes de referencia electrónicas). Clase animal Especie (nombre común)

Tamaño del genoma

Centro de coordinación3

Ascidios

Ciona intestinalis (ascidia)

200 Mb

US DOE Joint Genome Institute

Aves

Gallus gallus (pollo)

1 200 Mb

Washington University

Peces

Brachydanio rerio (pez cebra) Fugu rubripes (pez soplador) Tetraodon nigroviridis (pez soplador)

1 900 Mb 400 Mb 350 Mb

Wellcome Trust Sanger Institute International Fugu Genome Consortium Genoscope, Paris

Ranas

Xenopus tropicalis

1 700 Mb

US DoE Joint Genome Institute

Insectos

Apis mellifera (abeja) /letfes aegypti (mosquito de la fiebre amarilla) Anopheles gambiae (mosquito del paludismo) Drosophila melanogaster (mosca de la fruta; región de eucromatina)

270 780 278 165

Baylor College of Medicine TIGR (The Institute for Genome Research) International (pero sobre todo Celera & Genoscope) Celera/Drosophila Genome Center/Howard Hughes Medical Institute

Drosophila pseudoobscura (región de eucromatina)

125 Mb

Baylor College of Medicine

Mamíferos

Sos taurus (vaca) Canis familiarís (perro) Mus musculus (ratón) Pan troglodytes (chimpancé común) Rattus norvegicus (rata)

3 2 2 3 3

Baylor College of Medicine Whitehead/MIT Mouse genome sequencing consortium/Celera Whitehead/MIT and Washington University Baylor College of Medicine

Gusanos redondos

Caenorhabditis elegans Caenorhabditis briggsae

100 Mb 80 Mb

Wellcome Trust Sanger Institute/WashingtonUniverslty Washington University

Erizo de mar

Strongylocentrotus purpuratus

800 Mb

Baylor College of Medicine (probablemente)

Mb Mb Mb Mb

000 800 500 500 100

Mb Mb Mb Mb Mb

aLas direcciones en la red para ios principales centros de secuenciación relacionados son las siguientes: Baylor College of Medicine of Genome Sequencing Center

http://hgsc.bcm.tmc.edu/

Celera

http://www.celera.com /

DoE Joint Genome Institute

http://www.jgi.doe.gov/

Genoscope

http://www.genoscope.cns.fr/

TIGR (The Institute for Genome Research)

http://www.tigr.org/

Washington University Genome Sequencing Center

http://genome.wustl.edu/

Wellcome Trust Sanger Institute

http://www.sanger.ac.uk/

Whitehead Institute/MIT Center for Genome Research

http://www-genome.wi.m it.edu

8.4

PROYECTOS DE GENOMAS PARA ORGANISMOS MODELOS

secuenciar cientos de miles de EST de alrededor de 20 especies de n em a tod os parásitos. Se incluye a Ascaris lumbricoides, que es el parásito nematodo más común de seres humanos y que se es tima que infecta a 1.47 mil millones de individuos (la afección puede ocasionar neumonía originada por la migración de los gusanos a través de los pulmones, bloqueo del tubo digestivo o los conductos biliar o pancreático; véase http://nematode.net). ► P royectos d e l gen o m a d e m am íferos. En fecha reciente se ini ciaron proyectos para secuenciar los genomas de: • el ch im p a n cé, el relacionado más de cerca con el hombre. El interés en la secuenciación del genoma del chimpancé proviene de un nexo evolucionista muy próximo al hombre. La información puede suministrar datos valiosos sobre en fermedades en las que las correspondientes en chimpancés son raras o así parece porque existen varios trastornos mé dicos que afectan a los seres humanos pero no a los chim pancés (p. ej., la progresión de HIV a sida, paludismo inducido por Plasmodium falciparum)-, véase Cyranoski [2002] y Olson y Varki [2003]; • la rata es un modelo valioso para investigación cardiovascular, psicológica y fisiológica. El Baylor College of Medicine anun ció una estructura preliminar de la secuencia del genoma y la envió al GenBank en noviembre de 2002. La secuencia incluye 90% del genoma (2 560 Mb del total estimado de 2 800 Mb; véase http://www.hgsc.bcm.tmc.edu/projects/rat/); • la vaca, o v eja y cerd o son animales de granja valiosos; • el p e r r o es un modelo de enfermedad valioso (los perros su fren muchas de las mismas afecciones que los seres huma

235

nos). El perro también es un modelo de importancia para genética de la conducta y se utiliza con amplitud en inves tigación farmacéutica. ► P royectos d e l g en o m a d e an im a les m a rin os sim ples. • El erizo d e m a r ha sido un sistema modelo notorio durante muchos años en el estudio de biología básica, en particular la biología del desarrollo. Es un deuterostoma y por consi guiente se relaciona en términos comparativos muy de cerca con vertebrados y el hombre (véase fig. 12-23). Existe un gran cúmulo de información sobre la expresión génica y el erizo de mar es un modelo útil para aprender la forma en que las vías de genes y proteínas regulan el crecimiento y el desarrollo. En fecha reciente se inició un proyecto de geno ma para Strongylocentrotus purpuratus. • Los a scid io s (llamados, asimismo, tunicados) son un grupo de animales marinos que pasan la mayor parte de su vida unidos a muelles, rocas o la parte inferior de botes. Pertene cen al phylum urochordata y se relacionan en realidad más de cerca con los vertebrados que la mayor parte de otros animales invertebrados. Ciona intestinalis tiene el genoma más pequeño de cualquier cordado manipulable por medios experimentales y proporciona un buen sistema para explo rar los orígenes evolucionistas del linaje cordado. Dehal y colaboradores (2002 ) publicaron un esquema de la secuen cia del genoma de C. intestinalis. El genoma de 117 Mb tie ne alrededor de 16 000 genes y análisis genómicos comparativos con genomas de vertebrados secuenciados han suministrado valiosa información sobre la evolución de cordados y vertebrados.

Lecturas adicionales Borsani G, Ballabio A, Banfi S (1998) Una guía práctica para orientarse personalmente en el laberinto de bases de datos so bre el genoma. Hum. Mol. Genet. 7, 1641-1648. Ejemplar de Base de datos of Nucleic Acid Research (2003) Nucí. Acid Res. 31, 1-516. Hedges SB (2002) The origin and evolution of model organism. Nature Rev. Genet. 3, 838-849. Ejemplar de Nature sobre el Genoma humano (15 de febrero 2001). Nature 409, 813-958 (los artículos están disponibles electrónicamente en http://www.nature.com/genomics/human/). Ejemplar de Science sobre el Genoma humano (16 de febrero 2001). Scbnce 291,1177-1351 ((los artículos están disponibles electrónicamen te en http:/A«ww.sciencemag.org/contenWol291/issue5507/index.shtml). Ejemplar de Nature sobre el Genoma del ratón (5 de diciem bre 2002). Nature 420, 509-590 (los artículos están disponibles electrónicamente en http:/AAWw.nature.com/nature/mousegenome/index.html/). Guía para usuarios sobre el Genoma humano Nature Genetics Supplement, Septiembre de 2002 (disponible electrónicamente a través de Nature Genome Gateway en http:/Mww.nature.com/genomics/). Wilkie T (1993) Perilous Knowledge: the Human Genome Project and is Implications. Faber and Faber, New York. Información electrónica sobre el Gene Ontology Consortium en http://www.geneontology.org/) Información electrónica sobre el Proyecto del genoma huma no (y proyectos relacionados); puede encontrarse en mu chos sitios. Los sitios útiles en la red incluyen los siguientes:

• el U.S. N a tio n a l H u m a n G e n o m e R e se a rch In stitute (NG H R I) en http://www.nghri.nih.gov/ • el U.S. N a tio n a l C e n te r fo r B io te c h n o lo g y In form ation (N CB I) en http://www.ncbi.nlm.nih.gov/ • el Genome Web maintained at the UK Human Genome Mapping Resource Centre en http://www.hgmp.mrc.ac.uk/GenomeWeb/ • la Genome Web conservada en el http://www.nature.com/genomics/ Información electrónica sobre Proyectos de genomas para microorganismos y organismos modelo; pueden encontrar se en diversos sitios, que incluyen: • Base de datos sobre el genoma microbiano TIGR, en http://www.tigr.org/tdb/mdb/mdbcomplete.html y http://www.tigr.org/tdb/mdb/mdbinprogress.html • The European Bioinformatics parasite genome webpage en http://www.ebi.ac.uk/parasites/paratable.html • Página en la red sobre el genoma parasitario http://www.rna.ucla.edu/par/ • The U.S. national Human Genome Research Institute's sitio en la red http://www.genome.gov/Pages/Research/Sequencing/ Proposals/ Información electrónica sobre Organismos modelo, incluyen: • El sitio de organismo modelo de NIH, en http://www.nih.gov/science/models

236 I CAPÍTULO OCHO

PROYECTOS DEL GENOMA Y ORGANISMOS MODELOS

• La Model Organisms Virtual Library en http://www.ceolas.org/VL7mo/ • El sitio de NCBI Model Organisms en http://www.ncbi.nlm.nih.gov/About/model/ • Glosario de organismos Modelo y otros, en http://www.genomicglossaries.com/content/rnodelorganisms.glossary.asp • Proyecto en la red el Tree of Life, en http://tolweb.org/tree/ Listas de resúmenes electrónicos de todos los Proyectos de genomas; pueden encontrarse en diversos sitios, incluyendo: • Una lista de proyectos de genomas terminados y en curso recopilados por Integrated Genomics en http://ergo.integratedgenomics.com/GOLD/

• Una lista de proyectos de genomas terminados y en curso recopilados por the European Bioinformatics Institute en http://www2.ebi.ac.uk/genomes/ Indagadores del Genoma humano y bases de datos integra das, incluyen: • Ensembl en http://www.ensembl.org • NCBI Map Viewer en http://www.ncbi.nlm.nih.gov/cgibin/Entrez/map-search • UCSC Genome Browser en http://genome.ucsc.edu • Base de datos integrada The HOWDY en http://www.alis.tokyo.jst.go.jp/HOWDY

Bibliografía Adams MD, Kelley JM, Gocayne JD ef al. (1991) Complementary DNA sequencing: expressed sequences tags and Human Genome Project. Science 252, 1651-1656. Adams MD, Celniker SE, Holt RA ef al. (2000) The genome sequence oWrosophila melanogaster. Science 287, 2185-2195. Banfi S, Borsani G, Rossi ef al. (1996) Identification and map ping of human cDNAs homologous to Drosophila mutant genes through EST database searching. Nature Genet. 13, 167-174. Batzoglou S, Pachter L, Mesirov JP, Berger B, Lander ES (2000) Human and mouse gene structure: comparative analysis and application to exon prediction. Genome Res. 10, 950-958. Beck CW, Slack JM (2001) An amphibian with amphibian: a new role for Xenopus in the 21st century. Genome Biol. 2, 1029.11029.5. Botstein D, White RL, Skolnick M, Davis RW (1980) Construction of a genetic linkage map in man using restriction fragment length polymorphism. Am. J. Hum. Genet. 32, 314331. Botstein D, Chervitz SA, Cherry JM (1997) Yeast as a model organism. Science 277, 1259-1260. Brown WRA, Hubbard SJ, Tickle C, Wilson SA (2003). The chicken as a model for large scale analysis of vertebrate gene function. Nature Rev. Genet. 4, 87-98. Burge C, Karlin S (1997) Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268, 78-94. C. elegans Sequencing Consortium (1998) Genome sequence of the nematode C. Elegans: a platform for Investigating biology. Science 282. 2012-2017. Camargo AA, de Souza SJ, Brentani RR, Simpson AJG (2002) Human gene discovery through experimental definition of trans cribed regions of the human genome. Curr. Opin. Chem. Biol. 6, 13-16. Cavalli-Sforza LL, Wilson AC, Cantor CR, Cook-Deegan RM, King MC (1991) Call for a worldwide survey of human genetic diversity: a vanishing opportunity for the Human Genome Project. Genomics 11, 490-491. Chumakov IM, Rigault P, Le Gall I ef al. (1995) A YAC contig map of the human genome. Nature 377, 175-297. Clark MS (1999) Comparative genomics: the key to understanding the Human Genome Proyect. Bioessays 21, 121-130. Cohen D, Chumakov I, Weissenbach J (1993) A first generation physical map of the human genome. Nature 366, 698-701. Collins FS, McKusick VA (2001) Implications of the human genome project for medical science. J. Am. Med. Assoc. 285, 540-544.

Collins F, Guyer MS, Chakravarti A (1997) Variations on a theme: cataloging human DNA sequence variation. Science 262, 43-46. Cox DR, Burmeister M, Proce ER, Kim S, Myers RM (1990) Radiation hybrid mapping: a somatic cell genetic constructing high-resolution maps of mammalian chromosomes. Science, 250. 245-250. Craig JM, Bickmore WA (1994) The distribution of CpG islands In mammalian chromosomes. Nature Genet. 7, 376-381. Cuthbert AP, Trot DA, Ekong RM ef al. (1995) Construction and characterization of a highly stable human: rodent monochromosomal hybrid panel for genetic complementarion and genome mapping studies. Cytogenet. Cell Genet. 71, 68-76. Cyranoski D (2002) Almost human. Nature 418, 910-912. Danesh J, Newton R, Beral V (1997) A human germ project? Nature 389, 21-24. Davies KE, Young BD, Elies RG, Hill ME, Williamson R (1981) Cloning of a representative genomic library of the human X chromosome after sorting by flow cytometry. Nature 293, 374376. Dehal P, Satou Y, Campbell RK (2002) The draft genome of Ciona intestinalis: insights into chordate and vertebrate origins. Science 298, 2157-2167. Deloukas P, Schuler GD, Gyapay G ef al. (1998) A physical map of 30,000 human genes. Science 282. 744-746. Doolittle RF (2002) Microbial genomes multiply. Nature 416, 697700. Dunham I, Shimizu N, Roe BA ef al. (1999) The DNA sequence of human chromosome 22. Nature 402, 489-495. Gardner MJ, Shallom SJ, Carlton JM ef al. (2002) Genome se quence of the human malaria parasite Plasmodium falciparum. Nature 419, 498-511. Garver KL, Garver B (1994) The Human Genome Project and eugenic concerns. Am. J. Hum. Genet. 54, 148-158. Gene Ontology Consortium (2000) Gene ontology: tool for the unification of biology. Nature Genet. 25, 25-29. Gene Ontology Consortium (2001) Creating the gene ontology resource: design and implementation. Genome Res. 11, 14251433. Goffeau A, Bernal BG, Bussey H ef al. (1996) Life with 6000 genes. Science 274, 546-567. Greely HT (2001) Human genome diversity: what about the other human genome proyect? Nature Rev. Genet. 2, 222-227. Hedges SB (2002) The origin and evolution of model organisms. Nature Rev. Genet. 3, 838-849.

CAPÍTULO NUEVE

«- ■ . ■ ■ ■ i

Organización del genoma humano Contenido del capítulo 9.1 9.2

Organización general del genoma humano Organización, distribución y función de genes RNA humanos

9.3

Organización, distribución y función de genes humanos que codifican polipéptidos

9.4

DNA no codificante de repetición tándem

9.5

DNA no codificante repetido disperso

Recuadro Recuadro Recuadro Recuadro Recuadro

9-1 9-2 9-3 9-4 9-5

Variación del número de copias del genoma en células humanas Autonomía limitada del genoma mitocondrial Metilación del DNA e islotes CpG Especificidad de anticodón de tRNA citoplásmico eucariota Genoma humano y estadísticas de genes humanos

240

CAPÍTULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

9.1

Organización general del genom a hum ano

9.1.1 Generalidades del genoma humano Genoma humano es el término que se utiliza para describir la infor mación genética total (contenido de DNA) de las células humanas. En realidad, comprende dos genomas: un gen o m a n u clea r complejo con unos 30 000 genes y un gen o m a m itoco n d ria l muy simple con 37 genes (fig. 9-1). El genoma nuclear proporciona el gran volumen de información genética esencial, que en su mayor parte especifica la síntesis de polipéptidos en ribosomas citoplásmicos. Las mitocondrias poseen ribosomas propios y los muy pocos ge nes del genoma mitocondrial que codifican polipéptidos producen mRNA que se traduce en los ribosomas mitocondriales. Sin embar go, el genoma mitocondrial sólo especifica una porción muy peque ña de las funciones mitocondriales específicas; el mayor volumen de los polipéptidos mitocondriales lo codifican genes nucleares y se sintetiza en ribosomas citoplásmicos, antes de llevarse al interior de las mitocondrias. Las comparaciones entre seres humanos y ratones demostraron que menos de 5% del genoma está conservado de forma notoria, incluido 1.5% para el DNA codificante y un porcentaje un poco mayor que comprende secuencias conservadas dentro de secuencias no traducidas, elementos reguladores, etc. (Mouse Genome Sequencing Consortium, 2002; Dermitzakis y cois., 2002). Casi todo el DNA codificante se emplea para elaborar mRNA y en conse cuencia polipéptidos, pero una minoría importante (cuando menos 5% y tal vez casi 10%) de los genes humanos especifica RNA no

1 .5 %

codificante (es decir, no traducido) (gen es RNA). En fecha recien te se identificó una diversidad de genes RNA nuevos, lo que obli gó a una revaloración de la función del RNA. Las secuencias codificantes pertenecen con frecuencia a familias de secuencias relacionadas (fam ilias d e secu en cia s d e DNA) que pueden organizarse en grupos en uno o más cromosomas o disper sarse. Estas secuencias duplicadas surgieron por diversos mecanis mos de d u p lica ció n g é n ica que ocurrieron en el transcurso de la evolución. La secuenciación del genoma proporcionó la primera valoración de la duplicación de todo el genoma y reveló una canti dad considerable de d u p lica ció n segm en ta ria específica de prima tes (como resultado de duplicaciones muy recientes se encuentran bloques de secuencias relacionados muy de cerca en diferentes cro mosomas o distintas regiones de un cromosoma aislado; sección 12.2.5 y fig. 12-13; véase Bailey y cois., 2002). Los mecanismos que dan lugar a genes duplicados también ori ginan secuencias no funcionales relacionadas con el gen, entre ellas seu d o gen es y fr a g m en to s g é n ico s (sección 9.3.6). Existen numero sas copias defectuosas de genes RNA diseminadas en la totalidad del genoma; asimismo, para algunos genes que codifican polipépti dos también se encuentran muchos genes relacionados: análisis de las secuencias terminadas de los cromosomas 21 y 22 predicen un total cercano a 20 000 genes en el genoma (Harrison y cois., 2002; Collins y cois., 2003). Al igual que en otros genomas complejos, un componente muy considerable del genoma humano está constituido por DNA no c o difica n te. Un componente valorable está organizado en repeticio nes tándem de cabeza a cola (-►-*-> ~f), pero la mayor parte consiste en repeticiones dispersas que se originaron de transcritos de RNA

-3% -5 %

115 kb de largo!)

5 ' UTR

Promedio alrededor de 0.2-0.3 kb

3 ' UTR

Promedio alrededor de 0.77 kb pero es probable que sea una subestimación por menos información de 3 ' UTR largas

Tamaño del RNA no codificante Tamaño de polipéptidos

Muy variable; de - 2 1 - 2 2 nucleótidos (micro-RNA) a muchos kb, p. ej., XIST (17 kb) Promedio alrededor de 500-550 aminoácidos

Polipéptido más grande

Titin: 38 138 codones en el gen titin (pero variación de longitud considerable)

Polipéptidos mas pequeños

Decenas de aminoácidos, p. ej., varias hormonas pequeñas, etc.

en la familia génica homeobox HOX, que consiste en grupos de anos 10 genes en cada uno de cuatro cromosomas, genes indivi duales en diferentes cromosomas pueden estar más relacionados entre sí que respecto de los miembros del mismo grupo génico (fig. .2-9). Además de lo anterior, genes que codifican isoformas especír.cas de tejido relacionadas, o isozimas específicas de compartimien to subcelular, casi siempre se localizan en diferentes cromosomas véase cuadro 9-8).

Genes relacionados en sentido funcional Algunos genes codifican productos que es muy posible que no ten gan una secuencia relacionada muy cercana, pero se relacionan con claridad desde el punto de vista funcional. Los productos pueden ser subunidades de la misma proteína o estructura macromolecular, componentes de la misma vía metabólica o del desarrollo o tal vez se requieran para enlazarse de manera específica entre sí como los

256 1 CAPÍTULO NUEVE | ORGANIZACIÓN DEL GENOMA HUMANO

Cuadro 9-6. Tamaños promedio de exones e intrones en genes humanos. Producto génico

Tamaño del gen (kb)

Número de exones

Tamaño promedio de exón (pb)

Tamaño promedio de intrón (pb)

tRNA,ír

0.1

2

50

20

Insulina

1.4

3

155

480

Globina p

1.6

3

150

490

HLA clase 1

3.5

8

187

260

Albúmina sérica

18

14

137

1 100

Colágena tipo VII

31

118

77

190

Complemento C3

41

29

122

900

Hidroxilasa de fenilalanina

90

26

96

3 500

Factor VIII

186

26

375

7100

CFTR (fibrosis qulstlca)

250

27

227

9100

Titin

283

363

315

466

2 400

79

180

30 770

Distrofina

Cuadro 9-7. Ejemplos de DNA intragénico de codificación repetida a gran escala. Producto génico

Tamaño de repetición codificada en aminoácidos

Núm. de copias

Homología de secuencia de nucleótidos entre copias

Involucrina

10

59

Homología alta para 39 repeticiones centrales

¿Apolipoproteína? (a)

114 = repeticiones parecidas a kringle 4a

37

Homología alta; 24 de las repeticiones tienen una secuencia idéntica

Plasminógeno

~ 75-80

Colágena

18

Albúmina sérica

195

3

Homología baja

Genes de proteínas ricos en prolina

16-21

5

Homología baja

Tropomiosina de cadena a

42

7

Homología baja

Inmunoglobullna de cadena e, región C

108

4

Homología baja

Distrofina

109

24

Homología baja

5

57

Homología baja pero dominios proteínicos conservados (kringles3) Homología baja pero elementos de aminoácidos conservados basados en (Gli-X-Y)6

aUn kringle es una secuencia rica en cisterna que contiene tres puentes disulfuro internos y crea una estructura en forma de “pretzel".

ligandos y sus receptores importantes. En casi todos estos casos, los genes no están agrupados y suelen hallarse en diferentes cromoso mas (véase cuadro 9-8 para algunos ejemplos).

9.3.3 En ocasiones se encuentran en el genoma humano genes superpuestos, genes dentro de genes y unidades de transcripción policistrónicas Organización génica bidireccional y genes superpuestos de modo parcial Los genomas simples tienen densidades génicas altas (por lo gene ral uno por 0.5 kb, 1 kb y 2 kb en los genomas de mitocondrias

humanas, E. coli y S. cerevisiae, respectivamente) y a menudo muestran ejemplos de genes superpuestos de forma parcial. Pue den utilizarse diferentes marcos de lectura, algunas veces de una cadena en sentido común (véase fig. 9-3). Los genes de organismos complejos están mucho menos agrupados (sólo un gen por 100 kb en el genoma nuclear humano) y no son tan comunes los genes su perpuestos. Sin embargo, en ocasiones se encuentran genes veci nos muy cercanos, algunos con sus extremos 5' separados por unos cuantos cientos de nucleótidos y que se transcriben de cadenas opuestas. Esta o rga n iz a ción g é n ica b id ire ccio n a l suele encon trarse, por ejemplo, en los genes de reparación de DNA y pueden proporcionar regulación común del par génico (Adachi y Lieber, 2002).

9.3

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

257

Cuadro 9-8. Distribución de genes que codifican productos relacionados desde el punto de vista funcional. Genes que codifican

Organización

Ejemplos

El mismo producto

Con frecuencia agrupados pero también pueden estar en diferentes cromosomas

Los dos genes de globina a en 11p (fig. 9-11); genes que codifican rRNA (fig. 10-2); algunas subfamlias de histona (véase httD://aenome.nhari.nih.aov/histones/chrmaD.shtmh

Isoformas o isozimas de proteína específica de tejido

En ocasiones agrupados; algunas veces no sinténicos

Agrupamiento de genes de amilasa pancreática y salival (1p21); no hay sintenia de genes de actina a expresados en músculo esquelético (1 p) y cardiaco (15q)

Isozimas en diferentes compartimientos celulares

Por lo general no sinténica

Isozimas citoplásmica (c) y mitocondrial (m) para diversas enzimas, p. ej., deshidrogenasa de aldehido (c)-9q y deshidrogenasa de aldehido (m)-12q; cinasa de timidina (c)-17q y cinasa de timidina (m)-16q

Enzimas en la mism a vía metabòlica

Por lo general no sinténica

Genes de enzimas codificantes en esteroidogénesis: hidroxilasa 8q de 1 1 esteroides; hidroxilasa 1 0q de 17 esteroídes; hidroxilasa 6p de 21 esteroides

Subunidades de la misma proteína

Por lo general no sinténica

Globina a -1 6p y globina (3-11 p; cadena pesada de ferritina 11 q y cadena ligera de ferritina 22q

Componentes de vía de señal que interactúan

Por lo general no sinténica

JAK1 -1 p; STAT1-2q

Ligando más receptor relacionado

Por lo general no sinténica

Insulina 11 p y receptor de insulina 19p; interferón p-9p; interferón p de receptor 21 q

Los g e n e s su p erp u estos d e fo r m a p a r cia l en los genomas nu cleares compuestos de mamíferos son raros y, cuando se presentan, suelen transcribirse a partir de dos cadenas de DNA diferentes. Se observa una agrupación génica fuerte en regiones subcromosómicas con abundancia de GC y las regiones de densidad génica en parti cular alta muestran con frecuencia algunos casos de genes super puestos. Por ejemplo, la región clase III del complejo HLA en 6p21.3 tiene una densidad génica aproximada de casi un gen por ! 5 kb y se sabe que incluye varios ejemplos de genes superpuestos fig. 9-8A).

Genes dentro de genes Los genes RNA nucleolares pequeños (snoRNA) son poco comunes porque casi todos están localizados dentro de otros genes, a menudo algunos que codifican una protema vinculada con el ribosoma o una proteína nucleolar. Es posible que esta disposición se conservara pa ra permitir la producción coordinada de proteínas y componentes de RNA del ribosoma (Tycowski y cois., 1993). Además de los genes ¿noRNA, algunos otros, incluidos varios genes que codifican polipéptidos, se hallan dentro de intrones de genes más grandes. Los eiemplos ilustrativos son el gen NF1 (neurofibromatosis tipo I; tres genes internos pequeños transcritos de la cadena opuesta; véase fig. 9-8B); el gen F8 (factor VIII de la coagulación sanguínea; dos genes internos transcritos en direcciones opuestas; véase fig. 11-20 ); y el gen RB1 (susceptibilidad al retinoblastoma; un gen interno transcri to de la cadena opuesta; véase fig. 9-19).

_ nidades de transcripción policistrónicas unidades de transcripción policistrónicas (es decir, multigénison comunes en los genomas simples de bacterias y asimismo encuentran con gran frecuencia en C. elegans. El genoma mitoa» d ria l humano simple (sección 9.1.2.) y los grupos mayores del

gen rRNA (fig. 10-2) proporcionan dos ejemplos de unidades de transcripción policistrónica en el genoma humano. Además, se co nocen algunos ejemplos raros de unidades de transcripción bicistrónicas que codifican polipéptidos en el genoma nuclear: la transcripción se inicia a partir de un gen y continúa a través de un gen contiguo corriente abajo para suministrar una proteína precur sora que se corta para proporcionar diferentes proteínas. Por lo regular se considera que las cadenas A y B de la insulina derivan de una unidad de transcripción bicistrónica (fig. 1-23), pe ro están relacionadas de manera estrecha desde el punto de vista fun cional. Sin embargo, algunas veces las unidades de transcripción bicistrónicas generan proteínas distintas desde el punto de vista fun cional. Por ejemplo, los genes UBA52 y UBA80 crean ubiquitina y una proteína ribosómica, S27a o L40, respectivamente. Otros genes de ubiquitina están organizados como repeticiones tándem de se cuencia codificante completa que forman unidades de transcripción policistrónicas (véase Nei y cois., 2000). En los genes de ubiquitina no hay intrones pero en otras unidades de transcripción bicistróni cas se requiere empalme (corte y unión) para enlazar transcritos de exones de un gen en los de un gen corriente abajo. La unidad de transcripción SNURF-SNRPN proporciona un ejemplo de dos po lipéptidos codificados por diferentes exones (Gray y cois., 1999), pe ro también se utiliza para hacer transcritos de RNA no traducidos que se improntan de forma paterna; véase la figura 10-24.

9.3.4 Las familias génicas que codifican polipéptidos pueden clasificarse de acuerdo con el grado y extensión de la relación de la secuencia en miembros de la familia Un gran porcentaje de genes humanos que se expresan de modo ac tivo, y codifican RNA no codificante y polipéptidos, es miembro de familias de secuencias de DNA que muestran una gran simili-

258

CAPITOLO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

A) C4B

PBX2 G18

1C7

CYP C4A 21 Ps / G11

G5b CKIIB

G11a RD G10 ' Bf I G9

I G15 TN-X I G14 \ X I / G13

/ / C2

\B 1 4 4

LTB nb6 1kBL

MICA NOB1 NOB2

PERB10 \ 2

\

I P5-6

BAT1 PERB6 \ \ \ / DHFRPs MICB \ \ \ \ | / / 1 7 NOB3

I G9a | G8 \

PPIPs

1200

I 1400

1300

I 1500

T

T 1600

---I------- 1 1700

---- 1 ----

---- 1 ----

---- 1 ---- n— i

1900

1800

2000

(2080)

0.9 Mb: -70 genes B) Cadena de sentido del gen NF1

E xó n 2 6 —

Exó n 27

Intrón

►

26 3'

5' I 1 ------

5'

Cadena antisentido 3 ' L del gen NF1

OGMP

i-------- 1 2.2 kb

EVI2B

h-

EVI2A

I10 kb

H 4 kb

Fig. 9-8. Genes superpuestos y genes dentro de genes. A) Genes superpuestos. Los genes en la región clase III del complejo HLA están empacados de forma estrecha y superpuestos en algunos casos. B) Genes dentro de genes. El intrón 26 del gen de la neurofibromatosis tipo 1 (NF1) contiene tres genes de dos exones internos cada uno transcritos de la cadena opuesta a la utilizada para transcribir el gen NF1. Los genes son: OGMP, glucoproteína de mielina del oligodendrocito; EVI2A y EVI2B, homólogos humanos de genes murinos que tal vez participen en la leucemogénesis y se localicen en sitios de integración viral Bcotrópicos.

tud secuencial. Sin embargo, la extensión de la secuencia comparti da y la organización de los miembros de la familia pueden variar en gran proporción. Es posible que muchos miembros de la familia no sean funcionales (seudogenes y fragm entos génicos; véase más adelan te) y acumulen en poco tiempo diferencias de secuencias, que con ducen a una divergencia secuencial notable.

Familias génicas comunes Los miembros de familias génicas comunes muestran una gran ho mología de secuencias en la mayor parte de la longitud del gen o, cuando menos, en el componente de DNA codificante. Los ejemplos incluyen familias del gen de histona (las histonas están muy conser vadas y los miembros de subfamilias son virtualmente idénticos) y las familias del gen de las globinas a y (3 (los miembros de una familia individual muestran un alto grado de similitud secuencial).

Familias génicas que codifican productos con dominios grandes y muy conservados En algunas familias génicas hay una homología en especial notable dentro de regiones específicas de los genes muy conservadas; la si militud secuencial correspondiente entre la porción restante de la secuencia codificante en los diferentes genes puede ser muy baja. A menudo, estas familias codifican factores de transcripción que tie nen funciones importantes en el desarrollo temprano y la secuencia conservada codifica un dominio proteínico que se requiere para en lazarse de forma específica al DNA de genes blancos seleccionados (véase cuadro 9-9).

Familias génicas que codifican productos con secuencias típicas conservadas de aminoácidos cortos Es posible que algunos miembros de ciertas familias génicas no se relacionen de forma evidente a nivel de las secuencias de DNA, pe ro no obstante codifican productos génicos que se caracterizan por una función general común y la presencia de secuencias típicas muy cortas conservadas, como la caja DEAD, la secuencia Asp-Glu-AlaAsp (DEAD en el código de una letra de aminoácidos) o la repeti ción WD (triptófano-aspartato); véase la figura 9-9.

Superfamilias génicas Los miembros de una superfamilia de genes se relacionan de mo do mucho más distante en términos evolucionistas que los de una familia de genes de dominio/secuencia típica común o conservada. Codifican productos relacionados desde el punto de vista funcional en un sentido general y sólo muestran una homología de secuencia muy débil en un segmento grande, sin secuencias típicas de ami noácidos conservadas muy importantes. Por el contrario, es posible que haya algunas pruebas de características estructurales generales comunes y una función general vinculada. Los ejemplos ilustrativos son: ► la su p erfa m ilia d e in m u n o glob u lin a (fig. 9-10): una familia muy grande que incluye los genes de inmunoglobulina (Ig), ge nes del receptor de célula T, genes HLA y muchos otros. Los ge nes codifican productos divergentes en grado considerable a nivel secuencial, pero que funcionan en el sistema inmunitario y contienen dominios parecidos a inmunoglobulina (Ig);

9.3

j

ORGANIZACIÓN, DISTRIBUCIÓN Y FUNCIÓN DE GENES HUMANOS QUE CODIFICAN POLIPÉPTIDOS

259

Cuadro 9-9. Ejemplos de genes humanos con elementos de secuencia típica que codifican dominios muy conservados. Fam ilia génica

N úm ero de genes

Elem entos de secuencia típ ic a/d o m in io

Genes homeobox

38 genes HOX (véase fig. 12-9) más 214 genes homeobox huérfanos

Homeobox especifica un homeodominio de unos 60 aminoácidos. Se ha definido una amplia variedad de diferentes subclases

Genes PAX

9

Box pareada codifica un dominio pareado de - 1 2 8 aminoácidos; los genes PAX suelen tener además un tipo de homeodominio conocido como homeodominio tipo pareado

Genes SOX

18

Caja HMG parecida a SRY que codifica un dominio de unos 69 aminoácidos

Genes TBX

18

Caja T que codifica un dominio de unos 170 aminoácidos

Genes de dominio en horquilla

49

El dominio en horquilla tiene - 1 1 0 aminoácidos de largo

Genes de dominio POU

24

El dominio POU tiene - 1 5 0 aminoácidos de largo

A)

C a ja D E A D 2 2 -4 2

nh

B)

2—

axxgxgkt

1 9 -2 9 PTR ELA

6 -9 4

1 7 -2 9

1 7 -2 3 TPGR

GG

19-51 DEAD

1 1 5 -1 9 2 SAT

2 0 -2 5 ARGXD

H R IG R — C O O H

23-41

R e p e tic ió n W D ( -------------------G H ------------------- W D

j

) n = 4 -1 6

C e n tro

Fig. 9-9. Algunas familias génicas se definen por productos génicos relacionados desde el punto de vista funcional que llevan secuencias típicas muy cortas de aminoácidos conservados. A) Secuencias típicas en la familia caja DEAD. Esta familia génica codifica productos relacionados con los procesos celulares que incluyen la alteración de la estructura secundaria del RNA, como el inicio de traslación y empalme (corte y unión). Son obvias ocho secuencias típicas de aminoácidos muy Dien conservadas, incluida la caja DEAD (Asp-Glu-Ala-Asp). Los números se refieren a los límites de tamaño que suelen encontrarse en secuencias ntermedías de aminoácidos (véase Schmid y Linder, 1992). X, cualquier aminoácido. Véase la contraportada para el código de aminoácidos de una letra. B) Familia repetida WD. Esta familia génica codifica productos que participan en una diversidad de funciones reguladoras, como la regulación de la división celular, transcripción, señalamiento transmembranoso, modificación de mRNA, etc. Los productos génicos se caracterizan por cuatro a 16 repeticiones tándem de WD, que consisten en alrededor de 44 a 60 aminoácidos cada una y que contienen una secuencia central de longitud fija que comienza con un dipéptido GH (gii-his) y termina en el dipéptido WD (Trp-Asp) precedido por una secuencia de longitud variable (véase Smith y cois., 1999).

► la su p erfa m ilia d e globin a : una familia pequeña que no sólo incluye los miembros de las familias génicas de las globinas a y (3 (fig. 9-11) que funcionan en el transporte de oxígeno y el al macenamiento de sangre, sino también genes equivalentes que codifican globinas musculares y cerebrales, mioglobina y neuroglobina, respectivamente (véase fig. 12-4); ► la su p erfa m ilia d e l recep to r a co p la d o a p r o te ín a G: una fa milia muy grande y diversa de receptores que median señales in ducidas por ligando entre los ambientes extracelular e intracelular a través de la interacción con proteínas G intracelulares. Comparten una estructura común de siete segmentos transmembranales de hélice a , pero casi siempre tienen una si militud secuencial baja (< 40%) entre sí.

9.3.5 Los genes en familias génicas humanas pueden estar organizados en grupos pequeños o esparcidos con amplitud, o ambas cosas Las familias génicas humanas pueden clasificarse en las que mues tran pruebas de agrupamiento génico cercano y las que se encuen tran diseminadas en varios sitios cromosómicos diferentes. Sin embargo, esta clasificación es un poco arbitraria ya que algunas fa milias génicas consisten en múltiples grupos de genes en diferentes sitios cromosómicos (véase cuadro 9-10) y otras, como la familia de genes de histona (http://genome.nhgri.nih.gov/histones/chrmap.shtml), pueden estar dominadas por uno o dos grupos grandes pero también tienen varios g en es h u érfa n o s esparcidos.

260

CAPITULO NUEVE

ORGANIZACIÓN DEL GENOMA HUMANO

C adena lig era C adena^ pesada

bQ

\

c°-

G ! G

\ \ \

!

g

g

ì

S^~ x

(

I V

.^ s

v_>s

T4

V

I

T8

)

C adena pesada

v

Q HBII-52

a

a

um L

$ $

$

li ni i nu 111— r UBE3A

Cl

I

Fig. 10-24. Grupo del gen impronto en 15q11-q13 relacionado con el síndrome de Prader-Willi/síndrome de Angelman. Las flechas muestran la dirección de la transcripción. Los genes improntos que codifican polipéptidos incluyen UBE3A y ATP10C, que se expresan de manera preferencial del cromosoma 15 materno, y MKRN3, NDN y MAGEL2, que se expresan de manera preferencial del cromosoma 15 paterno. Ade más la unidad de transcripción compleja SNURF/SNRPN (> 148 exones; y se extiende más de 460 kb para superponerse en el gen UBE3A y quizás en el gen ATP10C) es impronta. Codifica dos proteínas (la proteína SNURF, codificada por los exones 1 a 3, y la proteína espliceosómica SNRPN codificada por los exones 4-10) así com o ciertos transcritos de RNA (no se muestran aquí, pero en la bibliografía se conocen com o IPW, PAR5, UBE3AS, etc.) y puede regular los genes UBE3A y ATP10C como un regulador RNA antisentido. Aunado a esta complejidad se localiza un total de 79 secuencias snoRNA dentro de los intrones de la unidad de transcripción SNURF/SNRPN, que comprende una copia de cada uno de HBII-436, HBII-13, HBII-437 (un probable seudogén), dos copias idénticas pero separadas de HBII-438, 27 copias de HBII-85 y 47 copias de HBII-52 (se muestran como líneas verticales gran des comparadas con las líneas verticales pequeñas para los exones SNURF/SNRPN; véase Runte y cois., 2001). Casi todas estas copias (excepto HBII437) se expresan paternamente, en especial en el cerebro, y pueden tener un efecto directo en el síndrome de Prader-Wiíli (Gallagher y cois., 2002). Cl, centro de improntación. Adaptado de Runte y cois. (2001) Hum. Mol. Genet. 10 (23): 2687-2700, con autorización de Oxford Universíty Press.

Las observaciones anteriores sugieren que debe disponerse de algún mecanismo para diferenciar entre alelos heredados de la ma dre y el padre: conforme los cromosomas pasan a través de las lí neas germinales masculina y femenina deben adquirir cierta impronta para señalar una diferencia entre alelos paternos y mater nos en el organismo en desarrollo. Un componente fundamental,

cuando menos para conservar el estado impronto, es la mediación del DNA específica de alelo: todos los genes improntos se caracte rizan por regiones con abundancia de CG de metilación diferencial y está demostrado que la impronta de varios genes improntos está alterada en el ratón mutante deficiente en el gen de metiltransferasa de citosina D nm tl, la principal metilasa de sostén.

Cuadro 10-7. Ejemplos de la regulación de tejidos y la etapa del desarrollo de genes improntos en mamíferos. Gen

A lelo reprim ido

D iferen cias en los patrones de expresión

IGF2 (factor de crecimiento 2 similar a insulina)

Materno

Impronto en muchos tejidos pero expresión bialélica en cerebro, hígado adulto, condrocitos, etcétera

PEG1/MEST

Materno

Impronto en el tejido fetal pero expresado de manera bialélica en sangre de adultos

UBE3A (ligasa 3 de proteína ubíquitina)

Paterno

Impronto sólo en cerebro; expresado bialélícamente en otros tejidos

KvLOTl (canal de potasio)

Paterno

Impronto en varios tejidos pero expresado en forma bialélica en el corazón

WT1 (gen de tumor de Wilms)

Paterno

Con frecuencia impronto en células de placenta y cerebro pero expresión bialélica en riñón

10.5

CONTROL DE LARGO ALCANCE DE LA EXPRESIÓN Y LA IMPRONTA GÉNICAS

Se sabe que, intrigantemente, D nm tl tiene exones específicos z t sexo (sección 10.4.2; fig. 10-20). En oocitos esto da lugar a un producto proteínico truncado de terminal N específico de oocito, q _ie podría metilar de manera específica los alelos maternos de ge nes como el receptor del factor II de crecimiento similar a insulina. El exón de D nm tl específico de espermatocito interfiere con la tra ducción del mRNA de D nm tl y la forma en que podrían adquirir se los patrones de metilación específicos paternos es menos clara. Cabría esperar que durante el desarrollo la impronta se heredara de manera estable cuando menos durante muchas rondas de duplica ción del DNA (pero véase más adelante). Es claro que debe existir también un mecanismo para borrar las improntas durante la línea jerminal, que se requieren cuando, por ejemplo, un varón transmi te un alelo que heredó de su madre (véase fig. 10-25). Una forma en que lo anterior podría lograrse es la desmetilación que ocurre en ei embrión temprano y que deja las células germinales primordia les en esencia desmetiladas (véase fig. 10-19).

10.5.6 La inactivación del cromosoma X en mamíferos comprende la represión de la expresión génica de acción c/s de muy largo alcance Naturaleza de la inactivación del cromosoma X La inactivación del cromosoma X es un proceso que ocurre en to dos los mamíferos y resulta de la inactivación selectiva de alelos en uno de los dos cromosomas X en mujeres (Lyon, 1999). Constituve un mecanismo de compensación de dosis que supera diferencias

305

de sexo en la relación esperada de la dosis de genes autosómicos (A) con la dosis de genes del cromosoma X Los varones con un cro mosoma X tienen un alelo sólo para genes ligados a X y por tanto son constitucionalm ente hem icigotos para los genes ligados a X En consecuencia hay una diferencia de sexo en la relación de la dosis génica A:X (2:1 en varones pero 1:1 en mujeres). Las relaciones de dosis son importantes porque los productos de los genes ligados a X deben interactuar con los productos de genes autosómicos en una diversidad de vías metabólicas y del desarrollo importantes, y las cantidades de producto para gen es sensibles a dosis fundamenta les están bajo regulación estrecha. Para contrarrestar la diferencia de sexo en la dosis génica A:X, las células de la mayor parte de los mamíferos femeninos experimentan un ajuste compensador: uno de los dos cromosomas X parentales se inactiva. La inactivación de X comprende la modificación de la es tructura de la cromatina que produce una estructura heterocromatinizada, condensada, el corpúsculo d e B arr (que puede verse a lo largo de la parte inferior de la envoltura nuclear en células femeninas). Ca si todos los genes del cromosoma X inactivado están sometidos a al gún mecanismo que conduce a que se tornen transcripcionalmente inactivos. Por consiguiente, mediante la inactivación de uno de los dos cromosomas X parentales, los mamíferos hembra se convierten en hem icigotos fu n cion ales para la mayor parte de los genes ligados a X. No todos los genes se inactivan en el cromosoma X inactivado; los pocos que escapan a la inactivación de X abarcan los que tienen un homólogo funcional en el cromosoma Y y algunos genes en los que la dosis génica no parece importante (véase sección 12.2.8 para ejem plos de genes que escapan a la inactivación de X).

! Gametos;

Células somáticas

específica de sexo

Fig. 10-25. La ¡mprontación genomica (gamétíca) requiere el borramiento de la impronta en la línea germinal. El diagrama ilustra el destino de un cromosoma que lleva dos genes, A y B, que se someten a ¡mprontación: A está im pronto en la línea germinal feme nina, B lo está en la línea germinal masculina, como se indica con asteriscos. Como resultado, en células somáticas diploides A se impronta cuando se presenta en un cromosoma heredado de la madre y B se impronta cuando se encuentra en un cromosoma heredado del padre. Un cromosoma indivi dual puede pasar a través de las líneas germinales masculina y femenina en generaciones sucesivas: un varón puede transm itir un cromosoma hereda do de su madre y una mujer, un cromosoma heredado de su padre, como lo indican los gametos en el dibujo de la derecha. Como resultado, debe haber un mecanismo por el que la impronta antigua se borra de la línea germinal antes de establecer una nueva ¡mprontación específica de sexo.

306

CAPÍTULO DIEZ

EXPRESIÓN GÉNICA HUMANA

Programación de la inactivación del cromosoma X Aunque en etapas muy tempranas del desarrollo ambos cromoso mas X son activos, la inactivación de X inicia conforme las células comienzan a diferenciarse de los linajes totipotente y pluripotente, lo que ocurre en la etapa tardía de blástula en ratones y con mucha probabilidad también en humanos. En cada célula que da lugar al feto femenino se elige para la inactivación uno de los dos cromoso mas X parentales, pero la decisión para inactivar el cromosoma X de herencia paterna (XP) o el X materno (Xm) suele ser aleatoria y por consiguiente varía de célula a célula [nota: las células trofoblásticas y los mamíferos marsupiales son distintos: el cromosoma XP se inactiva de manera preferencial, un ejemplo de impronta restrin gida a tejido, y en individuos con una translocación X:autosoma el resultado final es que el cromosoma X normal se inactiva en forma consistente]. Es necesario borrar el patrón de inactivación de X de generación en generación y se sabe que, quizá como parte de este mecanismo, el cromosoma X se inactiva de modo pasajero tanto en varones como en mujeres durante la gametogénesis. Una vez que una célula progenitora en el embrión temprano se comprometió a inactivar el cromosoma XP o el Xm, el patrón de inactivación muestra herencia clonal: todos los descendientes de la célula dentro del linaje celular resultante llevan el mismo patrón de inactivación de X que la célula progenitora (véase fig. 10-26A). Es to significa que todos los mamíferos hembra son mosaicos y compren den mezclas de líneas celulares en las que se inactiva X paterno y líneas celulares en las que se inactiva X heredado de la madre. El pa trón de color del pelaje en mosaico del gato calicó (fig. 10-26B) ilustra lo anterior.

Mecanismo de inactivación del cromosoma X El proceso de inactivación del cromosoma X es complejo y en el inicio de la inactivación y en el mantenimiento de la misma parti cipan mecanismos moleculares precisos (véase Avner y Heard, 2001; Brockdorff, 2002). Dos elementos de acción cis importantes se definieron en términos genéticos: ► el centro de inactivación de X (Xic), que controla el inicio y la propagación de la inactivación de X. La presencia de Xic es esencial para la inactivación de X: un cromosoma X que lleva Xic puede experimentar inactivación, pero no uno que carece del mismo. Xic también es importante para “contar” cromoso mas. En individuos raros con un número anormal de cromo somas X (45,X; 47,XXX; 47.XXY, etc.), un cromosoma X permanece activo sin importar qué tantos de ellos existan. En contraste, en individuos triploides cualquiera de los cromoso mas X o ambos permanece activo y los dos cromosomas X si guen activos en tetraploides. Cierto tipo de mecanismo de conteo asegura que un cromosoma X permanezca activo por ca da dos grupos de autosomas. La función de Xic depende de un XIST, un gen que especifica un RNA funcional no codificante (véase más adelante), pero si bien XIST (Xist) es esencial para iniciar la inactivación del cromosoma X, no se requiere para conservar A estado de inactivación; ► el elemento de control de X (Xce), que afecta la elección del cromosoma X que permanece activo y del inactivo. Es posible que ocurra un sesgo de inactivación de X (del 50:50 normal de X inactivo con el activo) en mujeres heterocigotas para alelos

Xce (es más probable que un cromosoma X con un alelo Xce potente sea activo que uno con un alelo Xce débil). Xce es dis tinto de Xic y de XIST y de mapas teloméricos a ellos, pero la base molecular aún no se aclara. Después que el centro de inactivación de X se mapeó en Xql3 hu mano, análisis de esta región descubrieron un gen extraordinario: XIST (llamado Xist en roedores). XIST muestra expresión monoa lélica y se expresa de manera única del cromosoma X inactivo. Su transcrito primario experimenta empalme y poliadenilación para generar un RNA no codificante maduro de 17 kb. Al parecer es la principal señal para diseminar el estado de inactividad transcripcio nal a lo largo del cromosoma X del que se sintetiza, y de alguna ma nera la diseminación de este producto RNA limitada por cis actúa para cubrir el cromosoma X inactivado en distancias muy largas. Se piensa que el RNA incorpora después algunos factores proteínicos que organizan la cromatina en una conformación de inactividad transcripcional cerrada (Brockdorff, 2002). Otro gen extraordinario, TSIX (llamado TsiX en roedores) tie ne una unidad de transcripción que se superpone en la totalidad del gen XIST, pero en la cadena antisentido. Este gen compañero se ex presa en células madre embrionarias no diferenciadas y en embrio nes tempranos, y se propuso que controla la expresión de XIST en cis al inicio de la inactivación de X (véase Avner y Heard, 2001; Brockdorff, 2002).

10.6

Organización y expresión únicas de genes de Ig y RCT

Como se muestra en la figura 9-10, los receptores de inmunoglobulinas (Ig) y los receptores de célula T (RCT) son heterodímeros. Las células humanas contienen tres genes de Ig: uno, IGH, especi fica la cadena pesada y dos, IGK e IGL, codifican cadenas ligeras alternativas kappa ( k ) y lambda (\) respectivamente. Los cuatro ge nes de RCT humanos codifican, de manera respectiva, las cuatro variedades diferentes de cadena del RCT: a y |3 que forman el heterodímero común a(3, más "y y 5 que forman el heterodímero más raro 7 8 . La organización y la expresión de estos siete genes difieren en muchas formas de las de otros genes. Ello se debe a que cada per sona necesita producir un número enorme (del orden de unos 2.5 X 10 variedades diferentes) de Ig y RCT elaborados por linfocitos B y T respectivamente. Estas células son los principales agentes del sistem a inm unitario d e adaptación y necesitan reconocer una miriada de antígenos extraños y en consecuencia ser capaces de mon tar una defensa contra un gran número de patógenos distintos. Sin embargo, una célula B o T individual es monoespecífica: sólo pro duce un tipo de heterodímero Ig o RCT con un sitio de unión de antígeno único y por tanto es específica para un antígeno particular. La población de diferentes células B y T en cualquier individuo posibi lita la síntesis de tantos tipos diferentes de estas moléculas. Al pro porcionar un repertorio grande de Ig y RCT, las posibilidades de ser capaz de reconocer y enlazar muchos tipos diferentes de antíge no extraño aumentan de modo considerable. Los genes de Ig y RCT en la mayor parte de las células son inac tivos pero ocurre una mezcla extraordinaria de estos genes en célu las B y T respectivamente a fin de activarlos. Cuando esto sucede, se crean nuevas combinaciones codificantes que permiten que un

10.6 i ORGANIZACIÓN Y EXPRESIÓN ÚNICAS DE GENES DE IG Y RCT

A)

30"

Oogonia

Espermatogonia

Cigoto te m pra no /

/\

\

/\

/ \ / \ / \ / \

(J )

Ejemplo de X paterno inactivado /

B la sto cisto tardío

Ejemplo de X materno inactivado

\

/

\

\

/

/\ /\ /\/\/\/\

/\/\/\/\

Todas las células descendientes tienen X paterno inactivado (inactivación estable)

Todas las células descendientes tienen X materno inactivado (inactivación estable)

/

La inactivación aleatoria de X materno o paterno en diferentes células da por resultado mosalcismo

\

Fig. 10-26. Inactivación del cromosoma X en mamíferos. A) Proceso de inactivación de X. Los dos cromosomas X son activos

B)

en el cigoto femenino XX temprano, pero alrededor de la última etapa del blastocisto se realiza una elección aleatoria en cada célula a fin de inactivar X paterno o materno. La elección que toma una célula se pre serva en todos sus descendientes. Una mujer XX adulta tiene poblacio nes clónales de células con X paterno o materno inactivados. X inactivo se reactiva en oocitos un tiempo antes de la meiosis. Durante la espermatogénesis se inactivan en forma pasajera tanto el crom oso ma X como el Y. Adaptado de Migeon (1994) Trends Genet. 10, 230235, con autorización de Elsevier Trends Journals. B) Gato calicó (iconcha de tortuga y blanco). Este gato (que siempre es hembra) tie ne un cromosoma X con un gen para el color del pelaje negro y otro cromosoma X con un gen que especifica el color del pelaje naranja. Resultan placas de pelambre de diferentes colores a causa de la inacti vación clonal de X. Las placas de pelambre blanco se deben a un gen separado.

individuo aislado produzca una variedad extraordinaria de Ig y RCT. En vertebrados se aplican cuatro mecanismos de mezclado de DNA principales: ► recom binación d e VDJ o V], un m ecanism o disem inado. Las regiones variables tanto de Ig como de RCT son especificadas por dos o tres tipos de segmentos génicos, siempre un segmen to génico V (región variable) y uno J (región de unión), y en

algunos casos también un segmento génico D (región de diver sidad). Cada uno de estos segmentos génicos se encuentra en múltiples copias en el DNA de la línea germinal (véase cuadro 10-8 y sección 10.6.1). Sin embargo, el DNA de células B y cé lulas T maduras experimenta recombinación de DNA específi ca de células de manera que lleva consigo una combinación específica de un segmento V, D y J, o de un segmento de V V

308

CAPÍTULO DIEZ

EXPRESIÓN GÉNICA HUMANA

J, que crean un exón VDJ o un exón V] respectivamente (véa se sección 10 .6 . 1); ►

h ip e rm u ta c ió n s o m á tic a , u n m ecan ism o m a y o r en h u m a n o s y ratones. Se presenta una diversidad adicional de Ig cuando se introducen mutaciones de punto en la región V o en los exones VJ y VDJ debido a una reparación de DNA propensa a error;

►

►

conversión g é n ic a , u n m ecan ism o m a y o r en conejos y pollo s. La diversidad de Ig también puede resultar cuando tiras de se cuencia nucleótida se copian de segmentos de seudogen (Vi/j) co rriente arriba dentro de la secuencia de segmentos del gen V en exones VJ y VDJ; re c o m b in a c ió n d e c a m b io d e clase, u n m ecan ism o d is e m in a d o .

Unidades de transcripción que consisten en varios exones espe cifican la región constante de las Ig. En las cadenas pesadas de la Ig, varias unidades de transcripción distintas especifican las distintas clases de cadena pesada, como C|x (IgM), C 8 (IgD), C 7 (IgG), etc. Durante la maduración de las células B la re combinación intracromátide dentro del gen de cadena pesada acerca tipos específicos de unidad de transcripción de región constante a los exones VDJ (sección 10.6.2). En fecha muy reciente se demostró que los acontecimientos de hiper mutación somática, conversión génica y recombinación de cambio de clase (todos los cuales pueden ocurrir en una sola especie, aunque algunos mecanismos prevalecen en forma particular en especies par ticulares) son controlados en su totalidad por un gen único que co difica desaminasa de desoxicitidina inducida por activación (AID; véase Petersen-Mahrt y cois., 2002).

10.6.1 Reordenamientos del DNA en células B y T generan exones específicos de células que codifican regiones variables de Ig y de RCT Los genes que codifican las tres cadenas de Ig (una cadena pesada y dos tipos de cadena ligera) y las cuatro cadenas de RCT (a, (3, 7 y 8 ) se localizan en diferentes cromosomas y muestran una organización extraordinaria. En cada caso la región variable es especificada por

dos o tres diferentes segmentos génicos que se encuentran en nume rosas copias distintas que se repiten de manera secuencial en el DNA de la línea germinal (véase cuadro 10-8 y fig. 10-27). Los seg mentos génicos comprenden: ► segmentos de gen V (región variable). Los segmentos de gen V codifican la mayor parte de la región variable; ► segmentos del gen J (región de unión). Los segmentos del gen J codifican la reg ión de u n ió n , una parte pequeña en el extre mo terminal C de la región variable; ► segmentos del gen D (región de diversidad). Los segmentos del gen D codifican una región d e d iv e rs id a d pequeña cerca de los extremos terminal C de la región variable de las cadenas pesa das de Ig, las cadenas (3 de RCT y las cadenas 8 de RCT. El reordenamiento único de los segmentos génicos en los grupos de genes de Ig y RCT indica la forma muy poco usual en que los linfocitos B y T se someten a recombinaciones somáticas a fin de ac tivar genes de Ig o RCT antes no funcionales y a continuación expresar productos funcionales de ellos. Efectúan lo anterior reu niendo combinaciones específicas de segmentos génicos V + D + J (en el caso de los genes que codifican la cadena pesada Ig, (JRCT y 8 RCT) o de segmentos génicos V + J (en los otros cuatro genes). Una vez que se ensamblan, las unidades V + J o V + D + Js e comportan como exones funcionales (véase más adelante). Para cada uno de los siete genes, la elección entre los múltiples segmentos gén i cos V, (D) o J que se juntan, varía d e linfocito en linfocito y por con siguiente los exones VJ y los exones VDJ recién creados son específicos de célula (véase fig. 10-28). Como resultado, las células B y T individuales producen diferentes Ig y RCT. En consecuencia, en un sentido, cada individuo es un mosaico con respecto a la or ganización de los genes de Ig y RCT en linfocitos B y T, e inclusive los gem elos idénticos diferirán genéticam ente. Una vez que un exón VDJ o VJ se ensambla, se crea un gen fun cional Ig o RCT. A continuación el nuevo exón VDJ o VJ propor cionará el primer exón para este gen y los exones en la cercanía de la unidad de transcripción C aportarán los exones corriente abajo. En el caso del gen de cadena pesada de la Ig hay varias unidades de

Cuadro 10-8. Genes humanos de Ig y RCT. Número de segmentos génicos V, D, J Gen

Localización

V

D

J

Número de unidades de transcripción C

IGH

14q32.3

123-19a

27

9

11

IGK

2p12

76

0

5

1

IGL

22q11

70-71a

0

7 -1 1a

7-11

TRA

14q11.2

4 9 (+ 5 )b

0

61

1

TRB

7q34

64-67a

2

14

2

TRG

7p15-p14

12-15a

0

5

2

TRD

14q11.2

1 (+ 5 )b

3

4

1

Nota: los números incluyen secuencias no funcionales (seudogen); véase la figura 10-27 para un ejemplo del gen IGH. aEI número varía en diferentes haplotipos. bClnco segmentos del gen V se comparten entre los genes TRA y TRD vecinos. Para representaciones pictóricas véanse los nombres del gen Individual en diversas bases de datos como Atlas of Genetics and Cytogenetics in Oncology and Haematology en www.intoblogen.fr/services/chromcancer/ Genes/Genellste.html

10.6

ORGANIZACIÓN Y EXPRESIÓN ÚNICAS DE GENES DE IG Y RCT

Región V 900 kb

309

Región DJC 350 kb CEN

TEL

*

í> 'C^Cs C^C y,

123 a 129 segmentos VH (casi todos son no funcionales, pero se sabe que hasta 46 son funcionales)

26 segm entos Du

9 segm entos J H I + 1 D,H

^^1^2 C74

CE c a2

11 segm entos C H

Fig. 10-27. Múltiples segmentos génicos en el gen de cadena pesada de la Ig, IGH, en 14q32. El gen se extiende 1 250 kb del extremo telom érico de 14q32.3 (izquierda) al extremo centromérico (derecha). Hay 123 a 129 segmentos génicos VH (dependientes del haplotipo), de los que se sabe que casi todos son segmentos seudogénicos no funcionales, 27 segmentos génicos DH, nueve seg mentos génicos JH y 11 unidades de transcripción C (cada una de las cuales contiene varios exones). Para mayores detalles véase http://www.¡nfoblogen.fr/services/chromcancer/Genes/lgHID40.html

transcripción C funcionales diferentes con propiedades biológicas distintas. Sin embargo, al principio el empalme incluye el exón VDJ y los exones de las unidades de transcripción Cp y C8 veci nas, y el empalme alternativo puede resultar en síntesis de la ca dena p, o 8 que se incorpora en las inmunoglobulinas IgM e IgD (fig. 10-28). No obstante, conforme la célula C madura, recombi naciones somáticas subsecuentes originan la unión del exón VDJ ensamblado con anterioridad a diferentes unidades de transcrip ción C a fin de producir cadenas pesadas y , a o e para incorpo rarse en IgG, IgA o IgE (cambio d e clase d e cadena pesada; véase texto; fig. 10-29). Los mecanismos genéticos que conducen a la producción de exones VJ y VDJ funcionales suelen incluir deleciones a gran esca la de las secuencias que separan los segmentos génicos selecciona dos (muy probablemente por recombinación intracromátide en una forma muy similar a la que se indica en la figura 10-29B) y en algunos casos inversiones de la secuencia intermedia. Secuencias de señal de recombinación conservadas flanquean los extremos 3' de cada segmento V y J y los extremos 5' y 3' de cada segmento del gen D. Permiten la unión de V a J, o D a J seguida por V a DJ pe ro nunca V a V o D a D, etcétera. Los fenómenos de recombinación son dirigidos por una recombinasa V(D)J, un complejo que contiene dos proteínas específicas de linfocitos RAG1 y RAG2, así como enzimas que ayudan a reparar el DNA dañado en todas las células. RAG1 y RAG2 hacen roturas de doble cadena en las secuencias de la señal de recombinación, y las ro turas se reparan juntando segmentos génicos V, D y J apropiados en tanto se excluyen secuencias intermedias. Aunque por lo general la recombinación específica de sitio es precisa, la recombinación que ocurre en los genes de Ig y RCT en las células B y T, de manera res pectiva, no es precisa deliberadamente. En lugar de ello suele perder se un número variable de nucleótidos de los extremos de los segmentos génicos recombinantes y también pueden insertarse uno o más nucleótidos elegidos de manera aleatoria, lo que crea diversi ficación de unión. Esto incrementa muchísimo la diversidad de se cuencias de codificación de región variable.

10.6.2 El cambio de clase de cadena pesada comprende la unión de un exón VDJ aislado a unidades de transcripción de región constante alternativas Aunque una célula B sólo produce un tipo de molécula Ig, la clase (o isotipo) de la cadena pesada puede cambiar durante el desarro llo: dentro de un linaje aislado, los descendientes de una célula ori ginal pueden producir una Ig con el mismo sitio de unión de antígeno que antes pero utilizando una clase diferente de cadena pesada (cambio de clase o cam bio d e isotipo). Este cambio incluye la unión diferencial del mismo exón VDJ que se enlazó por dos re combinaciones somáticas sucesivas (véase fig. 10-28) a unidades de transcripción de región constante alternativas. El cambio de clase abarca una recombinación intracromátide cuyo resultado es la unión de un exón VDJ a una unidad de trans cripción de región constante más distal (unión VDJ-C). Incluye la progresión siguiente: ► a) síntesis in icia l d e IgM sólo p o r células B vírgen es inm adu ras. Esto ocurre temprano en el desarrollo de la célula B por que el empalme de RNA une la secuencia transcrita del exón VDJ y los exones de la unidad de transcripción Cp vecina (fig. 10-29A); ► b) síntesis p osterior tanto d e IgM com o d e IgD p o r células B vírgenes maduras. Más adelante en el desarrollo de la célula B, pero en una etapa en que estas células aún son inm unológicam en te vírgen es (es decir, aún rio se expusieron a un antígeno extraño), ocurre un cambio de clase parcial y las células B pro ducen ahora tanto IgD como IgM. Ello ocurre porque ahora el empalme alternativo de RNA adicional también puede juntar la secuencia transcrita del exón VDJ y los exones de la unidad de transcripción C8 vecina (fig. 10-29A). Casi toda la produc ción de IgM e IgD está dedicada a elaborar receptores de unión de membrana, pero la exposición a antígeno extraño estimula rá la secreción de anticuerpo IgM soluble en una respuesta inmunitaria primaria débil;

310

CAPÍTULO DIEZ

EXPRESIÓN GENICA HUMANA

Cadena pesada Vi

V2

V3

V4

V„

D., D 2 D 3 D .

D„

Ji J

2

J

3

J

4

J„

C ,

Cg

C y3

C y,

Ca

DNA Unión D-J

i

Vi V2 V3 V4

Vn D ,D 2 D3J2J3 J4 J„ CL1 C5

C.,

Ca2

C5 Cy3 Cy,

Ca2

Oß

DNA Unión V-D-J

1 Vi *1

VoDo » 2 , j 3 jJo2

DNA '^ . ''- ''E m p a l m e de RNA

mRNA

! ] Polipéptido

V

I_I IC

Traducción

Fig. 10-28. Recombinación de VDJ específico de células como preludio para la elaboración de una cadena pesada de Ig. Dos recombinaciones somáticas secuenciales producen la primera unión D-J y luego un exón maduro VDJ. En este ejemplo, el segundo de 129 seg mentos V diferentes (V2) se fusiona con el tercer segmento de la reglón D (D3) y el segundo segmento de la región J (J2) para producir un exón V2D3J2 funcional, pero como la elección es específica de la célula, un llnfocito B vecino puede tener, por ejemplo, un exón V ^ D ^ J , funcional. Una vez que el exón VDJ se ensambla, el gen puede transcribirse utilizando el exón VDJ com o primer exón, con los exones subsecuentes provistos por las unidades de transcripción C más cercanas. A fin de iniciarlo, las unidades de transcripción ( V y C8 están más cercanas y los primeros tipos de cadena pesada Ig que se elaboran son la cadena |x y después m- más 5, las cadenas pesadas características de IgM e IgD respectivamente. Sin embargo, conforme la cé lula B madura, recombinaclones somáticas subsecuentes ocasionan la unión del exón VDJ ensamblado con anterioridad a diferentes unidades de trans cripción C (cam bio de clase de cadena pesada, véase el texto y la fig. 10-29).

► c) síntesis ¿le IgG, IgE o IgA p o r células B maduras. Tras la ex posición a antígenos extraños, las células B desarrollan procesos para refinar la afinidad de unión de Ig (maduración de afinidad) de manera que puedan responder con mayor efectividad a un antígeno extraño en una ocasión futura (cuando serán capaces de secretar grandes cantidades de anticuerpo soluble con una afini dad muy alta por el antígeno extraño en una respuesta de inmunitaria secundaria potente). Fenómenos de hipermutación somática/conversión génica, etc. apoyan la maduración de afini dad. En la clase de célula B madura el cambio ahora ocurre por un mecanismo diferente e incluye un fenómeno de recombina ción que permite la unión a nivel del DNA del mismo exón VDJ a cualquiera de las unidades de transcripción Oy, Ce o C a. El mecanismo abarca deleción de la secuencia intermedia median te recombinación intracromátide (fig. 10-29B). Las moléculas Ig secretadas por células B maduras pueden enlazarse a diferentes tipos de células que tienen receptores especializados para la por ción de la cola (Fe) del anticuerpo soluble. Estos receptores Fe enlazan de manera selectiva diferentes tipos de Ig: *

IgG: además de activar el sistema de complemento, la IgG puede ser enlazada específicamente por receptores Fe en m acrófagos y neutrófilos, células fagocíticas potentes;

•

IgA: un tipo de receptor Fe único para el epitelio secretorio transporta anticuerpos IgA de modo que constituyen la

principal clase de anticuerpo en las secreciones, inclusive sa liva, lágrimas, leche y secreciones respiratorias e intestinales; •

IgE: receptores Fe en células cebadas y basófilos unen IgE con afinidad muy alta. Las moléculas IgE unidas funcio nan después como receptores de antígenos adquiridos en forma pasiva. El enlace subsecuente de antígeno estimula rá la células cebadas o los basófilos para que secreten una diversidad de citocinas e histamina. Además las células ce badas secretarán factores que atraen y activan eosinófilos que también tienen receptores Fe que unen moléculas IgE y pueden destruir varios tipos de parásitos.

10.6.3 La monoespecificidad de las Ig y los RCT se debe a exclusión alélica y de cadena ligera Las células humanas poseen tres genes de Ig funcionales (IGH que codifica la cadena pesada y dos genes, IG K e IGL, que codifican las cadenas ligeras kappa y lambda intercambiables en términos fun cionales), y puesto que esto ocurre tanto en homólogos materno como paterno, seis genes están potencialmente disponibles para elaborar cadenas de Ig. Sin embargo, una célula B individual es monoespecífica: sólo produce un tipo de molécula Ig con un tipo aislado de cadena pesada y un tipo único de cadena ligera. Ello se debe a dos razones:

10.6

ORGANIZACIÓN Y EXPRESIÓN ÚNICAS DE GENES DE IG Y RCT

Y A)

Transcritos primarios de célula B tempranos

¥

VDJ C u C s

DNA de células B tempranas

i

^

311

. 4

Empalmado alternativamente para dar mRNA I* o 5 — IgM o IgD

Cambio de clase (en este caso a IgG)

Corte y reunión de cadenas diferentes

VDJ

e .« C.^4 CE C,

DNA de células B maduras que producen IgG

Transcritos primarios de célula B madura Empalmado para dar 7 m RNA—►IgG

Fig. 10-29. El cambio de clase de la cadena pesada de la Ig es mediado por recombinación intracromátide. A) Cambio tem prano (parcial) a IgD. La clase de cadena pesada inicial es IgM porque el empalme de RNA junta las secuencias transcritas del exón VDJ y los exones de la unidad de transcripción C/x vecina. Sin embargo, a medida que las células B vírgenes maduran, el empalme alternativo de RNA une las secuencias del exón VDJ y los exones de la unidad de transcripción C8, y conduce a la producción adicional de IgD. B) Cam bio tardío a IgA, IgG e IgE. En este caso el cambio de clase ocurre por recombinación intracromátide, en la que el mismo exón VDJ es llevado cerca de las unidades de transcripción de región constante inicialmente más distales: una unidad de transcripción Ca, C-y (como se ilustra aquí) o una unidad de transcripción Ce. La nueva combinación VDJ-C se expresa para dar IgA, IgG o IgE.

► exclusión alélica. Puede sintetizarse una cadena ligera o una ca dena pesada a partir de un cromosoma materno o un cromoso ma paterno en cualquier célula B, pero no d e ambos homólogos parentales. Como resultado, hay expresión m onoalélica en el locus del gen de cadena pesada en células B. Este fenómeno se aplica también a grupos de genes de RCT; ► exclusión de cadena ligera. Una cadena ligera que se sintetiza en una célula B aislada puede ser una cadena K o una cadena \, pero nunca ambas. Como resultado de este requerimiento aunado al de la exclusión alélica, hay una expresión monoalé lica en uno de los dos grupos génicos de cadena ligera funcio nales y no hay expresión en el otro.

Al parecer la decisión respecto a cuál de los dos alelos de cadena pesa da debe utilizarse para formar una cadena pesada y cuál de los cuatro posibles genes de cadena ligera se empleará para formar una cadena li gera es aleatoria. Es muy probable que, en cada precursor de célula B, se intenten reordenamientos de DNA productivos en todos los seis ge nes de Ig pero es factible que las posibilidades de ordenamientos pro ductivos en más de un gen de cadena ligera o más de un gen de cadena pesada no sean altas. Sin embargo, al parecer hay cierto tipo de regu lación p o r retroalim entación negativa adicional; un reordenamiento funcional en uno de los alelos de cadena pesada suprime los reordena mientos que ocurren en el otro alelo y un reordenamiento funcional en cualquiera de los cuatro genes capaces de codificar una cadena li gera suprime los reordenamientos que ocurren en los otros tres.

CAPÍTULO

ONCE

Inestabilidad del genoma humano: mutación y reparación del DNA Contenido del capítulo 11.1

Generalidades de mutación, polimorfismo y reparación del DNA

11.2 11.3

Mutaciones simples Mecanismos genéticos que producen intercambios de secuencias entre repeticiones

11.4

Mutaciones patógenas

11.5

Potencial patógeno de secuencias repetidas

11.6

Reparación del DNA

Recuadro Recuadro Recuadro Recuadro

11-1 11-2 11-3 11-4

Clases de polimorfismo genético y variación de secuencias Mecanismos que afectan la frecuencia de alelos en la población Clases de sustitución de una base en el DNA que codifica polipéptidos Diferencias de sexo en la tasa de mutación y el problema de la evolución impulsada por varones

316

11.1

CAPÍTULO ONCE

INESTABILIDAD DEL GENOMA HUMANO: MUTACIÓN Y REPARACIÓN DEL DNA

Generalidades de mutación, polimorfismo y reparación del DNA

Como en otros genomas, el DNA del genoma humano no es una entidad estática. Por el contrario, está sujeto a una variedad de cam bios hereditarios (mutación). Las anormalidades cromosómicas a gran escala incluyen pérdida o ganancia de cromosomas o rotura y nueva unión de cromátides (véase sección 2.5). Las mutaciones a menor escala pueden agruparse en diferentes clases según el efecto en la secuencia del DNA en la forma siguiente: ► sustituciones de bases: incluyen el reemplazo de por lo gene ral una base; en casos raros se reemplazan al mismo tiempo va rias bases agrupadas como resultado de una forma de conversión génica (sección 11.3.3); ► deleciones: se eliminan uno o más nucleótidos de una secuencia; ► inserciones: se insertan uno o más nucleótidos en una secuencia. Las mutaciones también pueden clasificarse con base en si com prenden una secuencia de DNA aislada (m utaciones simples; sección 11.2) o el intercambio entre dos secuencias alélicas o no alélicas (sección 11.3). Cada una de las tres clases de mutación indicadas pueden originarse por mutaciones simples o intercambios de se cuencias. Surgen nuevas mutaciones en individuos aislados, sea en células somáticas o en la línea germinal (sección 3.1.3). Si una mutación en la línea germinal no deteriora de manera importante la capaci dad de un individuo para tener descendencia que transmita la mu tación, puede diseminarse a otros miembros de una población (sexual). Por tradición la variación de la secuencia alélica suele des cribirse como un polimorfismo de DNA si más de una variante (alelo) en un locus se observa en una población humana con una frecuencia mayor de 0.01 (que es más alta de la que podría conser varse sólo por mutación recurrente). Sin embargo, existe una diver sidad de tipos de polimorfismo que varían desde cambios de nucleótidos únicos a modificaciones a muy gran escala (recuadro 11- 1) .

En el DNA genómico humano la heterocigosidad media (también denominada d iv ersid a d p r o m ed io d e n u cleó tid os) es del orden de 0.08%; alrededor de 1 de cada 1 250 bases difiere en pro medio entre las secuencias alélicas. Esta cifra se estimó al inicio promediando datos de un número limitado de estudios de secuenciación de un locus (véase Przeworski y cois., 2000). Los valores de heterocigosidad varían mucho en diferentes locus y ciertos genes son excepcionalmente polimórficos, en especial algunos genes HLA (véase fig. 12-29), pero el análisis de grupos de datos de polimor fismos de nucleótido único (PNU) humano global disponible en fecha reciente confirma el valor medio de heterocigosidad de 0.08% (Reich y cois., 2002). No obstante, como los índices de mu tación son comparativamente bajos, la inmensa mayoría de las di ferencias entre secuencias alélicas dentro de un individuo es hereditaria en lugar de resultado de mutaciones nuevas. Aunque las mutaciones son el combustible crudo que impul sa la evolución, también pueden ser patógenas (secciones 11.4, 11.5). Es posible que sean la causa directa de una anormalidad fenotípica o que ocasionen un incremento en la susceptibilidad a una enfermedad. En consecuencia el valor casi siempre bajo de las mutaciones puede considerarse como un equilibrio entre per mitir la novedad evolutiva ocasional a expensas de causar enfer medad o muerte en una proporción de los miembros de una especie.

Con frecuencia las mutaciones surgen como errores de copiado durante la replicación del DNA. Aunque la fidelidad de la replicación del DNA in vivo es muy alta en condiciones normales, incor poraciones erróneas ocurren a una frecuencia baja y dependen de las energías libres relativas del pareamiento de bases correcto e in correcto. Cambios muy pequeños en la geometría de la hélice pue den estabilizar pares de bases G-T (con dos enlaces de hidrógeno; cabe señalar la ocurrencia frecu en te d el paream iento d e bases G-U en e l RNA; véase fig. 1-7B). A fin de reducir el índice de error de in corporación errónea, muchas polimerasas de DNA contienen una exonucleasa integral que puede desempeñar una a ctiv id a d d e lectu ra d e p r u eb a s (véase cuadro 1-2). Cuando una base inco rrecta se inserta durante la síntesis de DNA, esta última no puede proceder. En lugar de ello la actividad de exonucleasa 3 ,_>5' elimi na un nucleótido a la vez de la terminal hidroxilo 3' hasta obtener una terminal con un pareamiento de bases correcto, lo que permi te que la síntesis de DNA prosiga de nuevo. Sin embargo, aun en tonces el tamaño del genoma humano origina demandas enormes en la fidelidad de cualquier polimerasa de DNA: una secuencia de seis mil millones de nucleótidos necesita replicarse con precisión cada ocasión aislada en que célula humana se divide. El DNA también está sujeto a un ataque químico espontáneo importante en la célula y al daño causado por la exposición a radia ción ionizante natural y a metabolitos reactivos. Por tanto, con ob jeto de reducir al mínimo el índice de mutaciones, es necesario contar con sistemas de rep a ra ción d e l DNA eficaces que identifi quen y corrijan muchas anormalidades en la secuencia del DNA (sección 11.6). Además los errores que surgen en la secuencia del mRNA durante la expresión génica se someten a mecanismos de vigila n cia d e l RNA que aseguran la eliminación de los mRNA que tienen codones de terminación inapropiados (sección 11.4.4).

11.2

M utaciones sim ples

11.2.1 Las mutaciones que se deben a errores en la replicación y la reparación del DNA son frecuentes La exposición a una variedad de mutágenos que se encuentran en su ambiente externo o que se generan en el medio intracelular puede inducir mutaciones en el DNA de una persona. Por ejemplo, Dubrova y colaboradores (1996, 2002) publicaron que en la mutación inducida por radiación la tasa normal de mutación de la línea ger minal para locus minisatélite hipervariables se duplicó como conse cuencia de la exposición intensa a la lluvia radiactiva del accidente de Chernobyl. Sin embargo, en circunstancias normales la mayor fuente de mutaciones es con mucho la mutación endógena, que in cluye errores espontáneos en la replicación y la reparación del DNA. Es posible estimar que durante un tiempo de vida humana prome dio se llevan a cabo divisiones celulares del orden de 1017: son necesa rias alrededor de 2 X 10 11 divisiones para generar las cerca de 1014 células del adulto y mitosis adicionales para permitir la renovación ce lular en ciertos tipos de células, en especial las epiteliales (véase Cairns, 1975). Ya que cada división celular requiere la incorporación de 6 X 10 "1nuevos nucleótidos, la replicación del DNA sin errores en un tiempo de vida promedio demandaría un proceso de reparación de la replicación del DNA cuya precisión fuera lo suficientemente conside rable para que el nucleótido correcto se insertara en la cadena de DNA en crecimiento en cada una de las cerca de 6 X 1026 ocasiones.

11.2

MUTACIONES SIMPLES

317

R ecuadro 11-1. C lases de polimorfismo genético y variación de secuencias Las diferencias en los fenotipos individuales se deben en gran parte a variación genética y se conoce una diversidad de tipos de polim orfism os genéticos y de variación de secuencias a gran escala. Sin embargo, por ultimo el efecto en el fenotipo se expresa a nivel de proteínas o del RNA. Los cambios en el DNA que codifica polipéptidos pueden dar lugar a cam bios de aminoácidos que causan polimorfismos de proteínas Además de los polim orfism os de DNA y de las proteínas que se estudiaron durante muchos años existen diferencias cuantitativas mal comprendidas en la expresión a nivel del transcrito. La variación de expresión de genes humanos afólleos puede deberse a cambios en el DNA regulador, que incluyen secuencias que gobiernan la transcripción y el empalme. Este tipo de variación de secuencias puede sustentar la susceptibilidad a enfermedades frecuentes pero sólo hasta fecha reciente se desarrollaron métodos cuantitativos para valorar la variación alélica en la expresión génica humana (Yan y cois., 2002). A continuación se describen las clases usuales de polimorfismos de DNA y la variación de secuencias a gran escala. Polimorfismo de nucleótido único (PNU) Como lo sugiere el nombre, incluye un nucleótido aislado. En la mayor parte de los PNU se sustituye sólo un nucleótido por un nucleótido dife rente (sustitución de nucleótido), pero el término incluye también cam bios que com prenden inserciones o flgleciones de nucleótidos (polimorfismos indel simples). Por lo general los PNU sólo tienen dos alelos. Algunos PNU producen cambios en los sitios de restricción {po limorfismo de sitio de restricción, sección 7.1.3). Ya que el DNA de codificación sólo constituye alrededor de 1.5% del genoma humano, ca si todos los PNU se encuentran en DNA no codificante, com o secuen cias dentro de intrones e intergénicas. No obstante, la localización cromosómica de los PNU está muy lejos de ser uniforme: a menudo las regiones crom osóm icas grandes con muy pocos PNU se encuentran ad yacentes a regiones grandes que contienen muchos PNU (véase sección 11.2.6). Para la tipificación de los PNU, véase la sección 7.1.3. Polimorfismo simple de número variable de repetición tándem (NVRT) Polimorfismo NVRT suele describir alelos en locus que contienen tiras repetidas en forma tándem de una secuencia simple. Abarca las clases: microsatélites = polimorfismo RSS (repetición de secuencia simple) en los que la secuencia simple es de uno a varios nucleótidos de largo y la longitud del arreglo varía de menos de 10 a más de 100 nucleótidos, y polimorfismo minisatélite de DNA que incluye arreglos que con fre cuencia abarcan cientos de nucleótidos y consisten en repeticiones tán dem de una secuencia entre nueve y varias decenas de nucleótidos de largo. Los locus NVRT suelen tener múltiples alelos y algunos minisatélite hipervariables muestran una variación extraordinaria (p. ej., el locus MS32 tiene un valor de heterocigosidad de 0.975). Ambos tipos de polim orfism o se encuentran muy rara vez en DNA que codifica polipéptidos. Las excepciones comprenden los polimorfismos RSS sin cambio de marco, muy raros, y el polim orfism o minisatélite que se expresa en contadas ocasiones, por ejemplo, se sabe que el locus MUC1 en 1q21 codifica una glucoproteína altamente polimórfica que se halla en varios tejidos epiteliales y líquidos corporales como resultado de una variación extensa de repeticiones codificadas por minisatél'rtes (Swallow y cois., 1987). Además algunos de estos polim orfism os pueden localizarse muy cerca de genes y afectar su expresión. Un ejemplo notable es el NVRT INS, un minisatélite polim órfico ubicado 596 pb corriente

Conservar este nivel de fidelidad de replicacíón del DNA resulta imposible; de hecho la fidelidad de la replicación de polimerasas de DNA observada es mucho menor que ésta y ocurren errores de repli cación no corregidos con una frecuencia cercana a 10 9 a 10 11 por

arriba del sitio de inicio de traducción del gen de insulina que consiste en un número variable de repeticiones tándem basadas en la secuencia con senso ACAGGGGTGTGGGG. Al parecer diferentes alelos confieren una susceptibilidad diferencial a la diabetes tipo I, tal vez por los efectos difer enciales en la expresión del gen de insulina (sección 15.6.4.) Polimorfismo de repetición de transposón Casi 45% del genoma humano está compuesto por repeticiones basadas en transposón (sección 9.5.1). La inmensa mayoria ya no es activa, pero algunos transposones LINE1, Alu y basados en LTR aún tienen actividad de transposón. Como resultado de las transposiciones evolutivas recientes, algunos locus son polim órficos. Por ejemplo, muchos miem bros de las subfamilias Alu Vb9, Yc1 y Yc2 se insertaron en el genoma humano en fecha tan cercana que alrededor de un tercio de los elemen tos analizados es polim órfico para la presencia/ausencia de la repetición Alu en diversas poblaciones humanas (Roy-Engel y cois., 2001). Polimorfismo de número variable de repetición tándem (NVRT) a gran escala Las repeticiones tándem a gran escala son propensas a variación en el número de coplas com o resultado de cruzamiento desigual o intercam bios desiguales de cromátides hermanas que producen un tipo de polim orfism o de NVRT a gran escala. Los ejemplos incluyen repeticiones satélite alfa en centrómeros y varios genes RNA de repetición tándem como los genes rRNA y los snRNA U2 en el locus RNU2 en 17q21-q22 (de seis a más de 30 repeticiones de unidades de 6.1 kb casi idénticas). Algunos grupos génicos que codifican polipéptidos comprenden repeti ciones tándem grandes que son propensas a este tipo de polim orfism o, por ejemplo, el grupo de 21-hidroxilasa/complemento C4 (sección 11.5.3). Polimorfismo de inversión La secuenciación de la porción eucromática del genoma humano reveló muchos ejemplos de secuencias con números de copias bajos a moder ados con homología secuencial muy alta (> 95 % ) entre las secuencias relacionadas. En algunas repeticiones con número de copias bajo, la homología secuencial muy alta se extiende decenas de cientos de kb com o resultado de duplicación segmentaria (específica de primates) evolutivamente reciente; véase sección 12.2.5. Estas secuencias pueden predisponer a recombínación desigual y producir translocaciones y delecíones, duplicaciones e inversiones a gran escala. Aunque las deleciones y algunas duplicaciones suelen acompañarse de enfermedad y por lo general se extienden a intervalos megabase (pero subcitogenétícas), tam bién pueden ocurrir polim orfism os de inversión a gran escala que no con tribuyen en form a directa a enfermedades (sección 11.5.5). Polimorfismos cromosómicos y variantes secuenciales a gran escala Algunos polim orfism os comprenden cambios muy grandes del DNA no codificante de manera que es posible distinguir los alelos mediante análi sis citogenéticos tradicionales. A menudo el bandeo C (que identifica heterocromatina, véase recuadro 2-2) revela variación del tamaño para bloques específicos de heterocromatina com o se observa en los crom o somas 9 ,1 6 y Y. En la población normal con frecuencia se encuentra una inversión pericentromérica grande en el cromosoma 9. Las inversiones ocasionales con puntos de rotura aparentemente fuera de las secuencias de heterocromatina también pueden ser muy frecuentes en la población normal.

nucleótido incorporado (véase Cooper y cois., 2000). Como el DNA codificante de un gen humano promedio tiene alrededor de 1.65 kb, ocurrirán en forma espontánea mutaciones en el DNA de codifica ción con una frecuencia promedio cercana a 1.65 X 10 6 a 1.65 X

318 | CAPÍTULO ONCE

INESTABILIDAD DEL GENOMA HUMANO: MUTACIÓN Y REPARACIÓN DEL DNA

10 8 por gen por división celular. En consecuencia durante las alre dedor de 1016 mitosis que se efectúan en un tiempo de vida huma no promedio, cada gen será un locus para unas 108 a 10lu mutaciones (pero para cualquier gen, sólo una minoría muy pequeña de células llevará una mutación). En muchos casos una mutación génica perju dicial en una célula somática no tendrá consecuencias: la mutación puede causar letalidad en esa célula aislada, pero no tendrá conse cuencias para otras células. Sin embargo, en algunos casos la muta ción puede conducir a una continuación inapropiada de la división celular y causar cáncer (véase cap. 17).

bles a desaminación espontánea para dar timina (recuadro 9-3). Al parecer, como resultado de lo anterior, el dinucleótido CpG es un punto crítico para mutación en genomas de vertebrados: su índice de mutación es cerca de 8.5 veces mayor que el del dinucleótido promedio (véase Cooper y cois., 2000) y las transiciones CpG- ^► TpG son el tipo más frecuente de mutaciones de punto patógenas. Es probable que otros factores que favorecen las transiciones sobre las transversiones incluyan reparación diferencial de bases con pareamiento erróneo por actividades de lectura de pruebas depen diente de secuencia de las polimerasas de DNA relevantes.

11.2.2 La frecuencia de sustituciones de bases individuales es no aleatoria de acuerdo con la clase de sustitución

11.2.3 La frecuencia y la gama de mutaciones en el DNA codificante difieren de las del DNA no codificante

Las sustituciones de bases son una de las mutaciones más frecuen tes y pueden agruparse en dos clases. Las transiciones son sustitu ciones de una pirimidina por una pirimidina (C*+T) o una purina por una purina (A+*G). Las trajisversiones son sustituciones de una pirimidina por una purina o de una purina por una pirimidi na. Cuando se sustituye una base por otra, siempre hay dos posi bles elecciones para la transversión, pero sólo una para transición (véase fig. 11-1). Por tanto cabría esperar que las transversiones fue ran el doble de frecuentes que las transiciones. Como la sustitución de alelos en una población requiere miles y aun millones de años para completarse, no es posible observar en forma directa las sustituciones de nucleótidos. Siempre se suponen por comparaciones de pares de moléculas de DNA que comparten un origen común, como ortólogos en diferentes especies. Cuando lo anterior ocurre, se encuentra que el índice de transición en genomas de mamíferos es inesperadamente más alto que los índices de transversión. Por ejemplo, Collins y Jukes (1994) compararon 337 pares de ortólogos de humanos y roedores, y encontraron que la tasa de transición excedió la de transversión en una relación de 1.4:1 para sustituciones que no condujeron a un aminoácido alte rado y en una proporción mayor de 2:1 en las que dieron por re sultado un cambio de aminoácido. Las transiciones pueden favorecerse sobre las transversiones en el DNA de codificación porque por lo general producen una se cuencia polipéptida más conservada (véase más adelante). En el DNA tanto codificante como no codificante de vertebrados, el ex ceso de transiciones contra las transversiones se debe cuando menos en parte a la frecuencia comparativamente alta de transiciones C~>T, que resultan de inestabilidad de residuos de citosina que ocurren en el dinucleótido CpG. En estos dinucleótidos la citosina suele med iarse en el átomo de carbono 5 y las 5-metilcitosinas son suscepti-

En el DNA de los individuos muchas mutaciones se generan en esencia de manera aleatoria. Como resultado el DNA de codifica ción y el DNA no codificante son casi igual de susceptibles a mu tación. Sin embargo, es claro que las principales consecuencias de la mutación se restringen en gran parte a cerca de 1.5% del DNA del genoma humano que se sabe que es DNA de codificación y el otro 3% aproximado de secuencias muy conservadas (inclusive se cuencias reguladoras, etc.). Las mutaciones que ocurren dentro del DNA de codificación pueden agruparse en dos clases:

Fig. 11-1. En teoría puede esperarse que las transversiones sean el doble de (recuentes que las transiciones. Flechas rojas, transversiones; flechas negras, transiciones.

► mutaciones sinónimas (silenciosas), que no cambian la se cuencia del producto génico. Esto sólo se aplica al DNA que co difica polipéptidos. Una mutación sinónima origina un cambio en el codón pero no produce un aminoácido alterado por la de generación del código genético. N ota: algunas mutaciones que parecen silenciosas tal vez no lo sean porque afectan el empal me (al activar un sitio de empalme críptico o modificar una se cuencia intensificadora de empalme exónica; sección 11.4.3); ► mutaciones no sinónimas que cambian la secuencia del pro ducto génico, que puede ser un polipéptido o un RNA no co dificante (= no traducido) funcional. Se piensa que las mutaciones silenciosas verdaderas en genomas de mamíferos son mutaciones neutrales (que no confieren ventaja o desventaja al organismo en cuyo genoma se originan). En contras te, las mutaciones no sinónimas pueden agruparse en tres clases: las que tienen un efecto perjudicial, las que carecen de algún efecto y las que ejercen un efecto benéfico (p. ej„ mejoría de la función gé nica o interacción intergénica). Es probable que casi todas las mu taciones no sinónimas nuevas tengan un efecto perjudicial en la expresión génica y por consiguiente ocasionen enfermedad o letali dad. Sin embargo, la frecuencia de este tipo de mutación en la po blación es mucho muy reducida gracias a la selecció n n a tu ra l (véase recuadro 11-2). En consecuencia el total de mutaciones en el DNA de codificación es mucho menor que el del DNA no codificante y las secuencias del DNA de codificación (y las secuencias reguladoras importantes, etc.) muestran un grado más o menos alto de conser vación evolutiva. ► La p r esió n d e selecció n (las selecciones impuestas por selección natural) reduce tanto la frecuencia total de mutaciones sobre vivientes en el DNA de codificación como la gama de muta ciones que se observa. Por ejemplo, las deleciones/inserciones de uno o varios nucleótidos son frecuentes en el DNA no co dificante pero destaca el hecho que no se encuentren en el DNA de codificación. Esto a menudo se debe a que estas mu taciones ocasionarán un cambio en el marco de lectura traduc-

11.2

MUTACIONES SIMPLES

319

Recuadro 11-2. Mecanismos que afectan la frecuencia de alelos en la población Los individuos de una población difieren entre sí, sobre todo com o resul tado de la variación genética hereditaria. La frecuencia de cualquier alelo mutante en una población depende de varios factores, que abarcan selec ción natural, deriva genética aleatoria e intercambios secuenciales entre secuencias no alélicas.

va genética aleatoria puede ocasionar cambios considerables en las fre cuencias de alelos (véase figura). En ausencia de una nueva mutación y otros factores que afectan la frecuencia de alelos, como la selección, los alelos que se someten a deriva genética aleatoria se fijarán por último (el punto al que la frecuencia de alelo en la población es 0 o 100%).

SELECCIÓN NATURAL Selección natural es el proceso por el que parte de la variación genética heredada dará por resultado diferencias entre individuos en cuanto a su ca pacidad para sobrevivir y reproducirse con éxito. La reproducción diferen cial se debe a divergencias entre los individuos en cuanto a su capacidad para efectuar la reproducción (que se afecta por parámetros como morta lidad, salud y éxito en el apareamiento) y producir una descendencia salu dable (diferencias en fertilidad, fecundidad y viabilidad de la descendencia). La aptitud de un organismo es una medida de la capacidad de los indivi duos para sobrevivir y reproducirse de manera satisfactoria. En los mode los más simples se considera que la aptitud de un individuo está determinada sólo por su constitución genética y se supone que todos los locus contribuyen de modo independiente a la aptitud de un individuo, de manera que es posible tratar por separado cada locus. En consecuencia también puede hablarse de aptitud de un genotipo.

Generación

Frecuencia de alelo 0 .5 /0 .5

0 .5 /0 .5

0 .4 /0 .6

La gran mayoría de las nuevas mutaciones no sinónimas en el DNA de co dificación reduce la aptitud de sus portadores. Por consiguiente se selec cionan contra la población y se eliminan de la misma (selección negativa o purificante). En ocasiones una nueva mutación puede ser tan apta co mo el mejor alelo en la población; esta mutación es neutral desde el pun to de vista de la selección. Muy rara vez una nueva mutación confiere una ventaja selectiva e incrementa la aptitud de su portador. Esta mutación se someterá a selección positiva (o ventajosa), que cabria esperar que fo mentara su diseminación a través de una población. Si se consideran lo cus con dos alelos que poseen diferentes aptitudes, el heterocigoto puede tener una aptitud intermedia entre los dos tipos de homocigotos. En este caso la modalidad de selección es codominante y la selección será direccional, lo que resultará en un incremento del alelo ventajoso. Sin embargo, en algunos casos es posible que una nueva mutación no sea ventajosa en homocigotos sino sólo en heterocigotos (ventaja de heterocigoto). Esta situación, en la que el heterocigoto tiene una aptitud más alta que el homocigoto mutante y el homocigoto normal, es una forma de selección ba lanceada que se conoce como selección sobredominante (véase el ejemplo de la fibrosis quística en el recuadro 4-8).

0 .4 /0 .6

0 .7 /0 .3

0 .7 /0 .3

DERIVA GENÉTICA ALEATORIA Los cambios en la frecuencia de alelos pueden ocurrir por simple azar (deriva genética aleatoria). Aun si todos los individuos de una población tienen la misma aptitud de manera que la selección natural no pueda ope rar, las frecuencias de alelos cambiarán por un muestreo aleatorio de ga metos. El muestreo ocurre porque sólo una pequeña proporción de los gametos disponibles en cualquier generación se transmite alguna vez a la generación siguiente (no todos los individuos de una población se repro ducirán por las circunstancias o elección). Inclusive si no hubiera un ex ceso de gametos (de modo que cada individuo aislado contribuye con dos gametos a la generación siguiente), ocurriría muestreo porque los he terocigotos pueden producir dos tipos de gametos que portan diferentes alelos pero los dos gametos que se transmiten a la generación siguiente pueden llevar, por azar, el mism o alelo. La deriva genética tiene poco efecto en poblaciones grandes. Ello se debe a que aunque sólo se transmite una fracción pequeña del total de game tos, se transmiten los gametos suficientes para ser, con mucho, estadís ticamente representativos de todos los gametos en la población. Sin embargo, cuando los tamaños de la población son pequeños (p. e j„ como resultado de aislamiento geográfico), el número de gametos que se trans mite a la generación siguiente será más pequeño en proporción y la deri

El muestreo aleatorio de gametos en poblaciones pequeñas puede conducir a cambios considerables en las frecuencias de alelos. Modificado de Bodmer y Cavalli-Sforza (1976) Genetics, Evoiution and Man. INTERCAMBIO DE SECUENCIAS INTERLOCUS En algunas familias génicas, genes individuales codifican en esencia el mism o producto, pero puede haber intercambios de secuencias que ocu rren entre las diferentes copias génicas. Por ejemplo, rRNA 5.8S, 18S y 28S humanos son codificados por unidades de transcripción repetidas en form a tándem (véase fig. 10-2) y muestran una propensión particular a intercambios de secuencias entre las diferentes repeticiones. La frecuen cia de un tipo de repetición puede aumentar en la población como resul tado de los intercambios de secuencias entre distintas repeticiones (véase fig. 11-8 para una ilustración del principio general). En casos en los que múltiples locus producen productos idénticos, todos los genes pueden considerarse de manera efectiva como el equivalente de alelos. aunque no en el sentido mendeliano (que por lo general permite un máxi mo de dos alelos en la célula diploide). Por consiguiente la frecuencia de una repetición específica (“ alelo” ) puede determinarse en parte por la fre cuencia con que participa en intercambios de secuencia.

320

CAPÍTULO ONCE

INESTABILIDAD DEL GENOMA HUMANO: MUTACIÓN Y REPARACIÓN DEL DNA

cional (mutación de cambio de marco) mediante la introduc ción de un codón de terminación prematuro y causando pérdi da de la expresión gènica. Aun si las inserciones/deleciones no originan una mutación de cambio de marco, con frecuencia afectan la función genica, por ejemplo, como resultado de la eliminación de una secuencia de codificación fundamental. Por el contrario el DNA de codificación se caracteriza por una fre cuencia comparativamente alta de sustitución de bases no alea toria que ocurre en localizaciones que conducen a efectos mínimos en la expresión genica (véase sección siguiente).

11.2.4 La localización de sustituciones de bases en el DNA de codificación es no aleatoria Las sustituciones de nucleótidos que ocurren en el DNA no codi ficante no suelen tener un efecto neto en la expresión gènica. Las excepciones comprenden algunos cambios en los elementos pro motores o alguna otra secuencia de DNA que regula la expresión gènica o que se requiere para el empalme (fig. 1-15). Las sustitucio nes que se observan en las secuencias del DNA de codificación que especifica polipéptidos muestran un patrón de sustituciones no aleatorio en exceso por la necesidad de conservar la secuencia polipéptida y la función biológica. En principio las sustituciones de ba ses pueden agruparse en tres clases según su efecto en el potencial de codificación (véase recuadro 11-3). Las diferentes clases de sustitución de bases que se presentan en el recuadro 11-3 muestran tendencias diferenciales a localizarse en la primera, segunda o tercera posiciones de bases de codones. A causa del diseño del código genético, diferentes grados de degene ración caracterizan distintos sitios. Las posiciones de bases en co dones que especifican aminoácidos pueden agruparse en tres clases: ► los sitios no degenerados son posiciones de bases en las que las tres posibles sustituciones pertenecen a la variedad no si nónima. Abarcan la posición de la primera base de todos los codones con excepción de ocho, la posición de la segunda ba se de todos los codones y la posición de la tercera base de dos codones, AUG y UGG (véase fig. 11-2). Si se consideran las frecuencias de codones observadas en genes humanos, com prenden alrededor de 65% de las posiciones de bases en co dones humanos. El índice de sustitución de bases en sitios no degenerados es muy bajo y compatible con una presión de se lección conservadora potente para evitar cambios de aminoá cidos (véase más adelante); ► los sitios degenerados cuádruples son posiciones de bases en las que las tres posibles sustituciones son sinónimas y se en cuentran en la posición de la tercera base de varios codones (véase fig. 11-2). Comprenden alrededor de 16% de las posi ciones de bases en codones humanos. La tasa de sustitución en sitios cuádruples es muy similar a la que ocurre dentro de intrones y seudogenes, compatible con la suposición de que las sustituciones sinónimas son neutrales desde el punto de vista de la selección (sección 11.2.5); ► los sidos degenerados dobles son posiciones de bases en las que una de las tres posibles sustituciones es sinónima. Suelen encontrarse en las posiciones de la tercera base de codones, pero también en la posición de la primera base en ocho codo nes (véase fig. 11-2). Comprenden alrededor de 19% de las posiciones de bases en codones humanos. Como cabría espe

rar, la tasa de sustitución de los sitios degenerados dobles es intermedia: sólo una de las tres posibles sustituciones, una transición, conserva el mismo aminoácido. Las otras dos po sibles sustituciones son transversiones que, por la forma en que el código genético evolucionó, suelen ser sustituciones conservadoras. Por ejemplo, en la posición de la tercera base del codón de glutamato GAA, una transición A- *C es silen ciosa, en tanto que las otras dos transversiones (A-*C; A—>T) dan como resultado la sustitución por un aminoácido muy si milar, aspartato. El diseño del código genético y el grado al que un aminoácido tie ne funciones similares a otro afectan las m u ta b ilid a d es d e a m i n o á cid o s relativas. Ciertos aminoácidos pueden desempeñar acciones fundamentales que no es posible sustituir con facilidad por otras. Por ejemplo, con frecuencia la cisterna participa en el en lace disulfuro que puede tener una función de importancia crucial en el establecimiento de la conformación de un polipéptido (véase fig. 1-25). Como ningún otro aminoácido tiene una cadena lateral con un grupo sulfhidrilo, la presión de selección es potente para conservar los residuos de cisterna en muchas localizaciones y la cis terna es uno de los aminoácidos menos mutables (cuadro 11-1). En contraste, algunos otros aminoácidos, como serina y treonina, tie nen cadenas laterales muy similares y sustituciones tanto en la po sición de la primera base de codones (ACX—>UCX, en la que X = cualquier nucléotido) como en las posiciones en la segunda base (ACPy—>AGPy, en la que Py =pirimidina) que pueden originar sus tituciones en serina treonina. Quizá como resultado, la serina y la treonina se encuentran entre los aminoácidos más mutables (cua dro 11-1).

11.2.5 Las tasas de sustitución varían de manera considerable entre diferentes genes y entre distintos componentes génicos Tasa de sustitución neutral La reciente disponibilidad de secuencias bosquejo de los genomas humano y del ratón permitió analizar las tasas de divergencia y sus titución de secuencias en la extensión del genoma (Mouse Genome Sequencing Consortium, 2002). Como punto de referencia se esti mó la tasa de sustitución neutral a partir de alineamientos de DNA no funcional. Ello se logró al identificar secuencias repetidas ances trales (repeticiones no codificantes basadas en transposón que se juzgó se habían insertado en el DNA genómico del ancestro común y que se fijaron antes de la divergencia de humanos y ratones). Fue factible identificar un total de 165 Mb de secuencias repetidas an cestrales (las secuencias ortólogas se determinaron mediante alinea ción de DNA no repetido adyacente). La identidad de secuencias total en secuencias repetidas ances trales se estimó en 66.7%. La identidad de secuencias en sitios degenerados cuatro veces (véase sección previa), otro grupo de se cuencias en potencia no funcionales, fue de 67%. Estos valores tan similares condujeron a estimaciones de 0.46 a 0.47 sustituciones por sitio para la tasa de sustitución neutral (Mouse Genome Sequen cing Consortium, 2002). Con base en las diferencias en la tasa de mutación en los linajes que condujeron a los humanos y los rato nes modernos (sección 11.2.6), se estimó que esto refleja una tasa de sustitución neutral aproximada de 2 X 10 ; por sitio por año en el linaje humano.

11.2

MUTACIONES SIMPLES

321

becuadro 11-3. C lases de sustitución de una base en el DNA que codifica poli tiempo en tiempo la sustitución de un nucleótido aislado dentro de un a o n de codificación altera el empalme de RNA y ocasiona una expresión jr 'ic a defectuosa. Esto puede suceder en varias formas: mediante actiíáción de un sitio de empalme críptico dentro de un exón (fig. 1 1 - 1 2 ), por r o ta c ió n de nucleótidos en las secuencias del donador y el aceptor de í- p a lm e justo adyacentes a las señales GT y AG conservadas (fig. 1-15), o por alteración de secuencias internas que regulan el empalme, en especial intensificadores de empalme exónico (sección 11.4.3). Otras sustituciones de base única pueden clasificarse como sinónimas (silen:» sa s) o no sinónimas, en las que un codón está mutando para causar un cambio de la secuencia de aminoácidos. jí

SUSTITUCIONES SINÓNIMAS (SILENCIOSAS) El resultado de la sustitución es un nuevo codón pero especifica el misTio aminoácido. Constituyen el cambio que se observa con mayor fre cuencia en el DNA de codificación (porque casi siempre son mutaciones neutrales y no están sujetas a presión de selección). Las sustituciones silenciosas se presentan sobre todo en la posición de la tercera base de un codón porque la tercera base bamboleante significa que el codón al terado a menudo especifica el m ism o aminoácido que antes. Sin embar go, a veces la sustitución incluye la posición de la primera base, como se observa en algunos codones de leucina (C UA«U UA, £U G oU U G ) y arginina (AGA£GA, AGG£GG). MUTACIONES SIN SENTIDO Representan una forma de sustitución no sinónima en la que un codón que especifica un aminoácido se reemplaza por un codón de detención. Puesto que estas mutaciones casi siempre se acompañan de una dis minución notable de la función génica, la presión de selección asegura que en condiciones normales sean raras. El polipéptido humano prome dio es especificado por alrededor de 500 a 550 codones, un tamaño que

cabría esperar que incluyera más de 20 codones de terminacio:: si nc hubiera restricciones funcionales. MUTACIONES EN SENTIDO ERRÓNEO Son sustituciones no sinónimas en las que el codón alterado especifica un aminoácido distinto. Pueden clasificarse en dos subgrupos: ► sustituciones conservadoras, cuyo resultado es el reemplazo de un aminoácido por otro químicamente similar a él. Con frecuencia el efecto de estas sustituciones en la función de la proteina es mínimo porque la cadena lateral del nuevo aminoácido puede tener funciones similares a la del aminoácido que reemplaza (véase nota de pie mas adelante). Para reducir al mínimo el efecto de la sustitución del nu cleótido, al parecer el código genético evolucionó de tal manera que los codones que especifican aminoácidos relacionados se vinculan en sí mism os. Por ejemplo, los pares de codón Asp (GAC, GAT) y Glu (GAA, GAG) aseguran que la tercera base bamboleante en el codón GAX (en la que X es cualquier nucleótido) tenga un efecto mínimo. Sin embargo, algunos cambios en la posición del primer codón también pueden ser conservadores, por ejemplo £UX (Leu)»G U X (Val): ► sustituciones no conservadoras dan por resultado el reemplazo de un aminoácido por otro con una cadena lateral distinta (véase cua dro). En ocasiones se introduce una diferencia de carga; otros cam bios pueden incluir reemplazo de cadenas laterales polares por otras no polares y viceversa. Las sustituciones de bases en las posiciones del primero y el segundo codones pueden producir sustituciones no conservadoras, por ejemplo, £GX (Arg)-*£G X (Gli), CQX (Pro), CjJX (Leu) o CAX (Gln/His), etc. (donde X = cualquier nucleótido).

D istancias fisicoquím icas entre pares de am inoácidos. Arg

Leu

Pro

Tre

Ala

Val

Gli

lie

Fen

Tir

Cis

His

Gln

Asn

Lis

Asp

Glu

Met

Trp

110

145

74

58

99

124

56

142

155

144

112

89

68

46

121

65

80

135

177

Ser

102

103

71

112

96

125

97

97

77

180

29

43

86

26

96

54

91

101

Arg

98

92

96

32

138

5

22

36

198

99

113

153

107

172

138

15

61

Leu

38

27

68

42

95

114

110

169

77

76

91

103

108

93

87

147

Pro

58

69

59

89

103

92

149

47

42

65

78

85

65

81

128

Tre

64

60

94

113

112

195

86

91

111

106

126

107

84

148

Ala

109

29

50

55

192

84

96

133

97

152

121

21

88

Val

135

153

147

159

98

87

80

127

94

98

127

184

Gli

21

33

198

94

109

149

102

168

134

10

61

lie

22

205

10

116

158

102

177

140

28

40

Fen

83

99

143

85

160

122

36

37

Tir

174

154

139

202

154

170

196

215

Cis

24

68

32

81

40

87

115

His

46

53

61

29

101

130

Gln

23

42

142

174

Asn

101

56

95

110

Lis

45

160

181

Asp

126

152

Glu

67

Met

194

94

La cuantificación del grado de similitud entre dos aminoácidos se basa en propiedades como polaridad, volumen molecular y composición química, y ios números granass significan mayor disimilitud. En el cuadro anterior, tomado de Grantham (1974), los pares más similares son: Leu o lie (5), Met » lie (10) y Met » Leu (15): .os pares ~ás disimiles son Cis « Trp (215), Cis » Fen (205) y Cis « Lis (202).

¡ ,

322

CAPÍTULO ONCE

INESTABILIDAD DEL GENOMA HUMANO: MUTACIÓN Y REPARACIÓN DEL DNA

UUA UUG

Fen Fen Leu Leu

17.1 20.4 7.3 12.7

UCU UCC UCA UCG

Ser Ser Ser Ser

CUU CUC CUA CUG

Leu Leu Leu Leu

12.9 19.5 7.0 40.1

CCU CCC CCA CCG

Pro Pro Pro Pro

AUU AUC AUA AUG

lie lie lie M et

15.8 21.3 7.2 22.3

ACU ACC ACA ACG

Tre Tre Tre Tre

GUU GUC GUA GUG

Val Val Val Val

10.9 14.6 7.0 28.7

GCU GCC GCA GCG

Ala Ala A la Ala

UUU

uuc

14.7 17.5 11.9 4.5

UAU UAC (UAA (UAG

17.3

CAU CAC CAA CAG

His His Gin Gin

15.0 11.9 34.4

CGU CGC CGA CGG

Arg Arg Arg Arg

AAU AAC AA AAG

Asn Asn L is Lis

16.7 19.3 24.0 32.5

AGU AGC AGA AGG

Ser Ser Arg Arg

GAU GAC GAA GAG

Asp Asp Glu Glu

GGU GGC GGA GGG

G li G li G li G li

2 0 . 0

16.7 7.0 12.9 19.1 14.9 6 . 2

18.6 28.4

16.0 7.6

T ir 1 2 . 1 T ir 15.5 DETENCIÓN) DETENCIÓN) 1 0 . 6

2 2 . 1

25.7 29.0 40.3

UGU UGC (UG A UGG

C ls 1 0 . 1 C is 12.4 DETENCIÓN) Trp 13.0

4.7 1 0 . 8

6.3 1 1 . 8

1 2 . 0

19.4 11.7 1 1 . 6

1 0 . 8 2 2 . 6

16.4 16.4

C la v e N S itio n o d e g e n e ra d o N S itio d e g e n e ra d o d o b le N S itio d e g e n e ra d o c u á d ru p le

Fig. 11-2. Frecuencias de codón en genes humanos y localizaciones de sitios degenerados dobles y cuádruples. Las frecuencias de codón observadas se presentan como valores de cada 1 000 (p. e j„ UUU = 17.1/1 000 o 0.0171). Se derivaron de la base de datos Codon Usage (http://www.kazusa.or.ip/codon/) e incluyeron el muestreo de 21 930 294 codones del GenBank Release 131.0 (15 de agosto de 2002). Nota: aunque ocho de las 61 posiciones de primera base son degeneradas dobles, alrededor de 96% de todas las posibles sustituciones en la posición de primera base no es sinónimo. De las sustituciones en la posición de segunda base, 100% no es sinónimo y en la posición de la tercera base, cerca de 33%.

Cuadro 11-1. Mutabilidad relativa de aminoácidos. (Ala = 100; datos obtenidos de Collins y Jukes, 1994) Tre

116

Asp

84

Ser

114

Lis

77

His

107

Glu

76

Asn

107

Pro

67

Met

102

Leu

58

Ala

100

Gli

57

Gln

99

Fen

55

Val

98

Tir

53

Arg

94

Trp

31

lie

92

Cis

29

Tasa de sustitución en diferentes componentes génicos Las comparaciones de más de 14 000 pares de secuencias génicas ortólogas en humanos y ratones también enfatizaron las diferencias en la tasa de sustitución dentro de diferentes componentes génicos (Mouse Genome Sequencing Consortium, 2002; véase fig. 11-3 para una representación visual basada en un subgrupo de los datos). Co mo cabría esperar, las regiones codificantes son las más conservadas

(85% de identidad de secuencia o 0.165 sustituciones por sitio de nucleótido) pero las secuencias de intrón están mucho menos con servadas (68.6% de identidad secuencial, que se acerca al total de 69.1% de identidad de secuencias en las comparaciones de secuen cias en toda la extensión del genoma). Las regiones no traducidas muestran una conservación intermedia (5’UTR, 75.9%; 3' UTR, 74.7%) igual que los 200 pb de flanqueo corriente arriba (región promotora, 73.9%) y 200 pb corriente abajo (70.9%).

Tasa de sustitución en diferentes genes y dominios Los diferentes genes están conservados en distintas extensiones. Aun que por lo general la tasa de sustitución en sitios sinónimos está has ta cierto punto preservada, la tasa de sustitución no sinónima puede variar mucho. Si se utiliza K s para indicar el número de sustituciones por sitio sinónimo y KÁpara el de sustituciones por sitio no sinóni mo, los genes que se someten a selección negativa (purificación) ten drán Ka « Ks . Los genes sometidos a selección positiva para reemplazo de aminoácidos también pueden mostrar KA< Ks porque es posible que la selección positiva sólo opere en unos cuantos sitios cruciales y es compensada por la selección de purificación en un gran número de otros sitios. Cuando el Mouse Genome Sequencing Consor tium (2002) examinó más de 12 000 pares de genes ortólogos huma nos y de ratón encontró que el valor mediano de KA/KS es de 0.115. En un extremo se encuentran proteínas cuyas secuencias están en extremo bien conservadas porque se requieren para funciones cruciales de la célula y especifican proteínas como actinas, calmodulina, histonas, proteínas ribosómicas, ubiquitinas, etc. Por ejem-

11.2

Primer exón

Exones medios

MUTACIONES SIMPLES

323

Último exón

100 95 90

-

85 80

U

75 70 65

- > i

60 55 50

200 pb

UTR 5'

Intrón

Intrón

Corriente arriba

UTR 3'

200 pb Corriente abajo

Posición dentro del genoma

Fig. 11-3. Variación en la conservación de secuencia en humanos y ratones a través de un gen típico. La tasa de sustitución de nucleótidos varía en diferentes componentes de un gen, como lo muestra la alineación de más de 3 000 RefSeq de mRNA humanos y secuencias genómicas corriente arriba/corriente abajo contra secuencias ortólogas de ratón. Adaptado de Mouse Genome Sequence Consortium (2002). Nature 420, 520-562, figura 25A con autorización de Nature Publishing Group.

pío, las proteínas ubiquitinas de humanos, ratones y Drosophila muestran una identidad de secuencias de 100% y la comparación con la ubiquitina de la levadura revela una identidad de secuencias de 96.1%. Estos genes no están protegidos de manera especial de mutaciones porque la tasa de sustitución sinónima de codón es tí pica de la de muchos genes que codifican proteínas. Lo que los dis tingue es la tasa en extremo baja de sustitución no sinónima de codones en comparación con otros genes (véase cuadro 11-2 para algunos ejemplos). Los genes que muestran las tasas más altas de sustitución no si nónima de codones incluyen muchos relacionados con los sistemas de defensa y respuesta inmunitaria de mamíferos (cuadro 11-2), igual que seis de ocho dominios proteínicos comunes relacionados con los valores KA/Ks m is altos (Mouse Genome Sequencing Consor tium, 2002, cuadro 13). La relación KA/KS alta en estos casos indi ca que se encuentran bajo una selección de purificación reducida, un incremento de selección positiva o ambos. El incremento de la selección positiva podría indicar una lucha competitiva entre un huésped mamífero y sus patógenos, en la que cada uno está bajo una presión potente para responder a innovaciones en el otro geno ma. Los mismos seis de ocho dominios con los valores Ky¡/K¡ más altos se encuentran en proteínas secretadas y los dominios secreta dos tienen relaciones KA/K¡ mucho más altas que los dominios nu cleares y citoplásmicos (cuadro 11-3). Al parecer los dominios catalíticos tienen relaciones KA/KS comparativamente bajas.

11.2.6 La tasa de sustitución puede variar en las diferentes regiones cromosómicas y en distintos linajes Tasa de sustitución y heterocigosidad en diferentes regiones cromosómicas Por diversas razones, la tasa de sustitución en el genoma mitocondrial es mucho más alta que en el DNA del genoma nuclear (sec ción 11.4.2), pero la última muestra una variación regional muy

considerable. El bosquejo de secuencias del genoma humano y del ratón brindó una oportunidad ideal para estimar lo anterior. Me diante el uso de secuencias de repetición ancestrales alineadas (véa se sección previa) y sitios degenerados cuatro veces alineados, el Mouse Genome Sequencing Consortium (2002) calculó la tasa apa rente de sustitución neutral para unas 2 500 ventanas de 5 Mb su perpuestas a través del genoma humano. La variación regional fue evidente cuando se compararon las tasas promedio en diferentes cromosomas. La tasa de sustitución es más baja en el cromosoma X y se observan diferencias importantes entre los autosomas (fig. 114A). Ya que el cromosoma X transcurre dos tercios de su vida en mujeres, la tasa de sustitución baja puede reflejar diferencias en el número de divisiones de las células germinales en varones y muje res (recuadro 11-4). También la variación subcromosómica en la tasa de sustitución (lo mismo que en los índices de deleciones e inserciones) es muy obvia, como en el caso del cromosoma 22 humano (fig. 11-4B). Es to refleja en parte la composición de bases: aunque al parecer la ta sa de sustitución es más alta en regiones de contenido muy alto o bajo de G + C, la relación es compleja. Con el mapa de recombi nación de alta resolución deCode Genetics del genoma humano (Kong y cois., 2002) como referencia se identificó asimismo una correlación entre la tasa de sustitución y la de recombinación, y una densidad de polimorfismo de nucleótido único (PNU) (véase fig. 11-4C). Si bien la heterocigosidad promedio en el genoma huma no es del orden de 1 de cada 1 250 bases (Reich y cois., 2002), la densidad de PNU puede variar de modo considerable en diferentes partes del genoma y cuando se promedia a través de ventanas de 200 kb, las tasas de heterocigosidad muestran una variación hasta de 10 veces (International SNP Map Working Group, 2001). En una resolución más fina las regiones mesurables del genoma humano que abarcan más de decenas de miles de pares de bases al parecer tienen tasas intrínsecamente altas y bajas de variación de secuen cias. En estas regiones sólo una proporción pequeña (hasta 25%) de la variación parece deberse a la tasa de mutación local; el contribu yente mayor es la historia genealógica compartida (Reich y cois. 2002).

324

CAPITULO ONCE

INESTABILIDAD DEL GENOMA HUMANO: MUTACIÓN Y REPARACIÓN DEL DNA

Cuadro 11-2. Tasas de sustituciones sinónimas y no sinónimas en genes que codifican proteínas en mamíferos. Gen

Número de codones comparados

Tasa no sinónima ( x 109)

Tasa sinónima ( x 109)

Actina a

376

0.01

2.92

Proteina ribosómica S14

150

0.02

2.16

Proteina ribosómica S17

134

0.06

2.69

Aldolasa A

363

0.09

2.78

HPRT

217

0.12

1.57

51

0.20

3.03

G lob in aa

141

0.56

4.38

Globina p

146

0.78

2.58

Albúmina

590

0.92

5.16

ig v H

100

1.10

4.76

Hormona del crecimiento

189

1.34

3.79

Ig k

106

2.03

5.56

Interferón p,

159

2.38

5.33

Interferón y

136

3.06

5.50

Insulina

Datos de comparaciones de humanos y roedores extraídos del cuadro 4-1 de Grauer y Li (2000).

Tasas de sustitución en humanos comparadas con ratones El bosquejo de las secuencias humana y de ratón también hizo po sible analizar la forma en que las tasas de sustitución pueden variar en diferentes linajes. Como se consideró que las sustituciones sinó nimas eran efectivamente neutrales desde el punto de vista de res tricciones de selectividad, hace más de 30 años se sugirió el concepto del reloj molecular constante (por el que un determinado gen o un producto del mismo se somete a una tasa constante de evolución molecular). Sin embargo, desde entonces varias líneas de evidencia argumentaron contra un reloj molecular constante (véase Ayala,

1999, y el cuadro 11-2 que muestra diferencias aparentes en la tasa de sustituciones sinónimas de codón y también en el caso de susti tuciones no sinónimas de codón). Para valorar las tasas relativas de sustituciones de nucleótidos en dos linajes que conducen a las especies A y B actuales, muchos es tudios utilizan una prueba de tasa relativa con una especie C de referencia relacionada en forma distante (que se sabe que se ramifi có temprano en la evolución, antes de la división A-B). A fin de cal cular el valor K, la frecuencia de sustituciones sinónimas, se emplean comparaciones de pares de bases de ortólogos en A y C, y en B y C. Los valores KAc y Kbq proporcionan entonces una medida

Cuadro 11-3. Conservación de secuencias y tasas de sustitución de genes ortólogos y DNA que codifica dominios en humanos y ratones. Regiones ortólogas

Identidad de aminoácidos (%)

Ka

Ks

Ka/Ks

Proteína de longitud completa

78.5

0.071

0.602

0.115

Regiones proteínicas que contienen dominio

93.5

0.032

0.601

0.061

Regiones proteínicas sin dominio

71.1

0.090

0.586

0.155

Todos los dominios predichos

95.1

0.024

0.627

0.062

Dominios catalíticos

96.6

0.015

0.578

0.033

Dominios no catalíticos

94.9

0.026

0.635

0.068

Dominios nucleares

98.6

0.008

0.655

0.050

Dominios secretados

88.9

0.058

0.694

0.091

Dominios citoplásmicos

96.7

0.015

0.587

0.041

KA, tasa de sustitución no sinónima; Ks, tasa de sustitución sinónima. Datos resumidos del cuadro 12 del Mouse Genome Sequencing Consortium (2002) Nature 420, 520-562, con autorización de Nature Publishing Group.

11.2

MUTACIONES SIMPLES

325

A) 0.60

0.55 o

Cl

v> 90% de identidad secuencial que se extien de en segmentos de 1 kb hasta varios cientos de kb de longitud (Bailey y cois., 2002; Samonte y Eichler, 2002; véase fig. 12-12). Pueden mencionarse las siguientes:

368

CAPÍTULO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

► d u p lica cion es in tracrom osóm ica s que tienden a ocurrir en regio nes eucromáticas. Cuando la identidad secuencial excede 95% y se extiende 10 kb o más, estos elementos de secuencias suelen predisponer a deleciones, duplicaciones e inversiones a gran es cala, muchas de las cuales se acompañan de enfermedades (sec ciones 11.5.4, 11.5.5).

saico que combinan módulos de secuencias de una variedad dife rente de localizaciones cromosómicas. Al parecer, ciertas regiones del genoma, en especial las pericentroméricas, aceptan con facili dad copias de secuencias de otras regiones del genoma y las inter cambian con otras de estas regiones (véase fig. 12-13).

► d u p lica cion es in tercrom osóm ica s que tienden a estar localizadas en regiones pericentroméricas o subteloméricas. Las duplica ciones pueden incluir genes o porciones de ellos, que suelen dar lugar a copias génicas no funcionales esparcidas (fig. 9-13), transcritos quiméricos y quizá nuevos genes. Al parecer, las du plicaciones intercromosómicas de primates son un poco menos frecuentes que las intracromosómicas (Samonte y Eichler,

12.2.6 Los cromosomas X y Y humanos muestran regiones importantes de homología secuencial, incluidas las regiones seudoautosómicas comunes

2002).

La selección del genoma del ratón para secuencias relacionadas muy de cerca con las secuencias humanas duplicadas de modo seg mentario revela de manera característica secuencias de copia única. Por consiguiente, las duplicaciones segmentarias humanas se origi naron en época comparativamente reciente: en apariencia, los acontecimientos de duplicación segmentaria han sido constantes en el linaje de primates durante los últimos 40 millones de años y es posible que casi todos sucedieran en los últimos 12 millones de años (Samonte y Eichler, 2002). Sin embargo, la duplicación seg mentaria no es específica de primates: en el ratón tuvieron lugar duplicaciones pericentroméricas recientes no relacionadas (Thomas y cois., 2003). No se comprende bien el mecanismo de la duplica ción segmentaria, pero casi siempre da lugar a estructuras en mo

En mamíferos, pares de cromosomas autosómicos homólogos son idénticos desde el punto de vista estructural (homomórfico); se pre supone que el pareamiento de cromosomas en la meiosis se facilita por el grado alto de identidad secuencial entre homólogos, aunque por un mecanismo que no se comprende. En contraste, los cromo somas X y Y de seres humanos y otras especies de mamíferos son heteromórficos. El cromosoma X humano es submetacéntrico y contiene más de 160 Mb de DNA, en tanto que el Y es acrocéntri co y mucho más pequeño (incluye alrededor de 50 Mb de DNA). El cromosoma X humano contiene numerosos genes de importan cia; en notable contraste, el cromosoma Y sólo posee alrededor de 50 genes (cuadro 12-2) y la mayor parte del cromosoma Y se com pone de heterocromatina constitutiva, inerte desde el punto de vis ta genético. Sin embargo, cabe señalar que muchos de los genes en la porción no recombinante del cromosoma Y participan en la es permatogénesis y la determinación del sexo (cuadro 12-2) y que el cromosoma X al parecer también contiene en abundancia genes re lacionados con el sexo y la reproducción (p. ej., Wangy cois., 2001).

Locus donadores

Distribución de transposición

Locus aceptor Duplicación com pleta

Fig. 12-13. Modelo de duplicación segmentaria. Las copias de secuencias moderadamente largas a grandes (segmentos de 1 a 2 0 0 kb) se originan por duplicación de secuencias a partir de ciertas regiones en el genoma (locus donador) y se transponen al Integrarse en cualquier otra parte del genoma

(transposición duplicativa).

Como se muestra,

pueden insertarse en regiones receptoras comunes diferentes secuencias donadoras de regiones muy distintas. Los diferentes acontecimientos de transposición duplicativa ocurren de manera independiente con el tiempo y dan lugar a bloques más grandes de secuencias duplicadas que tienen una estructura

en mosaico.

Las porciones de esta estructura en mosaico pueden a su vez duplicarse y copiarse a otras regiones del genoma. Los

reordenamlentos (deleciones e Inversiones) alteran de forma subsecuente la estructura de estas regiones. Reproducido de Samonte y Eichler (2 0 0 2 ),

Nature Rev. Genet.

3:6 5 -7 2 , con autorización de Nature Publishing Group.

12.2

EVOLUCIÓN DE CROMOSOMAS Y GENOMAS

369

Cuadro 12-2. Clasificación funcional de genes del cromosoma Y humano. Categoría génica

Genes

Función(es) conocida/posible

Especificidad de expresión

¿Múltiples copias en Y?

¿Tiene homólogo ¿Homólogo X X activo? inactivado en mujeres?

Seudoautosómica

M uchos*

Tan diversa como genes autosómicos haya

Diversa

No

Sí

Sí (excepto

SYBL1, HSPRY3

Clase 1 RNY

RPSRY, ZFY, USP9Y, DBY, UTY, TB4Y, SMCY, EIF1AY

Cuidadores

Amplia

No

Si-

No

Clase 2 RNY

TÍY1, TSPY, PRY TTY2, CDY, XKRY, DAZ, BPY2

Espermatogénesis

Testículo

Si-

No

N/A

Clase 3 RNY

SRY RBMY AMELY VCY PCDHY

Determinación masculina Espermatogénesis Desarrollo dental Desconocida Desconocida

Testículo Testículo Yema dental Testículo Cerebro

No Sí No Si No

Sí SiSí Sí Sí

Sí Sí Tal vez N/A No

(RNY, región no recomblnante del cromosoma Y; N/A, no aplicable). ‘ Cuando menos 17, de los cuales 13 se encuentran en la región seudoautosómica mayor (véase fig . 12-15).

A pesar de ser distintos a nivel morfológico, los cromosomas X y Y muestran regiones sustanciales de homología, incluida una diversidad de homologías Xp-Yq y Xq-Yp, y también homologías Xp-Yp y Xq-Yq. Estas homologías permitieron identificar una di versidad de pares de genes X-Y (véase fig. 12-14). La existencia de estas homologías sugiere que los dos cromosomas evolucionaron a partir de un par de cromosomas homomórficos ancestrales. Es evidente que los dos cromosomas sufrieron con posterioridad una divergencia notoria y las secuencias que están cerca en un cromo soma pueden tener equivalentes muy espaciados en el otro. Los cromosomas X y Y también son capaces de parearse durante la meiosis masculina y en consecuencia pueden intercambiar se cuencias en la misma forma en que lo llevan a cabo los homólo gos autosómicos. No obstante, los intercambios meióticos son de extensión muy reducida y se limitan a regiones seudoautosómicas pequeñas en las puntas del cromosoma (por consiguiente, es tas secuencias no están ligadas a X o Y y de ahí el término seudoautosómica). En los seres humanos existen dos regiones seudoautosómicas. ► La región seudoautosómica mayor (PAR-1) se extiende 2.6 Mb en las puntas extremas de los brazos cortos de X y Y y se sabe que contiene cuando menos 13 genes (Ried y cois., 1998; Gianfrancesco y cois., 2001). Es el sitio de un cruzamiento obligado durante la meiosis masculina que se piensa que es necesario pa ra la segregación meiótica correcta. Esta región muy pequeña es inestable en cuanto a la evolución (véase más adelante) y con tiene secuencias muy recombinógenas (la frecuencia promedio de recombinación del sexo es de 28%, una cifra que, para una región de sólo 2.6 Mb, es alrededor de 10 veces la frecuencia de recombinación normal). Por supuesto, la elevada cifra se debe

sobre todo al cruzamiento obligatorio en la meiosis masculina que tiene como resultado una frecuencia de cruzamiento que se aproxima al 50%. Se ha demostrado que el límite entre la re gión seudoautosómica mayor y la región específica del sexo se mapea dentro del gen del grupo sanguíneo XG y el gen deter minante del varón SRYsólo ocurre a unos 5 kb del límite PAR1 en el cromosoma Y (fig. 12-15). ► La región seudoautosómica menor (PAR2) abarca 330 kb en las puntas extremas de los brazos largos de X y Y y sólo contie ne cuatro genes (Ciccodicola y cois., 2000; Charchar y cois., 2003). El cruzamiento entre X y Y en esta región no es tan co mún como en PAR-1 y no es necesario ni suficiente para el éxi to en la meiosis masculina.

12.2.7 Los cromosomas del sexo humanos evolucionaron de autosomas y divergieron debido a la supre sión regional periódica de recombinación En muchos animales se desarrollaron de manera independiente cromosomas del sexo precisos con linajes evolucionistas desiguales, incluidos no sólo los mamíferos sino las aves (en las que las hem bras son ZW, el sexo heterogamético, y los machos ZZ, el sexo homogam éticó) y ciertas especies de peces, reptiles e insectos. Se piensa que en cada caso los diferentes cromosomas del sexo se iniciaron como autosomas virtualmente idénticos, excepto que uno de ellos evolucionó a un locus mayor determinante del sexo (el locus SRYen seres humanos, localizado a 5 kb del límite PAR-1 en el Y). La evo lución subsecuente dio por resultado que los dos cromosomas se tornaran cada vez más diferentes hasta que, en muchas especies, se redujo un cromosoma del sexo (el Y en mamíferos, el W en aves) a

370

CAPITOLO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

r G YG 2 r ARSD ARSE J PRKX STS KAL1 > AM ELX TB 4X E IF1A X ZFX D FFR X DBX C ASK U TX U B E 1X

SRY RPS4Y ZFY

SMCX PRKY AM ELY r ARSEP

i A R S D P -A L G Y G 2P - s p DFFRY— c DBY 0 CASK P UTYJ TB 4YJ I

a

hr

L

k a l p -y stspj

SMCY EIF1A Y

RPS4X

RBMY

C la v e : R eg ió n s e u d o a u to s ó m ic a C e n tro m e ro Parte del crom osom a X específica de sexo

RBMX S O X3

P orción del c ro m o s o m a Y e u c ro m á tic a no re c o m b in a n te Porción del cromosoma Y heterocromática no re c o m b in a n te

Fig. 12-14. Los cromosomas X y Y humanos muestran varias regiones de homología que indican un origen evolucionista común. Las reglones seudoautosómicas en las puntas de Xp

7

Yp son idénticas (véase la fig. 1 2 -1 5 ), al igual que las de las puntas Xq

recombinantes restantes muestran varios pares de genes XY claramente homólogos aunados al par

S0X3-SRY (que tiene

7

Yq. Las reglones no

un dominio HMG común). Los

números uno a cuatro en el cromosoma X corresponden a diferentes “estratos evolucionistas” (véase el texto). Algunos de los homólogos del cromosoma Y degeneraron a seudogenes (el símbolo termina en una R por ej„

ARSEP ARSDP, etc.).

con autorización de la American Association for the Advancement of Science.

Reproducido a partir de Lahn y Page (1999),

Science 286:964-967,

12.2

EVOLUCIÓN DE CROMOSOMAS Y GENOMAS

Lim ite

P A R -1 , región s e u d o a u to s ó m ic a m a y o r

PPP2R3B TEL PGPL SHOX I_____■

■

■

O rtó lo g o s d e rató n +

ANT3 CSF2RA I DHRSXY \IL3RA¡ASMTL XE7 ¡ A SM T Tramp

i___ ■ ■ ■__

Cromosoma de sexo específico

ARSE ARSF M IC2 5' XG !3 ' XG

ARSD^

J lÍ ué J l divdiv - ■

PPP2R3B TEL PGPL I SHOX

371

div

ANT3 CSF2RA \IL3RAIASMTL XE7

-MJftJÉLÉ____

O rtó lo g o s d e ratón

div J

A S M T Tramp

M IC2 5 ' x d SRY

m ___ M_

_■

div

div

O rtó lo g o s d e ratón

RPS4Y

.JHt_■__

Fig. 12-15. Organización e inestabilidad evolucionistas de la principal región seudoautosómica humana (PAR-1). La región PAR-1 de

2.6 Mb

es común en las puntas de Xp (arriba a la izquierda)

-y Yp

(abajo a la izquierda; TEL, telómero) y contiene cuando menos 13

genes. Adyacentes a PAR-1 se encuentran las partes largas específicas del sexo de X y Y de las cuales se muestran los genes inmediatamente adyacentes a PAR-1 a la derecha de la línea limítrofe. El límite PAR-1 ocurre dentro del gen del grupo sanguíneo XG en el cromosoma X. En el cromosoma Y hay un homólogo del gen XG truncado: el promotor y los escasos primeros exones se presentan en la región seudoautosómica, pero con posterioridad son secuencias específicas del cromosoma Y no relacionadas, por ejemplo

SRY, RPS4Y.

Los genes incluidos en PAR-1 y en las regiones vecinas específicas

de sexo (que fueron parte de una región seudoautosómica anterior) se conservaron mal durante la evolución y con frecuencia no se detectan ortólogos en el ratón ( - ) o con una divergencia muy alta (div).

un cromosoma pequeño, con abundancia de secuencias repetidas pero sólo con muy pocos genes funcionales. Al parecer existe una presión evolucionista para adoptar la medida de tener dos cromo somas del sexo diferentes desde los puntos de vista estructural y funcional.

Orígenes autosómicos y plasticidad de regiones seudoautosómicas Durante la evolución no se conservaron bien las regiones seudoau tosómicas. En el ratón no hay un equivalente de PAR2, e incluso en algunos primates, y los ortólogos de los genes PAR2 del ratón conocidos son autosomas o se mapean cerca del centròmero del cromosoma X. También existen diferencias de especies muy impor tantes en PAR-1. En los seres humanos el límite de PAR-1 ocurre dentro del gen XG, que al parecer no tiene un ortólogo en el ratón (fig. 12-5). La región seudoautosómica equivalente del ratón (PAR) de sólo 0.7 Mb de largo, y localizada en la punta del brazo largo del X, muestra una homología secuencial muy pequeña con PAR-1 hu mano (Perry y cois., 2001). El límite de PAR en el ratón se encuen tra dentro del gen M idi (antes Fxy), cuyo ortólogo humano MIDI se ubica de manera más proximal dentro de la región específica del cromosoma X. El gen de sulfatasa de esteroides, Sts, es el único otro gen que se halla en el PAR del ratón, pero el homólogo humano se sitúa alrededor de 3.5 Mb proximal a PAR-1 en el cromosoma X. Tres de los genes PAR-1 humanos tienen ortólogos autosómicos en el ratón y otros genes PAR-1 humanos poseen ortólogos autosómi cos en algunos otros mamíferos. Por consiguiente, se asume que la

región PAR-1 evolucionó mediante la adición repetida de segmen tos autosómicos en la región seudoautosómica de uno de los cro mosomas del sexo, antes de recombinarse con el otro cromosoma del sexo (Graves y cois., 1998). Se piensa que PAR-1 y áreas contiguas son regiones inestables en términos comparativos. Los intercambios frecuentes de DNA dan por resultado una alta incidencia de fusiones génicas, dupli caciones de exones y mezcla de exones (véase Ried y cois., 1998). Muchos de los genes PAR-1 y genes en regiones específicas de se xo cercanas (que antes fueron regiones seudoautosómicas; véase más adelante) no parecen tener ortólogos detectables en el ratón (mediante el análisis de la secuencia del genoma del ratón dispo nible o por valoración de hibridación). Los que tienen ortólogos se someten a menudo a divergencia secuencial en extremo rápida como se observa en el determinante mayor del varón SRY, que se localiza a sólo 5 kb del límite de PAR-1 y el gen de la sulfatasa de esteroides, STS.

Orígenes autosómicos para Xp humano y estratos evolucionistas en el cromosoma X La comparación de genes en mamíferos relacionados en grado dis tante indica que gran parte del brazo corto del cromosoma X huma no se adquirió en época reciente por translocación de un autosoma X. Los mamíferos suelen dividirse en dos subclases: prototeria (los mamíferos monotremos o que ponen huevos) y teria, que a su vez se subdivide en dos subclases: metateria (marsupiales) y euteria, un grupo que incluye mamíferos placentarios. Se ha encontrado que

372

CAPÍTULO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

muchos genes euterianos ligados a X están ligados a X en marsupia les. Sin embargo, los genes que se mapean a una parte grande de Xp humano (distal a Xp 11.3) tienen ortólogos en autosomas de marsu piales y monotremos. Debido a que la divergencia prototeriana fue anterior a la división metateriana-euteriana (véase fig. 12-24), la ex plicación más sencilla es que se translocó cuando menos una región autosómica grande al cromosoma X en un momento temprano del linaje euteriano. Aparte de las regiones PAR-1 y PAR2 compartidas, hay todavía alrededor de 20 pares de genes X-Y que son reliquias de la identi dad de secuencia extensa que existió alguna vez entre los cromoso mas X y Y ancestrales. En los pares X-Y, casi todos los genes en X se localizan en Xp pero las secuencias equivalentes se encuentran al parecer en la totalidad de la porción eucromática de Y (fig. 12-14). Sin embargo, hay una diferencia regional clara en la divergencia secuencial de los pares X-Y. Al tomar a (el número medio de sus tituciones sinónimas por sitio sinónimo; véase sección 11.2.5) como una medida de la divergencia secuencial, pueden agruparse los pares X-Y en cuatro clases de divergencias de secuencias (y por consiguiente de edad) que corresponden a regiones lineales a lo lar go del cromosoma X (Lahn y Page, 1999; véase cuadro 12-3). Los datos del cuadro 12-3 indican que las edades de los pares de genes X-Y disminuyen en forma gradual a medida que se prosigue a lo largo de la porción no recombinante de X, desde el extremo del brazo largo (Xq distal) hasta el extremo del brazo corto (Xp distal). Son obvios cuando menos cuatro estratos evolucionistas, que corres ponden a los cuatro juegos de genes en la figura 12-14 y se piensa que la recombinación entre X y Y se suprimió a nivel regional, pri mero en el estrato uno, hace alrededor de 240 a 320 millones de años (poco después de la divergencia de los linajes que condujeron a los mamíferos y las aves; véase fig. 12-24 para información filo-

génica). Con posterioridad, la supresión de la recombinación se dispersó en pasos discretos hasta el estrato dos, a continuación al tres y por último al cuatro. La forma más probable en que se supri mió la recombinación fue tal vez por inversiones (que se sabe que son capaces de suprimir recombinación en regiones amplias en ma míferos) y que tal vez ocurrieron en el cromosoma Y (p. ej., una in versión específica de Y explicaría por qué el límite PAR-1 cruza un gen que está intacto en el cromosoma X pero alterado en Y; véase fig. 12-5). En la figura 12-16 se ilustra una secuencia de los proba bles acontecimientos que explican la forma en que evolucionaron los cromosomas del sexo.

12.2.8 La diferenciación del cromosoma del sexo dio por resultado degeneración progresiva del cromosoma Y e inactivación del cromosoma X ¡Es posible que el cromosoma Y humano esté en camino de extinguirse pero aún hay un futuro para los varones! La evolución de los sistemas de determinación del sexo fue crucial para el desarrollo de organismos multicelulares complejos por la novedad genética proporcionada por recombinación. Después de establecerse un locus determinante del sexo mayor durante la evo lución es esencial suprimir la recombinación en la región que contie ne ese locus (a fin de conservar las diferencias de sexo). En contraste con el cromosoma X humano que puede recombinarse en toda su longitud con un cromosoma X compañero en la meiosis femenina, el cromosoma Y humano suele considerarse como un cromosoma en esencia asexual (no recombinante). La genética de población predice que un cromosoma no recom binante debe degenerarse por un proceso conocido como depura

Cuadro 12-3. Los genes homólogos ligados a X y Y pueden agruparse en cuatro categorías de divergencia de secuencias que corresponden a la localización del gen enlazado a X en el cromosoma X (véase fig. 12-14). Par gènico X-Y (*se u d o g é n )

D ivergencia de DNA Ks

(% )

Grupo 1

Par gènico X-Y (*se u d o g é n )

Dive Ks

(% )

Grupo 2

RPS4X/Y

0.97

18

UBE1X/Y

0.58

16

RBMX/Y

0.94

29

SMCX/Y

0.52

17

S0X3/SRY

1.25

28

Grupo 3

Grupo 4

TB4X/Y

0.29

7

GYG2/GYG2P*

0 .1 1

7

EIF1AX/Y

0.32

9

ARSD/ARSDP*

0.09

7

ZFX/Y

0.23

7

ASRE/ARSEP*

0.05

4

DFFRX/Y

0 .33

11

PRKX/Y

0.07

5

DBX/Y

0.36

12

STS/STSP*

0 .1 2

11

CASK/CASKP*

0.24

15

KALI/KALP*

0.07

6

UIXIY

0.26

12

AMELX/Y

0.07

7

12.2

ción de Muller. Si la tasa de mutación es razonablemente alta, la ausencia de recombinación significa que pueden acumularse de manera gradual mutaciones perjudiciales en genes de ese cromoso ma durante las escalas de tiempo evolucionistas largas (no existe la posibilidad de restablecer el cruzamiento en lugar de una secuencia alela que carece de la mutación perjudicial). Los alelos mutantes pueden derivar a una fijación como cromosomas Y con la pérdida de pocos mutantes por azar, o pueden “transportarse de forma ca sual” junto con un alelo favorable en una región protegida de re combinación. Una vez que se acumulan mutaciones en el cromosoma Y no recombinante y causan pérdida de función génica, no hay una pre sión selectiva para conservar el segmento de DNA importante. Los mecanismos de recambio de DNA aseguran que el cromosoma se contraiga de manera gradual, pero inexorable, por una serie de de leciones. Como resultado, es posible que el cromosoma Y humano se encamine a la extinción. Sin embargo, continuará la masculinidad por el cambio a un sistema de determinación del sexo alterna tivo. Es muy probable que sea conferido tan sólo por una relación de dosis génica X:autosoma y los individuos XO serán varones (co mo en el caso de Drosophilá).

Desarrollo necesario de la Inactivación del cromosoma X La evolución del sistema de determinación del sexo en mamíferos también está entremezclada de manera inextricable con la evolu ción del mecanismo de inactivación de X para compensación de dosis (sección 10.5.6; véase Ellis, 1998). En respuesta a una des trucción a gran escala de las secuencias del cromosoma Y, tal vez hubo presiones para incrementar la expresión génica en el cromo

Cromosomas del sexo, surgimiento de RNY (la región SRY detiene la recombinación) hace -290-350 M años

P ar de au to so m as

A utoso m as en aves

Segunda expansión principal de RNY (RBMY, RPS4Y) hace -2 30-300 M años

EVOLUCIÓN DE CROMOSOMAS Y GENOMAS

soma X. Sin embargo, ello conduciría a una expresión génica exce siva en el cromosoma X en mujeres que podría causar una aptitud reducida. Como resultado, evolucionó una forma de compensación de dosis génica por la cual se eligió un cromosoma X aislado para ser inactivado en células femeninas (inactivación d eX ). La explicación de la inactivación del cromosoma X es actuar como un mecanismo de compensación de dosis para los genes del cromosoma X que no tienen homólogos en el cromosoma Y. No obstante, una pequeña minoría de genes humanos ligados a X tie ne homólogos fu n cionales en el cromosoma Y. Debido a que estos genes no muestran diferencias de sexo en la dosis génica, cabría esperar que escaparan a la inactivación de X. Todos los genes PAR-1 estudiados escapan a la inactivación de X. Los genes PAR2 son diferentes. Los dos genes más teloméricos, IL9R y CXYorfl, escapan a la inactivación, pero los dos genes proximales, SYBL1 y HSPRY3, los inactiva X. La discrepancia aparente se debe a un mecanismo compensador de inactivación de Y para estos genes: cuando se presentan en el cromosoma Y, SYBL1 y HSPRY3 se metilan y no se expresan. Además de los genes en las regiones seudoautosómicas, tal vez una quinta parte del total de genes en el cromosoma X elude la inactivación (véase Carrel y cois., 1999). Los genes que la eluden tienden a concentrarse en grupos, sobre todo en Xp, y muchos de ellos al parecer derivan de adiciones autosómicas recientes a los cromosomas del sexo. Los genes que no tienen un homólogo funcional en el cromosoma Y, pero que escapan a la inactivación, suelen ser aquellos en los que no son un problema las diferencias de dosis 2:1. Pueden ocurrir asimismo diferencias de especie pa ra los patrones de expresión no seudoautosómicos. Por ejemplo, los genes no seudoautosómicos humanos ZFX, RPS4X y UBE1

Cuarta expansión Tercera expansión La translocación principal de RNY principal de RNY ,D « v w , expande PARp hace (CASKP, DBY, EIF1AY, (SMCY,, iUBE1Y) hace = ^ 1 3 0 M a ñ o s TB4Y,, UTY, ZFY) TB4Y -1 30-170 M años hace -8 0 -1 3 0 M años

XY

XY

X Y en m o n otrem os

3"3

X Y en m arsupiales

XY

Quinta expansión principal de RNY (AMELY, ARSDP, ' p qyqop

La translocación X a Y establece

PCDHY

t i ? ? £ ™ 2P’ KALP, PRKY)

hace -3 -4 M años

hace -3 0 -5 0 M años

XY

XY I

i

i X Y en no a n trop oides p lacentarios

i

XY

S er hum ano

X Y en antrop oides no hom ínidos

Fig. 12-16. Evolución del cromosoma del sexo humano. La figura muestra el encogimiento total del cromosoma Y y la expansión en forma de bloques de su región no recombinante (RNY), tal vez como resultado de inversiones sucesivas a gran escala. En términos evolucionistas, se colocan entre paréntesis los nuevos genes RNY y las ramas filogenéticas se indican con flechas. Las regiones verdes son recombinantes con libertad; las rojas son especificas del cromosoma X y las azules específicas de Y (RNY). La región amarilla representa la secuencia que contiene

PCDHX/Y (protocaderina X/Y) que se translocó de X a RNY

(para mayor sencillez se omitieron otras posibles

translocaciones). El diagrama no es un dibujo a escala y se suprimieron los centrómeros, ya que sus localizaciones son inciertas en muchas etapas de la evolución. PAR-1, región seudoautosómica mayor. Adaptado de Lahn y cois. (2001),

Nature Rev. Genet. 2:207-216,

con autorización de Nature Publishing Group.

374

CAPÍTULO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

escapan a la inactivación, pero los homólogos murinos Zfic, Rps4 y UbelX (que a diferencia del gen humano UBE1 tiene un ho mólogo en Y) se someten a inactivación de X. En genes ligados a X en los que la dosis génica debe en apariencia controlarse de modo estrecho, la inactivación de X evolucionó como una adap tación para la decadencia de un gen homólogo ligado a Y (Jegalian y Page, 1998).

12.3

Filogenética m olecular y genóm ica com parativa

La filogenética molecular describe el uso de comparaciones de áci do nucleico o proteínas a fin de establecer las relaciones evolucio nistas entre organismos o poblaciones. Por supuesto, lo anterior complementa los métodos filogenéticos habituales basados en ca racterísticas anatómicas y morfológicas de organismos vivos e infor mación reunida del registro de fósiles. Hasta fecha reciente, cuando los biólogos moleculares evolu cionistas compararon secuencias de DNA (o las secuencias proteínicas deducidas), utilizaban de ordinario las secuencias cuando mucho de unos cuantos sitios genómicos. Sin embargo, la filoge nia basada en grupos de datos de secuencias muy pequeñas pue de ser errónea y suministrar resultados diferentes. Por ejemplo, las comparaciones de proteínas relacionadas con la transcripción, traducción, replicación y reparación del DNA resaltan las simili tudes entre archaea y eucariotas, en tanto que las comparaciones de proteínas que participan en el metabolismo celular agrupan a archaea con bacterias. Cuando se llevaron a cabo esfuerzos para obtener una perspectiva más amplia, se basaron en mapas genéti cos comparativos (O'Brien y cois., 1999) o cariotipificación com parativa. Por supuesto, los proyectos de genomas cambiaron todo lo anterior y permitieron examinar la perspectiva completa de las secuencias del genoma total y nació una nueva ciencia: la genó mica comparativa. La información sobre secuencias que ha surgido de los proyec tos de genomas proporciona perfiles de DNA mucho más defini tivos y representativos en los que puede deducirse la filogenia. Al determinar las secuencias de una serie completa de genomas (cap. 8) se obtienen informaciones mucho más profundas sobre la for ma en que se modelaron los genomas durante la evolución. Por su puesto, los datos ayudan asimismo a comprender la forma en que se relacionan entre sí los genomas actuales e identificar secuencias relevantes conservadas.

de secuencias para derivar calificaciones cuantitativas que describen la extensión de la relación entre las secuencias. La comparación de secuencias de igual longitud fija casi siempre es directa si hay una homología de secuencias razonable mente alta. Sin embargo, muchas veces las secuencias del ácido nucleico que se comparan habrán sufrido antes deleciones o in serciones y en consecuencia se requieren métodos matemáticos rígidos para el alineamiento de las secuencias. Se han diseñado algoritmos complementarios. El método de similaridad de Needleman y Wunsch (1970) busca llevar al máximo el número de nucleótidos compatibles; el método de distancia de Waterman y colaboradores (1976) se dirige a reducir al mínimo el número de incompatibilidades. Programas de computadora como Clustal lle van a cabo múltiples alineamientos de secuencias (Jeanmougin y cois., 1998). Una vez que se alinean las secuencias, es posible elaborar ár boles evolucionistas. Con mayor frecuencia se representan como diagramas en los que se emplean combinaciones de líneas (ramas) y nudos. Los diferentes organismos (secuencias) que se comparan se localizan en nudos externos pero se unen a través de ramas a nudos in teriores (intersecciones entre las ramas) que representan formas ancestrales para dos o más organismos. Un árbol con raíz (o cladograma) supone la existencia de un ancestro común (re presentado por el tronco o la raíz del árbol) e indica la dirección del proceso evolucionista (fig. 12-17). La raíz del árbol puede de terminarse al comparar las secuencias con una secuencia fu e r a d el gru p o (alguna que se relaciona de modo obvio en la evolución pe ro de manera distante con la secuencia en estudio). Un árbol sin raíz presupone que no hay un ancestro común y sólo muestra las rela ciones evolucionistas entre los organismos. Cabe señalar que el nú mero de posibles árboles con raíz suele ser mucho mayor que el de árboles sin raíz.

B)

Nudos

N udos e x te rn o s

12.3.1 La filogenética molecular utiliza alineamientos de secuencias para elaborar árboles evolucionistas Con la finalidad de elaborar un árbol evolucionista es necesario comparar secuencias de ácido nucleico (o en ocasiones las secuen cias proteínicas supuestas; las secuencias del ácido nucleico son más informativas, pero en comparaciones de genes relacionados de for ma muy distante suelen usarse secuencias de proteínas). Si dos o más secuencias muestran un grado suficiente de similitud (hom olo gía d e secuencia) puede asumirse que derivan de una secuencia an cestral común. A continuación es posible utilizar los alineamientos

Fig. 12-17. Árboles evolucionistas sin raíz y con ella. A) Árbol sin raíz. El árbol tiene cinco unidos por líneas

(ramas) que se

nudos externos (A, B, C, D y E) nudos internos. Este

intersectan en

árbol especifica sólo las relaciones entre los organismos en estudio, pero no define la vía evolucionista. B) Árbol con raiz. Desde un nudo Interno particular,

la raíz (se

muestra con R en rojo), hay una vía

evolucionista única que conduce a cualquier otro nudo, como la vía a D (línea roja punteada).

12.3

FILOGENÉTICA MOLECULAR Y GENÓMICA COMPARATIVA

Elaboración de árboles evolucionistas Para elaborar árboles evolucionistas se recurre a una variedad de métodos diferentes, pero muchos utilizan un método de distancia de matriz. En el primer paso se calcula la distancia evolucionista entre todos los pares de secuencias en el grupo de datos y se los dis pone en un cuadro (matriz). Éste puede expresarse como el núme ro de diferencias de nucleótidos o sustituciones de aminoácidos entre las dos secuencias o el número de diferencias de nucleótidos (aminoácidos) por sitio de nucleótido (aminoácido) (véase fig. 1218A para observar un ejemplo).

A)

3"5

Una vez que se calcula la matriz de diferencias de pares, el si guiente paso consiste en enlazar las secuencias de acuerdo con la dis tancia evolucionista entre ellas. Por ejemplo, en un método se conectan con una raíz entre ellas dos miembros del par de secuen cias que tienen la calificación de distancia más pequeña. Para el pa so siguiente de la matriz de distancia se emplea la media de las distancias de cada miembro de este par a un tercer nudo y se repite el proceso hasta que se colocan todas las secuencias en el árbol. Es to siempre tiene como resultado un árbol con raíz, pero métodos va riables, como el de relación d e vecino, pueden crear árboles sin raíz. La suposición crítica es de un reloj m olecular constante (la tasa de

S e c u e n c ia 1

G TATAGG G GATATACTG AG AG CTATTTACA

S e c u e n c ia 2

G TATTG GCG ATATTCCG AG ACCTATTTACT

S e c u e n c ia 3

G TATTG GCCATATTCCG AG ACCTATTTACT

S e c u e n c ia 4

G TATAGGCGATATACCGAGACCTATTTACT

Distancia de matriz 0.20

0 .2 3 3 0 .1 3 3 0 .2 0 0 .0 6 7

--------

B)

1 2 3 4 5 6 7 8

0.10

9 10 111213141516 1718 19 20 21 22 2324 2526 2728 29 30

GTATAGGGGATATACTGAGAGCTATTTACA GTATTGGCGATATTCCGAGACCTATTTACT GTATTGGCCATATTCCGAGACCTATTTACT GTATAGGCGATATACC GAG ACCTATTTACT x

; j_v

i

1 2 3 4 5 6 7 8 9 1011121314 1516 2 9 29 20 5 251411 21 8 16 7 3018

GTATAGGGGATATACTTGCAACATGCTGAA GTATTGGCGATATTCCTGCATCTTCCCGTA GTATTGGCCATATTCCTCCATCTTCCCGTA GTATAGGCGATATACCTGCAACATCCCGTA Fig. 12-18. Elaboración de un árbol evolucionista por el método de matriz de distancia y verificado mediante A)

Elaboración del árbol.

bootstrapping.

Se utilizan múltiples alineamientos de secuencias para calcular las distancias evolucionistas entre pares de secuencias.

Las secuencias uno y dos difieren en 6 /3 0 (= 0 .2 0 ) posiciones de nucleótidos; tres y cuatro varían en 3 /3 0 (= 0 .1 0 ) posiciones. Estos y otros valores de diferencia a nivel de pares se incluyen en una matriz de distancia y los programas de computadora utilizan los datos para valorar las relaciones de secuencias y elaborar un árbol evolucionista. Los métodos de matriz de distancia necesitan incluir estimaciones estadísticas de la cantidad de sustituciones múltiples que pudieron ocurrir (una sustitución simple A - * T pudo resultar en realidad de una sustitución sucesiva A -> C - * T). B) Análisis bootslrap. Del grupo de datos original se selecciona un subgrupo (aqui los sitios 17 a 3 0 ) para descartarse, pero se conserva el resto (sitios 1 a 16). Los sitios originales 17 a 30 se reemplazan por un grupo de datos del mismo tamaño de nuevo

alineamiento de seudosecuencia en

sitios elegidos al azar de

los 30 sitios originales, con lo cual se crea un

el que algunos de los sitios originales son repetidos ( 2 , 9 , 5 , 1 4 , 1 1 , etc.) y otros faltan (17, 21, 23, etc.).

El proceso se repite unas 1 000 veces para generar 1 000 alineamientos de seudosecuencia y en cada caso se elaboran árboles evolucionistas y se comparan (referencia) con el original para proporcionar un

valor bootstrap (véase

el texto).

376

CAPÍTULO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

mutaciones es constante en diferentes linajes) que a menudo tal vez no es correcta (sección 11.2.6). El método de unión de vecino es una variante que no requiere que todos los linajes divergieran en can tidades iguales por unidad de tiempo. Por consiguiente, es en espe cial adecuado para grupos de datos que comprenden linajes con tasas de evolución muy variables (véase fig. 12-31 para un ejemplo de un árbol elaborado con este método). Las alternativas de los métodos de distancia de matriz incluyen los métodos de parsimonia máxima y probabilidad máxima. El método de parsimonia máxima busca emplear el número mínimo de pasos evolucionistas. Considera todos los posibles árboles evo lucionistas que expliquen las relaciones de secuencias observadas, pero a continuación elige los que requieren menos cambios. Los métodos de posibilidad máxima crean todos los posibles árboles y a continuación recurren a estadísticas para valorar cuál es el árbol probable. Lo anterior puede ser posible para un número pequeño de secuencias, aunque en grandes números de secuencias la canti dad de árboles generados se torna tan considerable que se utilizan métodos heurísticos (métodos que proporcionan una respuesta en una longitud de tiempo computable, si bien por el cual tal vez no sea óptima la respuesta) a fin de seleccionar un subgrupo de árbo les por crear.

Valoración de la precisión de un árbol evolucionista Una vez que se derivó un árbol evolucionista, pueden usarse mé todos estadísticos para obtener una medición de su confiabilidad. Un método difundido es el de bootstrapping, una forma de simu lación de Monte-Cario. De manera característica, se elimina una submuestra de los datos y se reemplaza por un grupo equivalente de datos generados de modo aleatorio y se analiza la seudosecuencia resultante para observar si aún es válido el patrón evolucionis ta sugerido (fig. 12-18B). El nuevo muestreo aleatoriza los datos, pero si hay una relación clara entre dos secuencias la aleatorización no la borra. Por otra parte, si es falso un nudo que conecta las dos secuencias en el árbol original, puede desaparecer en la aleatoriza ción porque el proceso de aleatorización cambia las frecuencias de los

sitios individuales. El bootstrapping incluye con frecuencia nuevo muestreo de subgrupos de datos 1 000 veces. El valor bootstrap más alto suele proporcionarse como porcentaje, de tal manera que un valor de 100 significa que las simulaciones apoyan por comple to la interpretación original. Valores de 95 a 100 indican un nivel alto de seguridad en un nudo predicho. Valores bootstrap menores de 95% no significan que sea erróneo el agrupamiento original de secuencias, sino que los datos disponibles no proporcionan un apoyo convincente. Véase la figura 12-31 para cotejar algunos ejemplos.

12.3.2 Los nuevos programas de computadora alinean secuencias a gran escala y del genoma completo para asistir el análisis y la identificación evolucionistas de secuencias conservadas Los datos sobre secuencias que surgen de los proyectos del genoma son, por supuesto, sólo el inicio de una larga campaña para estudiar lo que significan. Debido al enorme tamaño de los grupos de datos, se requirieron nuevos programas de computación para hacer posi bles alineamientos de secuencias a gran escala y del genoma com pleto. Los nuevos programas han sido inestimables para ayudar a identificar secuencias bien conservadas y comprender relaciones evolucionistas.

Análisis comparativo de secuencias a gran escala para Identificar secuencias conservadas Un desafío importante en los proyectos del genoma es identificar genes RNA, secuencias reguladoras y otras secuencias importan tes funcionalmente que no elaboran proteínas. No es fácil anali zar las secuencias de un genoma completo (porcentaje bajo de DNA de codificación) porque los programas de computadoras no predicen con facilidad genes RNA y secuencias reguladoras (son más fáciles los genes que codifican polipéptidos; hay marcos de lectura abiertos largos y grandes cantidades de datos de secuencias

K IF3 S e r h u m a n o /p e rro S e r h u m a n o /ra tó n

i AL 4 ú J IJIn mu’ IV\ ru nS i l i l i

IL -4

R a tó n /p e rro

^ - 1 ..!.... aftll J ....,

h Í JlJU n m .m V W .y r n P i n 1 m i L ill III* ^\ .1M 111

1

— 11nA------tíJ' . In I i — IIi ü M ¿AiblUs . JU

fin í «Aív» ¡i

I----------&i is. »»MM/* ira a

u J : 11 , , it 1 Kk tÁí\. L kA^ti

A h n i. - IL

1 1 iA »/i (M li A u

1

Fig. 12-19. Alineamiento de la secuencia VISTA de una secuencia genómica de 50 kb que contiene las secuencias génicas humanas KIF3 e IL4 con secuencias ortólogas en el perro (D) y el ratón (M). Se muestran secuencias conservadas en relación con sus posiciones en el genoma humano (ejes horizontales) y sus identidades porcentuales (50 a 100% ) se indican en los ejes verticales. Las localizaciones de los exones de codificación (rectángulos azules en la parte superior) y la UTR 3 ' de

KIF3

(rectángulo turquesa) se muestran arriba del perfil. Las flechas horizontales indican la dirección de la transcripción para cada gen. Los picos de secuencias muy conservadas incluyen secuencias de codificación (azul) y asimismo secuencias no codificantes (rojo) de función desconocida. Adaptado de Dubchak y cois. (2000),

Genome Res.

10:1 3 04 -13 0 6 , con autorización de Coid Spring Harbor Laboratory Press.

12.3

FILOGENÉTICA MOLECULAR Y GENÓMICA COMPARATIVA

en genes y sus productos de expresión para compararlos con ellos). Una alternativa consiste en buscar secuencias muy conser vadas y contrastar diferentes secuencias genómicas en intervalos grandes. Diferentes programas de computadora, como VISTA (http://www-gsd.lbl.gov/vista) y Pipmaker (http://bio.cse.psu.edu/pipmaker/) permiten alineaciones de secuencias a gran escala y expresan los resultados en un formato gráfico (véase fig. 12-19 para observar un ejemplo). Como resultado de análisis comparativos de mamíferos (sobre todo seres humanos y ratones) en la actualidad se piensa que la can tidad de secuencias muy conservadas en el genoma humano es de alrededor de 5%, del cual se cree que sólo 30% (-1.5% del geno ma total) es DNA que codifica polipéptidos. Muchos análisis com pararon secuencias humanas y de ratón pero quizá sea necesario comparar algunas secuencias reguladoras que participan en la ex presión génica específica de primates con una gama de frecuencias de primates. Se han comparado asimismo los genomas de organismos mode los con secuencias genómicas de especies del mismo género relacio nadas en grado distante. Por ejemplo, los nematodos C. elegansy C. briggsae derivaron de un ancestro común hace 100 millones de años y en la actualidad es posible interrogar ambas secuencias genómicas mediante ENSEMBL (en http://www.ensembl.org/). Un proyecto de genoma de Drosophila pseudoobscura (http://www.hgsc.bcm.tmc.edu/projects/drosophila/) permitirá compararlo con las secuencias del genoma de D. melanogaster.

Alineamientos de secuencias del genoma completo de mamíferos Los genomas complejos contienen una proporción amplia de se cuencias que evolucionaron de modo neutral. Debido a la falta de presión de selección, estas secuencias divergieron en poco tiempo. A fin de obtener mayor información sobre la evolución de genomas, los programas de computadoras deben ser capaces de alinear secuencias que evolucionaron de manera neutral cuando menos en una gran proporción de los genomas que se comparan. Esto se lo gró para los genomas humano y del ratón mediante una modifica ción del programa BLASTZ (Schwartz y cois., 2003) y se dispone de alineaciones d e secu en cias d e l gen om a com pleto hum ano y d el ratón junto con ilustraciones de su utilidad en http://bio.cse.psu. edu/genome/hummus/ Las alineaciones del genoma completo mostraron que alrededor del 40% de las secuencias del genoma humano se alinean con las del ratón y que las secuencias de DNA muy repetidas pueden dividirse en dos clases. Las repeticiones especificas d e lin a je se introdujeron por transposición después de la divergencia de los seres humanos y los ratones de un ancestro común (dentro de los últimos 80 a 100 millones de años aproximadamente). Las repeticiones antiguas con servadas se retuvieron del ancestro común y es posible identificar y alinear repeticiones ortólogas humanas y del ratón aunque tienen > 80 a 100 millones de años. Los datos también revelan diferencias en la relación de dos clases de repeticiones. En seres humanos, 24.4% del genoma (o alrededor del 53% de las repeticiones disper sas) es específico de linaje pero en el ratón constituye el 32.4% del

3~

genoma o casi 85% de las repeticiones dispersas (alrededor de 39% del genoma del ratón). Las repeticiones ancestrales se reemplazaron en gran parte en el genoma del ratón y constituyen sólo alrededor del 5% del genoma; en personas, 22% del genoma está compuesto de repeticiones ancestrales. La diferencia indica las variaciones en las tasas de sustitución de nucleótidos en los dos genomas (sección 11.2 .6).

12.3.3 El número de genes suele ser proporcional a la complejidad biológica La secuenciación del genoma reveló algunas sorpresas y a primera vista es posible que el número de genes tal vez no sea paralelo a la complejidad biológica tanto como se esperaba. ¿Quién hubiera an ticipado que el hombre sólo tiene alrededor de 1.5 veces el núme ro de genes que se encuentran en un gusano nematodo de 1 mm de largo que sólo contiene alrededor de 1 000 células o que este gu sano pequeño posee al parecer miles de genes más que la mosca de la fruta mucho más compleja? No obstante, si se consideran los ge nomas secuenciados se reconoce una tendencia clara: los genomas de vertebrados tienen en general el doble del número de genes que se encuentran en genomas de invertebrados, que a su vez tienen muchos más genes que los organismos unicelulares (cuadro 12-4). Por lo general, el número de genes de metazoarios aumenta se gún sea la especialización, pero en tanto que la duplicación génica proporcionó un refuerzo importante al desarrollo de metazoarios complejos, algunas especies, por ejemplo D. melanogaster, tienen un número sorprendentemente bajo de genes duplicados. Es im portante considerar que los genes también pueden perderse del li naje durante la evolución. Como se observa en el cuadro 12-4, la densidad génica dismi nuye a medida que se pasa de genomas simples a genomas metazoáricos complejos. Eso apunta hacia el surgimiento de intrones en eucariotas tempranos y una tendencia creciente a acumular DNA repetido dentro de intrones y regiones intergénicas a medida que se tornan más complejos los genomas. Por consiguiente, por ejemplo, alrededor de 45% del genoma humano está compuesto de repeti ciones basadas en transposones, pero el valor correspondiente para el ratón es de 37% y los valores equivalentes en D. melanogaster y C. elegans son más bajos en proporción considerable.

12.3.4 Las comparaciones de proteomas revelan la extensión de la especialización progresiva de proteínas Cuando se determinaron por vez primera las secuencias genómicas de organismos modelos estudiados en extenso, como E. coli y la le vadura S. cerevisiae, fue una sorpresa encontrar que se identificó un número notable de genes cuyas funciones se desconocían. En el es quema de secuencias del genoma humano casi la mitad carecía de una función conocida, un recordatorio importante de que aún exis te un camino largo antes de comenzar a comprender en verdad el genoma humano. De los restantes, alrededor de la mitad participa en transducción de señales o enlace de ácido nucleico (fig. 12-20).

Cuadro 12-4. Número y densidad génicos en genomas simples y complejos. Genomas unicelulares Genoma

Genomas multicelulares

Tamaño del genoma (límites)

Número génico

Densidad gènica

PROCARIOTAS Bacterianos

3 .10 Mb

Promedio

1 por 1.09 kb

(n = 97)

[0 .5 8 -9 .1 1 Mb]

= 2 840

Archaea

2 .2 3 Mb

Promedio

(n = 16)

[ 1 .6 6 - 5 .7 Mb]

=

EUCARIOTAS UNICELULARES Microsporidianos E. cuniculi 2 .9 M b ** Hongos unicelulares S. cerevisiae 14 S. pombe 14

Mb Mb

1

por

1 .0 2

Genoma

kb

Densidad genica

117 M b* 97 Mb

~ 1 por 7 kb - 1 por 5 kb

Invertebrados Ascidiano (C. intestinalis) Nematodo (C. elegans) Mosca de la fruta (D. melanogaster) Mosquito

2 200

Tamaño del genoma Número (o número de génico Mb secuenciado*)

(A. gambiae)

16 0 0 0 19 000

123 M b*

14 000

278 Mb

14 000

- 1

115 M b*

25 500

- 1 por 4 .5 kb

365 Mb 2500 M b*

31 000

- 1

por

¿—30 000? - 3 0 000

- 1

por 80 kb por 1 0 0 kb

- 1 por 9 kb por 2 0 kb

Planta 2 000

300 4 800 6

**

1 por 1.45 kb

Mastuerzo (A

thaliana)

1 por 2 . 2 kb 1 por 2.9 kb

Vertebrados Protozoarios P. falciparum P. Y. yoeli

(T. rubripes) (M. musculus)

Pez soplador 23 Mb 23 Mb

5 300 5 900

1 por 4.3 kb 1 por 3 .9 kb

Ratón

Ser humano

2900 M b *

- 1

12

kb

*N o representa el tamaño del genoma completo porque excluye repeticiones tándem muy repetidas que es difícil clonar y secuenciar, pero sí el número total de genes. * *E I tamaño pequeño del genoma y el número escaso de genes reflejan el estado intracelular obligado de los microsporidios.

Las comparaciones de las proteínas predichas a partir de la se cuencia del genoma humano contra las predichas de los genomas secuenciados de varios organismos modelo proporcionó cierta in formación sobre el despliegue génico durante la evolución (fig. 12-21 y cuadro 12-5). Alrededor de 20% de las proteínas huma nas muestra homología de secuencia con proteínas distribuidas con amplitud que se encuentran en eucariotas y procariotas. Ca si 1% de las proteínas carece de un homólogo en otros genomas animales estudiados. Sin embargo, en esa época había pocas en tradas de bases de datos de primates no humanos y por consi guiente es posible que el 1% resulte ser específico de primates en lugar de específico de seres humanos (cuando mucho, se espera que sólo un número muy pequeño de genes humanos sea especí fico de personas). La disponibilidad de genomas completos de diferentes especies también permite una forma de proteómica comparativa en la cual se interrogan todas las secuencias de proteínas conocidas o predichas codificadas por los diferentes genomas para la presencia de domi nios, secuencias típicas u otros componentes de subsecuencias de proteínas específicas. El principal recurso es InterPro (recurso inte grado de familias, dominios y sitios de proteínas), una amalgama de varias bases de datos de secuencias de proteínas conservada por el European Bioinformatics Institute (http://www.ebi.ac.uk/interpro/).

Los datos de InterPro se proporcionan en diversas formas, que in cluyen listas que catalogan las frecuencias de familias de proteínas específicas, dominios proteínicos y repeticiones de proteínas dentro de los proteomas de genomas secuenciados (véase http://www.ebi. ac.uk/proteome/). Cuando se comparan las 25 principales entradas InterPro hu manas (basadas en prevalencia) a través de diferentes tipos de genomas eucariotas, no existen varias categorías, no sólo para la levadura unicelular S. cerevisiae (11/25) sino también para la planta A. thaliana (6/25) y en menor extensión para animales invertebrados (3/25 de C. elega nsy 2/25 de D. melanogaster, véase cuadro 12-5). Esto depende en parte de la especialización del vertebrado, como los genes del sistema inmunitario. Los genes del receptor olfatorio son con claridad importantes en ratones y seres humanos y aunque no existen contrapartes directas en los otros organismos, la princi pal entrada InterPro para C. elegans es el quimiorreceptor 7TM de nematodos que puede funcionar como un receptor olfatorio. Tam bién hay diferencias de especies mayores en las categorías de fre cuencias de entradas InterPro, incluso en personas y ratones, al igual que en la prevalencia de receptores olfatorios, dedos de cinc tipo C2H2 y cajas KRAB (dominios que se hallan en proteínas de dedos de cinc tipo C2H2) y receptores acoplados a proteína G ti po rodopsina (cuadro 12-5).

12.4 j ¿QUÉ CONVIERTE AL HOMBRE EN SER HUMANO?

3~9

Adherencia celular (577,1.9% ) D iversos (1 3 1 8 ,4 .3 % ) \ Acompañante (159, 0.5%) Proteína viral (100, 0.3%) I \ Proteina estructural citoesquelética (876, 2.; \ \ Matriz extracelular (437,1.4% ) Proteína de transferencia/portador (203, 0.7%) \ \ Inmunoglobulina (264, 0.9%) Factor de transcripción (1 850, 6.0%)

\

'

L— 1

/

Enzima de ácido nucleico (2 308, 7.5%)

/ Canal iónico (406,1.3% ) M o to ra (3 7 6 ,1 .2 % ) Proteína estructural del músculo (296,1.0% ) P rotooncogen (902, 2 .9 % ) Proteína selecta de unión de calcio (34,1.0% ) Transportador intracelular (350,1.1% ) Transportador (533,1.7% )

Molécula de señalamiento (376,1.2% ) R ec ep to r (1 543, 5 .0 % )

C inasa (868, 2 .8 % ) Molécula reguladora selecta (988, 3.2%) Transferasa (610, 2.0%) Sintasa y sintetasa (313,1 Oxídorreductasa (656, 2.1 %) Liasa (117, 0.4%) Ligasa (56, 0.2%) Isomerasa (163, 0.5%)

C ateg o rías GO

Hidrolasa (1 227, 4.0%)

Función molecular desconocida (12 809, 41.7%) C ateg o rías phanter

Fig. 12-20. Clasificación funcional preliminar de genes humanos que codifican polipéptidos. Funciones conocidas o predichas de 26 383 genes humanos que codifican polipéptidos humanos. La clasificación se basa en las categorías de función molecular G0, como se muestra en los círculos externos (clasificación Gene Ontology; véase sección 8 .3 .6), o las categorías de función molecular

Celera 's Panther (círculo

interno). Reproducido a partir de Venter y cois. (2 0 0 1 ),

Science 29 1 :13 0 4 -1 3 5 1 ,

con autorización de la American Association

for the Advancement of Science.

12.4

¿Qué convierte al hom bre en ser humano?

¿De dónde proviene el hombre?, ¿qué hace al hombre un ser humano? Preguntas fundamentales como las anteriores son algunas que se res ponderán mejor una vez que se tengan inventarios de genomas com pletos, listas de genes y productos génicos de seres vivientes. Los proyectos del genoma se iniciaron en 1995 para obtener secuencias genómicas y los 10 a 20 primeros años del nuevo milenio deben ser testigos de un surgimiento enorme de genomas secuenciados, anota ciones detalladas sobre genes e información amplia de proteomas y productos de RNA. Análisis comparativos de los datos disponibles co menzaron a proporcionar un cúmulo de detalles moleculares sobre las secuencias del ácido nucleico y las proteínas inferidas que comparte el hombre con otras especies y la forma en que difiere de ellas. Por supuesto, es posible llevar a cabo comparaciones a diferen tes niveles y los seres humanos pueden colocarse en una diversidad de grupos filogenéticos. En una serie evolucionista de grupos más

especializados en grado progresivo, el hombre es eucariota, metazoario, bilateriano, celomato, deuterostoma, cordado, craneado, verte brado, gnatostoma, amniota, mamífero euteriano, primate cararrino, hominoide y homínido, etc. (véase fig. 12-22 a 12-24 y asimismo el recuadro 12-5 para cotejar glosario). La universalidad del código genético, la enorme conservación evolucionista de las reacciones bioquímicas elementales y los proce sos esenciales para la función celular y el grado alto de conservación de algunos procesos del desarrollo fundamentales en células de metazoarios son características que resaltan la relación cercana de los se res humanos con especies que son muy distintas desde el punto de vista morfológico y relacionadas apenas en sentido evolucionista. Por supuesto, también existen diferencias. Los metazoarios más complejos tienden a mostrar genomas más complejos con más ge nes y dominios proteínicos y más DNA repetido. También puede haber diferencias considerables entre distintas especies en varias ca racterísticas vinculadas con la expresión génica. Los ejemplos inclu yen los siguientes:

380

CAPÍTULO DOCE

LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

► operones'. la transcripción de genes eucarióticos tiende a regular se de manera independiente, a diferencia del control coordina do en operones bacterianos, pero una fracción grande de genes de C. elegans está organizada en operones que semejan operones bacterianos (pero son distintos de modo operacional). ► m etilación d el DNA (que está muy lejos de ser universal en metazoarios; véase recuadro 9-3). ► impronta genóm ica (una característica importante de la expre sión génica en mamíferos pero que al parecer no ocurre en or ganismos como Drosophila, C. elegans, etc.). ► adaptaciones d e vertebrados, por ejemplo genes vinculados con sistemas inmunitarios, hormonas, etcétera. ► adaptaciones d e mamíferos, como genes relacionados con el sis tema XY de determinación del sexo, inactivación del cromoso ma X, placentación, etcétera. Desde luego, los seres humanos también se diferencian de otros mamíferos y sus primos, los grandes monos. La secuenciación re ciente de los genomas del ratón y la rata y la secuenciación en cur so de los genomas del chimpancé (Olson y Varki, 2003), y otros primates, proporcionarán información relevante sobre la constitu ción y la forma en que difieren del hombre.

12.4.1 ¿Qué diferencia a los seres humanos de los ratones?

CpG (-27 000 en DNA humano de repetición libre) que en el ra tón (15 000). Las regiones de sintenia ser humano-ratón conserva da tienen en promedio cerca de 10 Mb de largo (véase fig. 12-21).

Repeticiones dispersas Gran parte de la diferencia en el tamaño del genoma humano-ratón se debe a la cantidad más alta de DNA repetido en el genoma humano: las repeticiones basadas en transposones constituyen alre dedor de -45% del genoma humano, pero sólo -37% del ratón. La cantidad de secuencias LINE humana excede un poco la de secuen cias LINE del ratón. Aunque las secuencias LINE se heredaron del ancestro común de seres humanos y ratones, hubo un recambio más alto de secuencias LINE en el genoma del ratón. En ambos ge nomas sólo se transpuso de manera activa el elemento LINE-1; pe se a ello, si bien la clara mayoría de las secuencias LINE-1 actuales del ratón sufrió transposición después de la divergencia del ser hu mano y el ratón, se retuvo la mayor parte de las secuencias huma nas LINE-1 del ancestro común. Las repeticiones LINE-1 están conservadas en personas y ratones (y en todos los mamíferos), en

Sin homología animal

Un comentario reciente sobre la secuenciación del genoma del ra tón sugirió que el mejor amigo del hombre ya no es el perro sino el ratón. Sin duda, el ratón es el modelo de mamífero más impor tante (para sus ventajas, véase el recuadro 8-8) y en algunas áreas suele confiarse en la extrapolación de estudios en ratones (p. ej., el estudio de la expresión génica durante el desarrollo). Empero, por supuesto, el ratón es aún un m odelo y cada vez se reconocen más las diferencias entre seres humanos y ratones. Casi todas las observaciones siguientes derivaron del Mouse Genome Sequencing Consortium (2002), que se abrevia MGSC en las referencias cru zadas posteriores.

Aspectos generales de la organización del genoma El tamaño del genoma eucromático del ratón es de 2 500 Mb, un poco más pequeño que el de 2 900 Mb del genoma eucromático hu mano. La diferencia se debe sobre todo a la mayor cantidad de DNA repetido (véase más adelante). Como resultado, los tamaños de intrones son alrededor de 16% más cortos en los genes del ratón en promedio. Las distancias intergénicas son casi siempre más peque ñas pero hay una gran variación regional. Los tamaños del exón y el DNA de codificación (del orden de 500 a 550 codones en prome dio) son muy similares en personas y ratones y asimismo el número de exones en genes ortólogos. El contenido total (G + C) del geno ma del ratón es 42%, apenas mayor que el contenido de 41% (G + C) del genoma humano. No obstante, este último tiene una frac ción mayor en grado significativo de contenido de DNA (G + C) (MGSC, 2002; fig. 7) y, por consiguiente, muchos más islotes de

Fig. 12-21. Distribución taxonómica de homólogos de proteínas humanas y de ratón predichas. Muchas de las proteínas del hombre son de origen evolucionista antiguo y sólo menos de una cuarta parte se originó desde que aparecieron los vertebrados. Obsérvese que las bases de datos de secuencias aún se llenan con nuevas secuencias y se espera que haya un número muy pequeño de genes específicos en verdad humanos. Adaptados del

International Human Genome Sequencing Consortium (2001), autorización del Nature Publishing Group.

con

12.4 1 ¿QUÉ CONVIERTE AL HOMBRE EN SER HUMANO?

381

Cuadro 12-5. Ocurrencia comparativa en metazoarios de familias proteínicas, dominios y repeticiones seleccionados. H. sapiens (28 525 proteínas)

M. musculus D. melanogaster (20 804 proteínas) (13 446 proteínas)

C. elegans (20 377 proteínas)

A. thaliana (25 936 proteínas)

S. cerevisiae (6 202 proteínas)

Familia proteínica, dominio o repetición

Proteínas Lugar compatibles

Proteínas Lugar Proteínas Lugar compatibles compatibles

Proteínas Lugar compatibles

Proteínas Lugar compatibles

Proteínas Lugar compatibles

Dedo de Zn, tipo C2H2

946

1

482

6

360

1

246

11

191

20

54

10

Inmunoglobulina/ complejo mayor de histocompatibilidad

883

2

674

3

160

8

120

26

51

110

Ninguno

N/A

Superfamilia GPCR parecida a rodopsina

826

3

1 375

1

86

26

403

4

6

836

Ninguno

N/A

Parecida a inmunoglobulina

804

4

655

4

144

10

100

35

1

1 920

Ninguno

N/A

Cinasa de proteína

687

5

486

5

263

2

507

2

1 047

1

118

1

Receptor olfatorio

477

6

980

2

Ninguno

N/A

Ninguno

N/A

Ninguno

N/A

Ninguno

N/A

Cinasa de proteína serina/treonina

472

7

319

7

205

4

286

7

816

2

113

2

Repetición W D -40 de proteina G beta

386

8

243

10

188

5

166

17

267

12

101

3

Dedo de Zn, RING

367

9

222

13

121

15

173

16

466

5

39

16

Dominio parecido a EGF

357

10

286

8

101

21

202

13

34

175

Ninguno

N/A

Región de enlace 342 de RNA RNP-1 (secuencia típica de reconocimiento de RNA)

11

234

12

166

7

160

18

299

10

58

8

Parecido a plaquestrina

331

12

188

18

79

35

90

46

31

197

29

25

Subtipo de inmunoglobulina

327

13

191

16

79

35

28

161

Ninguno

N/A

Ninguno

N/A

Extensión abundante en prolina

324

14

185

19

147

9

150

19

186

21

Cinasa de proteína tirosina

314

15

216

15

132

12

192

14

360

7

26

28

N/A

Caja KRAB

314

15

119

32

Ninguno

N/A

Ninguno

N/A

Ninguno

N/A

Ninguno

N/A

Mano-EF de enlace de calcio

298

17

220

14

128

13

134

23

220

16

17

46

Dedo de Zn, subtipo C2H2

286

189

91

48

2

1

2

1161

Ninguno

N/A

Ninguno

N/A

25

29

116

Dominio SH3

280

19

189

17

80

33

70

64

4

1 075

Andrina

259

20

162

20

94

23

110

27

114

38

19

42

Inmunoglobulina tipo C-2

259

20

145

26

111

17

67

67

Ninguno

N/A

Ninguno

N/A

Homeobox

254

22

238

11

107

19

106

30

95

53

8

125

Fibronectina tipo III

232

23

157

22

71

42

54

78

4

1 075

2

584

Inmunoglobulina tipo V

223

24

249

9

4

713

N/A

Ninguno

N/A

Ninguno

N/A

Repetición abundante en leucina

212

25

146

25

108

18

65

509

4

6

183

69

El número de diferentes proteínas bajo los nombres de las especies se basa en juegos de proteoma no redundantes de entradas SWISS-PROT, TrEMBL y Ensembl. La columna de la izquierda indica las 25 principales entradas humanas (de acuerdo con el número de proteínas compatibles) en la base de datos InterPro. Bajo los nombres de las especies se encuentran un número de diferentes proteínas compatibles y el lugar que ocupan. Datos obtenidos (marzo, 2003) del European Bioinformatics Institute a través de http://www.ebi.ac.uk/proteome

382

CAPÍTULO DOCE ¡ LUGAR DEL HOMBRE EN EL ÁRBOL DE LA VIDA

B acterias ____4 0 0 0 r m illones d e años

A rch a ea

L

E ucariotas

38 0 0 m illones d e años

Euglenozoarios

_2200 m illones d e años I__2Ó00

m illones d e años

Taxa, e tc é te ra

E je m p lo s

M e ta m o n a d a s

G iardia lam blia

Parabasilido s

Trichom on as

Euglénidos

E uglena gracilis

C in e to p lás tid o s

Leishm ania m a jo r T ryp anosom a b ru c e i T ryp anosom a cru z

C iliados

P a ra m e c u im tetraurelia T e tra h ym en a therm o p h ila

A p ic o m p le xa

P la sm o d iu m falciparum

18 0 0 m illones d e años Alveolados

A lgas rojas

A lgas y

A lgas verdes

p lantas

_ 1600 m illones d e añ os

Am oebozoarios

□

P lantas

A rab id o p sis thaliana

Entai E n ta m o eb id ae

E n ta m o e b a histolytica

H ti D in ictiostelida

D ictyostelium disco id eu m

M icrosp oridianos .1 5 0 0 m illones d e años Hongos

Tafrinom icotina

S c h izo s ac ch a ro m yc es p o m b e

S ac aro m ico tin a

S ac c h a ro m y a s cerevisiae C an d id a albicans

S o rd iaro m iceto s

N eu ro s p o ra crossa

E urotiom icetos

Aspergillus nidulans

C o an o flag e lad o s M e ta zo a rio s (véase fig. 12-23)

Fig. 12-22. Filogenia eucariota simplificada.

Nota: los coanoflagelados

(o flagelados con collar) se consideran los relacionados protistas vivientes más cercanos de las esponjas, los metazoarios

más primitivos (los coanoflagelados son casi idénticos en forma y función a los coanocitos, o células en collar, de esponjas).

gran parte debido a la presión de selección conservadora para mantener la secuencia de la secuencia ORF-2 grande que especi fica la transcriptasa inversa. Muchas de las diferencias entre el hombre y el ratón en el con tenido de repeticiones entremezcladas se deben a la cantidad más alta de DNA SINE en el genoma humano. Ninguno de los elemen tos SINE se heredó de un ancestro común (a diferencia de los ele mentos LINE, los elementos LTR y los transposones DNA; véase MGSC, 2002, cuadros 5 y 6). En tanto que sólo un SINE aislado, la repetición Alu, es activo en el genoma humano, se desarrollaron cuatro familias SINE en el ratón, con base cada una en la retrotransposición LINE-1. De ellas, las repeticiones B2, ID y B4 deri varon como copias de cDNA de genes tRNA pero la repetición B1, al igual que la Alu, procedió de RNA 7SL (fig. 12-25). Sin embar

go, las repeticiones B1 y Alu tienen una divergencia significativa en la secuencia.

Divergencia en las secuencias génica y proteínica Al parecer, alrededor de 80% de las proteínas de ratón tiene ortó logos 1:1 en el genoma humano y las identidades secuenciales sue len encontrarse entre el 70 a 100%. No obstante, tal vez alrededor de 10% de las proteínas ortólogas humanas y de ratón muestra di vergencia de secuencias más extremas (fig. 12-26). Se sabe que muchas de las proteínas que evolucionaron en menos tiempo fun cionan en la defensa/inmunidad del huésped, por ejemplo los ge nes MHC, o en los procesos de reproducción. Las proteínas de reproducción que evolucionan con rapidez incluyen la proteína 2

12.4 I ¿QUÉ CONVIERTE AL HOMBRE EN SER HUMANO:

583

E je m p lo s / e s p e c ie s

Taxón o filo , e tc é te ra

• Poriféranos

Esponjas

■C n id a ria n o s

M e d u s a , co ra les , aném onas de m ar

■P la te lm in to s

G u s a n o s p la n o s (tenias)

■M o lu s c o s

P u lp o

■A n é lid o s

G u s a n o s d e tie rra

■A rtró p o d o s

D. m elanogaster A nopheles gam biae

• N e m a to d o s

C. elegans C. briggsae

Diploblastos (dos capas germinales)

T R 1 Tres ca p as L germ inales, bilaterales y sim étricas (BILATERA)

P 1 O H L A S T 0

s

1 0 00 m illo n e s d e añ os

P R O T O s T 0 M A O

L o fo tro c o zo a n o s

E c d is o z o a n o s

■H e m ic o rd a d o s D F U T E R O S T U M A S

U ro c o rd a d o s

C e fa lo c o rd a d o s

C ra n e a d os

■E q u in o d e rm o s

Erizo d e m ar, e s trella d e m ar, p la n ta s m a rin as

■T u n icad o s (u ro co rd ad o s )

Ciona Intestinalis

■C e fa lo c o rd a d o s

Am phioxus

■H ip e ro tre ta s

P e z cic ló s to m o

■V e rte b ra d o s

V é a s e fig. 1 2 -2 4

Fig. 12-23. Filogenia metazoárica simplificada.

Nota: la división el tunicado

C. elegans y D. melanogaster Strongylocentrotus purpuratus,

profostoma-deuterostoma fundamental que ocurrió hace alrededor de 1 000 millones de años significa que

están relacionadas de modo más distante con los seres humanos que algunos otros invertebrados como el erizo de mar

Ciona intestinalis y el cefalocordado Amphioxus.

de transición (divergencia de secuencias de aminoácidos de 68% entre seres humanos y ratones), glucoproteínas 2 y 3 de la zona pe lúcida (divergencia de 43 y 33%, respectivamente), acrosina (diver gencia de 38%) y protaminas P15 y P2 específicas de espermatozoo (divergencia de 41 y 36%, respectivamente). Se ha identificado se lección positiva, (darwiniana) (selección para sustitución de ami noácidos a fin de promover la diversidad) para varios de estos tipos de proteínas (véase p. ej., Swanson y cois., 2001).

Divergencia en el número génico Aún es necesario establecer el número total de genes humanos y el ratón, pero se espera que sean muy similares. Sin embargo, mu chas proteínas humanas y del ratón pertenecen a familias génicas que se sometieron a expansión diferencial cuando menos en uno de los dos genomas, con una falta de relación 1:1 rígida resultan te. Por supuesto, cuando varía el número de genes en una familia génica puede ser difícil identificar ortólogos verdaderos, en espe cial si hay una divergencia de secuencias considerable. Un ejemplo establecido desde hace mucho tiempo es el complejo mayor de his-

tocompatibilidad (MHC) en el que no es fácil identificar ortólo gos entre los locus MHC típicos (HLA en personas, H-2 en rato nes) y en los que existen diferencias notorias en el número de locus MHC no comunes. Un caso extremo es la familia génica del receptor olfatorio. El ratón tiene alrededor de 1 200 genes funcionales, más de tres veces el número de genes humanos funcionales (Young y cois., 2002); es to representa diferentes grados y repertorios de detección olfatoria entre ratones y seres humanos. Se conoce un grupo adicional de 25 genes específicos del ratón; 14 contienen genes que participan en la reproducción del roedor (MGSC, 2002; cuadro 16) y cinco inclu yen genes relacionados con la defensa e inmunidad del huésped. Como los roedores y primates muestran algunas diferencias nota bles en la fisiología de la reproducción, es posible que los caracte res reproductivos sean la causa de las presiones evolucionistas potentes y que la exigencia de innovación estimulara expansiones diferenciadas de la familia génica. La pérdida génica durante la evolución también puede condu cir a diferencias en el número de genes, no sólo en familias génicas agrupadas sino asimismo en genes esparcidos. Por consiguiente, al

384

CAPITULO DOCE ¡ LUGAR DEL HOMBRE EN EL ARBOL DE LA VIDA

gunos genes humanos no parecen tener un ortólogo en linajes de roedores, en especial los genes de la región seudoautosóraica mayor y la región próxima específica del cromosoma del sexo (fig. 12-15). La mutación en algunos de estos genes causa enfermedad, como el gen seudoautosómico SHOX (síndrome de Leri-Weill, displasia mesomélica de Langer) y el gen del síndrome de Kallman, KAL1, localizado en Xp (se han identificado homólogos en C. elega nsy D. melanogaster, pero al parecer se eliminaron genes equivalentes de li najes de los roedores).

Divergencia en la expresión génica Las diferencias en la expresión de genes ortólogos entre el hombre y el ratón incluyen muchos ejemplos de variaciones en el procesa miento del RNA y el uso alternativo de promotores, diferencias en el patrón de inactivación del cromosoma X y variaciones en la improntación. Además, incluso cuando se conservan de forma nota

ble genes ortólogos a nivel proteínico, no es raro que los patrones de expresión espaciotemporal muestren diferencias notorias (Fougerousse y cois., 2000).

12.4.2 ¿Qué diferencia al ser humano de sus relacionados más cercanos, los grandes monos? Hace casi siglo y medio, Thomas Huxley identificó de forma co rrecta al chimpancé y el gorila como los relacionados más cercanos del hombre. Desde entonces, los genetistas evolucionistas se con centraron en el problema de la tricotomía: ¿cuál de las dos especies es la que se relaciona de modo más cercano con el hombre? o ¿ha habido una divergencia simultánea de los linajes humano, del chimpancé y el gorila (tricotomía)? Casi todos los datos sobre se cuencias de nucleótidos (p. ej., Satta y cois., 2000) apoyan una re lación más cercana entre seres humanos y chimpancés (incluidos Pan troglodytes, el chimpancé común, y Pan paniscus, el chimpancé

G ru p o s y e je m p lo s

Vertebrados no ~m andibulados

L a m p re a s P e c e s ca rtila g in o s o s

Vertebrados "m andíbulados-

Tiburones, mantarrayas, rayas

P e z te le o s to

l 450

P e z lo b o , p e z c e b ra , m edaka

A n fib io s Xenopus R ep tiles y av es

-360

Pollo

-310

M a m ífe ro s p ro to te ria n o s (m o n o trem o s )

-170

M a m ífe ro s m e ta te ria n o s (m a rsu p iales )

130

-20

r

P la tip u s , e c h id n a C an g u ro O v e ja , c a b ra s G anado

■65

C e rd o s

r85 -95 '

C a b a llo s

■75

P erros

-45 i_

G a to s C o n ejo s R a ta s

40

I__

R ato n e s

90 Monos del Nuevo Mundo (p. ej., marmosetas)

C lave:

~3|5 i-------- Mono! Monos del Viejo Mundo (p. ej., macacos) Lor O ra n g u tá n

M a m ífe ro s eu te rian o s G o rila P rim a tes ca tarrin o s H om ín idos

C h im p a n c é , b o n o b o S e r h u m an o

Fig. 12-24. Filogenia de vertebrados simplificada. Los números en los nudos muestran los tiempos estimados de divergencia en millones de años.

12.4 | ¿QUÉ CONVIERTE AL HOMBRE EN SER HUMANO?

385

D u p lic a c ió n

o a

,

b

a

b AAAAAAA TTTTTTT

B1

d V

b

R NA7SL

M o n ó m e ro iz q u ie rd o

m

|

/

M onóm ero

AAAAAAA

AAAAAAA TTTTTTT

D ím e ro A lu a

D e re c h o

I

■ v c

a

b

■ dy

TTTTTTT b

3 2 pb E xcisión

3) con la fracción de recombinación más probable de 0.23 y un intervalo de apoyo de 0.17 a 0.32. La cur va es más aguda cuanto mayor es la cantidad de datos, pero en ge neral los picos son muy amplios. Es importante recordar que las distancias de mapas genéticos humanos suelen ser estimaciones muy imprecisas. Las calificaciones lod negativas excluyen enlace para la región en la que Z < —2. La curva 3 en la figura 13-7 excluye la distancia de 12 cM en cualquiera de los lados del marcador. Si bien los mapas génicos esperan una calificación lod positiva, las exclusiones no de jan de tener valor. Indican en dónde no se encuentra la enfermedad (mapeo de exclusión). Ello puede descartar un posible gen candi dato y si se elimina suficiente genoma, sólo pueden permanecer unas cuantas posibles localizaciones.

13.4 | EL MAPEO DE MÚLTIPLES PUNTOS ES MÁS EFICIENTE QUE EL MAPEO DE DOS PUNTOS

409

13.3.4 Para investigaciones en el genoma completo debe utilizarse un umbral de significancia de toda la extensión del genoma En estudios de enfermedades se tipifican familias marcador por marcador hasta obtener lod positivos. El umbral apropiado para significancia es una calificación lod, de tal manera que sólo hay una posibilidad de 0.05 de que surja un resultado falsopositivo en cual quier parte durante una búsqueda del genoma completo. Como se muestra en el recuadro 13-4, una calificación lod de 3.0 correspon de a una significancia de 0.05 en un punto aislado. Pero si se utili zaron 50 marcadores, la posibilidad de un resultado falso positivo es mayor en comparación con emplear sólo un marcador. Un proce dimiento rígido (corrección de Bonferroni) es multiplicar el valor p por 50 antes de valorar su significancia. El umbral de calificación lod para un estudio en el que se utilizan n marcadores sería 3 + log(n), que es una calificación lod de 4 para 10 marcadores, 5 para ÍOO, y así de forma sucesiva. Sin embargo, lo anterior es en exceso riguroso. Los datos de enlace no son independientes: si se excluye una localización, entonces aumenta la probabilidad previa de que el carácter se mapee en otra localización. Se ha propuesto el umbral para un nivel de significancia en la extensión d el genom a de 0.05, pe ro una respuesta que se acepta con amplitud para caracteres mendelianos es de 3.3 (Lander y Schork, 1994). Para caracteres no mendelianos, véase la sección 15.3.4. En la práctica, calificaciones lod menores de 5, sea con un marcador o muchos de ellos, deben considerarse provisionales.

13 .4

Fig. 13-7. Curvas de calificación lod. Gráficas de calificación iod contra la fracción de recombinación de un

El m apeo de m últiples puntos es m ás e fic ie n te que el m apeo de dos puntos

13.4.1 El enlace de múltiples puntos puede localizar un locus de enfermedad en un marco estructural de marcadores

grupo hipotético de experimentos de enlace. Curva 1, prueba de enlace (Z > 3) sin recombinantes. Curva 2, prueba de enlace (Z > 3), con fracción de recomblnación más probable de 0.23. Curva 3, enlace ex cluido (Z < - 2 ) para fracciones de recombinación abajo de 0.12; no

El análisis de enlace puede ser más eficiente si se analizan de for ma simultánea datos para más de dos locus. El análisis m ultilocus es en especial útil para establecer el orden cromosómico de un

concluyente para fracciones de recomblnación más grandes. Curva 4, no concluyente en todas las fracciones de recomblnación.

Se ha discutido la probabilidad de que dos locus estuvieran enlazados (la probabilidad previa de enlace), pero se aceptaron con amplitud estimados al rededor de uno en 50.

Hipótesis

Locus enlazados

Locus no enlazados

(fracción de recombinación = 0 )

................ ....... *.... 11........ . ........ . ................ ..... ......

'

(fracción de recombinación = 0.5)

-------------- ------- ----- ------------ ------ —------------------í

Probabilidad previa

1 /5 0

4 9 /5 0

Probabilidad condicional: 1 000:1 probabilidades de enlace (calificación lod Z (0) = 3.0 )

1 000

1

Probabilidad de unión (previa x condicional)

20

— 1

Debido a la probabilidad previa baja de que dos locus elegidos de modo aleatorio estuvieran enlazados, se requirieron pruebas de 1 000:1 probabilida des en favor de enlace a fin de dar probabilidades totales de 20:1 en favor de enlace. Esto corresponde al umbral convencional p = 0 .0 5 de signifi cancia estadística. El cálculo es un ejemplo del uso de la fórmula de Bayes para combinar probabilidades (véase recuadro 18 -4 y fig. 18-1 5 ). Véase también el texto para la descripción de la calificación lod.

410

CAPÍTULO TRECE

MAPEO GENÉTICO DE CARACTERES MENDELIANOS

grupo de locus enlazados. Los genetistas experimentados utilizan desde hace mucho tiempo cruzam ientos d e tres puntos para este propósito. La clase recombinante más rara es la que requiere una doble recombinación. En el cuadro 13-1 es aparente de inmedia to el orden génico A-C-B. Este procedimiento es más eficiente que la estimación de las fracciones de recombinación para inter valos A-B, A-C y B-C por separado en una serie de cruzamientos de dos puntos. Como ideal, en un análisis de enlace debe selec cionarse para todo el genoma y se emplea el grupo de datos com pleto para calcular la probabilidad en cada localización a través del genoma. Una segunda ventaja del mapeo de múltiples locus en seres hu manos es que ayuda a superar los problemas originados por la informatividad limitada de marcadores. Algunas meiosis en una familia podrían ser informativas con el marcador A y otras no in formativas para A pero sí con el marcador B cercano. Sólo los aná lisis de enlace simultáneos de la enfermedad con marcadores A y B extraen la información completa. Esto es menos importante para los mapeos en los que se utilizan marcadores microsatélites muy in formativos en lugar de RFLP de dos alelos, pero resurge cuando se usan polimorfismos de nucleótido único (SNP).

13.4.2 Mapas de marco estructural marcador: familias CEPH Es en particular útil la potencia de mapeo de múltiples puntos pa ra ordenar locus a fin de elaborar mapas d el marco estructural mar cador. Sin embargo, la ordenación de locus en estos mapas no es un problema corriente. Hay n\l2 posibles órdenes para marcado res n y los mapas actuales tienen cientos de marcadores por cro

Cuadro

1 3 -1 .

Ordenación génica mediante cruzamientos en tres puntos.

Clase de descendencia

Posición de la recombinación (x)

Número

ABC/abc

No recombinante

853

abc/abc ABc/abc

(A, B C ) - x - C

5

abC/abc Abc/abc

A —x— (B, c)

47

B - x - ( A , C)

95

aBC/abc AbC/abc aBc/abc Se estableció un cruzamiento entre heterocigotos de ratones y tres lo cus enlazados (ABC/abc) y triples homocigotos (abc/abc). La clase más rara de descendencia es aquella cuya producción requiere dos cruzamientos. De los 1 0 0 0 animales, 142 (95 + 4 7 ) son recombi nantes entre A y B, 52 (47 + 5) entre A y C y 100 (95 + 5 ) entre B y C. Sólo cinco animales son recombinantes entre A y C pero no entre A y B, de tal manera que éstos deben tener cruzamientos do bles, A - x - C - x - B . Por consiguiente, el orden del mapa es A - C - B y las distancias genéticas son aproximadamente A —(5 c M )—C —(1 0 c M )—B.

mosoma. Antes de completar la secuencia del genoma humano, esto resultó una dificultad notoria para marcadores de mapas. En ocasiones fue necesario emplear más computación inteligente que fuerza bruta para tener éxito en el orden correcto. Incluso sin da tos de secuencia a gran escala, fue inmensamente útil la informa ción del mapeo físico. Pueden usarse marcadores que es posible tipificar mediante PCR como sitios de secuencia marcados (SSM; recuadro 15-4) y localizarse de forma física, sea mediante base de datos o de modo experimental con híbridos por radiación (recua dro 8-4). El resultado es un marco estructural de marcadores fija d o d e manera física. El mapeo de marcadores de enfermedad adolece de la necesi dad de utilizar cualquier familia que pueda encontrarse en la que se segrega la afección de interés. Estas familias rara vez poseen es tructuras ideales. Con gran frecuencia, el número de meiosis es in deseablemente pequeño y algunas son de fase desconocida. El mapeo marcador-marcador puede evitar estos problemas. Es posi ble estudiar marcadores en cualquier familia, de tal forma que pue dan elegirse familias que tienen muchos niños y estructuras ideales para enlace, como la familia de la figura 13-1. La elaboración de mapas de marco estructural marcador se benefició en grado consi derable por un conjunto de familias (las familias CEPH) reunidas de manera específica para este propósito por el Centre d’Étude du Polymorphisme Humain (en la actualidad Fondation Jean Dausset) en París. Líneas celulares inmortalizadas de cada individuo asegu ran una dotación permanente de DNA y desde entonces se descar taron muestras confusas y no paternidad al tipificar con muchos marcadores. Como ejemplo, el mapa CHLC de 1998 (Cooperative Human Linkage Center) se basa en los resultados de la califica ción de ocho familias CEPH con 8 325 microsatélites, que dieron por resultado más de un millón de genotipos (Broman y cois., 1998).

13.4.3 Mapeo de marcador de enfermedad de múltiples puntos Para un marcador de enfermedad el mapeo del punto inicial es el mapa del marco estructural de marcadores. Esto se da por hecho y el objetivo es localizar el gen patológico en uno de los intervalos del marco estructural. Los programas como Linkmap (parte del paque te Linkage) o Genehunter (sección 13.6.2) pueden cortar el locus de enfermedad a través del marco estructural marcador tras calcular la probabilidad total de los datos de genealogía para cada posición. El resultado (fig. 13-8) es una curva de calificación lod comparada con la localización en el mapa. Este método también es útil para el mapeo de exclusión: si la curva permanece abajo de una calificación lod de —2 a través de la región, entonces se excluye el locus de en fermedad de esa región. La naturaleza al parecer cuantitativa de la figura 13-8 es sospe chosa en alto grado. Las alturas máximas de los picos dependen de forma crucial de las distancias genéticas precisas entre los marcado res, que sólo suelen conocerse en forma muy general. Más aún, nin guna de las funciones de mapeo (sección 13.1.3) en programas de enlace se aproxima incluso a las complejidades reales de la distribu ción de quiasmas (fig. 13-4). No obstante, a menos que el mapa marcador sea radicalmente erróneo, es aún cierto que el pico más alto marca la localización más probable. Si el marco estructural marcador está fijado de modo físico, como se describió, se estable ce entonces el medio para buscar el DNA del intervalo candidato e identificar el gen de la enfermedad.

13.5

13.5

MAPEO FINO MEDIANTE GENEALOGÍAS EXTENDIDAS Y HAPLOTIPOS ANCESTRALES

Mapeo fino m ediante genealogías extendidas y haplotipos ancestrales

La resolución del mapeo depende del número de meiosis -cuanto más meiosis se analicen mayor es la posibilidad de que un aconte cimiento de recombinación reduzca la región de enlace-. El tama ño pequeño de la mayor parte de las familias humanas limita de manera considerable la resolución factible de alcanzar en estudios de familias. Pese a ello, algunas veces es posible utilizar estructuras familiares extendidas para el mapeo de alta resolución. En algunas sociedades, las personas están muy conscientes de los miembros del grupo y pueden verse a sí mismas como parte de estas familias muy extendidas. Incluso en sociedades en las que las personas limitan su sentimiento familiar a los relacionados inmediatos, al final cada uno se vincula y en ocasiones es posible identificar segmentos cromosómicos ancestrales compartidos entre individuos “no relacionados”. Las enfermedades autosómicas recesivas conducen por sí mismas a estos análisis, ya que puede transmitirse un alelo mutado durante muchas generaciones; para la mayor parte de las enfermedades do minantes o ligadas a X, el recambio de alelos mutantes es muy rá pido para permitir que se comparta en familias extensas (sección 4.5.2). Aun si se asume que no es posible identificar a portadores de una enfermedad recesiva mapeada, el límite de mapeo lo estable ce el número de personas afectadas relacionadas en grado distante que heredaron la enfermedad de un ancestro común.

13.5.1 El mapeo de autocigosidad puede mapear con eficiencia padecimientos recesivos en familias endogámicas extendidas Autocigosidad es un término que se emplea para indicar la homocigosidad para marcadores idénticos p o r descendiente heredados de w oo O J T—

co co Q

r-

tco CM CNJ

55 55 co co QQ

411

un ancestro común reciente. Las personas con trastornos recesivos raros en familias consanguíneas tal vez sean autocigotas para mar cadores relacionados con el locus de enfermedad. Supóngase que los padres son primos segundos; cabría esperar que compartieran 1/32 de todos sus genes por su ancestro común y un niño sería autocigoto en sólo 1/64 de todos los locus. Si ese niño es homocigoto para un alelo marcador particular, ello podría deberse a la autocigosidad o tal vez a la penetración en la familia de manera in dependiente de una segunda copia del mismo alelo. Cuanto más ra ro sea el alelo en esta población, mayor es la probabilidad de que la homocigosidad represente autocigosidad. Para un alelo infinita mente raro, un niño afectado homocigoto único que nace de pri mos segundos genera una calificación lod de log10(64) = 1.8. Si existen otros dos hermanos afectados que también son homocigotos para el mismo alelo raro, la calificación lod es de 3.0 (log10(64 X 4 X 4); la probabilidad de que el hermano pudiera heredar el mismo par de haplotipos parentales, incluso si no se relacionan con la enfermedad, es de uno en cuatro). En consecuencia, familias endogámicas muy pequeñas pueden generar calificaciones lod importantes. El mapeo de autocigosidad es un medio en especial potente si es posible encontrar familias con múltiples personas afectadas por el mismo padecimiento recesivo en dos o más consanguíneos enlazados por endogamia. Es posible hallar familias adecuadas en países del Medio Oriente en los que es común la consanguinidad (endogamia). El método se aplica con gran éxito a la localización de genes para la pérdida de la audición autosómica recesiva (Guilford y cois., 1994; fig. 13-9). La heteroge neidad de locus extensa (fig. 4-3) determina que sea imposible ana lizar la pérdida de la audición recesiva en conjuntos de familias de núcleos pequeños. Una aplicación audaz de autocigosidad en una población del norte de Europa permitió que Houwen y colaboradores (1994) mapearan el raro padecimiento recesivo, colestasis intrahepática recuo^r T -C O CMCVJ

COCO

coco

QQ

CO CO

Q

Fig. 13-8. Mapeo de múltiples puntos en varones. El eje horizontal es un mapa de marco estructural de marcadores y el eje vertical es la calificación lod del análisis de una familia con síndrome de Waardenburg. La calificación lod se calcula para cada posible localización del locus de enfermedad. Las calificaciones lod descienden hasta valores muy negativos cerca de la posición del locus que muestra recombinantes con la enfermedad. El pico más alto marca la localización más probable: ¡as probabilidades en favor de esta localización se miden por el grado al que sobresale de sus rivales el pico más alto. Modificado a partir de Hughes y colaboradores (1994), Nat. Genet. 7:509-512, con autorización de Nature Publishing Group.

412

CAPÍTULO TRECE

MAPEO GENÉTICO DE CARACTERES MENDELLANOS

rrente benigna, tras recurrir sólo a cuatro individuos afectados (dos hermanos y dos personas al parecer sin nexo) de una villa holande sa aislada. Estudio finlandeses publicaron asimismo aplicaciones similares de autocigosidad. Cuanto más remoto es el ancestro com partido, menor es la proporción del genoma que se comparte por virtud de ese ancestro común y por consiguiente mayor la impor tancia de demostrar que los pacientes comparten un segmento idéntico por descendiente. Empero, al mismo tiempo, cuanto más remoto es el ancestro común, mayores son las posibilidades de que un segundo alelo independiente penetre en la familia desde el exte rior y, por consiguiente, menor es la probabilidad de que la homocigosidad represente autocigosidad, sea para una enfermedad o los marcadores. Con un ancestro común remoto, como en el estudio de Houwen y colaboradores, todo depende de encontrar a las personas con un padecimiento recesivo muy raro que son homocigotos para un alelo marcador raro o, con mayor probabilidad, haplotipo. La poten cia del estudio de Houwen parece casi milagrosa, pero es importante recordar que esta metodología sólo se aplica a enfermedades y pobla ciones en las que la mayoría de las personas afectadas es descendiente de un ancestro común que era portador.

13.5.2 La identificación de segmentos ancestrales compartidos permitió el mapeo de alta resolución de los locus para la fibrosis quística y el síndrome de rotura de Nijmegen La fibrosis quística (FQ) es una enfermedad muy rara en países no europeos en donde las estructuras familiares son más susceptibles de mapeo de autocigosidad y, por lo tanto, el mapeo de la FQ depende de núcleos familiares desafortunados raros con más de un niño afec tado. Al utilizar lo anterior, se mapeó la FQen 7q31.2, pero después de emplear todas las recombinantes disponibles, la región candidata aún era demasiado grande (esto sucedió a fines de la década de 1980 cuando la clonación posicional era trabajo de héroes). Al aducir que las mutaciones de FQ podrían ser en su mayor parte muy antiguas (no sólo no hay selección contra heterocigotos, sino que con proba bilidad existe selección positiva en su favor; véase sección 4.5.2), los investigadores buscaron identificar segmentos cromosómicos ances trales compartidos en cromosomas de FQ de pacientes “no relacio nados”. La repartición estaría indicada por el hallazgo en repetidas ocasiones del mismo haplotipo de alelos marcadores. El fenómeno se 1

2

Oy-O 4,

O

r ú

j 6 "

□

Q

Ó -r O

IV

5 7

2 1

6 7 1 4 2 3 9 5

4 5 2 7 5 4 4 5

Q tO

6 3 2 1

56 2 8 6 2

2 6

5 7

1 2

12 12

5 3 6 2 5 2 6

32

6 2 5 2

5 7

12

2 1

1 5 3 6 2 3 7 6

3 4 5 2 3 7 5

5 1 1 8 3 0 2 3 7 6

1

■ 1 1 5 3 6 2 3 7 6

5 2 3 1 4 6 2

5

2 6

5 1 1 5 3 6 2 3 7 6

6 1 2 2 3 5 4 4 5 2

4 2 1 5 3 6 2 3 7 6

6 1 2 2 3 5 4 4 5 2

5 5 12 13 5 1 3 4 6 6 2 2 3 5 7 2 6 6

4 2 6 7 1 4 2 3 9 5

5 2 3 1 4 6 2 5 2 6

5 5 12 13 5 1 3 4 6 6 2 2 3 5 7 2 6 6

7 1 5 7 2 3 1 6 8 2

7 2 2 3 4 5 2 3 7 5

7 1 5 7 2 3 1 6 8 2

7 2 2 3 4 5 2 3 7 5

5 2 4 2 3 6 2 5 2 6

7 2 2 3 4 5 2 3 7 5

7 1 5 7 2 3 1 6 8 2

5 1 1 5 3 6 2 3 7 6

5 2 2 2 2 1 2 3 3 3

22

5 3 2 7 6 5

I

¿

15 \

5 : 2 3 ; ¡4 6 : 2 5 2 6

2 2 2 2 2 1 2 3 3 3

5 3 3 4 6 5

13

D2S305 D2S310 D2S144 D2S171 AFMb346ye5 AFMa052yb5 D2S158 D2S174 D2S365 D2S170

r í ]

O

t

C h rÓ

4 5

D2S305 D2S310 D2S144 D2S171 AFMb346ye5 AFMa052yb5 D2S158 D2S174 D2S365 D2S170

O

■O

Ó T ÍÜ /"'l.

7 2 2 3 4 5 2 3 7 5

2 1

4 2 3 6 2 5

1 5 3 6 2 5

2 2

66

5 1 1 5 3 6 2 5 2 6

2 2 2 2 2 1 2 3 3 3

5 1 1 5 3 6 2 5 2 6

5 1 1 5 3 6 2 3 7 6

5 1 1 5 3 6 2 5 2 6

17

b 1l¡ai 2 2 2 2 2 1 2 3 3 3

5 1 1 5 3 6 2 5 2 6

2 2 1 5 3 6 2 3 7 6

h 5 1 1 5 3 6 2 3 7 6

6 3 2 3 2 2 2 6 7 2

1» 4 5 1 1 5 3 6 2 3 7 6

5 1 1 5 3 6 2 5 2 6

5 1 1 5 3 6 2 3 7 6

6 1 1 5 3 6 2 5 2 6

5 5

1 1 1 1

5 5 3 3 6 6 2 2

3 5 7 2

Fig. 13-9. Mapeo de autocigosidad. Una familia endogámica múltiple grande en la que varios miembros sufren sordera congénita profunda recesiva autosómica (símbolos llenos). El color marca un haplotipo de marcadores del cromosoma 2 que se segrega con la sordera. Los marcadores AFMa052yb5 y D2S158 son homocigotos en todas las personas afectadas y las no afectadas. El gen de sordera debe encontrarse en alguna parte entre los dos marcadores que flanquean éstos (AFMb346ye5 y D2S174). Modificado a partir de Chaíb y colaboradores (1996), Hum. Motee. Genet. 5:155-158, con autorización de Oxford University Press.

13.4

EL MAPEO DE MÚLTIPLES PUNTOS ES MÁS EFICIENTE QUE EL MAPEO DE DOS P I NTOS

denomina desequilibrio de enlace {DE); véase una descripción rr.ií amplia en la sección 15.4. El cuadro 13-2 muestra datos típicos de dos marcadores dentro de la región candidata de fibrosis quísrica (FQ). Los cromosomas que no son de FQ muestran una selección aleatoria de haplotipos, pero los cromosomas de FQ tienden a llevar Xi,K2. La relevancia de este hecho radica en que el DE es un fenó meno de límite muy corto (los segmentos ancestrales compartidos son cortos por recombinación recurrente) y en consecuencia señalan a los investigadores la localización exacta del gen de FQ elusivo. Un gen que se clonó en fecha más reciente, que rige el síndrome de rotura de Nijmegen (SRN; MIM 251 260), muestra una aplica ción más detallada del mismo principio. El SRN es una enfermedad autosómica recesiva muy rara que se caracteriza por rotura cromosómica, retraso del crecimiento, microcefalia, inmunodeficiencia y pre disposición a1 cáncer. La causa que se sospecha es un defecto de la reparación del DNA. El análisis de enlace convencional en núcleos pe-

Cuadro 13-2. Relación alélica en la fibrosis quística. Alelos marcadores

Cromosomas de FQ

Cromosomas normales

X,,K,

3

49

Xi ,K2

147

19

X2, K-|

8

70

x2, k2

8

25

Datos de la tipificación para los marcadores de RFLP XV2.C (alelos X, y X2) y KM19 (alelos K, y K2) en 114 familias británicas con un niño con fibrosis quística (FQ). Los cromosomas que llevan la mutación de la enfermedad FQ tienden a llevar el alelo X, de XV2.c y el alelo K2 de KM19. Datos de M nson y cote. (1989).

1

2

3

4

5

6

7

8

9

10

11

74 haplotipos dieron el alelo de enfermedad de SR N

M a rca d o r

413

12

13

14

15

16

I

--------

1

___ ___ ! ........................

_ _

.

...................

........................................... 1___ .... ....................... ............. .

Fig. 13-10. Haplotipo ancestral en pacientes europeos con síndrome de rotura de Nijmegen. Los pacientes con SRN en apariencia no relacionados quizá heredaron con frecuencia un segmento cromosómico en 8p21 de un ancestro común. Se definieron los haplotipos mediante 16 marcadores, que se muestran en orden cromosómico a través de la parte superior del cuadro. El color rosa marca las localizaciones con alelos idénticos a los del supuesto haplotipo ancestral. Los alelos no ancestrales se codifican en amarillo cuando difieren del alelo ancestral sólo en uno o dos pares de bases y pudieron derivar del alelo ancestral por mutación; los alelos codificados en gris difieren en grado sustan cial del alelo ancestral y tal vez resultaron de recombinación. Los blancos marcan locus en los que no hay datos. Sólo en los locus 11 y 12 no existen alelos recombinantes (gris), lo que sugiere que el gen NBS se mapea en esta posición. Datos de Varón y cois., 1998.

414

CAPÍTULO TRECE

MAPEO GENÉTICO DE CARACTERES MENDELIANOS

quefios de familias localizó el locus del SRN en el cromosoma 8p21, pero después de utilizar todos los recombinantes la región blanco aún no abarcaba 8 Mb entre los marcadores D8S271 y D8S270. A conti nuación se tipificó a 51 pacientes en apariencia no relacionados y sus padres para una serie de marcadores microsatélites espaciados a través de la región candidata. Esto generó 102 haplotipos de SRN. De éstos, 74 parecían derivados de un haplotipo ancestral común, quizá de ori gen eslavo (fig. 13-10). La región más conservada incluyó los marca dores 11 y 12 de la figura 13-10, que luego marcaron la probable localización del gen NBS. De modo subsecuente se clonó a partir de esta localización un gen que codifica una nueva proteína y mostró lle var mutaciones en personas con síndrome de rotura de Nijmegen. Como se predijo, todos los enfermos con el haplotipo común tenían la misma mutación, en tanto que los que tenían haplotipos indepen dientes tuvieron mutaciones independientes (Varón y cois., 1998). El desequilibrio de enlace (DE) es una herramienta central en los esfuerzos para identificar genes susceptibles para enfermedades complejas y se comentan con detalle en la sección 15.4.

13.6

de localizar un gen de enfermedad, pero puede representar dificul tades, entre ellas las siguientes: ► vulnerabilidad de errores; ► límites computacionales sobre las genealogías que pueden ana lizarse; ► problemas con la heterogeneidad de locus; ► límites sobre la última resolución adquirible; ► necesidad de especificar un modelo genético preciso y detallar la modalidad de herencia, las frecuencias génicas y la penetrancia de cada genotipo.

13.6.1 Los errores en la genotipificación y los diagnósticos erróneos pueden generar recombinantes falsas Con marcadores muy polimórficos, los errores comunes como geles de lectura errónea, muestras cambiadas o falta de paternidad, tienen casi siempre como resultado la adjudicación de un niño a un genotipo incompatible con los padres. El programa de análisis de enlace se detendrá hasta que se corrijan dichos errores. Los errores que introducen posibles genotipos, pero equívocos, son un gran problema, en especial el diagnóstico equivocado del estado de en fermedad de una persona. Estos errores incrementan la longitud de los mapas genéticos al introducir recombinaciones falsas: si se asig nó a un niño el alelo parental erróneo, parecerá ser un recombinante.

El análisis de calificació n lod están d ar no está exento de problem as

El análisis estándar de la calificación lod es un método sumamente potente para seleccionar el genoma en segmentos de 20 Mb a fin Lo cu s M a rc a d o r 1 C ro m o s o m a s h o m ó lo g o s d e un trip le h e te ro c ig o to d e fa s e c o n o c id a

E n fe rm e d a d

F re c u e n c ia e s p e ra d a

+ 02 = 0 -0 5

--1

T ip o d e g a m e to

b2 01 = 0 -0 5

M a rc a d o r 2

G a m e to s

M a p a g e n é tic o 1

- -2

1

-1

- -2

- -1

- -2

-1

--

-- + - -D

- + - -D

- -D - - +

-D -

--1

-2

- -2 - - 1

-1

- -2

N o re c o m b in a n te

- -1

R e c o m b in a n te s m a rc a d o r-m a rc a d o r

0-1 + 0g = 0-9

=

0-1

--

R e c o m b in a n te s d o b le s a p a re n te s

< 0102 < 0 0025

Fig. 13-11. Los recombinantes dobles aparentes sugieren errores en los datos. Debido a la interferencia (sección 13.1.3), la probabilidad de un recombinante doble verdadero con marcadores separados 5 cM es pequeña, bastante menor de 0.05 x 0.05 = 0.0025. Los recombinantes dobles aparentes suelen señalar un error en la tipificación de los marcadores, un error en el diagnóstico clínico o heterogeneidad de locus, de tal manera que la afección en este caso no se mapea en el locus D sino en cualquiera otra parte del genoma. La mutación en uno de los genes o mosaicismo germinal son causas más raras.

13.6

EL ANÁLISIS DE CALIFICACIÓN LOD ESTÁNDAR NO ESTÁ EXENTO DE PROBLEMAS

Pueden ayudar análisis de múltiples locus, ya que las recombinacio nes falsas aparecen como recombinantes dobles cercanas (fig. 13-11). Como se observó en la sección 13.1.3, la interferencia determina que sean muy poco probables los recombinantes dobles cercanos. Cuando se elaboran mapas de marco de estructura marcador, las rutinas para revisar errores valoran la extensión a la que puede acor tarse el mapa y omitir cualquier resultado de una prueba aislada (véase Broman y cois., 1998). Se sospechan resultados que alargan de forma significativa el mapa (es decir, añaden recombinantes). Los errores en el orden de los marcadores en mapas de marcos estructurales marcadores solían causar dolores de cabeza (los recombinantes únicos podían parecer dobles), pero este problema se ha atenuado a medida que se revisan de forma cruzada mapas ge néticos y la secuencia física.

13.6.2 Las dificultades computacionales limitan las genealogías posibles Como se comentó en la sección 13.3.2, el análisis de enlace huma no depende de programas de computación que utilizan algoritmos para manejar árboles de ramificación de probabilidades de genotipo y toman en cuenta los datos de genealogía y las frecuencias génicas. El Liped fue el primer programa de uso general y el Mlink (parte de un paquete llamado Linkage) empleaba el mismo algoritmo básico, el algoritmo Elston-Stewart, pero lo extendía a datos de múltiples puntos. El algoritmo Elston-Stewart puede manejar de modo arbi trario grandes genealogías, pero el tiempo de computación aumen ta en grado exponencial con el número cada vez mayor de posibles haplotipos (más alelos, más locus, o ambos). Esto limita la capaci dad de Mlink para analizar datos de múltiples puntos. Se dispone de un algoritmo alternativo, el algoritmo Lander-Green, capaz de mane jar cualquier número de locus (el tiempo de computación aumenta de manera lineal con el número de locus), pero tiene problemas de memoria con genealogías grandes. Este algoritmo se instituyó en el Genebunter (Kruglyak y cois., 1996) y los programas Merlin (Abecasis y cois., 2002). Dichos programas son en particular adecuados para analizar búsquedas en el genoma completo de genealogías de tamaño moderado. La teoría general del análisis de enlace se comenta de manera ex celente en el libro de Ott (véase las lecturas adicionales), en tanto que el libro de Terwilliger y Ott (véase las lecturas adicionales) está lleno de consejos prácticos indispensables para cualquiera que lleve a cabo análisis de enlace en seres humanos.

13.6.3 La heterogeneidad de locus siempre es un posible error en el mapeo de genes humanos Como se comenta en la sección 4.1.4, es común que las mutacio nes en varios genes no enlazados produzcan el mismo fenotipo clí nico. Puede ser difícil mapear incluso un padecimiento dominante con familias grandes si hay heterogeneidad de locus dentro del conjunto de familias estudiadas. Se requirieron años de trabajo colaborativo para demostrar que la esclerosis tuberosa se debía a mu taciones en cualquiera de dos locus, TSC1 (MIM 191 100) en 9q34 y TSC2 (MIM 191 092) en 16p 13. Con padecimientos rece sivos se multiplican las dificultades por la necesidad de combinar

415

muchas familias pequeñas. En estos casos, la principal solución es el mapeo d e autocigosidad (véase sección 13.5.1). G enehunteru H om ogy programas relacionados (véase Terwilliger y Ott en las lecturas adicionales) pueden comparar la probabilidad de los datos sobre las suposiciones alternativas de homogeneidad (todas las familias se mapean para la localización que se estudia) y heterogeneidad (una proporción a de familias no enlazadas) de lo cus y suministran un estimado de probabilidad máxima de a.

13.6.4 El mapeo meiótico tiene una resolución limitada La resolución de mapeo depende del número de meiosis analizado. Las familias humanas son muy limitadas para este propósito; por ejemplo, el conjunto de familias CEPH (sección 13.4.2) puede pro porcionar una resolución promedio de sólo unos 3 Mb. Una solu ción consiste en usar espermatozoos. Los varones pueden tener muy pocos niños para mapeo de alta resolución, pero producen con efec tividad cantidades ilimitadas de espermatozoos. Es posible calificar los espermatozoos individuales como recombinantes o no recombi nantes para pares de marcadores amplificables mediante reacción en cadena de la polimerasa (PCR). Este método no puede emplearse para mapear enfermedades, pero suministra al investigador la capa cidad técnica necesaria para llevar a cabo el mapeo marcador-marcador a cualquier resolución deseada. Lien y colaboradores (2000) describen una aplicación típica. La existencia de puntos críticos de recombinación muy localizados (fig. 13-5) se comprobó tras medir fracciones de recombinación tan bajas como 0.00001 (Jeffreys y cois., 2001). Por supuesto, esto proporciona sólo información en la recombinación masculina.

13.6.5 Con los métodos descritos en este capítulo no es posible mapear caracteres cuya herencia no es mendeliana Los métodos de análisis de calificación lod que se describen en este capí tulo requieren un modelo genético preciso. Es necesario especificar la modalidad de herencia, las frecuencias génicas y la penetrancia de cada genotipo. Para los caracteres mendelianos no suele ser un pro blema proporcionar cifras plausibles. La penetrancia puede requerir un poco de meditación. Si no se permite que personas no afectadas sean posiblemente portadores génicos no penetrantes, o que las personas afectadas sean tal vez fenocopias, entonces este individuo se calificaría como recombinante. Por otra parte, si la penetrancia se establece muy baja hay una disminución de la potencia para detec tar enlace, porque se adquiere una hipótesis menos precisa. Sin em bargo, para enfermedades complejas comunes, como diabetes o esquizofrenia, los problemas son mucho menos factibles de tratarse. Cualquier modelo genético no es más que una hipótesis -no se tiene la idea real de las frecuencias o la penetrancia de los genes de cualquier alelo de susceptibilidad o incluso la modalidad de herencia-. Lo anterior determina que sea muy razonable aplicar los métodos descritos en este capítulo a esas enfermedades. No obstante, la identificación de los com ponentes genéticos d e suscepti bilidad a enferm edades complejas es en la actualidad una parte im portan te d e la investigación en genética humana. En el capítulo 15 se incluyen las formas en que es posible llevar a cabo lo anterior.

416

CAPÍTULO TRECE

MAPEO GENÉTICO DE CARACTERES MENDELIANOS

Lecturas adicionales Ott J (1999) Analysis of Human Genetic Linkage, 3a. ed. Johns Hopkins University Press, Baltimore, MD.

Terwilliger J, Ott J (1994) Handbook for Human Genetic Linkage. Johns Hopkins University Press, Baltimore, MD.

Bibliografía Abecasis GR, Cherny SS, Cookson WO, Cardón LR (2002) Merlin - rapid analysis of dense genetic maps using sparse ge ne flow trees. Nature Genet. 30, 97-101. Broman KW, Murria JC, Sheffield VC, White RL, Weber JL (1998) Comprehensive human genetic maps: individual and sex specific variation in recombination. Am. J. Hum. Genet. 63. 861869. Broman KW, Weber JL (2000) Characterization of human crossover interference. Ad. J. Hum. Genet. 66. 1911-1926. Chaib H, Place C, Salem N ef a/. (1996) A gene responsible for a sensorineural nonsyndromic recessive deafness maps to ch romosome 2p22-23. Hum. Mot. Genet. 5, 155-158. Guilford R Ben Arab S, Blanchard S, Levilliers J, Weissen bach J, Belkahia A, Petit C (1994) A non-syndrome form of neurosensory, recessive deafness maps to the pericentromeric region of chromosome 13q. Nature Genet. 6, 24-28. Houwen RHJ, Baharloo S, Blankenship K, Raeymaekers P, Juyn J, Sandkuijl LA, Freimer NB (1994). Genome screening by searching for shared segments: mapping a gene for benign recurrent intrahepatic cholestasis. Nature Genet. 8, 380-386. Hughes A, Newton VE, Liu XZ, Read AP (1994) A gene for Waardenburg syndrome Type 2 maps close to the human homologue of the microphthalmia gene at chromosome 3p12-p14.1. Natu re Genet. 7, 509-512. Hultén MA, Lindsten J (1973) Cytogenetic aspects of human ma le meiosis. Adv. Hum. Genet. 4, 327-387. Hultén MA, Tease C (2003) Genetic maps: direct meiotic analysis. En: Cooper DN (ed) Enciclopedia of the Human Genome. Natu re Publishing Gropu, Londres.

Ivinson AJ, Read AP, Harris R, Super M, Zchwarz M, Clayton Smith J, Elles R (1989) Testing for cystic fibrosis using allelic association. J. Med. Genet. 26, 426-430. Jeffreys AJ, Kauppi L, Neumann R (2001) Intensely punctate meiotic recombination in the class II region of the major histo compatibility complex. Nature Genet. 29, 217-222. Kong A, Gudbjartsson DF, Sainz J et a/. (2002) A high-resolution recombination map of the human genome. Nature Genet. 31 241-247. Kruglyak L, Daly MJ, Reeve-Daly MP, Lander ES (1996) Para metric and non-parametric linkage analysis: a unified multipoint approach. Am. J. Hum. Genet. 58, 1347-1363. Lander ES, Schork NJ (1994) Genetic dissection of complex traits. Science 265, 2037-2048. Lien S, Szyda J, Schechinger B, Rappold G, Arnheim N (2000) Evidence for heterogeneity in recombination in the human pseudoautosomal region: high resolution analysis by sperm typing and radiation-hybrid mapping. Am. J. Hum. Genet. 66, 557-566. Morton NE (1955) Sequential tests for the detection of linkage. Am. J. Hum. Genet. 7, 277-318. Tease C, Hartshorme GM, Hultén, MA (2002) Patterns of meiotic recombination in human fetal oocytes. Am. J. Hum. Genet. 70, 1469-1479. Varón R, Vissinga C, Platzer M et al. (1988) Nibrin, a novel DNA double-stranded break repair protein, is mutated in Nijmegen Breakage Síndrome. Cell 93, 467-476. Wang DG, Fan JB, Siao CJ ef al. (1988) Large-scale identifica tion, mapping and genotyping of single nucleotide polymorp hisms in the human genome. Science 280, 1077-1082.

CAPÍTULO

CATORCE

Identificación d e gen es patológicos hum anos Contenido del capítulo 14.1 14.2

Principios y formas de identificar genes patológicos Conductas independientes de la posición para identificar genes de enfermedad 14.3 Clonación posicional 14.4 Uso de anormalidades cromosómicas 14.5 Confirmación de un gen candidato 14.6 Ocho ejemplos ilustran diversas formas de identificar genes de enfermedades

Recuadro 14-1

Recuadro 14-2 Recuadro 14-3 Recuadro 14-4 Recuadro 14-5

Mapeo de transcritos: métodos de laboratorio que complementan los análisis de bases de datos para identificar secuencias expresadas entre clonas genómicas Mapeo de genes del ratón Indicadores de la presencia de anormalidades cromosómicas Efectos de la posición: un peligro latente en la identificación de un gen patológico Hibridación genómica comparativa para detectar desequilibrios cromosómicos submicroscópicos

418 | CAPÍTULO CATORCE

IDENTIFICACIÓN DE GENES PATOLÓGICOS HUMANOS

Un título más preciso aunque menos elegante para este capítulo se ría “identificación de determinantes genéticos de fenotipos huma nos”. Los métodos que se describen pueden también aplicarse a la identificación de determinantes de enfermedades o variaciones nor males, como cabello rojo o ceguera a los colores rojo y verde. No todos los factores son por fuerza genes, entendidos como secuen cias que codifican proteínas. Por definición, deben tener un efecto en el fenotipo, pero puede tratarse de cierta acción indirecta en el nivel de expresión de un gen que codifica una proteína o el proce samiento o estabilidad de su mRNA. La función de la patología molecular es comprender por qué una variante de una secuencia de DNA determinada causa un fenotipo particular (cap. 16); en este capítulo se comenta la forma de identificar la variante correcta. Es importante no confundir frases como “el gen para la fibro sis quística”, “el gen para la diabetes”, y otras más. Muchos genes humanos se descubrieron por primera vez al investigar las afec ciones consecutivas a mutaciones en ellos y quizá se requieran años antes de comprender su función normal. De ahí el interés de esta forma de nominarlos; tampoco se describiría el refrigera dor doméstico como un “aparato para arruinar los alimentos congelados”. Los genes llevan a cabo una labor en las células; si no se cumple esa función, o se realiza de forma errónea, el resul tado puede ser una enfermedad. Pocos temas han avanzado con tanta rapidez como la identifica ción de genes patológicos en seres humanos. Antes de la década de 1980 se habían reconocido muy pocos genes humanos como el lo cus de enfermedad. Los escasos éxitos iniciales incluyeron unas cuantas anormalidades con una base bioquímica conocida en la que fue posible purificar el producto génico. En la década de 1980 los adelantos tecnológicos del DNA recombinante hicieron posible una nueva conducta, que en ocasiones recibió el errático nombre de “genética inversa”. El número de genes de enfermedades reconoci do comenzó a aumentar y estos éxitos iniciales fueron en verdad he roicos, ganados con esfuerzo. Con el advenimiento de la PCR para estudios de enlace y selección de mutaciones esto se facilitó mucho más. En la actualidad, cuando los proyectos del genoma humanos y otros permiten disponer de una vasta gama de recursos, la capa cidad para identificar el gen de una enfermedad mendeliana depen de casi por completo de contar con las familias adecuadas. No obstante, aún es muy difícil reconocer factores que confieren sus ceptibilidad a trastornos complejos comunes.

14.1

Principios y form as de id en tificar genes patológicos

Existen muchas formas diferentes de identificación (fig. 14-1), pero todos los caminos convergen en un gen candidato. De una manera u otra, se reconoce un gen candidato y después, para confirmar la hi pótesis, el investigador lo selecciona para mutaciones en pacientes con la afección. Los genes candidatos pueden identificarse sin referencia a su lo calización cromosómica (sección 14.2); empero, más a menudo se señala primero una región cromosómica y luego se identifican los genes candidatos que se hallan dentro de esa región (sección 14.3). Hoy en día, con la disposición de un buen catálogo (aunque in completo) de todos los genes humanos, se facilita en grado notorio la labor de reconocer candidatos, aunque todavía puede ser muy la borioso trabajar con base en una lista de candidatos y buscar mu taciones.

La información posicional reduce la lista de posibles candidatos de un total de 300 000 genes humanos a tal vez unos 10 a 30 en una región candidata. Este hecho es relevante porque a pesar de la dili gencia con la que se intenta adivinar los probables genes, en la ac tualidad la capacidad para llevarlo a cabo es muy limitada. Una y otra vez, cuando por fin se reconoce un gen de enfermedad, aún es un gran misterio la razón por la que las mutaciones provocan esa anormalidad particular. ¿Por qué la pérdida de la función de la pro teína FMR1, que participa en el transporte de RNA del núcleo al ci toplasma, causa retraso mental y macroorquidismo (síndrome de X frágil, MIM 309 550)?, ¿por qué ciertas mutaciones en la proteína de enlace TATA (véase sección 1.3.4) producen ataxia espinocerebelosa (AEC17; cuadro 16-6)?

14.2

Conductas independientes de la posición para id en tificar genes de enferm edad

Desde el punto de vista histórico, los primeros genes de enferme dades se identificaron mediante métodos independientes de la po sición, tan sólo porque no existía información de mapeo y no se disponía de técnicas para generarla. En estas circunstancias, el can didato debía sugerirlo el conocimiento del producto génico: globina p$ para la enfermedad de células falciformes; hidroxilasa de fenilalanina para fenilcetonuria, y así de modo sucesivo. Hoy en día, los estudios que provienen de una dirección bioquímica o bio lógica celular pueden todavía identificar productos proteínicos de genes desconocidos. Se requiere algún método para pasar de la pro teína al DNA.

14.2.1 Identificación de un gen de enfermedad por el conocimiento del producto proteínico Las técnicas proteínicas modernas permiten identificar o secuenciar de modo parcial cantidades incluso muy pequeñas de una proteína mediante espectrometría de masa (Mann y cois., 2001 y sección 19.4.2) y microsecuenciación química (Bartlett, 2001). Si es posi ble resolver la secuencia del cDNA que codifica esos aminoácidos, es factible sintetizar una sonda oligonucleótida y utilizarla para se leccionar genotecas a fin de recuperar el cDNA. El problema es la degeneración del código genético —casi todos los aminoácidos pue den codificarse por uno de varios codones-. La sonda debe ser un oligonucleótido degenerado, un conjunto de todas las posibles se cuencias, seleccionado para que sea compatible con una parte de la secuencia de aminoácidos en la que el número de posibles permu taciones no es demasiado grande. Debido a que sólo uno de los oligonucleótidos de la mezcla corresponde a la secuencia auténtica, es importante conservar bajo el número de diferentes oligonucleótidos para incrementar la posibilidad de identificar el blanco correc to. En este caso son muy útiles el triptófano y la metionina, ya que sólo tienen un codón. Se evitan tanto como sea posible la arginina, leucina y serina, que poseen seis codones cada una. La selección de una genoteca puede ser tediosa cuando se emplea una sonda degenerada, dado que los resultados se influyen en grado considerable por las condiciones de la hibridación. Una alternativa más rápida consiste en usar oligonucleótidos degenerados de forma parcial como cebadores de la reacción en cadena de la polimerasa (PCR). Es posible reducir el número de permutaciones factibles al ligar el cDNA blanco a un vector y utilizar un cebador específico de

14.2

CONDUCTAS INDEPENDIENTES DE LA POSICIÓN PARA IDENTIFICAR GENES DE ENFERMEDAD

B1

A1

C1

¿ H o m ó lo g o c a n d id a to m apeado?

N

¿ R eg ió n c ro m o s o m ic a c a n d id a ta ?

R evisar bases d e dato s para genes

N

¿ L o c a liza d o co n éxito?

C2 '

D2

D3 Id e n tific a r n u e vo s g e n e s hum anos

P o s ib le g en c a n d id a to

B4

Pensar otra vez sobre el modo de herencia, heterogeneidad

Clonar los puntos de rotura cromosómicos

D eleciones o translocaciones crom osóm icas

>f

E2

r

¿ H o m ó lo g o c a n d id a to c lo n a d o ?

E1 >

J J

B3

A3

D1 M a p eo genético: búsqued a del genom a

Á

r

B2

R eu n ir fam ilia s p a ra m a p e o

419

D4

¿Se caracterizó por com pleto?

E3 Pensar otra . vez sobre genes candidatos: ir a A3, B2, D3

R e s o lv e r la s e c u e n c ia y e s tru c tu ra c o m p le ta s

N

C5

Organismos modelo

Búsqueda en base de datos

E5

D5 R eu n ir a p a c ie n te s no re la c io n a d o s

B uscar m u ta c io n e s

Información clínica

Trabajo de laboratorio

Fig. 14-1. Forma de identificar un gen de enfermedad humana.

-►

¿Se encontraron mutaciones patogénicas?

________________________

No existe una vía única de éxito, pero el paso fundamental consiste en llegar a un gen candidato factible, que a continuación puede estudiarse para mu taciones en la persona afectada. Obsérvese la interrelación entre el trabajo clínico, el trabajo de banco de laboratorio y el análisis por computadora. La investigación de bases de datos es cada vez más crucial a medida que se acumula información de proyectos de genomas.

vector y otro específico de proteína degenerada. Sin embargo, es ne cesaria cierta suerte para obtener el producto de la PCR deseado, en lugar de ninguno o de una revoltura de productos irrelevantes. Una vía alternativa, si se dispone de la proteína aun en cantida des diminutas, supone elaborar un anticuerpo a la proteína y utili zarlo para encontrar el gen. Desde el año de 1982 se recuperó el mRNA que codifica a la hidroxilasa de fenilalanina mediante inmunoprecipitación de polisomas que sintetizaron la proteína en un sistema sin células (Robson y cois., 1982). Hoy en día es posible

crear una genoteca de expresión de cDNA al clonar cDNA man comunado en un vector de expresión (sección 5.6.1). Las células huésped que contienen clonas con el gen deseado deben producir la proteína, o cuando menos partes de ella, y puede identificarse tras seleccionar filtros de colonias de la genoteca con un anticuer po apropiado. En este caso, todo depende de la especificidad del anticuerpo y la esperanza de que la proteína no sea tóxica para la célula huésped. La exhibición de íago (sección 5.6.2) perfeccionaría el método alternativo.

420

CAPÍTULO CATORCE

IDENTIFICACIÓN DE GENES PATOLÓGICOS HUMANOS

14.2.2 Identificación del gen patológico a través de un modelo animal Muchos genes de enfermedades humanas se identificaron con ayu da de modelos animales, si bien casi siempre después de revisar la información posicional. Es posible que un mutante de ratón y una afección humana similar en sentido fenotípico se mapeen en las lo calizaciones cromosómicas correspondientes (mediante la Parrilla Oxford, véase fig. 14-7). A continuación, si se clona el gen del ra tón, su homólogo humano se constituye en un candidato natural. De manera alternativa, se identifica en el ratón un gen patológico y en seguida se aísla el homólogo humano; éste puede mapearse mediante hibridación de fluorescencia in situ (sección 2.4.2) y se transforma en un gen candidato para cualquier mapeo de enferme dad en esa localización. Ésta es la manera en que se identificó el gen M ITFcomo causa del síndrome de Waardenburg tipo 2 (MIM 193 510; Hughes y cois., 1994). Es raro que un gen reconocido en un modelo animal se pruebe de forma directa en pacientes humanos sin ninguna confirmación posicional que indique que se trata de los individuos apropiados para el estudio, pero uno de estos casos es SOXIO. Este gen se identificó mediante laboriosa clonación posicional del ratón con mutación dom inante de megacolon (Dom). Los ratones Dom son un modelo de enfermedad de Hirschsprung humana que se ha estudia do durante mucho tiempo (sección 15.6.2). Los sujetos con una combinación de enfermedad de Hirschsprung, anormalidades pig mentarias y pérdida de la audición (síndrome de Waardenburg ti po IV, SW4, MIM 277 580) se asemejaron de manera especial a los ratones. El síndrome de Waardenburg tipo IV (SW4) es muy raro y en condiciones normales ocurre en familias muy pequeñas, lo que imposibilita su mapeo, de tal manera que se estudió un grupo de pacientes con esta afección para mutaciones de SOXIO sin ningún conocimiento previo del sitio en que podría mapearse la anormali dad. El intento redituó beneficios cuando se encontraron mutacio nes en SOXIO, aunque no en todos los individuos (Pingault y cois., 1998).

14.2.3 Identificación de un gen de enfermedad mediante el conocimiento de la secuencia de DNA independiente de la posición Por lo regular, esto surge sobre todo cuando el investigador consi dera los trastornos que pueden atribuirse a mutaciones de un gen particular conocido. Los candidatos independientes de la posición también se generan mediante experimentos de arreglos de expre sión, en los cuales se comparan muestras de mRNA de pacientes y testigos para crear una lista de genes cuya expresión está alterada en la enfermedad.

Definir la región candidata

Obtener clonas de todo el DNA de la región

Una aplicación interesante del conocimiento de la secuencia del DNA independiente de la posición es el intento de clonar genes que contienen repeticiones expandidas de trinucleótidos novedosas. Co mo se muestra en la sección 16.6.4, éstas ocasionan varios trastornos neurológicos hereditarios. Con frecuencia, tales padecimientos mues tran anticipación, es decir, la afección se presenta a una edad más temprana y con mayor gravedad en generaciones sucesivas. Si una anomalía en investigación muestra cualquiera de estas características, merece la pena seleccionar el DNA de los sujetos afectados para ex pansiones repetidas de tripletos. El método de detección de expansión repetida de Schalling y colaboradores (1993) permite detectar repeti ciones expandidas en DNA genómico no fraccionado de personas afectadas y se han desarrollado métodos para clonar cualquier repeti ción expandida reconocida (Koob y cois., 1998). Este método se em pleó en una forma por completo independiente de la posición a fin de identificar una nueva expansión repetida que participa en una forma de ataxia espinocerebelosa (AEC8) (Koob y cois., 1999).

14.3

Clonación posicional

En la clonación posicional se identifica un gen patológico sin co nocer nada, excepto su localización cromosómica aproximada. El primer éxito con este método fue el reconocimiento del gen para la enfermedad granulomatosa crónica ligada a X (Royer-Pokora y cois., 1985). Un campo de prueba importante para los métodos de clo nación posicional fue la distrofia muscular de Duchenne (DMD, MIM 310 200). Años de investigación cuidadosa de los cambios histopatológicos en el músculo afectado habían fracasado para re velar la base bioquímica de esta afección (DMD). Al inicio de la década de 1980 varios grupos compitieron para clonar el gen de DMD mediante diferentes conductas. El trabajo pionero de éstos, que venció dificultades técnicas formidables para clonar un gen sin precedente, fue tal vez la mayor inspiración para casi todos los es fuerzos subsecuentes de clonación posicional. Este trabajo lo revi saron bien Worton y Thompson (1988). La conclusión satisfactoria de este trabajo en 1986 marcó el ini cio de una nueva era de triunfo para la genética molecular huma na. Se aislaron uno tras otro los genes subyacentes de trastornos graves, como la fibrosis quística, enfermedad de Huntington, en fermedad poliquística del riñón del adulto y cáncer colorrectal fa miliar. La lógica de la clonación posicional sigue el esquema que se indica en la figura 14-2. Sin embargo, antes de disponerse de los mapas marcadores, las clonas y secuencias actuales, la clonación po sicional podía ser una labor desesperadamente difícil. Hacia 1995 sólo se habían identificado con este método alrededor de 50 genes de enfermedades hereditarias. La naturaleza frustrante de la clona ción posicional la resume un investigador en la figura 14-3.

Identificar todos los genes en la región

Prioridad a la selección de mutación

Estudiar genes candidatos para mutaciones en personas afectadas

Fig. 14-2. Lógica de la clonación posicional. La figura ilustra la progresión lógica de la clonación posicional; empero, hasta que se dispuso de los datos de secuencia y los mapas marcadores de al ta resolución actuales, los investigadores intentaron todas las formas de métodos abreviados para reducir la labor de clonación posicional pura.

14.3

CLONACIÓN POSICIONAL

421

R egió n c a n d id a ta

La tía M aría es una fenocopia. Tres m eses perdidos y adición d e 1 M b al intervalo.

El c o n tig u o tie n e un orificio. A ñ a d ir o tros tre s m eses.

B uen in te n to p e ro é s te es un p o lim o rfis m o b e n ig n o . 6 5 ex o n e s m á s p a ra seleccio n ar.

M u y m a l, g en erró n e o : seis g e n e s m á s p a ra estudiar. O tro s seis m e se s.

El gen

Fig. 14-3. Vía difícil de la región candidata al gen. Observación de un investigador de las frustraciones de una clonación posicional. Cortesía de Richard Smith, University of lowa.

14.3.1 El primer paso consiste en definir la región candidata tanto como sea posible La dificultad de la clonación posicional depende en buena medida del tamaño de la región candidata, de tal manera que la primera prioridad es reducirlo cuanto más sea posible. Para anomalías mendelianas, lo anterior depende en particular del número de meiosis disponibles para estudio. El límite de resolución se alcanza cuan do se mapea el último recombinante entre marcadores espaciados de modo cercano. Esto se decide tras inspeccionar haplotipos en lu gar del análisis por computadora (fig. 14-4). Al emplear la regla empírica de 1 cM = 1 Mb (sección 13.1.5), un conjunto de fami lias con 100 meiosis informativas puede localizar una enfermedad mendeliana en una región candidata de 1 Mb. Cuando las recombinaciones aisladas definen los límites de la re gión candidata, es importante considerar las posibles causas de error (sección 13.6.1). Son imprescindibles diagnósticos clínicos meticu losos. Los recombinantes esenciales son más seguros si ocurren en personas no afectadas de modo ambiguo (un individuo no afectado podría ser portador de un gen no penetrante). Los recombinantes dobles aparentes son sumamente sospechosos. En ocasiones, a pe sar de las buenas calificaciones lod positivas, parece haber recombi nantes en los que se intentaron todos los marcadores. Muchas veces esto indica que una de las familias en el estudio no se mapea en esa

región. De manera alternativa, es posible que los marcadores estén ordenados de manera incorrecta en el mapa genético. Para fenotipos no mendelianos, el análisis de enlace es mucho menos preciso y las regiones candidatas son de forma característica de 20 cM o más (cap. 15). Es demasiado grande para buscarse sin indicios adicionales y por esa razón se insiste en utilizar el desequi librio de enlace a fin de reducir la búsqueda (sección 15.4). Inclu so para enfermedades mendelianas, el desequilibrio de enlace puede ser una herramienta muy valiosa para mapeo fino, como se obser vó en la fibrosis quística y el síndrome de rotura de Nijmegen (sec ción 13.5.2).

14.3.2 Es necesario establecer un contiguo de clonas a través de la región candidata En el recuadro 8-5 se describen las técnicas para elaborar contiguos. En los primeros días la formación de contiguos representaba un gran esfuerzo. El artículo que describe la identificación del gen de la fi brosis quística (Rommens y cois., 1989) resume tal vez el ejemplo más impresionante de esta fase inicial. El uso de selección por hibri dación de genotecas para reconocer clonas sucesivas superpuestas (caminata cromosómica) fue penosamente lento con la disponibi lidad de entonces de genotecas de fagos de inserto pequeño y cósmidos y se complementó con la técnica, hoy en día obsoleta, del

422

CAPÍTULO CATORCE

IDENTIFICACIÓN DE GENES PATOLÓGICOS HUMANOS

A)

0 2

8 6 3 2 1 8

6 5 2 6 2 2

8 6 3 2 1 8

6 5 2 6 2 2

3 Ó 1

5 6

4 3 6 5 5 7 8

S84 S105 S234 S129 S354 S79

8 3 8 2 7 10

10 4 6 4 1 6

8 3 8 2 7 10

10 3 2 3 5 8

8 3 8 2 7 10

3 2 2 1 6 2 2

6 5 2 6 2 2

7 5 4 6 6 2

3 6 5 5 7 8

6 5 2 6 2 2

7 4 4 2 5 4

S84 S105 S234 S129 S354 S79

Fig. 14-4. Definición de la región candidata mínima mediante inspección de haplotipos. Las dos genealogías muestran un trastorno de la piel de herencia dominante, la enfermedad de Darier-White (M IM 124 20 0 ) que se había mapeado con anterioridad en 12q. Se destaca el haplotipo marcador 12q que segrega con la enfermedad. Los cuadros en gris indican los haplotipos inferidos en la persona muerta. En el individuo II-6 de la genealogía A, la recombinación mapea el gen patológico distal a D 12584;

D12S105 no

es informativo porque

1-1 fue evidentemente homocigoto para el alelo 5 (compárese los genotipos de II-3 y II-7). La recombinación que se muestra en 111-1 sugiere que el gen de la enfermedad se mapea proximal a

D12S129,

pero es necesario confirmarlo porque la interpretación depende de que se infieran de manera correcta

los genotipos de 11-1 y II-2 y de que 111-1 no sea portador de un gen no penetrante. La recombinación en el individuo II-4 de la genealogía B proporciona la confirmación. Los datos combinados localizan el gen de Darier en el intervalo entre (19 9 4 ),

Genomics 24,

D12S84 y D12S129.

Modificado a partir de Cárter y colaboradores

3 7 8 -3 8 2 . © 1 9 9 4 con autorización de Elsevier.

brincado cromosómico (Poustka y cois., 1987). En la actualidad es posible descargar contiguos elaborados con facilidad a partir de ba ses de datos de secuencias del genoma humano, aunque siempre es necesario revisar estos ensambles antes de confiar en ellos.

14.3.3 Un mapa de transcritos define todos los genes dentro de la región candidata Una vez que se establece un contiguo, el paso siguiente es catalogar todos los genes de su interior. A medida que mejora el conocimien to del genoma humano, es más probable cada vez que la causa de cualquier enfermedad que se investiga sea una mutación de un gen conocido. Se utiliza una búsqueda general del genoma, como Ensembl (http://www.ensembl.org) o el buscador general Santa Cruz (http://genome.cse.ucsc.edu) para mostrar y analizar todos los genes definidos y posibles en la región candidata (fig. 14-5; véase asimis mo la sección 8.3.6 y Wolfsberg y cois., en las lecturas adicionales). Por impresionantes que sean estas exhibiciones, es importante no confiar por completo en ellas. Tales herramientas muy complicadas deben usarse como coadyuvantes del pensamiento y no para susti tuirlo. Es necesario complementarlas mediante un estudio personal a fondo de primera mano de la región mediante una combinación de trabajo de computadora y experimental. El artículo de Reymond y colegas (2002) ilustra las variedades de análisis adicionales que pueden instituirse. Las búsquedas por computadora intentan obtener más informa ción de bases de datos de la que pueden extraer los programas de

búsqueda general del genoma. Los programas de búsqueda génica son malos para encontrar exones pequeños, exones con sitios de empalme poco comunes o predisposiciones de codón, o bien genes con regiones no traducidas 5' o 3' demasiado largas. Es posible que los marcadores de secuencia expresados (MSE) que se elaboran con exones pequeños empalmados no sean compatibles con su secuen cia genómica. Análisis por computadora más amplios pueden enfo carse en reconocer homologías. La comparación de las secuencias humana y del ratón puede revelar secuencias adicionales conserva das que sugerirían cierta función. Es posible que las búsquedas uti lizadas para anotación automática del genoma pasen por alto homologías débiles a posibles ortólogos o parálogos. Tal vez surja una investigación más directa, impulsada por hipótesis, con indica dores relevantes de la función génica. El trabajo experimental implica una revisión doble para equivo caciones en el ensamble de secuencias, como subclonas ordenadas de forma errónea o equivocaciones del ensamble génico, por ejem plo omisión o exones falsos, genes cortados o concatenados, etc. Con la finalidad de comprobar que se crean los productos del ta maño predicho, se utilizan cebadores compatibles con diferentes partes de la secuencia genómica. El fracaso en la amplificación su giere un ensamble erróneo de la secuencia genómica. La PCR-RT con cebadores de diferentes posibles exones suele valorar si puede amplificarse del todo el producto previsto y, de ser factible, si con tiene los exones intermedios esperados. Puede revelar empalme alternativo no sospechado o exones adicionales. Es posible usar RACE-5' (sección 7.2.3) a fin de extender secuencias génicas, en

14.3

423

_E21U _

Benda cromosomi c a t

DNfl (contiguos)

CLONACIÓN POSICIONAL

AL 136223 > >

< fiL 049643

fiL353716 >

< fiL 035567

riarcadon es

>

fiL133375 >

RL355365 >

II

i l l

D6S322E 06E1374 D6S2ÍI78

PFHa272zb5 06Í15S 2 06S1S59 D6S1883 D6S216S

> AL359613 >

>

I D8S1790

I

Genes l 5 .4

Confirmada

0.01 en un estudio de una región candidato que dio un enlace significante en un estudio independiente previo

Categoría de enlace

445

446

CAPÍTULO QUINCE

MAPEO E IDENTIFICACIÓN DE GENES

Recuadro 15-2. Mediciones de desequilibrio de enlace Si dos locus tienen alelos A,a y B,b con frecuencias pAi pa, pB y pb, hay cuatro posibles haplotipos AB, Ab, aB y ab. Asúmase que las frecuencias de los cuatro haplotipos sean pAB, pAb, paB y pab. Si no hay desequilibrio de enlace (DE), pAB = pApB, etc. El grado de partida desde esta asocia ción aleatoria puede medirse mediante D = pABpab- pabpaB. Como una medición del DE, los D adolecen de la propiedad de que su va lor absoluto máximo depende tanto de las frecuencias génicas en los dos locus como de la extensión del desequilibrio. Entre las mediciones prefe ridas se encuentran: ► O' = (PAB-PAPsI/Dmáx. donde Dmáx es el valor máximo de |pAB- p ApB| posible con las frecuencias de alelos dadas.

15.4.2 Asociación es un principio muy distinto de enlace, pero donde la familia y la población se fusionan, el enlace y la asociación se funden En principio enlace y asociación son fenómenos por completo dis tintos. Enlace es una relación entre locus, pero asociación es una re lación entre alelos o fenotipos. Enlace es una relación específicamente genética en tanto que asociación, como se mencionó, es sólo una observación estadística que puede tener varias causas. El enlace no produce por sí mismo ninguna asociación en la po blación general. Por ejemplo, aunque el locus marcador STR45 es tá enlazado con el locus de distrofina, la distribución de los alelos STR45 en un grupo de pacientes con distrofia de Duchenne no re lacionados es justo la misma que en la población general. Sin em bargo, dentro de una familia en la que una mutación de distrofina está segregándose, cabría esperar que la persona afectada compar tiera el mismo alelo STR45 porque los locus están enlazados de ma nera estrecha. Por consiguiente el enlace crea asociaciones dentro de familias, pero no entre personas no relacionadas. No obstante, si dos personas supuestamente no relacionadas con la enfermedad D en realidad heredaron su enfermedad de un ancestro común distante, también pueden tender a compartir alelos ancestrales particulares en locus enlazados en forma cercana a D. En la sección 13.5.2 se muestran ejemplos de este fenómeno. Los ancestros comunes son importantes porque todas las perso nas los tienen. Si se retrocede lo suficiente, todos los humanos es tán relacionados. En la medida en que una población es una familia extendida, han de existir asociaciones a nivel de la población que se deben a DE entre genes de susceptibilidad a enfermedades ances trales y marcadores enlazados de modo cercano. Un cálculo grueso sugiere que en el Reino Unido dos personas “no relacionadas” com partirían ancestros no más de 22 generaciones antes. Si son por completo exogámicas, tendrán 2 = 4 millones de ancestros cada uno en ese tiempo. Veintidós generaciones representan alrededor de 500 años y en 1500 la población británica se acercaba a 4 millo nes (fig. 15-4). Supóngase que cada una de las dos personas “no relacionadas” hereda un alelo de susceptibilidad de enfermedad de su ancestro co mún. Durante las múltiples generaciones y las muchas meiosis que las separaron de su ancestro común, la recombinación repetida ha

►

A 2 =

(P a b

P a P b )2/ (P A P a P B P b )

D' es la que más se utiliza. Varia entre 0 (no DE) y ± 1 (asociación com pleta), y depende menos de D en las frecuencias de alelos. Como regla empírica, D' > 0.33 a menudo se considera como el nivel de umbral de DE arriba del cual serán aparentes asociaciones en el tamaño usual del grupo de datos. La proliferación de medidas alternativas sugiere que nin guna es ideal (Devlin y Risch, 1995). Estas medidas se desarrollaron en particular para pares de locus, en tanto que la mayor parte de los estu dios del genoma completo usan análisis de múltiples puntos. Estos datos deben observarse para haplotipos conservados y no sólo analizarse para DE a nivel de pares.

brá reducido el segmento cromosómico compartido a una región muy pequeña. Sólo se compartirán los alelos en locus estrechamen te enlazados al locus de susceptibilidad a la enfermedad. Para que un locus muestre una fracción de recombinación theta (0) con el locus de susceptibilidad, una proporción 0 de cromosomas ancestrales perderá la asociación cada generación y una proporción (1-0) la re tendrá. Después de n meiosis, una fracción (1—0)n de los cromoso mas conservará la asociación. La media vida de DE entre locus separados 1 cM y 2 cM es de 69 y 34 meiosis respectivamente, ya que (0.99)6"1= (9.98)34 = 0.5. Antes se calculó que los ancestros de dos personas británicas “no relacionadas” se fusionaron por completo 22 generaciones atrás. Ese cálculo se simplificó de mane ra gruesa porque se supuso que toda la población británica fue una

Fecha C la v e • — • Núm. de ancestros (generación de 25 años) ------- Población británica (aproximada)

Fig. 15-4. Fusión en un fondo común géníco. Una persona por completo exogámica tiene 2" ancestros hace n gene raciones. Si toda la población británica fuera del todo exogámica, dos personas actuales “ no relacionadas" compartirían todos los mismos ancestros en 1500. En realidad, por supuesto, la población no es com pletamente exogámica y las dos personas tendrán una superposición potente pero no fondos comunes idénticos de ancestros en 1500.

15.4 I ESTUDIOS DE ASOCIACIÓN Y DESEQUILIBRIO DE ENLACE

44-

Fíg. 15-5. Desequilibrio de enlace alrededor del locus de la enfermedad de Huntington. S10, S125, etc. son abreviaturas de los marcadores de DNA D4S10, D4S125, etc., que se muestran en sus posiciones en el mapa en relación con el locus HD. La distancia total representada es de 2 500 kb. Para algunos locus, existen varios PRLF diferentes, que en ocasiones muestran una asociación alélica muy distinta, por ejemplo, marcador S95 (véase texto). Tomado de Krawczak y Schmidtke (1998) DNA Fingerprinting, 2a ed. BIOS Scientific, Publishers, Oxford.

unidad libremente interendogámica durante los últimos 500 años. Sin embargo, proporciona un primer estimado grueso de que las asociaciones alélicas que reflejan segmentos ancestrales comparti dos pudieran comenzar a notarse para locus dentro de 1 cM entre sí en la población británica. Cálculos más complicados utilizan una distribución Poisson de acontecimientos de recombinación e incor poran suposiciones respecto a la estructura y la historia de la pobla ción (Kruglyak, 1999). Un determinante fundamental es el tiempo de coalescencia, el número de generaciones anteriores al ancestro compartido más reciente (véase recuadro 12-6). Sin embargo, la varianza fortuita amplia y la confiabilidad en detalles desconocidos de la historia de la población determinan que inclusive los cálculos más elaborados no sean seguros. Lo que se requieren son datos y en fecha reciente ha sido posible disponer de cantidades crecientes de datos reales.

15.4.3 Muchos estudios muestran islotes de desequilibrio de enlace separados por puntos críticos de recombinación El gen de la fibrosis quística se identificó ascendiendo un gradien te de DE hasta llegar a un máximo (sección 13.5.2). Sin embargo, la investigación de otras enfermedades mostró pronto que los gra dientes uniformes de DE eran la excepción más que la norma. En la enfermedad de Huntington (fig. 15-5) es posible observar casos de una asociación potente con un marcador más distante y una aso ciación débil con un marcador más cercano. Aun más curioso re sulta que el marcador D4S95, enlazado en forma cercana al locus HD, detecta PRLF con tres enzimas, Tacj[, M bol y Accl. Los resul

tados confirmados en varios estudios independientes mostraron una asociación potente con un alelo particular Accl y uno particu lar Mbol, pero ninguna asociación con cualquier alelo Taq\. Estos patrones desconcertantes deben reflejar una historia compleja, con acontecimientos de recombinación al azar en poblaciones fundado ras pequeñas y tal vez un origen más reciente de algunos polimor fismos marcadores que ciertas mutaciones de enfermedad. En fecha reciente se publicaron varios estudios sistemáticos de DE marcador-marcador a través de segmentos cromosómicos im portantes (Gabriel y cois., 2002b y las referencias que incluye). Un hallazgo frecuente es que el DE no declina de manera uniforme con la distancia. Por el contrario, los cromosomas contienen una serie de islotes de DE de relativamente largo alcance que están se parados con precisión entre sí (fig. 15-6). En todos los islotes pue den extenderse DE útiles por 50 kb (en europeos; menos en africanos) pero aun los marcadores espaciados en forma muy cer cana en diferentes islotes no muestran DE entre sí. El examen de tallado de unas cuantas regiones confirmó que los límites de islotes son en realidad puntos críticos de recombinación. Es posible que ello muestre el mosaico de segmentos cromosómicos ancestrales que caracteriza la herencia compartida del hombre. Si fuera posible definir la estructura de DE del islote de una población a través del genoma completo, entonces sería factible identificar un grupo de marcadores (“SNP-hap”) para establecer haplotipos en cada islote que después podrían estudiarse en cuanto a su vínculo con cual quier enfermedad. Se sugiere que la mayor parte de los islotes sólo tendrá cuatro a seis haplotipos comunes diferentes en cualquier po blación (Gabriel y cois., 2002b). Se encuentran en curso esfuerzos a gran escala para definir estas estructuras mediante el mapeo exten so marcador-marcador (véase www.genome.gov/10005336).

448 j CAPÍTULO QUINCE

MAPEO E IDENTIFICACIÓN DE GENES

15.4.4 Diseño de estudios de asociación La búsqueda de asociaciones en la población es una opción atrac tiva para identificar genes de susceptibilidad a enfermedad. Los estudios de asociación son más fáciles de conducir que los análi sis de enlace porque no se requieren familias con múltiples casos ni estructuras familiares especiales. En algunas circunstancias la asociación también puede ser más potente que el enlace para de tectar alelos de susceptibilidad débil (véase más adelante). Sin embargo, es importante pensar con cuidado respecto al diseño ex perimental.

Elección del método para estudiar la asociación Aunque la elección del grupo testigo es crucial en cualquier estudio de asociación, por mucho que se intente equiparar los testigos con los casos resulta imposible estar por completo seguro de no haber pasado por alto nada. En consecuencia, cuando se encuentra una asociación, siempre existe la preocupación de que se deba a testigos equiparados de modo inadecuado y no a desequilibrio de enlace con un locus de susceptibilidad. La combinación de esta incertidumbre y una plétora de resultados no factibles de reproducirse (en especial para asociaciones HLA-enfermedad) condujeron a que los genetistas humanos dejaran de preferir los estudios de casos y testi gos durante el decenio de 1980. En fecha reciente se desarrolló un grupo de métodos que evita en gran parte este problema. En conjunto, estos métodos pueden denominarse estudios de asociación con testigos internos. El método más popular es la prueba de desequilibrio de transmi sión (PDT; Schaid, 1998). La PDT se inicia con parejas que tie

nen uno o más descendientes afectados. No tiene importancia si cada padre está afectado o no. Para estudiar si el alelo marcador M, se relaciona con la enfermedad, se eligen los padres que son heterocigotos para M ¡. La prueba sólo compara el número de ca sos en los que este padre transmite a la descendencia afecta da con el número en el que transmite su otro alelo (recuadro 15-3). La estratificación de la población no afecta el resultado. Se desarrolló una PDT extendida (PDTE; Sham y Curtís, 1995) a fin de manejar datos de marcadores multialélicos como microsatélites. La PDT puede utilizarse cuando sólo se dispone de un padre, pero ello suele sesgar el resultado (Schaid, 1998). Cuan do no se cuenta con padres (un problema frecuente en las enfer medades de inicio tardío), en una variante alternativa, la PDT de hermanos, se buscan diferencias en las frecuencias del alelo mar cador entre los hermanos afectados y los no afectados (Spielman y Ewens, 1998). Se discute un poco si la PDT es una prueba de enlace o de aso ciación. Ya que pregunta respecto a alelos y no locus, es sobre todo una prueba de asociación. El alelo asociado puede ser en sí mismo un factor de susceptibilidad o encontrarse en desequilibrio de enla ce con un alelo de susceptibilidad en un locus cercano. La PDT no puede detectar enlace en ausencia de desequilibrio -un punto que debe recordarse cuando se consideran esquemas para emplearla en exploraciones del genoma completo. En la actualidad se prefieren de nuevo los estudios convencio nales de casos y testigos como una alternativa a la PDT. Tales estu dios necesitan menos muestras que la PDT y son más fáciles de realizar para enfermedades de inicio tardío en las que rara vez se dispone de los padres. Se piensa que el riesgo de asociaciones falsas debidas a estratificación de la población se ha exagerado y es posi-

WTC82P:‘ WTC16P' 7WTC7P‘ WTC72P: WTC75P‘ WTC58Pj VTC1Q4P= ¡WTC81P: VTC110P! ¿WTC91P5 TC49WP: ‘ WTC21P-

¡WTC96PIWTC12P¡WTC89P¡9WTC1P¡WTC53PI.

Fig. 15-6. Patrones de desequilibrio de enlace en dos regiones cromosómicas. En cada cuadro está representado el mismo grupo de marcadores, en orden cromosómico, en los ejes X y Y. El color de la coordenada cartesiana para cada par de marcadores muestra la potencia de DE a nivel de pares según la escala en el centro. El programa GOLD llena el espacio entre puntos mediante interpolación. Si el DE fuera sólo una función de distancia, cada cuadro mostrarla un color rojo uniforme en la diagonal, sombreando a través del azul uniforme por puntos muy alejados en la diagonal. Obsérvese el patrón básico de islotes aislados de DE, pero con un gran cúmulo de detalles complicados. Panel izquierdo, parte del cromosoma 2; panel derecho, parte del cromosoma 13. Cortesía del doctor William Cookson, Oxford.

15.4 I ESTUDIOS DE ASOCIACIÓN Y DESEQUILIBRIO DE ENLACE

449

Recuadro 15-3. P ru eb a de desequilibrio de transmisión (PDT) para determinar si el alelo marcador M, se re la cio n a con una enfermedad 1) Se indagan los probandos. 2) Los probandos y sus padres se tipifican para el marcador. 3) Los padres que son heterocigotos para el alelo marcador M, se selec cionan. Pueden estar o no afectados.

ble revisar los datos para posibles efectos de la estratificación si se comparan las frecuencias de alelo en una gama de locus no enlaza dos en los casos y los testigos (Pritchard y Rosenberg, 1999). El di seño óptimo del estudio, según Risch y Teng (1998), consiste en usar pares de hermanos afectados como casos con dos testigos no relacionados. Cualquiera que sea la prueba de asociación que se utilice, es im perativo abordar el problema de múltiples pruebas. Una corrección completa Bonferroni (en la que el valor umbral p se divide por N, el número total de preguntas hechas) es demasiado conservadora para valores grandes de N. El umbral preferido de significancia es p' = 1 —(1 —p )N(Emahazion y cois., 2001). Cardón y Bell (2001) discuten con detalle no matemático algunos problemas generales del diseño de los estudios de asociación; véase Lecturas adicionales.

Selección de marcadores Los marcadores de elección para estudios de asociación son los po limorfismos de nucleótido único (SNP, recuadro 13-1), por dos razones: ► a diferencia de los microsatélites, son suficientemente numero sos (> 1 por kb en promedio) para definir islotes de DE y pue den calificarse por varios métodos de rendimiento ultra alto (sección 18.4.2). ► los SNP son menos mutables que los microsatélites. Si es cier to, como suele sugerirse, que la susceptibilidad a enfermedades frecuentes está determinada sobre todo por variantes de DNA antiguas comunes, sería necesario utilizar marcadores que son estables durante una escala de tiempo prolongada para identifi car los haplotipos ancestrales. Para regiones cromosómicas y poblaciones en las que el patrón de desequilibrio de enlace se conoce (como las que se ilustran en la fig. 15-6), se seleccionarían marcadores para definir haplotipos en cada islote de desequilibrio. Si no se cuenta con tal conocimiento, todo es conjetura. Cuanto más antiguo es un alelo de enfermedad en la historia humana mayor es la densidad de SNP necesarios para de tectarla (Kruglyak, 1999; Wright y cois., 1999). Algunos investiga dores apoyan los SNP localizados dentro de genes y en especial los que se encuentran en secuencias de codificación (cSNP) porque argumentan que es más probable que estas variantes sean las deter minantes de susceptibilidad reales. Es cierto que en la actualidad nadie conoce la estrategia óptima para seleccionar un marcador. Diversas enfermedades en distintas poblaciones tienen diferentes

Asúmase que a es el número de veces que un padre heterocigoto trans mite M, a la descendencia afectada y bel número de ocasiones que se transmite el otro alelo. La estadística de la PDT es ( a - b ) 2/(a + b ). Ésta tiene una distribución \ 2 con 1 grado de libertad, a condición de que los números sean razonable mente grandes.

historias y es posible que cada estudio individual requiera una es trategia a la medida.

Elección de la población de estudio Una pregunta contenciosa es si los estudios de asociación serán más fructíferos en poblaciones aisladas. Se espera que las poblacio nes derivadas de un número pequeño de fundadores muestren una diversidad de haplotipos limitada y valores más altos de desequili brio de enlace. El concepto de que será más fácil identificar alelos que causan enfermedad en locus de susceptibilidad en poblaciones aisladas se basa en el proyecto de DeCode en Islandia y proyectos similares en alguna otra parte (Gulcher y cois., 2001). Dichas po blaciones bien pueden mostrar desequilibrio potente y de largo al cance alrededor del locus para las enfermedades mendelianas raras que caracterizan a la población (p. ej., enfermedades “finlandesas” en Finlandia), pero ese desequilibrio sólo existe en cromosomas que llevan el alelo de enfermedad, que tal vez se derivaron todos de un ancestro compartido único. Para variantes más frecuentes, datos empíricos no muestran un desequilibrio mucho mayor (Varilo y cois., 2000; Pritchard y Przeworski, 2001). Puede ser más im portante disponer de un gran número de posibles sujetos con buenos expedientes médicos que la estructura de la población -lo que constituye el pensamiento que respalda el proyecto BioBank en el Reino Unido, que pretende reunir datos médicos, del estilo de vida y del DNA de 500 000 británicos de 45 a 69 años de edad y seguir su salud en forma prospectiva. Las poblaciones del Africa subsahariana muestran una diver sidad genética más alta que las europeas, compatible con la hipó tesis de los orígenes humanos “fuera de Africa”, y datos limitados sugieren que el desequilibrio de enlace es de corto alcance en africanos (Reich y cois., 2001). Por otra parte, poblaciones deri vadas mediante mezcla reciente pueden mostrar desequilibrio de enlace muy potente (p. ej., las poblaciones Lemba, un híbrido Bantu-semítico estudiado por Wilson y Goldstein, 2001). En teoría, si las dos poblaciones fuente tuvieran incidencias muy di ferentes de una enfermedad común, la población mixta podría utilizarse para mapear los determinantes con bastante eficiencia (como en un cruzamiento de ratón), pero la idea aún no se estu dia en la práctica. En resumen, todavía no se aclara si alguna po blación presenta ventajas especiales para estudios de asociación en enfermedades complejas. Para excelentes comentarios de estos problemas, véanse Wright y colaboradores (1999) y Peltonen y colaboradores (2000).

450 s CAPÍTULO QUINCE

MAPEO E IDENTIFICACIÓN DE GENES

¿Genotipos o haplotipos? Cuando se estudian individuos en lugar de familias, los datos cru dos consisten en genotipos, pero los análisis de asociación requie ren haplotipos. Estos últimos se deducen a partir de los genotipos mediante un análisis por computadora de expectación-maximización (Long y cois., 1995), pero en principio resulta imposible efectuar lo anterior con 100% de seguridad; el único medio por completo seguro es tipificar híbridos de células somáticas que contienen cromosomas haploides (Douglas y cois., 2001). Algu nos argumentan que éste es un error fundamental en el diseño de los estudios de asociación actuales a gran escala. Los optimistas piensan que los estudios funcionarán porque casi todos los islotes de DE (sección 15.4.3) sólo comparten un número pequeño de haplotipos, que pueden identificarse en forma adecuada y segura a partir de datos de genotipo. Será interesante observar quiénes están en lo correcto.

Enlace comparado con asociación: practicando el juego de números Un artículo importante de Risch y Merikangas (1996) sugirió que la asociación puede ser más potente que el enlace para detectar alelos de susceptibilidad débil. Los autores compararon la potencia del enlace (par de hermanos afectados, PHA) y la prueba de asociación (PDT) con objeto de identificar un marcador enlazado en forma estrecha a un locus de susceptibilidad a enfermedad. Calcularon el número de tríos de PHA o de PDT (niños y ambos padres afecta dos) necesarios para distinguir un efecto genético de la hipótesis nula, con una potencia y un nivel de significancia determinados. El recuadro 15-4 ilustra su método (para detalles más amplios consúl tese el artículo original) y el cuadro 15-7 muestra los resultados tí picos de la aplicación de su fórmula. La conclusión es clara. El análisis de PHA requeriría muestras grandes no factibles para de

tectar el locus de susceptibilidad que confiere un riesgo relativo me nor cercano a tres, en tanto que la PDT podría detectar alelos que dan un riesgo relativo menor de dos con tamaños de muestras ma nejables. Por cualquiera de los métodos sería muy difícil encontrar alelos de susceptibilidad que confieren un riesgo relativo menor de 1.5. Sin embargo, cabe señalar que su resultado incorpora varias su posiciones -en particular asume un alelo de susceptibilidad ances tral único en el locus de enfermedad—. Cualquier heterogeneidad alélica degradaría con rapidez la ejecución de una prueba de asocia ción, en tanto que no afectaría la potencia de una prueba de enla ce. En la actualidad se cuenta con algunos datos que ilustran lo anterior (sección 15.6.6).

15.4.5 Enlace y asociación: técnicas complementarias El enlace y la asociación proporcionan datos complementarios en muchas formas. El enlace opera en límites cromosómicos lar gos y puede explorar la totalidad del genoma en unos cuantos cientos de pruebas. Un estudio típico de 250 pares de hermanos afectados con 300 marcadores demandaría generar 1.5 a 3 X 10’ genotipos (lo que depende de que los padres se tipificaran o no). Éste es un trabajo de unas cuantas semanas para un laboratorio bien automatizado y consolidado. Por otra parte, los autores ob servaron que el desequilibrio de enlace es un fenómeno de corto alcance, con islotes de DE de 20 a 50 kb de tamaño por lo gene ral. Un estudio de PDT del genoma completo de 300 tríos (ni ño y ambos padres afectados), incluso cuando se estudia un SNP aislado en cada islote, requeriría 108 genotipos, si se consideran islotes promedio de 25 kb de tamaño. Aunque las tecnologías en surgimiento ofrecerán en poco tiempo este rendimiento, el cos to aún será atemorizante. Por consiguiente los estudios de aso ciación deben dirigirse a regiones candidato predeterminadas. Aunque esto puede sugerirse por referencia a modelos animales o

Recuadro 15-4. Tamaños de muestras necesarios para encontrar un locus de susceptibilidad a una enfermedad por el estudio del genoma completo mediante el uso de pares de hermanos afectados (PHA) o la prueba de desequilibrio de transmisión (PDT) Risch y Merikangas (1996) calcularon los tamaños de muestras necesa rios para distinguir un efecto genético de la hipótesis nula con potencia (1-(3) y nivel de significancia alfa. Aunque este recuadro resume sus fór mulas y ecuaciones, debe consultarse el artículo original para las deriva ciones y los detalles.

m- = 2 Y -1 y a 2 = 4Y (1 - Y ) . El umbral de significancia en la extensión del genoma (probabilidad de una positiva falsa en cualquier parte del ge noma = 0.05; las pruebas para com partir IPD) requiere una calificación lod de 3.6, que corresponde a a = 3 x 10” 5, y Z„ = 4.014. Para una potencia de 80% para detectar un efecto, 1 - p = 0.2 y Z ^ B = -0 .8 4 .

Una pieza estándar de estadística índica que el tamaño necesario de la mues tra M está determinado por (Zq -o -Z ! _b)2/ Ij.2, donde Z se refiere a la des viación normal estándar. La n media y la varíanza o-2 se calculan como funciones de la frecuencia del alelo de susceptibilidad (p) y el riesgo re lativo 7 conferido por una copla del alelo de susceptibilidad. El modelo asume que el riesgo relativo para que una persona porte dos alelos de susceptibilidad es y 2, que el marcador utilizado siempre sea informativo y que no haya recombinación con el locus de susceptibilidad.

Para la PDT, la probabilidad de que un padre será heterocigoto para el ale lo en cuestión es h = pq (-y+1)/(p-y+q). P(trA), la probabilidad de que es te padre heterocigoto transmitirá el alelo de alto riesgo al niño afectado, es = 7/(1 + 7 ). ¡X = Vh(7 - 1 )/(7 + 1 ), y a 2 = 1 - [h(7 - 1)2/(7 - 1 )2]. Como se comentó, para una selección final del genoma que incluye 1 000 000 de pruebas, a = 5 x 10"8, Z„ = 5.33 y, como antes, Z,_p = -0 .8 4 .

Para la PHA, el alelo esperado que comparte el locus de susceptibilidad es determinado por V = (1 + w ) /( 2 + w ), donde w = [pq(-y—1 )2/(p -/+ q ).

En el cuadro 15-7 los valores Za, Z ^ , |¿ y a 2 se utilizan para calcular ta maños de muestras sustituyendo en la fórmula M = {Za - a l ^ ) 2/ ^ 2. Pa ra la PDT la respuesta es la mitad porque cada trío padre-hijo permite dos pruebas, una en cada padre.

15.6

OCHO EJEMPLOS QUE ILUSTRAN EL ÉXITO VARIABLE DE LA DISECCIÓN GENÉTICA.

genes conocidos, de manera alternativa suele definirse mediante estudios de enlace. Como se comentó, las regiones candidato de finidas por estudios de PHA suelen ser imprácticamente grandes para clonación posicional de genes de susceptibilidad. En conse cuencia el diseño natural de un estudio consiste en iniciar una selección de la extensión del genoma mediante enlace, tal vez en pares de hermanos afectados, y a continuación, una vez que la lo calización inicial se logra, reducir la región candidato por mapeo de desequilibrio de enlace.

15.5

Id en tificación de aleios de susceptibilidad

En enfermedades mendelianas puede ser difícil encontrar el gen co rrecto, pero suele ser obvio cuando se logra el éxito. Los pacientes tienen mutaciones ambiguas, que no se encuentran en testigos, en un gen cuya posición casi siempre se definió mediante análisis de enlace. Para enfermedades complejas es muchísimo más difícil dis tinguir factores de susceptibilidad verdaderos de polimorfismos de DNA sin importancia. Hay tres razones para ello: ► puesto que la mutación de un gen único no es necesaria ni su ficiente para causar la enfermedad, algunos testigos presenta-

Cuadro 15-7. Tamaños de muestra para una potencia de 80% a fin de detectar enlace o asociación significativos en una búsqueda en toda la extensión del genoma. Análisis de PHA

Análisis de PDT P(trA)

7

p

Y

5

0.01

0.534

2 530

0.830

747

0.1

0.634

161

0.830

108

3

2

1.5

1.2

N-ASP

N-TDT

0.5

0.591

355

0.830

53

0.01

0.509

33 797

0.750

1 960

0,1

0.556

953

0.750

251

0.5

0.556

953

0.750

150

0.1

0.518

9167

0.667

696

0.5

0.526

4 254

0.667

340

0.1

0.505

115 537

0.600

2 219

0.5

0.510

30 660

0.600

950

0.1

0.501

3 951 997

0.545

1 1 868

0.5

0.502

696 099

0.545

4 606

-y es el riesgo relativo para individuos del genotipo Aa comparados con aa; p es la frecuencia del alelo de susceptibilidad A. Para análisis de pares de hermanos afectados (ASP), Y es el alelo esperado com parti do y N-ASP el número de pares necesarios para significancia, basado en pruebas IBD (_ = 3 x 10.5). Para pruebas de desequilibrio de trans misión (TDT), P(trA) es la probabilidad de que un padre Aa transmita A a un niño afectado, y N-TDT es el número de tríos padres-hijo necesa rios para significancia. Según Risch y Merikangas (1996).

451

rán inclusive un alelo de susceptibilidad verdadera y algunos pacientes no. Además los principales determinantes de sus ceptibilidad pueden ser diferentes en distintas poblaciones; ► la naturaleza dispersa del DE, con la coexistencia de algunas co rrelaciones de largo alcance con falta de correlación de corto al cance, significa que a pesar de la alta resolución teórica de los estudios de asociación, en realidad rara vez puede tenerse la confianza de estar buscando justo en el sitio adecuado para el determinante de susceptibilidad. Más aún, no hay una forma genética de identificar el determinante verdadero entre un gru po de alelos que se encuentran en su totalidad en desequilibrio potente entre sí; ► es posible que las variantes genéticas que causan susceptibili dad a enfermedades frecuentes no sean mutaciones obvias. Aunque se conocen excepciones, las enfermedades mendelia nas suelen deberse a mutaciones que inactivan por completo un gen, o cuando menos tienen un efecto mayor en su expre sión (cap. 16), y no suele ser difícil resolver si una variante de secuencia del DNA candidato lo llevaría a cabo. Es más proba ble que la susceptibilidad a enfermedades frecuentes dependa de una combinación de cambios muy sutiles en la expresión de va rios genes, ninguno de los cuales es patógeno en forma aislada, y todos los cuales pueden ser muy frecuentes en la población sa na. La susceptibilidad puede modelarse mejor como un locus de carácter cuantitativo (LCC, véase sección 15.6.8) que como un factor binario (presente/ausente). Los factores de suscepti bilidad pueden ser polimorfismos en DNA no codificante que tienen cierto efecto pequeño en la actividad promotora, el em palme o la estabilidad de mRNA. Por ejemplo, el alelo UCSNP-43 G que se relacionó con la susceptibilidad a la dia betes tipo 2 (sección 15.6.5) se encuentra a profundidad den tro de un intrón del gen candidato y tiene una frecuencia de 0.75 en testigos no afectados. Para un comentario meditado del problema (en el contexto de la diabetes tipo 2) véase la revisión de Altshuler, Daly y Kruglyak (2000).

15.6

Ocho ejem plos que ilustran el éxito v ariab le de la disección g enética de enferm edades com plejas

No se cuenta con una historia unificada en el análisis genético de enfermedades complejas. Los autores no intentan resumir el estado actual de jugar a través de todo el campo: cada enfermedad es dife rente. Los lectores interesados en una enfermedad específica deben recurrir a PubMed para encontrar una buena revisión actualizada del padecimiento que elijan. Las ocho enfermedades que se resu men en este capítulo se escogieron para ilustrar algunos de los te mas recurrentes de la investigación de una enfermedad compleja. Los autores no se concentraron en presentar historias de éxito. En algunos casos hay muy poco progreso que informar. La falta de éxi to es casi tan interesante como el éxito si se toman en cuenta los grandes esfuerzos relacionados en cada caso.

452 | CAPÍTULO QUINCE | MAPEO E IDENTIFICACIÓN DE GENES

15.6.1 Cáncer de mama: la identificación de un subgrupo mendeliano condujo a adelantos médicos importantes, pero no explica las causas de la enfermedad esporádica frecuente Aunque los cánceres comunes suelen ser esporádicos, la existencia de “familias con cáncer” se conoce desde hace mucho tiempo. Cuando varios familiares sufren el mismo cáncer raro, como los schwanno mas vestibulares (véase NF2, MIM 101 000), es fácil sospechar un síndrome mendeliano, y la investigación de estas familias condujo a identificar los genes supresores de tumor que se describen en la sección 17.4. Puesto que el cáncer de mama es frecuente -el riesgo durante toda la vida para una mujer inglesa es de 1 en 12-, cuan do varios familiares tienen cáncer de mama es menos claro si se tra ta sólo de mala suerte o de una verdadera familia con cáncer. Sin embargo, un antecedente familiar fuerte de cáncer de mama tam bién se relaciona con una edad de inicio excepcionalmente tempra na, con cáncer de mama aunado a cáncer de ovario, tumores

A nálisis d e se g reg ació n c o m p lejo

bilaterales frecuentes y a veces varones afectados. La investigación de estas familias condujo a la identificación de los genes BRCA1 y BRCA2. Un análisis de segregación a gran escala de 1 500 familias (Newman y cois., 1988) apoyó el concepto de que 4 a 5% del cáncer de mama, en particular los casos de inicio temprano, podría atribuir se a factores hereditarios. Se reunieron análisis de enlace en familias con patrones de genealogía casi mendelianas (fig. 15-7; véase MIM 113 705 para detalles del trabajo de enlace). Un locus de suscepti bilidad, denominado BRCA1, se mapeó a 17 q21 en 1990. La edad media al momento del diagnóstico en familias enlazadas con 17q fue antes de los 45 años. Las familias con inicio más tardío tuvie ron calificaciones lod negativas. En 1994 una búsqueda de enlace en 15 familias grandes con cáncer de mama no enlazadas con 17c identificó un locus BRCA2 en 13 q l2 (véase MIM 600 185). Lue go sobrevino uno carrera turbulenta para identificar los dos genes mapeados. BRCA1 se clonó en 1994 y BRCA2en 1995; véanse en tradas MIM 113 705 y 600 185 para detalles. Parecía que BRCA1 podría explicar 80 a 90% de familias tanto con cáncer de manu

Alelo de enfermedad dominante, frecuencia - 0.01 Riesgo

Por edad Por edad Tiempo 40 55 de vida

Portador del gen 0.37

0.66

0.82

No portador

0.028

0.081

0.004

•

0

m

•

•

23 fam ilias de m últiples casos seleccionadas

M odelo de susceptibilidad gen ética (4% de fam ilias)

A nálisis d e calificación lod

G en BRCAI 24 exones 1 863 am inoácidos

Locus en 17q21 (Z = 3 .2 8 - 5.98 con D 17S84)

214 familias de múltiples casos seleccionadas (estudio internación a. de colaboración)

R egión c a n d id a to d e BRCAI

Fig. 15-7. Forma en que se encontró el gen BRCA1. La clonación posicional estándar identificó de manera satisfactoria un gen que confería susceptibilidad a una enfermedad frecuente -pe ro sólo a un subgrupo mendeliano de la enfermedad-, Al parecer BRCA1 tiene poca función en el cáncer de mama esporádico común.

15.6 1 OCHO EJEMPLOS QUE ILUSTRAN EL ÉXITO VARIABLE DE LA DISECCIÓN GENÉTICA. . . [ 453

como de ovario, pero una proporción mucho menor de familias con cáncer de mama nada más. El cáncer de mama en varones se observó sobre todo en familias con BRCA2. Ambos genes codifican proteínas nuevas grandes que al final resultaron ser coactivadores transcripcionales, con funciones adi cionales en la reparación del DNA (véase sección 17.5.1). Se com portan como genes supresores de tumor, porque las mutaciones heredadas causan pérdida de función (sección 16.3) y los tumores de casos familiares pierden el alelo de tipo silvestre. Sin embargo, la historia del cáncer de mama ofrece un contraste notable con el cán cer de colon. En este último, el gen APC, que se identificó median te el estudio de una forma mendeliana rara de la enfermedad, también suele estar mutado en las formas esporádicas frecuentes (sección 17.5.4). En contraste BRCA1 y BRCA2 rara vez están inactivados en el cáncer de mama esporádico. Más aún, las muta ciones en estos dos locus explican sólo 20 a 25% del riesgo familiar de cáncer de mama (Pharoah y cois., 2002). Una encuesta de 257 familias con cuatro casos o más de cáncer de mama (Ford y col., 1998) sugirió que de las que tenían cuatro o cinco casos de cáncer de mama en mujeres pero sin cáncer de mama en ovario o cáncer de mama en varones, tal vez 67% no incluyó mutaciones BRCA1/2. Nathanson y Weber (2001) describieron la búsqueda de más genes de susceptibilidad. El análisis de segregación es compatible con que la susceptibilidad restante es poligénica y se identificó un alelo de riesgo común de penetración baja: una mutación en el gen de cinasa del ciclo celular CHEK2 se encontró en 1.1% de los testigos pe ro en 5% de pacientes con cáncer de mama (CHECK2-Breast Cáncer Consortium, 2002). Los datos iniciales sugirieron que una mujer que porta una mu tación BRCA1 tiene 85 a 90% de posibilidad de desarrollar cáncer de mama y 40% de riesgo de cáncer de ovario. El riesgo de cán cer de mama (pero no de ovario) para una mujer con una muta ción BRCA2 es similar. Sin embargo, estos análisis se basaron en mujeres de las familias grandes que se utilizaron para el mapeo. Más adelante, cuando se encontraron mutaciones en mujeres no seleccionadas por antecedente familiar, se observaron mucho más casos no penetrantes entre sus familiares. Tres mutaciones particulares (185delAG y 5382insC en BRCA1, 6174delT en BRCA2) son más frecuentes en mujeres judías ashkenazi. Un es tudio de familiares de mujeres ashkenazi con cáncer de mama, no seleccionadas con base en el antecedente familiar, sugirió un riesgo de 36% durante la vida de las portadoras de estas muta ciones en lugar de 85 a 95% que suele señalarse (Fodor y cois., 1998). Una característica general de la investigación de una en fermedad compleja que estima de manera inicial la penetrancia, la gravedad y el riesgo para los familiares, definidos en los con juntos de familias empleadas para la identificación original del locus de susceptibilidad, exagera el riesgo en la población general (Góring y cois., 2001). Este hecho tiene implicaciones importan tes para la selección de población. Es probable que las mutacio nes definidas en estudios familiares iniciales tengan un efecto mucho menos notable en casos en que se precisan mediante selec ción y además bien pueden existir mutaciones de penetrancia ba ja que podrían no advertirse en el estudio inicial pero revelarse mediante la selección de población.

15.6.2 Enfermedad de Hirschsprung: una enfermedad oligogénica La enfermedad de Hirschsprung (HSCR) es una ausencia congèni ta de ganglios en la totalidad o alguna parte del intestino grueso o colon. La consecuente falta de actividad peristáltica produce un megacolon muy distendido que es letal para el neonato a menos que el segmento afectado se extirpe. Amiel y Lyonnet (2001) revi saron la genética de la enfermedad de Hirschsprung (HSCR). La HSCR es parte de un síndrome en 18% de los casos y 12% más presenta anomalías cromosómicas. El restante 70% tiene HSCR aislada, un padecimiento “multifactorial” típico, a menudo familiar pero no mendeliano. El resultado del análisis de segregación ya se comentó (cuadro 15-4). Los métodos de clonación posicional clá sica tuvieron éxito para identificar varios locus en la HSCR. ► Una anormalidad cromosómica: se observaron dos pacientes con HSCR que tenían deleciones visibles de 1Oql lq21. El oncogén RET se encuentra en la región eliminada y codifica una cinasa de receptor de tirosina que se expresa en las células apro piadas. Resultó que alrededor de 50% de los familiares y 15 a 35% de los pacientes esporádicos con HSCR aislada tienen una mutación RET, pero también algunos familiares no afectados. Las variantes conocidas de RET no explican la totalidad del efecto del locus RET en la susceptibilidad; tal vez variantes no codificantes también desempeñen una función (Gabriel y cois., 2002a). Véase la patología molecular interesante de las muta ciones de RET en la sección 16.6.2. ► Enlace y un modelo de ratón: un segundo locus de suscep tibilidad se mapeó en el cromosoma 13q en una genealogía menonita muy numerosa con múltiples consanguinidades; la presencia de HSCR en varios pacientes no relacionados con dcleciones de 13q apuntó asimismo hacia esta región. De manera independiente, el gen del receptor de endotelina B (ednrli) del ratón se knocked como parte de una investigación de la partici pación de las endotelinas en el control del tono vascular. Resul tó inesperado que el knockout tiene el fenotipo de un modelo de ratón de HSCR bien estudiado, piebald-lethal ( s l\). En el hom bre, EDNRB se encuentra en la región candidato de HSCR en 13q y poco tiempo después se demostró una mutación en la ge nealogía menonita. Como hecho interesante, una vez que la mutación familiar se definió (como W276C), se encontró que no era necesaria ni suficiente. La penetrancia fue específica de sexo y distinta para cada genotipo: 0.13 (M), 0.09 (F) para W/W, 0.33 (M), 0.08 (F) para W/C, y 0.85 (M), 0.60 (F) pa ra C/C, lo que ilustra el carácter oligogénico de la enfermedad de Hirschsprung. Merece la pena leer los informes de este tra bajo (Puffenberger y cois., 1994a, b) como una ilustración de las complejidades de la identificación de genes en una enfermedad oligogénica hasta cierto punto frecuente. ► Pruebas directas de genes candidato: puesto que tanto RET como EDNRB codifican receptores, los genes que codifican sus ligandos (GDNF, NT Ny EDN3) fueron genes de susceptibili dad candidatos naturales. En un número pequeño de familias se demostraron mutaciones en cada uno; otra familia tenía una

454 I CAPÍTULO QUINCE j MAPEO E IDENTIFICACIÓN DE GENES

mutación en el gen ECE1 que codificaba una enzima necesaria para la maduración proteolítica de la endotelina 3. Se identificó un gen candidato adicional, SOXIO, cuando el gen subyacente en otro modelo de ratón de HSCR, megacolon dominante, se clo nó pero dio por resultado que los humanos con mutaciones SOXIO tuvieran síndromes complejos en lugar de HSCR típica. Las mutaciones en SMAD1P1 en 2q22 son frecuentes en pacien tes con HSCR y retraso mental. ► Mapeo de locus de susceptibilidad restantes: aunque RET es el gen principal, la penetrancia es incompleta y dependiente del sexo (65% en varones, 45% en mujeres). Los otros genes identi ficados son importantes en familias ocasionales, pero no contri buyen de manera significativa a la susceptibilidad total. Gabriel y colaboradores (2002a) realizaron análisis de enlace sistemáti cos, a partir de los cuales concluyeron que las variaciones en el locus RET, que interactúan con variación en locus desconocidos en 3p21 y 19ql2, aunadas a un modificador dependiente de RET en 9q31, explicarían toda la susceptibilidad genética a la enfermedad de Hirschsprung (HSCR). Sin embargo, en la ge nealogía menonita mencionada, al parecer la susceptibilidad es tá determinada por una interacción entre alelos en los locus RET y EDNRB, junto con un locus no identificado en 16q23 (Carrasquillo y col., 2002). Como hecho curioso no se observó nin guna asociación sugestiva con los locus 3p21 a 19ql2, ni con 21q22.3, que antes se informó que estaban asociados dentro de esta genealogía. La HSCR aislada surge como una enfermedad oligogénica (Amiel y Lyonnett, 2001). Si la clonación posicional y los estudios funcio nales apoyan este análisis, la HSCR bien podría ser la primera de estas enfermedades que se analiza por completo. Un contribuyente importante de este éxito es el valor muy alto, 187, de \s (Gabriel y cois., 2002a).

15.6.3 Enfermedad de Alzheimer: los factores genéticos son importantes tanto en la forma frecuente de inicio tardío como en las formas mendelianas raras de inicio temprano, pero son genes diferentes que actúan de maneras distintas La enfermedad de Alzheimer (EA) (AD; MIM 104 310) afecta a alrededor de 5% de las personas mayores de 65 años y a casi 20% de las de más de 80. Ocurre una pérdida progresiva de la memo ria, seguida de alteraciones de la conducta emocional y deterioro cognoscitivo general. Las necropsias del cerebro revelan pérdida de neuronas con muchas placas que contienen amiloide. Las neuronas en degeneración incluyen marañas neurofibrilares ca racterísticas. Rara vez inicia a una edad mucho menor. Las carac terísticas clínicas y anatomopatológicas son idénticas en la EA de inicio temprano y la de inicio tardío, pero a veces la enfermedad de inicio temprano es mendeliana y autosómica dominante, en tanto que la EA de inicio tardío no es mendeliana y sólo muestra un agrupamiento familiar moderado. El análisis de calificación

lod estándar permitió mapear y después clonar los tres genes, APP en 21 q21, presenilina-1 en 14q24 y presenilina-2 en 1q42 (véase MIM, 104 300, 104 311 y 600 579 respectivamente) en familias dominantes de inicio temprano. Aunque las mutaciones en estos tres locus sólo explican alrededor de 10% de los casos de EA que inician antes de los 65 años de edad, se observan en particular en las familias raras afectadas por EA dominante muy penetrante de inicio notablemente temprano. Cualquier persona que desee in formación respecto a lo que esta enfermedad significa para una familia debe leer Hannab' s Heirs de Daniel Pollen (véase Lecturas adicionales). Las familias de inicio tardío de múltiples casos no mostraron evi dencias de enlace con los locus relacionados con la enfermedad de inicio temprano, pero sí enlace con el cromosoma 19. Por último el locus de susceptibilidad se identificó como APOE (apolipoproteína E, MIM 107 741), localizado en 19ql3.2. Se conocen tres alelos con frecuencias (en caucásicos) de 0.08 (E2), 0.77 (E3) y 0.15 (E4). Tan to la EA familiar de inicio tardío como la esporádica se relaciona con firmeza con el alelo E4, mientras que E2 se vincula con resistencia a la enfermedad de Alzheimer (EA). En estudios seccionales cruzados de personas mayores de 65 años los pacientes E3/E4 tuvieron alrede dor de tres veces el riesgo y los de E4/E4 casi 14 veces, en compara ción con homocigotos E3. Al parecer ApoE explica cerca de 50% de la susceptibilidad a la EA de inicio tardío. Por consiguiente, en con traste con el cáncer de mama, no sólo las formas mendelianas raras sino también la forma esporádica frecuente tienen un grado impor tante de determinación genética. Un estudio longitudinal (Meyer y col., 1998) sugirió que E4 puede regir la edad de inicio más que la susceptibilidad. Una vez que la EA comienza, su progreso no es dis tinto en personas con E4 o sin él. Si bien no hay discusión en cuan to a la relación de E4 con EA de inicio tardío, el mecanismo aún no se aclara. Los determinantes E2/E3/E4 son sustituciones de los ami noácidos R112C y R158C; investigaciones intensivas no revelaron ningún determinante de susceptibilidad “verdadero” en el desequili brio de enlace con E4. Estudios de enlace y asociación más amplios proporcionaron una plétora de otras regiones de susceptibilidad candidatas. Emahazion y colaboradores (2001) hicieron una lista de ellas y publica ron un estudio de asociación a gran escala utilizando SNP de 60 regiones o genes candidatos. Los resultados, después de corregir los valores p crudos para pruebas múltiples, apenas identificaron APOE y fueron negativos para todos los otros candidatos. Los au tores emplean estos datos para destacar lo difícil que será confirmar o refutar las asociaciones sostenidas en enfermedades complejas. Por lo general los estudios de seguimiento no replicaron una loca lización inicial: con cuánta frecuencia esto se debe a que el infor me inicial fue un error tipo 1 y qué tan a menudo a que el estudio de seguimiento carecía de potencia? Con base en la tendencia es tadística de los estudios a estimar en exceso el efecto de cualquier locus verdadero que identifican (Góring y cois., 2001), no resulta fácil decidir qué tanta potencia requeriría un estudio de segui miento para refutar un enlace. La historia ApoE también es muy importante para las discusio nes acerca de las posibles implicaciones sociales y éticas de la iden

15.6

OCHO EJEMPLOS QUE ILUSTRAN EL ÉXITO VARIABLE DE LA DISECCIÓN GENÉTICA.. .

tificación del alelo de susceptibilidad para una enfermedad frecuen te (véase Recuadro de ética 1).

15.6.4 Diabetes mellitus tipo 1: ¿aún es la pesadilla de los genetistas? El primer paso para comprender la genética de la diabetes consistió en distinguir los diferentes tipos de esta afección (cuadro 15-8). Las diabetes tipo 1 y tipo 2 son enfermedades diferentes, con causas distintas, evoluciones diversas y genética distinta. La diabetes tipo

j

455

1 (DT1, diabetes dependiente de insulina; véase MIM 222 100) se debe a la destrucción autoinmunitaria de las células (3 pancreáticas, suele afectar a personas jóvenes y éstas requieren tratamiento con insulina toda la vida. Se observa un agrupamiento familiar bastan te fuerte (\s =15, concordancia de gemelos MC, cerca de 30%). En el decenio de 1970 se estableció una asociación con ciertos alelos HLA. En el Reino Unido, alrededor de 95% de los pacientes con DT1 tiene antígenos HLA-DR3, DR4, o ambos, en comparación con 45 a 54% de la población general. HLA constituye cerca de 40% de la

Ética, recuadro I . Enfermedad de Alzheimer, prueba de ApoE y discriminación La identificación de genotipos susceptibles a enfermedades frecuentes da lugar a problemas éticos y sociales que ApoE ¡lustra bien. ¿Los patrones y las ase guradoras presionarán para el uso amplio de las pruebas, y ello conduciria a una discriminación Injusta en el empleo, el cuidado de la salud y el seguro? Empleo. Los patrones tienen un Interés legitimo en la capacidad en cur so de una persona para realizar el trabajo, pero muy poco Interés en lo que pudiera suceder en un tiempo de 10 años. Sólo los trabajos que re quieren que el patrón invierta intensamente en entrenamiento especializa do son una excepción parcial a ello. En el Reino Unido sería ¡legal que un patrón discriminara a una persona sana por su riesgo de desarrollar una enfermedad en alguna fecha posterior. Cuidado de la salud. En países con sistemas médicos especializados no se presenta el problema de discriminación en el cuidado de la salud. Don de el acceso depende de seguros privados, el problema regresa al aspec to de la discriminación en seguros. Seguro. El seguro comercial se basa en el principio de mutualidad; el ase gurador asigna al solicitante a un fondo común de riesgo y la prima refleja el riesgo al que el solicitante contribuye al fondo común. En pólizas de se guros suscritas de manera individual siempre habrá un conflicto entre la justicia actuarial y la justicia moral. ¿Es justo que se penalice a un solici tante por una constitución genética que no está bajo su control? No obs tante, la mayoría de las personas no tiene problemas con compañías que asignan diferentes tarifas para varones y mujeres. La solución obvia es comprobar que el seguro basado en mutualidad no se utiliza para sufragar las necesidades de una vida civilizada, como el cuidado básico de la salud, sino que se limita a productos que la persona puede elegir comprar o no como parte de sus elecciones normales en las sociedades consumidoras.

y C. El interés de las aseguradoras es evitar la antlselección. Ésta surge cuando los proponentes utilizan el conocimiento secreto para obtener una ventaja injusta. Alguien que sabe en secreto que tiene un riesgo alto adquie re una póliza especialmente considerable en términos estándar, en tanto que alguien que sabe que tiene un riesgo bajo decide no molestarse con un se guro. Por tanto las aseguradoras desean conocer tanto como sea posible del solicitante respecto a pruebas preexistentes importantes; la única razón le gítima para hacer que un solicitante se someta a pruebas extra es cuando se sospecha que, de hecho, ya se las hizo en secreto. El criterio de lo que es “ importante" es distinto para pruebas clínicas y de aseguradoras. En una prueba clínica útil el resultado debe ser predecible para cada individuo. Para la aseguradora, en principio, sólo es necesario disponer de una prueba para distinguir grupos con riesgos promedio muy diferentes -un a labor mucho menos exigente. Ésta es la diferencia entre desviación estándar y error estándar de la media. AP0E4 no es necesa ria ni suficiente para la enfermedad de Alzheimer (EA). Casi la mitad de las personas con APOE4 nunca desarrollará EA, sin Importar cuánto tiem po vivan, en tanto que muchos pacientes con EA carecen de AP0E4. La incertidumbre no permite ni la confirmación de un diagnóstico clínico ni pruebas de predicción útiles en personas sanas. El American College of Medical Genetics y la American Society of Human Genetics recomiendan no utilizar la prueba ApoE para el diagnóstico clínico de rutina o pruebas de predicción en la enfermedad de Alzheimer (EA) (ACMG/ASHG Working Group, 1995). La única indicación clínica para la genotipificación ApoE en la enfermedad de Alzheimer sería que un medicamento caro utilizado pa ra el tratamiento de pacientes con Alzheimer sólo fuera eficaz para cier tos genotipos ApoE o en especial perjudicial en ciertos genotipos. El problema crucial para el seguro consiste en saber si los genotipos ApoE definen fondos comunes con riesgos suficientemente diferentes para que las pruebas sean importantes. Según los actuarios Macdonald y Pritchard (2001), la pregunta básica, con unas cuantas calificaciones, es “ no". Aunque resulte que la prueba ApoE no origine problemas de política públi ca mayores, es posible que lleguen otras pruebas que sí requieran control social. Las tres características de una prueba que originaría alarmas son:

Fondo común de riesgo A prima $ 1.00

Fondo común de riesgo B prima $1.50

Fondo común de riesgo C prima $3.00

Al contrario de la creencia popular, las aseguradoras tienen muy poco Inte rés en que las personas se sometan a pruebas genéticas. En el ejemplo ilus trado la compañía aseguradora no recibe un beneficio por el uso de pruebas genéticas para dividir el fondo común de riesgo A en los fondos comunes B

► predecir un riesgo que ya no es evidente en el estilo de vida o el an tecedente familiar (esto excluye, por ejemplo, pruebas para enferme dad de Huntington); ► el padecimiento debe ser suficientemente frecuente y la prueba lo bastante predecible para que la aseguradora no corra el riesgo de ig norarla, pero la prueba no debe estar disponible como parte del ser vicio clínico rutinario; ► deben estar disponibles pruebas confidenciales privadas y utilizarlas con amplitud.

456 j CAPITULO QUINCE

MAPEO E IDENTIFICACIÓN DE GENES

predisposición genética, pero varios haplotipos diferentes se relacio nan con susceptibilidad o resistencia. El desequilibrio de enlace po tente dentro del complejo mayor de histocompatibilidad dificulta la identificación del principal determinante de susceptibilidad. Se encontró que todos los haplotipos que se acompañan de un riesgo bajo de diabetes llevan un alelo en el locus DQB1 en el que el ami noácido 57 es ácido aspártico, en tanto que los haplotipos de alto riesgo tienen alelos DQB1 con algún otro aminoácido en esta po sición (Todd y cois. 1987). En un estudio, 96% de diabéticos pero sólo 20% de testigos fueron homocigotos no Asp en la posición 57 de DQB1. Es probable que un factor de resistencia esté definido por un antígeno epitopo que incluye Asp-57 que varias moléculas diferentes de HLA comparten. La idea del epitopo compartido sue le aplicarse también a otras enfermedades autoinmunitarias relacio nadas con HLA, con un éxito mixto. Asimismo, el trabajo inicial en la DT1 identificó un segundo locus de susceptibilidad, IDDM2, cerca de INS, el gen estructural para insulina. El mapeo de desequilibrio de enlace reveló el deter minante real como una repetición minisatélite de 14 pb corriente arriba del gen. La susceptibilidad se vinculó con repeticiones cor tas (unidades de repetición 26 a 63). Las repeticiones largas (140 a 210 unidades) determinan que el gen de insulina se transcriba a un nivel bastante más alto en el timo en desarrollo; se argumen ta que esto incrementa la eficiencia de la deleción de las clonas de células T reactivas a insulina durante el desarrollo del sistema inmunitario y reduce el riesgo de un ataque autoinmunitario. Tanto el trabajo HLA-DQB como los hallazgos INS subrayan la probable diferencia entre el tipo de cambios genéticos sutiles que pueden sustentar la susceptibilidad a una enfermedad fre cuentes y los cambios gruesos que se observan en enfermedades mcndelianas. Varios grupos siguen con firmeza la estrategia de exámenes de enlace del genoma completo seguidos de mapeo de desequilibrio

de enlace dentro de las regiones candidato. El artículo del European Consortium (2001) proporciona referencias de los principales estudios de enlace y el cuadro 15-9 incluye una lista de las princi pales regiones implicadas hasta la fecha. A fin de evitar el efecto potente de HLA de ocultar señales más débiles, los datos para el genotipo HLA suelen estratificarse antes de buscar enlace a otros locus. Las regiones definidas mediante estudios de PHA son muy amplias y, más aún, el locus “verdadero” puede situarse bastante le jos del pico de calificación máxima, lo que determina que sea muy difícil conocer cuántos locus de susceptibilidad distintos se en cuentran en 2q y 6q, por ejemplo. En teoría la contribución total de cada locus puede medirse mediante la expresión de su \s como una fracción de la Xs total para D Tl (Risch, 1990a), de manera que es posible saber cuánto queda por explicar. Sin embargo, la práctica usual de emplear el mismo grupo de datos para definir una región candidato y luego calcular \s proporciona estimaciones muy poco confiables (Góring y cois., 2001). Tal vez HLA e INS ex pliquen 50% de la susceptibilidad, pero la contribución total de los otros locus del cuadro 15-9 se desconoce. Varias características de la DTl parecen favorecer la investiga ción genética. Con bastante frecuencia (tres por mil) es posible reunir grupos grandes de pacientes para estudio. Los enfermos son jóvenes y sus padres suelen estar disponibles para análisis de pruebas de desequilibrio de transmisión (PDT). El diagnóstico no es ambiguo y se cuenta con un buen modelo animal, el ratón NOD (no obeso diabético), en el que la enfermedad también es poligénica. Por todas estas razones, y a causa de sus costos finan ciero y personal considerables, durante decenios la D Tl se ha in vestigado de manera intensa mediante enlace, estudios de gen candidato y organismo modelo. Si se considera el progreso hasta cierto punto modesto logrado hasta la fecha, tal vez sea tiempo de re sucitar la antigua descripción de la diabetes como la pesadilla de los genetistas.

Cuadro 15-8. Clasificación clínica de la diabetes. Diabetes tipo 1

Diabetes tipo 2

DJIM

Inicio juvenil

Inicio en la madurez ( > 40 años)

Inicio juvenil

0.4% de la población británica

6% de la población estadounidense

Rara

Requiere Insulina

Por lo general controlable con hipoglucemiantes orales

Como la diabetes tipo 2

Ausencia de obesidad

Asociación potente con obesidad

Ausencia de obesidad

Familiar:

Familiar:

Familiar:

Concordancia de MC 30%

Concordancia de gemelos MC 40 a 100%

¿autosómica

riesgo de hermanos 6 a 10 %

riesgo de hermanos 30% (puede ser subclínica)

dominante?

Se relaciona con

Sin relación con HLA

Sin relación con HLA

HLA-DR3 y DR4 DJIM (diabetes juvenil de Inicio en la madurez) es una form a Infrecuente mendeliana, rara, para la que se identificaron varios genes (véase MIM 600496). Además la diabetes puede ser parte de varios síndromes raros.

15.6 j OCHO EJEMPLOS QUE ILUSTRAN EL ÉXITO VARIABLE DE LA DISECCIÓN GENÉTICA.

457

Cuadro 15-9. Principales locus de susceptibilidad a diabetes tipo 1 sugeridos por análisis de pares de hermanos afectados (PHA) o prueba de desequilibrio de transmisión (PDT). Lo cu s

M IM nú m .

L o c a liz a c ió n

E stado

IDDM1

222100

6p21

x s = 3.1; el determinante es HLA-DBQ

IDDM2

125852

1 1 p15

\ s - 1.3; el determinante es un NVRT corriente arriba del gen INS

IDDM4

600319

1 1 q13

\ s = 1.6; enlace significativo en resultados combinados de tres selecciones (596 familias)

IDDM5

600320

6q24-q27

\ s = 1 .2; observada en cuatro estudios

IDDM6

601941

18q21

Pruebas de PHA y PDT en un estudio

IDDM7

600321

2q31-q33

\ s = 1.3; observado en tres estudios de PHA. Desequilibrio de enlace con gen candidato CTLA4,

ID DM 12

600388

2q33

p = 5 x 10“ 5 pero sólo en algunas poblaciones

IDDM8

600883

6q25-q27

\ s = 1.8; no claramente distinto de IDDM5

ID DM 10

601942

10 p1 1 -q1 1

Datos de PHA y PDT de tres estudios

ID DM 13

601318

2q34

¿Igual que ID D M 7 ,12, o ambos?

IDDM15

601666

6q21

Confirmado (a través de un efecto difícil de separar de HLA)

Datos de las entradas OMIM y artículos citados en las mismas; los valores \ s son de Lou y colaboradores (1995).

15.6.5 Diabetes tipo 2: dos factores de susceptibilidad, uno muy frecuente para ser indetectable mediante enlace; el otro muy complejo y sólo en ciertas poblaciones La diabetes mellitus no dependiente de insulina o tipo 2 (DT2) es la forma más usual de este trastorno heterogéneo, que afecta a cerca de 135 millones de personas en todo el mundo. La DT2 es resultado de una combinación de deterioro de la secreción de in sulina y disminución de la respuesta de órgano final; los factores de riesgo que se conocen incluyen edad, obesidad y falta de ejercicio. En muchos países desarrollados 10 a 20% de las personas mayores de 45 años de edad está afectado y ciertas poblaciones tienen inci dencias en particular altas. Se informaron asociaciones entre DT2 y cuando menos 16 va riantes genéticas distintas (resumidas por Altshuler y cois., 2000a). Un estudio muy grande de Altshuler y colaboradores sólo replicó una. Un alelo común (p = 0.15) del gen PPARGst vinculó con dis m inución del riesgo de DT2 en varias cohortes (razón de posibili dades = 0.8). Como el alelo de riesgo mayor t s tan frecuente (p = 0.85) tal vez nunca se detecte mediante análisis de enlace. PPARG no es un gen candidato que cause sorpresa: codifica un receptor nu clear hormonal que regula la adipogénesis y es un blanco de los me dicamentos de la tiazolidinediona que se utilizan para el tratamiento de la diabetes tipo 2 (DT2). Altmüller y colaboradores (2001) detallaron 10 exámenes del genoma completo e informaron un enlace importante de 25 locus en 15 cromosomas diferentes. Como es usual, los hallazgos no se replicaron bien entre estudios. Un locus, NIDDM1 en 2q37, se identificó en mexicoestadounidenses y al parecer interactúa con un locus en el cromosoma 15 para incrementar la susceptibilidad en

este grupo (véase Horikawa y cois., 2000 para referencias). El artículo de Horikawa y colaboradores describe la identificación de una com binación particular de SNP dentro del gen calpaína 10 (CAPN10) en 2q37 como el determinante de susceptibilidad en mexicoestadou nidenses. Para mencionar una editorial que merece mucho la pena leer, “el estudio proporciona una visión sin precedentes en el borde de corte de la clonación posicional para caracteres complejos y en seña lecciones de importancia duradera respecto a lo difícil que puede ser encontrar genes para enfermedades frecuentes” (Altshuler y cois., 2000b). El trabajo se inició reduciendo la región candidato a una re gión de 7 cM en 2q37. En términos físicos esto correspondió a un contiguo de 1.7 Mb (las tasas de recombinación tienden a ser más altas cerca de telómeros, sección 13.1.5). Se estudió una serie de polimorfismos a partir de esta región, no sólo para la asociación con DT2, sino también para la asociación con la prueba para enla ce. La justificación consistió en que aunque sólo un subgrupo de casos estaba enlazado al locus 2q37, ésos deben ser los únicos que llevan el determinante de susceptibilidad. Análisis iniciales sugirie ron una región blanco de 66 kb, que en el examen contenía tres ge nes, CAPN10, RNPEPL1 y GPR35, y 179 variantes de secuencia (en un grupo de 10 diabéticos mexicanos). Lo anterior condujo a identificar una variante, UCSNP-43, en la que el genotipo homocigoto G/G mostró asociación con la prueba para enlace y quizá también con diabetes (razón de posibilidades, 1.54; intervalo de confianza, 0.88 a 2.41). Luego dio inicio la búsqueda de haplotipos que fueran: a) más frecuentes en los grupos de pacientes con mayor evidencia de enlace 2q37; b) compartidos por pares de her manos afectados con mayor frecuencia de la esperada, y c) vincula dos con riesgo más alto de diabetes. Una combinación heterocigota de dos haplotipos (definidos mediante tres SNP dentro de intrones

458 j CAPITULO QUINCE | MAPEO E IDENTIFICACIÓN DE GENES

C en

1 25 marcadores SNP alrededor del locus NIDDM1 Tel

Fig. 15-8. Genotipos de pacientes con diabetes tipo 2 en el locus calpaína-10. Cada hilera resume los resultados de un paciente con 25 SNP (columnas). Azul: homocigoto para alelo común; rojo: heterocigoto; amarillo: homocigoto para alelo raro; blanco: no hay datos. Los pacientes se disponen desde la parte superior hasta la inferior en orden de prueba decreciente de enlace a NIDDM1. Obsérvese cómo cambian los colores de la parte central del diagrama, el sitio del gen CAPN10, desde la parte superior hasta la Inferior, pero no los colores de otras partes. Esto muestra cómo ciertos genotipos en el locus CAPN10 se asocian con la evidencia para enlace. Adaptado de Cox NJ (2001) Hum. Mol. Genet. 10. 2301-2305 con autorización de Oxford Unlversity Press.

del gen CAPN10) satisfizo todos los criterios. Ningún haplotipo en la forma homocigota tuvo un factor de riesgo. Por consiguiente el determinante de susceptibilidad en NIDDM1 parece ser una com binación heterocigota particular de SNP no codificante que interactúa con un factor no identificado en el cromosoma 15. La figura 15-8 pretende brindar una impresión visual de lo que significa “asociación con evidencia para enlace”. ¿Qué tanta confianza puede tenerse en que este proyecto impre sionante identificara en realidad el factor de susceptibilidad de NIDDMP. Los estudios de seguimiento arrojan resultados conflic tivos (resumidos por Fullerton y cois., 2002); es cierto que no se ob serva asociación universal entre el genotipo de susceptibilidad propuesta y DT2 en todo el mundo. Calpain 10 fue un candidato inesperado; sin embargo, se publicó un efecto de UCSNP-43 en la transcripción del gen y se sugirió un posible efecto corriente abajo en el recambio de glucosa estimulado por insulina. En conjunto, este estudio impulsa a tener una gran precaución respecto a la iden tificación de factores de susceptibilidad de una enfermedad com pleja. En el lado positivo, se identificó un gen candidato nuevo; en el lado negativo, está lejos de ser claro que se haya identificado la variante real que causa susceptibilidad y tampoco está claro cómo podría resolverse esta incertidumbre. ¿Otros factores de riesgo de una enfermedad frecuente serán igual de oscuros y complejos? ¿Re sultarán específicos de poblaciones particulares? La labor heroica de Horikawa y colaboradores proporciona cuando menos muchos da tos para pensar.

15.6.6 Enfermedades inflamatorias del intestino: un gen de susceptibilidad preciso identificado La colitis ulcerosa (CU) y la enfermedad de Crohn son formas de en fermedades inflamatorias del intestino (Eli) que en total afectan de una a tres personas por mil en el mundo occidental. Estudios de fa milias y gemelos apoyan una susceptibilidad genética para cada en fermedad con ciertos componentes compartidos. El valor de \s es de 20 a 30 para EC y de 8 a 15 para CU. Análisis de enlace de pa res de hermanos y familia realizados por muchos grupos definieron varias regiones con enlace confirmado o replicado (IBD1, 16pl2q l3; IBD 212pl3; IBD3 6p; IBD 414ql l-q l2 ; Z&D5 5q31) y mu chos otros de enlace sugestivo (para referencias, véase OMIM entrada 266 600). Se confirmó en particular el enlace a IBD1 con una calificación lod máxima de 5.79 en familias con EC (pero no CU) en un estudio mancomunado muy grande de 613 familias con 1 298 hermanos afectados con EC, CU, o ambas (IBD Internatio nal Genetics Consortium, 2001). En fecha reciente tres grupos identificaron un gen relacionado con IBD1 (Hugot y cois., 2001; Oguray col., 2001; Hampe y cois., 2001). Ogura y colaboradores clonaron CARD15 (NOD2) como un regulador de la respuesta inflamatoria N F-kB. Lo probaron en Eli porque se mapeó al locus de IBD1 y desde el punto de vista biológico fue un candidato prometedor de enfermedad inflamato ria del intestino (Eli). En contraste, Hugot y colaboradores siguie ron una vía de asociación de enlace puro. La región candidato se

15.6 | OCHO EJEMPLOS QUE ILUSTRAN EL ÉXITO VARIABLE DE LA DISECCIÓN GENÉTICA. . . | 459

redujo mediante enlace y luego se efectuaron estudios de asocia ción. Cabe destacar que el resultado de la PDT que condujo a CARD15 sólo fue significativo limítrofe (/>= 0.05) y aunque se re plicó en una muestra independiente con p < 0.01, en esta ocasión la asociación ¡fue con un alelo diferente del marcador! De hecho la observación cuidadosa de sus datos sugiere que una búsqueda aleatoria basada en microsatélites para asociación en una cohorte grande no hubiera proporcionado resultados positivos. Por últi mo asociaciones potentes, aunque no espectaculares, destacaron una región genómica de la que clonaron los 10 genes CARD15 no publicados. El principal factor de susceptibilidad en IBD1 es una inser ción de base aislada, 3 020insC, en la parte terminal C del gen CARD15- Hampe y colaboradores demostraron una asociación PDT muy fuerte entre pacientes con EC y esta mutación. La inser ción tiene una frecuencia de 0.08 en pacientes con EC, 0.02 en tes tigos y 0.02 en enfermos con CU, lo que demuestra que es un factor de susceptibilidad para EC pero no para colitis ulcerosa. El riesgo relativo de EC se aproxima a 3 para heterocigotos y a 23 pa ra homocigotos. La inserción produce una proteína truncada en 33 aminoácidos que afecta una región con importancia demostrable en la activación de NF-kB. Este trabajo destaca tres puntos. Primero, demuestra que la empresa es posible: los genes de susceptibilidad pueden identifi carse, cuando menos en ocasiones, mediante un método genéti co. Segundo, resalta la necesidad de estudios de familias a gran escala. Por último, los resultados débiles de PDT para marcado res de enlace en el estudio de Hugot y colaboradores, comparados con los resultados muy potentes que observaron Hampe y cola boradores cuando estudiaron la mutación de inserción de mane ra directa, enseñan una lección importante acerca de los estudios de asociación. No sorprende que otras mutaciones en el gen CARD15 también contribuyan a la susceptibilidad de la EC. Otras dos cSNP, G908R y R702W (numeradas de manera distin ta por Hugot y cois.), se asocian fuertemente con EC y una varie dad completa de cambios en sentido erróneo raros en el gen CARD15 es más frecuente en pacientes con EC que en testigos. Aun en presencia de desequilibrio de enlace, cada mutación se acompañará de su haplotipo individual propio. Esta heterogenei dad alélica es por completo esperada -pero origina restricciones graves en las posibilidades de localizar un gen de susceptibilidad dentro de una región candidato mediante una estrategia basada en asociación.

15.6.7 Esquizofrenia: los problemas especiales de los trastornos psiquiátricos o conductuales Los genetistas que estudian una enfermedad psiquiátrica o con ducta antisocial enfrentan dos problemas adicionales, además de todas las dificultades inherentes al estudio de cualquier enferme dad compleja. a) A rgumentos respecto a naturaleza-crianza. Como el ambiente familiar compartido es una explicación tan plausible para la tendencia a que se presenten problemas psiquiátricos o con ductuales en familias, se requiere un estándar muy alto de

pruebas para hacer afirmaciones acerca de factores genéticos. Los cuadros 15-1 a 15-3 resumen algunas de las evidencias de estudios de familias, gemelos y de adopción para la esqui zofrenia. Muy a menudo los argumentos de naturaleza y crianza son tan sólo sustitutos de argumentos políticos y se elaboran con todo el decoro y la objetividad de las políticas públicas. Ambos lados basan su pasión en la premisa falsa de que si un padecimiento es genético, entonces no puede me jorarse con ninguna intervención social. Por consiguiente las personas de la izquierda favorecen la causa ambiental y las de la derecha apoyan causas genéticas. En la actualidad parte del acaloramiento de los argumentos respecto a psiquiatría se eliminó, pero los genetistas buscan una conducta antisocial que aún atrae una posición virulenta y patrocinadores no bienvenidos. b) Criterios diagnósticos. Como se comenta en la sección 15.3.1, los criterios diagnósticos constituyen otra área muy difícil en genética psiquiátrica. “La esquizofrenia no debe considerarse una enfermedad sino, igual que la epilepsia, un síndrome que se reconoce por un conjunto de signos y síntomas que tienen una patogénesis diversa” (Trimble, 1996). Los criterios acorda dos, como DSM-IV, se basan en el mejor juicio de psiquiatras experimentados respecto a lo que constituye el núcleo esencial del padecimiento -pero finalmente son arbitrarios-. ¿Es posi ble que la “personalidad esquizoide” sea una manifestación de los genes que tornan a las personas susceptibles a la esquizofre nia DSM-IV? O, ¿existe quizás una susceptibilidad genética general a una enfermedad psicòtica y también debe incluirse la enfermedad bipolar y depresiva? Con frecuencia los análisis ge néticos utilizan dos o más grupos de criterios distintos, uno es trecho y uno amplio, a fin de observar cuál proporciona la mejor calificación. De otra manera los investigadores pueden buscar enlace a un fenotipo intermedio, algo que no es esqui zofrenia pero que pudiera formar parte de la susceptibilidad y ser más simplemente determinado en forma genética -tal vez cierta variante fisiológica o neuropsicológica-. La esquizofrenia, como un padecimiento familiar hasta cierto punto frecuente y muy aflictivo, suele ocupar un lugar alto en la lista de prio ridades de los investigadores genéticos. Altmüller y colaboradores (2001) listan 10 estudios del genoma completo efectuados desde 1994 y se conocen muchos estudios adicionales de genes o regiones candidato individuales. Los candidatos típicos son genes codifica dores de proteínas que participan en la neurotransmisión o que se afectan por fármacos que se utilizan para el tratamiento de la esquizo frenia. Las múltiples genealogías grandes afectadas no son raras y a menudo se emplean para estudios de enlace. La elección de estas fa milias tiene implicaciones para el análisis: el programa Genehunter, que se usa con más frecuencia para enlace de enfermedad compleja, no puede manejar genealogías grandes (sección 13.6.2) y determina que muchos investigadores utilicen análisis paramétricos de califica ción lod (sección 13.3.1), pero con una diversidad de modelos gené ticos alternativos. Aunque realizar lo anterior es del todo válido, introduce grados adicionales de libertad y por tanto disminuye la potencia del estudio. En combinación con el uso de múltiples crite rios diagnósticos (véase antes), esto determina que la estimación de

460

CAPÍTULO QUINCE ¡ MAPEO E IDENTIFICACIÓN DE GENES

la significancia de los resultados sea excepcionalmente falsa. No obs tante, múltiples modelos pueden ser realistas en términos biológicos; es por completo factible que un alelo de riesgo en un locus confiera susceptibilidad dominante a una enfermedad definida de manera am plia, en tanto que un alelo en otro locus puede conferir susceptibili dad recesiva a la esquizofrenia definida sólo de manera estrecha. En la actualidad uno o más estudios muestran pruebas de enla ce a casi una docena de regiones cromosómicas, pero aún no se identifica con claridad algún alelo de susceptibilidad. Un candida to prometedor es el alelo de valina de un polimorfismo Metl58Val en el gen COMT (catecol-O-metiltransferasa). En términos bioló gicos es un candidato plausible y a pesar de ciertos estudios negati vos varios otros informaron una asociación y resultados de la PDT positivos. Por ejemplo, Weinberger y colaboradores (2001) encon traron una frecuencia de 52% en testigos y de 60% en esquizofré nicos con una razón de posibilidades de 1.5 para homocigotos. Sin embargo, aun si se confirma, este factor sólo explicaría 4% de la varianza del riesgo. La entrada OMIM 181 500 proporciona víncu los para discusiones de las principales regiones candidato, en tanto que los estudios de Gurling y colaboradores (2002), Camp y cola boradores (2001), Weinberger y colaboradores (2001) y Lewis co laboradores (2003) brindan un buen cuadro de los problemas y algunos de los métodos que se utilizan para intentar y descubrir la genética de esta enfermedad trágica. Los problemas planteados en este inciso se aplican por igual a una gama de otros fenotipos psi quiátricos y conductuales humanos.

15.6.8 Obesidad: análisis genético de un carácter cuantitativo Como un problema emotivo contencioso, la obesidad rivaliza con la esquizofrenia, con una escuela de pensamiento que prevalece en tre personas delgadas que culpa a una mala autodisciplina y laxitud moral y la parte fuerte que culpa a una predisposición constitucio nal. La obesidad es una preocupación de salud pública importante en países desarrollados y es de gran interés para compañías de bio tecnología, que ven la fortuna que pueden hacer con una píldora eficaz para la delgadez. Para los propósitos actuales, el principal in terés en la obesidad es como ejemplo de un carácter cuantitativo (Barsh y cois., 2000). La medición simple del peso no constituye una buena variable cuantitativa para el análisis porque confunde a las personas delga das altas con las personas gordas bajas. El índice de masa corporal (IMC; peso en kg/estatura en m2) es una medida mucho más ade cuada. El IMC medio en Estados Unidos era de 22 kg/m2 en 1983. Otros investigadores intentan usar medidas más cercanas de la fi siología subyacente, por ejemplo, el porcentaje de tejido adiposo o la concentración sérica de leptina. En cada caso podrían utilizarse ciertos límites para definir la obesidad, como IMC 25 a 29 kg/m = grado 1, IMC 30 a 40 kg/m" = grado II e IMC > 40 = grado III, con ajustes para la edad y el sexo. Sin embargo, esta conducta es ar bitraria y conduce a la pérdida de datos. Es mucho mejor analizar en forma directa la variable cuantitativa para identificar un locus de carácter cuantitativo (LCC). Estas medidas cuantitativas son el pan de cada día de la reproducción de animales y plantas. La técni

ca usual para el análisis del LCC en genealogías humanas es el aná lisis de enlace varianza-componente. Almasy y Blangero (1998) describieron la base matemática del método. En esencia, como en el análisis convencional de calificación lod, se calcula una califica ción lod a partir de la relación de la posibilidad de los datos en dos hipótesis alternativas. En este caso los datos son covarianzas entre familiares para el fenotipo cuantitativo y las hipótesis alternativas consisten en que existe o no un LCC en la localización cromosómica en cuestión. Las covarianzas pueden ajustarse para variables de confusión como edad y sexo. En la hipótesis de la existencia de un LCC, su efecto se predice a partir de la identidad por descen diente del segmento cromosómico en el par de familiares, según lo evidencian los datos marcadores. El método de múltiples puntos descrito por Almasy y Blangero proporciona un intervalo de con fianza para la localización del LCC y un estimado de su efecto. Aunque el IMC se analiza como un LCC en lugar de la obesidad como un carácter dicótomo, aún es preferible concentrarse en per sonas en los extremos de la distribución a fin de llevar al máximo la potencia estadística. OMIM tiene 44 entradas que comprenden “obesidad” en el tí tulo o sinopsis clínica, inclusive la obesidad espectacular rara que abarca componentes de las vías que regulan el consumo de alimen tos -la hormona leptina, el receptor de leptina, la pro-opiomelanocortina y el receptor de la melanocortina-4-. Sin embargo, la mayor parte de la obesidad no es mendeliana. De hecho los sín dromes con obesidad inevitable tienen poco interés: el objetivo de la investigación de la obesidad es descubrir los mecanismos que tornan susceptibles o resistentes a las personas a la obesidad indu cida por dieta, en lugar de aquellos que controlan el peso corporal p o r sí mismos -un punto importante cuando se consideran mode los animales-. Esta línea de pensamiento sugiere que el mejor di seño de investigación sólo tendría en cuenta a personas, obesas o de otra índole, que viven con alimentos chatarra y no hacen ejer cicio. Pueden captarse a la salida de un sitio de alimentos rápidos en automóvil. Como siempre la primera labor es revisar si hay algún compo nente genético en la causa. La obesidad tiende a presentarse en fa milias, pero ello fácilmente podría ser un efecto de un ambiente familiar compartido. Sin embargo, estudios en gemelos y de adop ción sugieren que alrededor de 70% de la varianza en el IMC pue de atribuirse a factores genéticos. Análisis de segregación sugieren que 20 a 65% de la varianza de IMC en la población podría deber se a uno o dos genes recesivos mayores (resumidos por Feitosa y cois., 2002). Altmüller y colaboradores (2001) publicaron una lista de cinco exámenes del genoma total informados antes de diciem bre del año 2000; Feitosa y colaboradores (2002) y Deng y colabo radores (2002) elaboraron dos informes más recientes. Los dos últimos muestran curvas de calificación lod para cada cromosoma que ilustran con claridad el problema general de la falta de replicación de los resultados. Como con muchas otras enfermedades com plejas, la pregunta fundamental es si el fracaso para replicarlas indica que el informe inicial fue erróneo o que el estudio de segui miento no tenía potencia. En el caso de la obesidad también mere ce la pena indicar que algunos de los mejores datos pueden estar ocultos en los expedientes de compañías de biotecnología, que no se revelarán hasta que se logre algo patentable.

15.7 i GENERALIDADES Y RESUMEN

15.7

G eneralidades y resum en

15.7.1 ¿Por qué es tan difícil? La identificación de factores de susceptibilidad resulta mucho más difícil de lo que las personas imaginaban hace 10 años. Weiss y Terwilliger (2002) preguntan de manera pertinente “¿qué por centaje de proyectos de mapeo del gen de enfermedades comple jas, cuyas proposiciones acordadas prometieron una potencia de 80%, ha tenido éxito real para identificar los genes de enferme dad que se asumía que existían en los datos?” La respuesta está muy por debajo de 80% de que algo seguramente está mal. Su ar tículo debe leerlo cualquier persona que piense que es fácil inves tigar una enfermedad compleja. No obstante, cualquier aventura importante hacia lo desconocido se acompaña siempre de argu mentos doctos apremiantes que demuestran por qué nunca pue de funcionar -que luego se comprueba que son erróneos-. La opinión de la mayoría es que los fracasos se debieron a falta de potencia y pueden remediarse con cohortes de pacientes más grandes, una genotipificación más efectiva y una prueba estadís tica más potente.

461

Una vez que se eligen los SNP apropiados para estudio, el princi pal problema es la heterogeneidad alélica. Las enfermedades infla matorias del intestino (sección 15.6.6) ilustran a la perfección la forma en que los estudios de potencia de asociación se hunden rápidamente tan pronto existe más de un alelo de susceptibilidad común en un locus de riesgo. Los cálculos de Risch y Merikangas (1996), que influyeron tanto en el impulso de estudios de PDT al frente de la investigación de enfermedades complejas, consideran un alelo de susceptibilidad aislado en el locus de en fermedad. Es importante recordar que sus cálculos se aplican a ese alelo y no a la influencia total del locus en la enfermedad. El grado de heterogeneidad alélica en un locus de susceptibilidad surge como un determinante fundamental del éxito o el fracaso. ¿La mayor parte de los alelos de susceptibilidad antiguos la cons tituyen polimorfismos comunes (la hipótesis de “enfermedad co mún-variante común”), o un conjunto heterogéneo de mutaciones raras recientes, como la mayor parte de las enfermedades mendelianas? Se conocen argumentos para ambas posiciones (Reich y Lander, 2001; Pritchard, 2001; Wright y cois., 2003). El jurado aún está preparado.

El problema central debe ser la heterogeneidad

15.7.2 Si todo funciona y se identifican alelos de susceptibilidad, ¿entonces qué?

Para el enlace, el análisis de un par de hermanos afectados es un método en extremo robusto. El hecho de que tengan tan pocas calificaciones lod importantes y que los estudios se repliquen tan rara vez entre sí (Altmüller y cois., 2001) sólo puede deber se a heterogeneidad de locus. Es evidente que la susceptibilidad a la mayor parte de las enfermedades complejas está determina da por muchos locus menores y no por unos cuantos locus ma yores. El análisis de pares de hermanos se limita a detectar factores de susceptibilidad bastante fuertes. Los cálculos del cuadro 15-7 muestran que para gamma ^ 2 el exceso de com partir alelos por pares de hermanos afectados es muy pequeño y la detección requeriría números muy considerables. Altmüller y colaboradores (2001) compararon 101 estudios del genoma completo para observar si podría aprenderse alguna lección de la forma en que tuvieran éxito, pero no pudieron identificar ninguna regla de oro además de pensamientos obvios como el tener una muestra grande por analizar. Una consideración adi cional es que la susceptibilidad en poblaciones diferentes puede tener distintas causas genéticas. Por ejemplo, en una encuesta de 483 pacientes japoneses con enfermedad de Crohn (Yamazaki y cois., 2002) se encontraron pocas evidencias de mutaciones en CARD15, que es un gen de susceptibilidad mayor entre euro peos (véase sección 15.6.6). Los estudios de asociación, el otro medio principal para la in vestigación, dependen del desequilibrio de enlace. Cada vez es más claro que en tanto no se tengan buenos mapas de desequili brio a lo largo de las líneas de la figura 15-6 no se contara con una base racional para seleccionar los marcadores que deben utilizar se. No obstante, también es claro que, al contrario de los cálculos de Kruglyak (1999), en muchos casos el desequilibrio es lo bas tante extenso para proporcionar una posibilidad razonable de éxi to de los estudios de asociación de SNP en las escalas actuales.

En el supuesto de que puede hacerse funcionar, la identificación de factores de susceptibilidad para una enfermedad debe au mentar el conocimiento de su patogénesis. Aunque ello no con duce de manera automática a una mejoría del tratamiento -es posible que un padecimiento permanezca incurable inclusive si se comprende bien y en ocasiones la terapéutica puramente sin tomática es muy eficaz- comprender la patología debe permitir establecer conductas para el tratamiento más razonables y diri gidas. Los pacientes con genotipos distintos pueden tener dife rencias en la patología subyacente y por tanto en la respuesta a diversos fármacos. Es mucho menos claro si la identificación de factores de riesgo conducirá a una preven ción efectiva. Los adelantos técnicos en la genotipificación de alto rendimiento permitirán seleccionar a la población con mayor facilidad, pero siempre es imperativo pre guntarse si esta selección será eficaz para el costo y aceptable des de el punto de vista ético. Los condiciones necesarias se comentan con detalle en la sección 18.3. El punto único más esencial, de ma yor importancia aún que cualquier problema técnico, es que la identificación de una persona con riesgo debe conducir a cierta ac ción útil. En general se habla de cambios en el estilo de vida. La terapéutica farmacológica profiláctica sólo se justificará si es posi ble dirigirla a un número pequeño de personas con riesgo alto y estos grupos son característicos de enfermedades mendelianas más que complejas. Pharoah y colaboradores (2002) también estable cen el punto importante de que en los casos en que se identifican personas con riesgo alto mediante genotipificación de múltiples locus, las intervenciones que se basan en mecanismos específicos de predisposición tal vez sólo aborden una pequeña parte específi ca de su riesgo adicional. La capacidad para definir la susceptibilidad genética contri buirá de modo considerable a identificar factores de estilo de vida

462

CAPITULO QUINCE j MAPEO EIDENTIFICACIÓN DE GENES

importantes. Éstos podrían determinarse con mucho mayor facilidad en una cohorte que se sabe que es susceptible genéticamente en su totalidad. Las opiniones respecto al impacto que ese conocimiento podría tener difieren con amplitud. Las dos posiciones extremas po drían caricaturizarse como las posturas con la cabeza en las nubes y la cabeza en la arena (fig. 15-9). La postura con la cabeza en las nu bes asume que no sólo podrían identificarse cambios en el estilo de

vida muy protectores sino que también la persona seguiría el conse jo para adoptarlos. Esto parece un poco optimista si se considera la epidemia actual en la mayor parte de los países desarrollados de una enfermedad por completo prevenible causada por el tabaquis mo, la obesidad y la falta de actividad. No obstante, no debe colapsarse hacia el pesimismo: el esfuerzo habrá valido la pena si es posible prevenir con efectividad inclusive una enfermedad frecuente.

"V

c y

ÍWO FUNCIONARÁ!

¡E U R E K A !

LA MEDICINA PEISI GIO XXI CAMBIARÁ ’ VE "DIAGNÓSTICO + TRATAMIENTO" A "PREDICCIÓN + M O P 6 U > ■

PREVENTIVO"

LA MAYOR PARTE V e LOS FACTORES VB RIESAATAGA

b ) por declinación del RNA mediada sin sentido

Globina |3 p.Q39X

Prevención del empalme correcto (sección 11.4.3) a) inactivación del sitio de empalme donador

Mutación P/IX3g.451 + 1G -*T (fig. 16-1)

b) inactivación del sitio de empalme aceptor

Mutación PAX3g.452-2A-*G (fig. 16-1)

c) alteración de un intensificador de empalme exónico

Exón SMN2 7 g.C6T (Cartegni y Krainer, 2002)

d) activación de un sitio de empalme crítico (puede ser profundo dentro de un intrón)

LGMD2A G624G (fig. 11-12) Mutación de globina p IVS1-110G—*A (cuadro 18-5) C /7 fl3 8 4 9 + 1 0 k b C - T (cuadro 18-6)

Introducción de un cambio de marco en la traducción

Mutación PAX3g.874_875ínsG (fig. 16-1)

Conversión de un codón en un codón de detención

Mutación PAX3p.Q254X (fig. 16-1)

Sustitución de un aminoácido esencial

Mutación PAX3p.R271C (fig. 16-1)

Prevención del procesamiento postranscripcional

Propéptido terminal N de colágena resistente a corte en el síndrome de Ehlers Danlos VII (sección 16.6.1)

Prevención de la localización celular correcta del producto

Mutación p.F508del en fibrosis quística

Recuadro 16-5. Lineamientos para estimar la significancia de un cambio de secuencia de DNA ► Las deleciones de todo el gen, las mutaciones sin sentido y los cam bios de marco destruyen casi con certeza la función.

puede ayudar a sugerir los residuos que son críticos. Por ejemplo, las mutaciones de sentido erróneo de la figura 16-1, que causan pérdida de la función, se concentran en los dominios de enlace de DNA fun damentales de la proteína PAX3.

► Las mutaciones que cambian los nucleótidos GT...AG conservados que flanquean la mayor parte de los intrones afectan el empalme y por lo general suprimirán la función génica. Muchos otros cambios de secuencia pueden afectar el empalme pero en formas mucho más di fíciles de predecir (véase más adelante).

► Es más factible que el cambio de un aminoácido afecte la función si ese aminoácido se conserva en genes relacionados (ortólogos o pa tólogos).

► Es más probable que una mutación de sentido erróneo sea patógena si afecta una parte de la proteína que se sabe que es funcionalmente importante. El modelo de computadora de la estructura proteínica

► Es más probable que las sustituciones de aminoácidos afecten la fun ción si no son conservadoras (sustitución de un aminoácido polar por otro no polar o de uno ácido por otro básico; véase recuadro 11-3).

16.4

MUTACIONES CON PÉRDIDA DE FUNCIÓN | 471

N --H h-------------- H

Fig. 16-2. Oeleciones en la parte central del gen de distrofína en pacientes con distrofia muscular de Duchenne o de Becker. Los cuadros numerados representan los exones 45 a 55. Los números arriba de cada cuadro muestran el efecto que tiene la deleción del exón en el marco de lectura (0 sin efecto, -1 cambio de 1 nucleótido retrógrado, + 1 cambio de 1 nucleótido anterógrado). Las barras rojas muestran deleciones en pacientes con DMD letal, las barras en azul indican deleciones en pacientes con DMB más leve. En general las deleciones de cambio de marco causan DMD y las neutrales de marco producen DMB. Las excepciones se indican mediante líneas de guiones. Las posibles razones de las excepciones incluyen deleciones que terminan dentro de un exón, acciones de genes modificadores o efectos ambientales, o tal vez errores clínicos o de laboratorio. Datos del sitio de red (website) Leiden Muscular Dystrophy w w w.dm d.nl, que deben consultarse para obtener información más completa de los datos básicos. La figura 18-6 muestra cómo se caracterizan estas deleciones en el laboratorio.

brincan el exón 9. Es probable que estos efectos contribuyan con frecuencia a una enfermedad genética, en especial quizá susceptibilidad a enfermedades frecuentes (Nissim-Rafinia y Kerem, 2002); ► alteraciones de intensificadores o silenciadores de empalme: estas secuencias importantes pero mal definidas pueden locali zarse en exones o intrones (Nissim-Rafinia y Kerem, 2002). Cartegni y Krainer (2002) proporcionan un ejemplo en particular claro de una mutación que altera un intensificador de empalme sónico; ► activación de sitios de empalme críptico: las sustituciones de bases al parecer innocuas pueden dar lugar a que una se cuencia antes inactiva se utilice como sitio de empalme. El si tio críptico puede encontrarse en un exón o un intrón. La figura 11-12 muestra un ejemplo. Si el sitio está situado a profundidad en un intrón, la mutación podría pasarse por al to sin estudios de PCR-RT; p. ej., la mutación CFTR 3849 + lOkbC -* T activa un sitio de empalme críptico situado 10 kb dentro del intrón 19.

16.4.2 En la haploinsuficiencia una reducción de 50% del nivel de la función génica causa un fenotipo anormal Las mutaciones con pérdida de función tienden a ser recesivas porque a menudo los heterocigotos funcionan en forma perfectamente nor mal. Esto a veces se debe a que asas de retroalimentación en la trans cripción o el nivel de actividad de la proteína compensan la dosis reducida, pero en muchos casos la célula y el organismo son capaces de funcionar de modo normal con apenas 50% del nivel de la acción génica. Hasta cierto punto pocos genes muestran haploinsuficiencia; el cuadro 16-2 presenta algunos ejemplos. Otros cuantos genes mues tran otras formas de sensibilidad de dosis (véase fig. 16-3 y 16-8). Sería razonable preguntarse por qué debe haber sensibilidad de dosis para cualquier producto génico ¿Por qué la selección natural no manejó mejor las cosas? Si un gen se expresa de modo que dos copias produzcan una cantidad apenas suficiente del producto, la selección de variantes con valores más altos de expresión debe con ducir a la evolución de un organismo más robusto, sin un precio

472

CAPÍTULO DIECISÉIS

PATOLOGÍA MOLECULAR

\ |/ a

\|/a

a l ex I

a | a

«I

alai

a

a l

N o rm a l

J

a|

o

C a rá c te r d e ta la s e m ia -a +

A n e m ia leve (ta l-a +)

1

R e p e tic ió n X R e p e tic ió n Z

; ; C ruzam iento \i entre repeticio'■ nes alineadas erróneam ente

E n fe rm e d a d HbH

H id ro p e s ía feta l

1

Fig. 16-3. Deleciones de genes de globina a en la talasemla a Las copias normales del cromosoma 16 llevan dos genes de globina a activos y un seudogén inactivo dispuesto en tándem. Los bloques repetidos (marcados X y Z) pueden alinearse de modo erróneo y permitir un cruzamiento desigual. El diagrama muestra cruzamiento desigual entre las repeticiones Z mal alineadas que produce un cromosoma que sólo lleva un gen a activo. Los cruzamientos desiguales entre repeticiones X tienen un efecto similar. Los cruzamientos desiguales entre otras repeticiones (no se muestran) suelen producir cromosomas que llevan un gen a no funcional. Por consiguiente los individuos pueden tener cualquier número de 0 a 4 o más genes de globina a. Las consecuencias se tornan más graves conforme el número de genes a disminuye. Véase Weatherall y colaboradores (Lecturas adicionales) para detalles.

obvio que pagar. La respuesta es que en la mayor parte de los casos esto en realidad sucedió -ésta es la razón por la que relativamente pocos genes son sensibles a dosis-. Sin embargo, ciertas funciones génicas son sensibles a dosis de manera inherente. Incluyen: ► productos génicos que son parte de un sistema de señalamien to cuantitativo cuya función depende de la ocupación parcial o variable de un receptor, sitio de unión de DNA, etcétera; ► productos génicos que compiten entre sí para determinar un cambio de desarrollo o metabólico; ► productos génicos que cooperan en interacciones con estoiquiometría fija (como las globinas a y p, y muchas proteínas estructurales). En cada caso el producto génico se ajusta contra algo más en las cé lulas. Lo que interesa no es el valor absoluto correcto del producto,

sino los valores relativos correctos de productos que interactúan. Los efectos son sensibles a cambios en todos los compañeros que inte ractúan y en consecuencia estos padecimientos dominantes suelen mostrar una expresión muy variable (véase sección 16.6.3). Los ge nes cuyos productos actúan en esencia solos, como muchas enzimas del metabolismo solubles, rara vez muestran efectos de dosis. Además en algunos casos en que una célula sólo con una copia funcional de un gen apenas puede satisfacer la demanda de un pro ducto génico que se requiere en grandes cantidades. Un ejemplo pue de ser la elastina. En personas heterocigotas para una deleción o una mutación con pérdida de la función del gen de elastina no se afectan los tejidos que sólo requieren cantidades moderadas de elastina (piel, pulmón), pero la aorta, que demanda mucha más elastina, a menu do muestra una anormalidad (estenosis aórtica supravalvular) que tal vez requiera una intervención quirúrgica (véase sección 16.8.1).

Cuadro 16-2. Fenotipos probablemente causados por haploinsuficiencia. Véase texto para detalles P a d e c im ie n to

M IM #

Gen

N ota s

Síndrome de Alagille

118450

JAG1

Véase sección

Exostosis múltiple

133700

EXT1

Véase cuadro

Neuropatía tomaculosa

162500

PMP22

Véase sección

Estenosis aórtica supravalvular

185500

ELN

Véase esta sección

Síndrome trico-rino-faríngeo

190350

TRPS1

Véase cuadro

193500

PAX3

Véase sección

Síndrome de Waardenburg tipo

1

16.8.1 16-8 16.6.2

16-8 16.3.2

16.5 ! MUTACIONES CON GANANCIA DE FUNCIÓN

16.4.3 Las mutaciones en proteínas que actúan como dímeros y multímeros a veces producen efectos dominantes negativos Un efecto dominante negativo ocurre cuando un polipéptido mu íante no sólo pierde su función, sino también interfiere con el producto del alelo normal en un heterocigoto. Algunas personas argumentarían que estas son mutaciones con ganancia de función, no pérdida de función, pero éste es sólo un argumento sobre pala bras. Las mutaciones dominantes negativas producen efectos más graves que los alelos nulos simples del mismo gen. Las proteínas es tructurales que forman estructuras multiméricas son en particular vulnerables a efectos dominantes negativos. Las colágenas represen tan un ejemplo clásico. Las colágenas fibrilares, las principales proteínas estructurales del tejido conjuntivo, están constituidos por hélices triples de cade nas polipéptidas, en ocasiones homotrímeros, a veces heterotrímeros, que se ensamblan en una disposición de enlace cruzado empacada de modo estrecho para formar fibrillas rígidas. En cadenas polipép tidas recién sintetizadas (preprocolágena), los polipéptidos en la terminal N y la terminal C flanquean una secuencia de repetición regular (Gli-X-Y)n, en la que X o Y suelen ser prolina y la otra es cualquier aminoácido. Tres cadenas de preprocolágena se vinculan y se tuercen en una triple hélice bajo el control del propéptido de la terminal C. Tras la formación de la triple hélice, los propéptidos de la terminal N y la terminal C se cortan y eliminan. Un polipép tido que forma complejos con cadenas normales pero después des troza la triple hélice puede reducir el rendimiento de la colágena funcional a bastante menos de 50% (fig. 16-4). La patología mo lecular de mutaciones de la colágena es muy abundante y se estu dia más adelante (véanse sección 16.6.1 y cuadro 16-7). Las proteínas no estructurales que se dimerizan u oligomerizan también muestran efectos dominantes negativos. Por ejemplo, los factores de transcripción de la familia b-HLH-Zip (fig. 10-9) unen DNA como dímeros. Las mutantes que no se dimerizan suelen cau sar fenotipos recesivos, pero las mutantes que son capaces de se cuestrar moléculas funcionales al interior de dímeros inactivos dan fenotipos dominantes (Hemesath y cois., 1994). Los canales iónicos en membranas celulares proveen otro ejemplo de estructuras mul timéricas sensibles a efectos dominantes negativos (sección 16.6.1).

16.4.4 La modificación epigenética puede abolir la función génica aun sin un cambio de secuencia de DNA Los cambios que son hereditarios (de la célula a la célula hija o del pa dre al niño) pero que no dependen de cambios en las secuencias del DNA se denominan epigenéticos (sección 10.1). Un grupo de minirrevisiones en el número del 1 de mayo de 1998 de Cell (Vol. 93, pp. 301 a 337) analiza muchas de las diversas facetas de la epigenética. Los efectos epigenéticos son en particular claros en el cáncer (Jones y Baylin, 2002). Para los propósitos de este capítulo el principal mecanis mo epigenédco de interés es la mediación del DNA. Para detalles más amplios respecto a este tema, véase la revisión de Bird (2002). Como se mencionó (sección 10.4.2), las bases de citosina en el DNA humano que se encuentran cerca de la guanina (un dinucleótido CpG) a menudo están metiladas en el carbono 5 y la metilación original de CpG puede transmitirse en forma estable cuando el DNA se replica (fig. 16-5). Estos patrones de metilación son señales importantes para controlar la transcripción de genes

473

(sección 10.4.3). La inactivación de X depende cuando menos en parte de la metilación del DNA y la transmisión epigenética del pa trón de metilación asegura que se inactive la misma X en las célu las madre y las hijas. La metilación inapropiada puede causar una pérdida de función patógena heredable. Por ejemplo, en muchos tumores la función del gen supresor de tumor p l6 (CDKN2A) se suprime por metilación del promotor en lugar de mutación de su secuencia de DNA (sección 17.4.3). Por el contrario, se piensa que la desmetilación inapropiada inicia la expresión de oncogenes en tumores. Los genes con improntas (secciones 4.3.4, 10.5.4) son un ejem plo en especial intrigante de modificación epigenética. Su expresión está controlada por patrones de metilación que difieren según el ori gen parental del gen. Cuando el funcionamiento inadecuado del mecanismo de improntación o el origen parental no es el esperado, puede ocurrir una pérdida de función o una expresión inapropiada en genes intactos. Los genes con improntas ocurren en el grupo que contiene genes improntos tanto maternos como paternos, algunos de los cuales sólo están improntos en ciertos tejidos. Con frecuencia ambas cadenas de DNA poseen el potencial de transcribirse -uno de los transcritos es un mRNA y el otro un RNA antisentido no tra ducible grande (> 100 kb)—,pero la transcripción de una cadena im pide la de la otra. Por tanto la patología molecular de enfermedades humanas por improntación es fascinante pero muy complicada. El recuadro 16-6 describe las enfermedades humanas por improntación que mejor se conocen, los síndromes de l’rader-Willi y de Angelman; para mayor información de otras enfermedades véanse OMIM 130650 (síndrome de Beckwith-Wiedemann), OMIM 139320 (GNAS) y las revisiones de Reik y Walter (2001) y Rougeulle y Heard (2002).

16.5

M utaciones con g anancia de función

El cuadro 16-3 contiene una lista de varios mecanismos que pueden producir un fenotipo con ganancia de función.

16.5.1 La adquisición de una función nueva es rara en enfermedades hereditarias pero frecuente en el cáncer Realizar cambios aleatorios en un gen es muy similar a detener su trabajo, pero es muy improbable que proporcionen una función novedosa. El único mecanismo que suele generar genes funcionales nuevos es cuando un reordenamiento cromosómico une exones funcionales de dos genes distintos (fig. 17-4A). Sin duda esta mez cla de exones fue importante en la evolución; en patología molecu lar se observa más a menudo cuando conduce a cáncer. Muchos reordenamientos cromosómicos específicos de tumor adquiridos producen genes quiméricos con actividades nuevas que llevan a la proliferación celular incontrolada (véase cuadro 17-3). Un caso ra ro de una mutación de punto hereditaria que confiere una función nueva en una proteína es el alelo Pittsburgh en el locus P I (MIM 107 400; fig. 16-6).

16.5.2 La expresión excesiva puede ser patógena La expresión excesiva gruesa de ciertos genes es frecuente en células cancerosas. Los mecanismos por los que los cambios genéticos so-

474 | CAPÍTULO DIECISÉIS I PATOLOGÍA MOLECULAR

COL1A2

COL1A1

locus 17q

OI leve

OI grave

Normal

iti íH

locus

M utación m ayor

M utación en sen tid o erróneo

7q

Y Y

Hí cH

'O

' E i I o . C

X LU

(Ü

V

n m oléculas

de p ro co lág en a (tres c ad en as)

H

i

í

H

i

Y Y

Y Y

, y

n cadenas

n cadenas

n cadenas

2n c a d e n a s

i

n cadenas n cadenas + n cadenas

no rm ales m u tan te s

K Æ

S S W

^ m oléculas

W

i

d e pro co lág en a norm al

I m oléculas d e pro co lág en a +

v/\/\/\

\S \/\/\ ^ c a d e n a s a2 (d eg rad ad as

2?4 m oléculas d e pro co lág en a anorm ales S ustitución en la parte term inal N d e la triple hélice: alteración m enor del em p aq u e

S ustitució n en la p a rte term inal C d e la triple hélice: alteración m ayor del em p aq u e

Fig. 16-4. Efectos dominantes negativos de mutaciones del gen de colágena Las fibrillas de colágena están constituidas por arreglos de unidades de procolágena de triple hélice. La procolágena tipo I comprende dos cadenas codificadas por el gen C0L1A1 y una codificada por C0L1A2. Las mutaciones nulas en cualquier gen tienen un efecto menos grave que las mutaciones que codifican polipéptidos que están incorporados en la triple hélice y destruyen su función.

máticos producen expresión excesiva incluyen reduplicación génica masiva o transposición de un gen que suele expresarse a un nivel ba jo en un ambiente cromatínico muy activo. Este hecho se comenta con mayor amplitud en la sección 17.3.3. Con frecuencia las enfermedades hereditarias no se deben a ex presión excesiva constitucional de un gen aislado. La duplicación del gen DSS en Xp21.3 causa reversión del sexo masculino a feme nino, tal vez como resultado directo de duplicación de la dosis (Bardoni y col., 1994). En el gen de proteína de mielina periférica PMP22, un incremento en la dosis génica de dos a tres copias es su ficiente para producir la enfermedad de Charcot-Marie-Tooth (véase más adelante y fig. 16-8). Es probable que estos incremen

tos moderados en la expresión génica rara vez sean patógenos, aunque un grado similar de sensibilidad a la dosis de genes no identificados debe explicar muchas características de las trisomías cromosómicas (sección 16.8.2). La actividad excesiva de un producto génico anor mal, con transcripción y traducción normal del gen, puede produ cir efectos similares.

16.5.3 Los cambios cualitativos en el producto de un gen pueden causar ganancia de función Aunque las ganancias de función de verdad nuevas son muy ra ras en enfermedades hereditarias, las mutaciones activadoras que

16.6

PATOLOGÍA MOLECULAR: DEL GEN A LA ENFERMEDAD

modifican las respuestas de señalamiento celular muy a menudo producen fenotipos dominantes. Los receptores hormonales aco plados a la proteína G proveen buenos ejemplos. Muchas hor monas ejercen sus efectos en células blanco por enlace a los dominios extracelulares de receptores transmembrana. El enlace del ligando da lugar a que la cola citoplásmica del receptor cata lice la conversión de una proteína G inactiva (enlace GDP) en una forma activa (enlace GTP) y ello releva la señal adicional mente al estimular la ciclasa de adenilato. Algunas mutaciones ocasionan que los receptores activen la ciclasa de adenilato inclu sive en ausencia de ligando. ► En la pubertad precoz masculina familiar (MIM 176 410: ini cio de la pubertad cerca de los cuatro años de edad en los niños afectados) se encuentra un receptor de hormona luteinizante con actividad constitucional. ► La hiperplasia tiroidea autosómica dominante puede deberse a una mutación activadora en el receptor de hormona estimulan te de la tiroides (véase MIM 275 200). ► La condrodistrofia metafisaria de Jansen (MIM 156 400: un trastorno del crecimiento) puede ocasionarla un receptor de hormona paratiroidea con actividad constitucional. ► Una proteína Gsa constitucionalmente activa (parte del recep tor que acopla proteína G) causa el síndrome de McCune-Albright o displasia fibrosa poliostósica (DFP) (PFD, MIM 174 800). La DFP se conoce como un padecimiento somático só lo en mosaicos -las mutaciones constitucionales podrían ser le tales-. Según los tejidos que portan la línea celular mutante, el resultado es displasia fibrosa poliostósica, manchas de café con leche, precocidad sexual y otras endocrinopatías hiperfúncionales. Las mutaciones con pérdida de función del mismo gen suelen causar una enfermedad distinta, la osteodistrofia here ditaria de Albright (véase cuadro 16-5).

16.6

Patología m olecular: del gen a la enferm edad

El punto inicial del pensamiento acerca de la patología molecular puede ser un gen o una enfermedad. Estas dos conductas se consi deran por separado en esta sección y la siguiente, aunque, por su puesto, el conocimiento total de la patología molecular reúne ambas.

16.6.1 En mutaciones con pérdida de función el efecto fenotípico depende del nivel residual de función génica Los cambios de secuencias del DNA que se describen en el cuadro 16-1 pueden ocasionar grados variables de pérdida de función. Mu chas sustituciones de aminoácidos no tienen efecto, o muy poco, en tanto que algunas mutaciones suprime por completo la función. Una mutación puede presentarse en una o ambas copias de un gen. A menudo las personas con padecimientos autosómicos recesivos son heterocigotas compuestas, con dos mutaciones diferentes. Si las dos mutaciones causan pérdida de función, pero en grados dife rentes, el alelo menos grave regirá el grado de función residual. La figura 16-7 representa cuatro posibles relaciones entre el ni vel de función génica residual y el fenotipo clínico.

475

M

5' > 3' <

CpG GpC

: : CpG— :r" GpC ■

— ~> 3' ? 5'

M

^

Duplicación de DNA

M 5'

3'

CpG

~

___

GpC~

~

C p G ~ . ...... ....... 3'

GpC~

5’

+ 5' ’m m sí'/í !.3'

CpG

:--g.^ M a n p G v:-';.‘a¿£asBiv^£» 3'

11 GpC -

GpC

~

M

CpG

M etilasa d e s o s té n CpG

——> 3' ' 5

3 5' 3 3' 3'

GpC

T

5'

M Fig. 16-5. Herencia del patrón de metilación CpG. La metilasa de sostén reconoce CpG hemimetilado en DNA recién replicado, lo que permite que el patrón de metilación CpG se herede (véase sección 10.4.2 y Bird, 2002).

A. Un padecimiento recesivo simple. Las personas heterocigotas para una mutación que suprime del todo la función génica son normales en cuanto a fenotipo, a condición de que el alelo res tante no sea muy defectuoso. B. Un padecimiento dominante causado por haploinsuficiencia. En realidad esta situación simple es rara. Si una reducción de 50% en el producto génico causa síntomas, una disminu ción más grave quizá tenga efectos más graves. C. Un padecimiento recesivo de gravedad gradual. Entre múlti ples ejemplos se encuentran: • mutantes en el gen de la fosforribosiltransferasa de guanina e hipoxantina (HPRT) ligado a X. La extensión de la acti vidad de la enzima residual en mutantes se correlaciona bien con el fenotipo clínico de varones afectados (cuadro 16-4); • números de copias reducidos de un gen de globina a produ cen efectos cada vez más graves. Como se muestra en la fi gura 16-2, la mayoría de las personas tiene cuatro copias del gen de globina a (aa/ aa). Las personas con tres copias (aa/ a—) son sanas; quienes poseen dos (sea la fase a —l a —o a a /~) sufren talasemia a leve; las que sólo tienen un gen (a-/—) padecen la enfermedad grave, en tanto que la ausen cia de todos los genes a (- / —) causa hidropesía fetal mortal. D. Varios fenotipos. La disminución de la función residual de un gen puede extender el fenotipo y tal vez causar un padecimien to con un nombre clínico distinto. Según la posición de los umbrales, pueden surgir varias situaciones diferentes:

476

CAPITOLO DIECISÉIS

PATOLOGÍA MOLECULAR

Recuadro 16-6. Patología m olecular de los síndrom es de Prader-W illi y d e A ngelm an Los síndromes de Prader-Willi (SPW) y de Angelman (SA) se deben a pro blemas con genes diferencialmente con improntas en 15q11-q13. Ejem plifican la patología m olecular com plicada que se relaciona con agrupaciones de genes con improntas (Nicholls y Knepper, 2001). ► Síndrome de Prader-WIII (SPW) (MIM 176 260: retraso mental, hipotonía, obesidad notable, hipogenitalismo masculino) lo ocasiona la fal ta de función de genes que sólo se expresan del cromosoma paterno. ► Síndrome de Angelman (SA) (MIM 105 830: retraso mental, falta de habla, retraso del crecimiento, hiperactividad, risa inapropiada) se de be a falta de función de un gen enlazado de manera cercana que se expresa sólo del cromosoma materno. Algunos niños con SA tendrán dos copias funcionales de los genes del SPW, y viceversa, pero esta expresión excesiva no parece tener ningún efecto fenotípico.

► A veces el mecanismo de improntación es erróneo. Ambos crom oso mas 15 homólogos llevan el mism o patrón de metilación específico del padre, aunque estudios de marcador muestran que se originan de diferentes padres. Estos casos interesantes son causados por dele ciones pequeñas que definen elementos de control de improntación de SPW y SA no superpuestos. ► El SA puede deberse por completo a falta de expresión del gen UBE3A ya que algunos casos hereditarios tienen estructura e improntación cromosómica normales, pero mutaciones de punto en este gen. El SPW es más complejo. El cromosoma paterno codifica un transcrito inmenso (hasta 460 kb y 148 exones) con múltiples formas de em palme. Los 10 primeros exones codifican dos proteínas, SNURF y SNRPN, en tanto que los exones corriente abajo carecen de marcos de lectura abiertos pero algunos de los intrones codifican RNA nucleolares pequeños (snoRNA) que forman parte de la maquinaria de empalme. La ausencia de snoRNA puede ocasionar los síntomas del síndrome de Prader-Willi (SPW). La parte corriente abajo del transcri to se superpone en el gen UBE3A de la cadena opuesta y tal vez ac túa como un RNA antisentido, io que previene la transcripción de UBE3A del cromosoma paterno (Runte y cois., 2001).

Como se muestra en el cuadro, una variedad de acontecimientos puede conducir a falta de una copia paterna (SPW) o materna (SA) de las 15 se cuencias del cromosoma importante. ► La causa más frecuente son deleciones nuevas de 4 a 4.5 Mb entre repeticiones de flanqueo 15q11-q13. Las deleciones en el crom oso ma paterno causan SPW: las deleciones de la misma región en el cro mosoma materno producen SA. ► Disomía uniparentai, se detecta cuando los estudios de marcador de ONA muestran que una persona con cromosomas aparentemente nor males heredó ambos homólogos de un par particular (número 15 en este caso) de un padre. La causa usual es trisomía de rescate. Un conceptus con trisomía 15 se desarrolla hasta una etapa multicelular; en condiciones normales moriria, pero si una no disyunción mitótíca al azar (sección 2.5.2) produce una célula con sólo dos copias del cromosoma 15 en una etapa del desarrollo lo bastante temprana, esa célula puede proseguir para form ar un niño completo que sobrevive. Casi todos los conceptus con trisomía 15 son 15M15M15P. Una oca sión de cada tres, la pérdida aleatoria de un cromosoma 15 producirá un feto con disomía uniparentai materna, 15M15M. Cuando cualquier cromosoma 15 paterno falta, el feto tendrá síndrome de Prader-Willi.

Orígenes de los síndromes de Prader-Willi y Angelman Acontecimiento

Proporción de SPW

Proporción de SA

Deleciones

~ 75%

75%

Disomía uniparentai

~ 20%

3%

Errores de improntación

~ 2%

5%

Mutaciones de punto

No se observan

15% (en el genUBE3A)

Cuadro 16-3. Mecanismos de mutaciones de ganancia de función. Disfunción

Gen

Enfermedad

MIM núm.

Expresión excesiva

PMP22

Enfermedad de Charcot-Marie-Tooth

118200

Receptor “encendido” permanentemente

GNAS

Enfermedad de McCune-Albright

174800

Adquisición de nuevo sustrato (alelo Pittsburgh)

Pl

Deficiencia de antitripsina a !

107400

Canal iónico abierto de modo inapropiado

SCN4A

Paramiotonía congénita

168300

Multímeros con estructura anormal

C0L2A1

Osteogénesis imperfecta

Varios

Agregación de proteínas

HD

Enfermedad de Huntington

143100

Gen quimérico

BCR-ABL

Leucemia mieloide crónica

151410

• Varios padecimientos recesivos relacionados pueden deberse a reducciones sucesivas de la función génica en un locus ais lado. Por ejemplo, la matriz extracelular es rica en proteoglucanos sulfatados, como el sulfato de heparán y el sulfato de condroitina, y los defectos en el transporte de sulfato inter fieren con el desarrollo esquelético. Las mutaciones con pér-

dida de función del transportador de sulfato DTDSTocasio nan cuatro displasias esqueléticas autosómicas recesivas rela cionadas: displasia diastrófica (MIM 226 600), displasia epifisaria múltiple 4 (MIM 226 900), atelosteogénesis II (MIM 256 050) y acondrogénesis tipo IB (MIM 600 972) de acuerdo con la extensión de la pérdida (Karniski, 2001).

16.6

PATOLOGÍA MOLECULAR: DEL GEN A LA ENFERMEDAD

477

Fig. 16-6. Mutación hereditaria que ocasiona la adquisición de una función nueva por una proteína La metionina 358 en el centro reactivo de la antitripsina a ! actúa como un “ señuelo” para elastasa. La elastasa corta el enlace péptido entre Met358 y Ser359, y da lugar a que los dos residuos se separen 65 Á, como se muestra aquí (esferas verdes). La elastasa es atrapada e inactivada. La variante Pittsburgh tiene una mutación de sentido erróneo M358R que reemplaza el señuelo de metionina con arginina. Esto destruye la afinidad por la elastasa pero crea un señuelo para trombina. Como una antitrombina nueva con actividad constitutiva, la variante Pittsburgh produce un trastorno hemorrágico letal. Imagen de la University of Geneva ExPASy molecular biology World Wide Web server.

(MIM 220 400: problemas cardiacos y pérdida de la audi ción) en homocigotos. Sin embargo, una mutación dominante negativa en el mismo gen produce el síndrome de RomanoWard que se hereda en forma dominante (MIM 192 500: arritmia cardiaca). En oocitos de Xenopus transfectados, los canales iónicos Romano-Ward tienen alrededor de 20% de la actividad normal, pero los canales iónicos de pacientes

Una pérdida de 50% tal vez no tenga efecto; una pérdida un poco mayor, causada por efectos dominantes negativos, pue de producir un padecimiento dominante; en tanto que la pérdida total de función ocasiona un padecimiento recesivo más grave. Las mutaciones con pérdida de función simples del canal KVLQT1 K+ no tienen efecto en heterocigotos, pe ro originan el síndrome recesivo de Jervell y Lange-Nielsen

Sin efecto

E nferm edad

A) L

Sin efecto

E nferm edad

B) i

Sin efecto

E nferm edad

Leve ----------------------- G rave

C)

Sin efecto

100

Efecto en el sistema A , E fecto en el sis te m a A + B

50

Nivel d e función g è n ic a residu al (%) Fig. 16-7. Cuatro posibles relaciones entre pérdida de la función y el fenotipo clínico. Véase sección 16.6.1 para el comentario.

478

CAPÍTULO DIECISÉIS

PATOLOGÍA MOLECULAR

JLN carecen por completo de función (Wollnik y col,, 1997). • Las mutaciones en el mismo gen pueden producir dos o más padecimientos dominantes, el más leve por haploinsuficiencia simple y las formas más graves mediante efectos dominantes negativos. Esto ocurre en los genes COL1AI o C0L1A2que codifican colágena tipo I (fig. 16-4). Las mutaciones en es tos genes suelen producir osteogénesis imperfecta (OI: enfer medad de huesos frágiles). Los cambios de marco y las mutaciones sin sentido producen OI tipo 1, la forma más le ve, en tanto que en las sustituciones de aminoácidos en uni dades repetidas Gli-X-Y se observan los tipos más graves de OI, II, III y IV. La relación genotipo-fenotipo es muy sutil. Las sustituciones de glicina por un aminoácido más volumi noso en la unidad Gli-X-Y tienen un efecto dominante ne gativo al interrumpir el empacamiento estrecho de la hélice triple de colágena. La hélice se ensambla a partir del extremo terminal C y la sustitución de glicina cerca de ese extre mo tiene un efecto más grave que las sustituciones cercanas al extremo terminal N. La omisión del exón 6 (de COL 1Al o C0L1A2) tiene un efecto muy diferente. El sitio de corte del propéptido terminal N se pierde y se produce una colá gena anormal que ocasiona el síndrome de Ehlers-Danlos tipo VII (MIM 130 060; laxitud de la piel y las articulacio nes). Una función diferente se perdió y dio por resultado un fenotipo distinto.

16.6.2 Las mutaciones con pérdida de función y ganancia de función en el mismo gen causarán diferentes enfermedades Ya se comentó que las mutaciones con pérdida de función en el gen PAX3 ocasionan las anormalidades del desarrollo del síndrome de Waardenburg tipo 1 (fig. 16-1). Un fenotipo por completo diferen te se observa cuando una translocación cromosómica adquirida crea un gen quimérico nuevo por fusión de PAX3 a otro gen de fac tor de transcripción, FKHR, en una célula somática. La ganancia de función de este factor de transcripción híbrido origina el desarrollo del tumor de la niñez rabdomiosarcoma alveolar (cuadro 17-3). Un ejemplo notable se relaciona con el gen RET (Manié y cois., 2001). RET codifica un receptor que abarca la membrana celular. Cuando su ligando (GDNF) se enlaza al dominio extracelular indu ce la dimerización de los receptores, que luego transmiten la señal al interior de la célula por medio de módulos de cinasa de tirosina en su dominio citoplásmico. Una variedad de mutaciones con pérdida de función -cambios de marco, mutaciones sin sentido y sustitucio

nes de aminoácidos que interfiere con la maduración postraduccional de la proteína RET- son una causa de enfermedad de Hirschsprung (MIM 142 623; estreñimiento rebelde por ausencia de ganglios en téricos en el intestino; véase sección 15.6.2). Ciertas mutaciones en sentido erróneo muy específicas en el gen RET se observan en un grupo del todo distinto de enfermedades, el carcinoma medular de la tiroides familiar y la neoplasia endocrina múltiple tipo 2 relacio nada pero más extensa. Éstas son mutaciones con ganancia de fun ción que producen receptores que reaccionan en exceso al ligando o que tienen actividad constitucional y dimerizan inclusive en ausen cia de ligando. Como hecho curioso, algunas personas con mutacio nes en sentido erróneo que afectan la cisteína 618 o 620 sufren tanto cáncer de la tiroides como enfermedad de Hirschsprung —pérdida y ganancia de función simultánea—. Esto recuerda que la pérdida de función y la ganancia de función no son simples cantidades numé ricas; las mutaciones pueden tener diferentes efectos en los distintos tipos de células en que un gen se expresa. El cuadro 16-5 incluye una lista de varios casos en que las mu taciones en un gen aislado pueden originar más de una enferme dad. Por lo general la ganancia de función mutante produce una proteína de calidad anormal. En ocasiones un efecto de dosis sim ple puede ser patógeno -un ejemplo es el gen de la proteína de mielina periférica PMP22-. Cruzamientos desiguales entre secuencias repetidas en el cromosoma 17pl 1 crean duplicaciones o deleciones de una región de 1.5 Mb que contiene el gen PMP22 (fig. 16-8). Los portadores heterocigotos de la deleción o duplicación tienen una copia o tres copias respectivamente de este gen. Las personas que sólo tienen una copia sufren neuropatía hereditaria con paráli sis por presión o neuropatía tomaculosa (MIM 162 500), en tanto que, como ya se mencionó, las personas con tres copias padecen una neuropatía clínicamente diferente, la enfermedad de CharcotMarie-Tooth 1A (CMT1A; MIM 118 220).

16.6.3 La variabilidad entre familias es evidencia de genes modificadores o efectos al azar Muchos padecimientos mendelianos son clínicamente variables aun entre los miembros afectados de la misma familia que llevan justo la misma mutación. La variabilidad intrafamiliar debe ser causada por cierta combinación de los efectos de otros genes no en lazados (genes modificadores) y por efectos ambientales (inclusive acontecimientos al azar). Como se comentó, los fenotipos que de penden de haploinsuficiencia son en especial sensibles a los efectos de modificadores (sección 16.4.2). El síndrome de Waardenburg es un ejemplo típico: la figura 16-1 muestra evidencias de que este pa decimiento dominante se debe a haploinsuficiencia y la figura 4-5C presenta una variación intrafamiliar típica.

Cuadro 16-4. Consecuencias de la disminución de la función de la fosforribosiltransferasa de guanina e hipoxantina (HPRT). Actividad de HPRT (% del normal)

Fenotipo

> 60

Normal

8-60

Neurològicamente normal: hiperuricemia (gota)

1.6-8

Problema neurològico (coreoatetosis)

1.4-1.6

Síndrome de Lesch-Nyhan (coreoatetosis, automutilación) pero inteligencia normal

< 1.4

Síndrome clásico de Lesch-Nyhan (MIM 308 000; coreoatetosis, automutilación y retraso mental)

16.6 I PATOLOGÍA MOLECULAR: DEL GEN A LA ENFERMEDAD

479

Cuadro 1 6 -5 . Ejemplos de genes que causan más de una enfermedad. Gen

Localización

Enfermedades

Símbolo

MIM núm.

PAX3

2q35

Síndrome de Waardenburg tipo

WS1

193500

Rabdomiosarcoma alveolar

RMS2

268220

Fibrosis quística

CF

279700

Neoplasia endocrina múltiple tipo 2A

MEN2A

171400

Neoplasia endocrina múltiple tipo 2B

MEN2B

162300

Carcinoma medular de la tiroides

FMTC

155420

Enfermedad de Hirschsprung

HSCR

142623

Neuropatía de Charcot-Marie-Tooth tipo 1A

CMT1A

118220

Neuropatía tomaculosa

HNPP

162500

Paramiotonía congénita

PMC

168300

Parálisis hiperpotasémica periódica

HYPP

170500

Enfermedad de Creutzfeldt-Jakob

CJD

123400

Insomnio fatal familiar

FFI

176640

Osteodistrofia hereditaria de Albright

AH0

103580

Síndrome de McCune-Albright

PFD

174800

Síndrome de feminización testicular

TFM

313700

Atrofia muscular espinobulbar

SBMA

313200

CFTR

7p31,2

Ausencia bilateral de conductos deferentes RET

PMP22

SCN4A

10q11.2

17p11.2

17q23.1-q25.3

Miotonía congénita que responde a acetazolamida PRNP

GNAS

AR

20p12-pter

20q13.2

Xcen-q22

La variabilidad intrafamiliar es un gran problema en asesoría ge nética porque las familias que consideran la procreación desean sa ber con qué tanta gravedad se afectarán. En consecuencia hay una motivación tanto clínica como científica para identificar genes mo dificadores. El conocimiento de las interacciones bioquímicas del producto génico primario o los estudios en ratones en los que el análisis genético necesario es factible suelen sugerir los genes modi ficadores candidato (Nadeau, 2001). El trabajo de Easton y colabo radores (1993) respecto a la neurofibromatosis tipo 1 (MIM 162 200) muestra la forma en que el análisis estadístico de fenotipos clí nicos dentro de familias grandes puede proporcionar evidencias de genes modificadores. Tampoco debe ignorarse la función del azar puro, sobre todo en padecimientos con un fenotipo en placas. Los ejemplos comprenden la despigmentación en placas en el síndrome de Waardenburg y los números variables de neurofibromas o póli pos en la neurofibromatosis tipo 1 y la poliposis adenomatosa del colon (MIM 175 100) respectivamente. Un ejemplo de la forma en que un modificador pudiera actuar proviene de una familia interesante con herencia de albinismo ocular al parecer digénico (Morell y cois., 1997). La tirosina es una enzima fundamental de los melanocitos; su deficiencia conduce a albinismo oculocutáneo (MIM 203 100). Una variante frecuente del gen de tirosinasa, R402Q, codifica una enzima con actividad reducida, pero la actividad residual es suficientemente alta para que inclusive los homocigotos tengan una pigmentación normal. Sin embargo, en la familia publicada por Morell y colaboradores las personas que portaban una o dos copias de R402Q mostraron albinismo ocular (una forma leve de

albinismo oculocutáneo) cuando también tenían una mutación en MITF, un gen que participa en la diferenciación de los melanocitos. Las mutaciones en MITF solas no causan albinismo ocular.

16.6.4 Repeticiones en expansión inestables: una nueva causa de enfermedad Las repeticiones de nucleótidos en expansión inestables (mutacio nes dinámicas) fueron un mecanismo de enfermedad por comple to nuevo y sin precedente cuando se descubrieron por primera vez en 1991. El cuadro 16-6 muestra los ejemplos que se conocen en la actualidad. Originan dos preguntas mayores: ► ¿cuál es el mecanismo de la inestabilidad de la expansión? Esto se comenta en la sección 11.5.2; ► ¿por qué las repeticiones expandidas causan enfermedad? Este problema se analiza en este inciso. Una característica de las enfermedades originadas por repeticiones dinámicas es la anticipación -es decir, la edad de inicio es menor, la gravedad mayor, o ambas, en generaciones sucesivas-. Véase la sección 4.3.3 para una nota de advertencia respecto a la anticipa ción. En algunos casos alelos de tamaño intermedio no son patóge nos pero sí inestables y se expanden con facilidad hasta alelos de mutación completa (p. ej-, las repeticiones FRAXA de 50 a 200 unidades); en otros casos estos alelos sólo se expanden de manera muy ocasional (p. ej., alelos HD con 29 a 35 repeticiones). Las ex pansiones patógenas corresponden a dos clases principales:

480

CAPÍTULO DIECISÉIS í PATOLOGÍA MOLECULAR

Norm al

E n ferm ed ad d e C harcot-M arie-T ooth (CMT1A)

_ | -------------- U ----------- 1------------- m ------------------ y

_

N eu ro p atía to m a c u lo sa (HNPP)

------------------[

] -------------

H etero cigo to p a ra du plicación d e 1.5 Mb

H eterocigo to p a ra deleción

H om ocigoto p a ra du plicación d e 1.5 M b -en ferm edad g rave

Mutación de punto con

C lave: ■ PMP22 Mutación de punto activante

I-------■-------1 Límites d e región du plicada d e 1.5 Mb

Fig. 16-8. Efectos de la dosis génica con el gen PMP22 Casi todos los pacientes con enfermedad de Charcot-Marie-Tooth son heterocigotos para una duplicación de 1.5 Mb en 17p11.2, que incluye el gen para proteína de mielina periférica, PMP22 (cuadro a color). Un paciente homocigoto para la duplicación padeció la enfermedad muy grave. Algunos enfermos sólo tienen dos copias del gen PMP22, pero una copia lleva una mutación activante. La deleción o la mutación de pérdida de función del gen PMP22 se observa en pacientes con neuropatía tomaculosa (Patel y Lupski, 1994).

► repeticiones muy expandidas fuera de secuencias de codificación; ► expansiones moderadas de repeticiones CAG que codifican vías de poliglutamina en el producto génico.

Repeticiones muy expandidas fuera de secuencias de codificación En el síndrome de X frágil y en la ataxia de Friedreich, una repetición demasiado expandida origina pérdida de función porque suprime la transcripción. Lo mismo sucede en la expansión 12-mer en la epilep sia mioclónica juvenil. En cada caso la enfermedad a veces se debe a mutaciones con pérdida de función diferentes, más convenciona les en el gen. Estas mutaciones producen el fenotipo clínico idéntico a expansiones, aparte (posiblemente) de no mostrar anticipación. Otras repeticiones muy expandidas similares, como FRA16A (repeti ción CCG expandida) o FRA16B (una expandida minisatélite de 33 pb) no son patógenas, quizá porque no se localizan cerca de un gen importante. Tal vez las repeticiones suprimen la transcripción me diante la alteración de la estructura cromatínica local. En X frágil, es to conduce a metilación del promotor. La expansión grande en la distrofia miotónica es distinta. Pues to que nunca se ha encontrado otra mutación en un paciente con distrofia miotónica, debe haber algo muy específico respecto a la acción de la repetición CTG. En fecha reciente se aclaró que la prin cipal acción patógena (en DM1 y DM2) se da a través del enlace de mRNA y el secuestro de proteínas de enlace de CUG que se re quieren para el empalme correcto de otros transcritos. El empalme aberrante conduce a pérdida del canal de cloruro específico de músculo, entre otros transcritos (revisado por Tapscott y Thornton,

2001). También debe haber otros efectos porque el sitio de expan sión forma parte del islote CpG del gen adyacente, S1X5 (MIM 600 963) y la expansión reduce la expresión de este gen. Al parecer el gen SCA8 (Koob y cois., 1999) codifica un RNA no traducido que actúa como un regulador antisentido de un gen en la otra cadena del DNA (similar a los transcritos improntos que se mencionan en la sección 16.4.4). La forma en que la expansión produce la enfermedad se desconoce -de hecho no es del todo cier to que este cambio sea patógeno.

Expansiones modestas de repeticiones CAG dentro de regiones de codificación que codifican vías de poliglutamina dentro del producto génico Las características comunes de ocho enfermedades causadas por expansión de una repetición CAG inestable dentro de un gen in cluyen: ► enfermedades neurodegenerativas de inicio tardío y, excepto por la enfermedad de Kennedy, todas se heredan en forma do minante; ► aún no se encuentra otra mutación en el gen que cause la en fermedad; ► el alelo expandido se transcribe y traduce; ► la repetición de trinucleótidos codifica una vía de poliglutami na en la proteína; ► un umbral crítico del tamaño de la repetición abajo del cual es ta última no es patógena; cuando se excede, la repetición cau sa enfermedad;

16.6

PATOLOGÍA MOLECULAR: DEL GEN A LA ENFERMEDAD

481

Cuadro 16-6. Enfermedades causadas por repeticiones expandidas de nucleótidos inestables. Enfermedad

MIM núm. Modalidad de herencia

Localización Localización del gen de la repetición

Secuencia repetida

Repetición estable núm.

Repetición Inestable núm.

1. Expansiones de repeticiones muy grandes fuera de secuencias de codificación: X frágil sitio A (FRAXA)

309550

X

Xq27.3

5'UTR

(CGG)n

6-54

200-1000+

X frágil sitio E (FRAXE)

309548

X

Xq28

Promotor

(CCG)n

6-25

200+

Ataxia de Friedreich (FA)

229300

AR

9q13-q21.1

Intrón 1

(GAA)n

7-22

200-1700

Distrofia miotónica 1 (DM1)

160900

AD

19q13

3'UTR

(CTG)n

5-35

50-4000

Distrofia miotónica 2 (DM2)

602668

AD

3q21

Intrón 1

(CCTG)n

12

75-11 000

Ataxia espinocerebelosa 8

603680

AD

13q21

RNA no traducido (CTG)n

16-37

11 0-5 00+

Ataxia espinocerebelosa 11

604432

AD

15q14-21

Intrón 9

(ATTCT)n

10-22

Hasta 22 kb

Epilepsia mioclónica juvenil (JME)

254800

AR

21q22.3

Promotor

(CCCCGCCCCGCG)n 2-3

40-80

2. Expansiones moderadas de repeticiones CAG en secuencias de codificación: Enfermedad de Huntington (HD) 143100

AD

4p16.3

Codificación

(CAG)n

6-35

3 6 -1 0 0 +

Enfermedad de Kennedy

313200

XR

Xq21

Codificación

(CAG)n

9-35

38-62

SCA1

164400

AD

6p23

Codificación

(CAG)n

6-38

39-83

SCA2

183090

AD

12q24

Codificación

(CAG)n

14-31

32-77

Enfermedad de Machado-Joseph (SCA3)

109150

AD

14q32.1

Codificación

(CAG)n

12-39

62-86

SCA6

183086

AD

19p13

Codificación

(CAG)n

4-17

21-30

SCA7

164500

AD

3p12-p21.1

Codificación

(CAG)n

7-35

37-200

SCA17

607136

AD

6q27

Codificación

(CAG)n

25-42

47-63

Atrofia dentatorrubropalidoluisiana (DRPLA)

125370

AD

12p

Codificación

(CAG)n

3-35

49-88

SCA, ataxia espinocerebelosa

► cuanto más grande es la repetición, por arriba del umbral, más temprana es la edad promedio de inicio (no es posible establecer predicciones en pacientes individuales, pero se observa una co rrelación estadística clara).

(gen HOXD13, MIM 186 000). Éstas no son mutaciones dinámi cas y no pertenecen a las repeticiones expandidas inestables clásicas.

La mutación del receptor de andrógeno en la enfermedad de Ken nedy provee evidencias claras que indican que las enfermedades por repetición de CAG comprenden una ganancia de función específi ca. Las mutaciones con pérdida de función en este gen se conocen bien y causan insensibilidad al andrógeno o síndrome de feminiza ción testicular (MIM 300 068), una falla de la diferenciación sexual masculina. En contraste, la expansión de poliglutamina ocasiona una enfermedad neurodegenerativa muy distinta, aunque con frecuen cia los pacientes también muestran feminización menor. El meca nismo patógeno que comparten abarca formación de agregados proteínicos (véase más adelante). Además de las repeticiones expandidas inestables clásicas, algu nas enfermedades pueden deberse a expansiones repetidas de trinucleótidos más cortas y bastante estables. Los ejemplos incluyen distrofia muscular bucofaríngea (gen PABP2, MIM 602 279), seudoacondroplasia (gen COMP, MIM 600 310) y simpolidactilia

Una PCR aislada establece el diagnóstico en enfermedades por repetición de poliglutamina. Las expansiones muy grandes en la distrofia miotónica requieren Southern blotting. La X frágil se diag nostica con un método de Southern blotting que depende tanto del tamaño como del estado de metilación del gen FRAXA. Para deta lles más amplios y fotografías de gel, véase la sección 18.4.3 y la fi gura 18-12.

Diagnóstico de laboratorio de repeticiones expandidas

16.6.5 La agregación de proteínas es un mecanismo patógeno frecuente en enfermedades por ganancia de función En fecha reciente se evidenció que la formación de agregados pro teínicos es una característica que varias enfermedades neurológicas que se inician en adultos comparten, inclusive las enfermedades

482

CAPÍTULO DIECISÉIS

PATOLOGÍA MOLECULAR

por poliglutamina antes descritas y las de Alzheimer, Parkinson, Creutzfeldt-Jakob y el grupo heterogéneo conocido como amiloidosis. Aunque la historia completa todavía no se esclarece, surge un tema común. Moléculas proteínicas globulosas semejan gotas de aceite, con los residuos hidrofóbicos en el interior y grupos polares en el exterior. El doblez correcto es un proceso crítico y muy espe cífico, y entre todas las posibles secuencias proteínicas se seleccio nan proteínas que ocurren de manera natural, en parte por su capacidad para doblarse de manera correcta. Las proteínas mutantes pueden ser más propensas al doblamiento erróneo. Las moléculas mal dobladas con grupos hidrofóbicos expuestos pueden agregarse entre sí o con otras proteínas; esto resulta un poco tóxico para las neuronas y puede serlo para otras células. En ocasiones parece que un cambio de conformación puede propagarse a través de una po blación de moléculas proteínicas, que se convierten de una confi guración natural estable en una nueva forma con diferentes propiedades en un proceso tal vez análogo a la cristalización. La conducta de las proteínas prión (Prusiner y cois., 1998) es el ejem plo más notable. El doblez erróneo puede iniciarse con un doblez erróneo al azar de una molécula con estructura normal recién sin tetizada (casos esporádicos), una secuencia mutante con una mayor propensión al doblez erróneo (una enfermedad genética) o una molécula doblada erróneamente adquirida en alguna forma del am biente (casos infecciosos). Por consiguiente esta vía final compartida une entre sí un grupo de enfermedades con orígenes muy distintos (Perurz y Windle, 2001; Bucciantini y cois., 2002).

16.6.6 La heteroplasmia y la inestabilidad complican la relación entre genotipo y fenotipo en las mutaciones mitocondriales Las mutaciones de punto, las deleciones o las duplicaciones que supri men la función de genes en el genoma mitocondrial densamente em pacado (fig. 9-2) se relacionan con una gama amplia de enfermedades degenerativas que incluyen sistema nervioso central, corazón, múscu lo, sistema endocrino, rifiones e hígado. Las células contienen muchas moléculas de mtDNA. Pueden ser homoplásmicas (cada molécula de mtDNA es igual) o heteroplásmicas (una población mixta de DNA mitocondrial normal y mutante). A diferencia del mosaicismo, la heteroplasmia puede transmitirse de la madre al niño a través de un óvulo heteroplásmico. Con frecuencia tanto las mutaciones como la heteroplasmia parecen evolucionar con el tiempo en un individuo. La misma persona puede llevar tanto deleciones como duplicaciones y es posible que la proporción cambie con el tiempo (Poulton y cois., 1993). A menudo se observa el mismo cambio de secuencia en perso nas con diferentes síndromes y es muy difícil establecer correlacio nes fenotipo-genotipo. Por ejemplo, 50% de las personas con neuropatía óptica hereditaria de Leber (MIM 535 000: pérdida sú bita irreversible de la visión) tienen una sustitución G-»A en el nucleótido 11 778 del genoma mitocondrial. Casi todos estos pa cientes son homoplásmicos, pero alrededor de 14%, con la misma gravedad de la afección, es heteroplásmico. Aun en familias homoplásmicas el padecimiento es muy variable; la penetrancia total es de 33 a 60% y 82% de los individuos afectados lo constituyen va rones (Wallace y cois., 2001). Las posibles razones de la mala corre lación incluyen: ► la heteroplasmia puede ser específica de tejido y es posible que el que se examine (por lo general sangre o músculo) no sea el tejido crítico en la patogénesis;

► el mtDNA es mucho más variable que el DNA nuclear y algu nos síndromes pueden depender de una combinación de la mutación informada con otras variantes no identificadas; ► al parecer algunas enfermedades mitocondriales son de natura leza cuantitativa: se acumulan cambios mutacionales pequeños que reducen la capacidad de la mitocondria para generar ener gía y a cierto umbral de déficit surgen síntomas clínicos; ► muchas funciones mitocondriales son codificadas por genes nucleares (véase recuadro 9-2), de manera que la variación nu clear puede ser una causa importante o modificar el fenotipo mitocondrial. La base de datos MITOMAP de mutaciones mitocondriales (www.mitomap.org) contiene una buena discusión general, aunada a cua dros de datos extensos que muestran tan sólo lo considerable que es el desafío de predecir fenotipos.

16.7

Patología m olecular: de la enferm edad al gen

Con mucha frecuencia el punto de inicio del pensamiento acerca de la patología molecular es una enfermedad en lugar de un gen. Este enfoque proporciona un punto de vista alternativo de las co rrelaciones genotipo-fenotipo. El mensaje total es que no se debe ser inocente cuando se especula respecto al defecto génico subya cente a un síndrome mendeliano.

16.7.1 Es posible que el gen subyacente a una enfermedad no sea el obvio Las mutaciones que conducen a deficiencia de una proteína no siempre se encuentran en el gen estructural que codifica la proteína La agammaglobulinemia (falta de inmunoglobulinas, que conduce a inmunodeficiencia clínica) suele ser mendeliana. Es natural supo ner que la causa serían mutaciones en los genes de inmunoglobulina, pero estos últimos se localizan en los cromosomas 2, 14 y 22, y las agammaglobulinemias no se mapean en estos sitios. Muchas formas son ligadas a X. Si se recuerdan los múltiples pasos nece sarios para cambiar un polipéptido recién sintetizado en una pro teína que funciona en forma correcta (sección 1.5), esta falta de correspondencia uno a uno entre la mutación y el gen de la proteí na estructural no debe ser una gran sorpresa. Las fallas en el proce samiento del gen de inmunoglobulina, en la maduración de la célula B o en el desarrollo total del sistema inmunitario producirán inmunodeficiencia.

En ocasiones un defecto génico puede ocasionar múltiples defectos enzimáticos La enfermedad de célula I o mucolipidosis II (MIM 252 500) se caracteriza por deficiencias de múltiples enzimas lisosómicas. El principal defecto no se encuentra en el gen estructural para ningu na de estas enzimas sino en una enzima, la 1-fosfotransferasa de Nacetilglucosamina, que fosforila residuos de mañosa en moléculas de la enzima glucosilada. La fosfomanosa es una señal que dirige las enzimas a lisosomas; cuando falta, los lisosomas carecen de una se rie completa de enzimas.

16.7

PATOLOGÍA MOLECULAR: DE LA ENFERMEDAD AL GEN

A menudo las mutaciones sólo afectan un subgrupo de los tejidos en que el gen se expresa El patrón de expresión específico de un gen es un mal indicador de predicción de los efectos clínicos de las mutaciones. No es proba ble que los tejidos en que un gen no se expresa sufran patología pri maria, pero lo contrario no es cierto. Por lo general sólo se afecta un subgrupo de tejidos de expresión. El gen HD se expresa con amplitud, pero la enfermedad de Huntington sólo afecta regiones limitadas del cerebro. El gen de retinoblastoma (sección 17.6.1) se expresa de modo ubicuo, pero sólo la retina suele afectarse por mutaciones heredadas. Esto también se observa con firmeza en trastornos lisosómicos. Se requiere la expresión gènica en un tipo de célula aislada, el macròfago, que se encuentra en muchos teji dos. Sin embargo, no todos los tejidos que contienen macrófagos son anormales en los pacientes afectados. No es difícil encontrar explicaciones: ► los genes no siempre se expresan sólo en los tejidos en que se requieren. A condición de que la expresión no cause daño, pue de haber poca presión de selectividad para suspender la expre sión, inclusive en los tejidos en que la expresión no confiere beneficio; ► la pérdida de una función gènica afectará algunos tejidos mu cho más que otros, a causa las funciones y necesidades metabólicas variables de diferentes tipos de células y los grados variables de redundancia funcional en la red de interacciones dentro de una célula. Además del recambio celular que es erró neo en el cáncer, es probable que el concepto del “gen celador” de la genética del cáncer (sección 17.7.2) sea aplicable a mu chas otras funciones y disfunciones celulares; ► cualquier ganancia de función puede ser patológica para cier tos tipos celulares y perjudicial para otros; véase el ejemplo del gen RET (sección 16.6.2).

16.7.2 La heterogeneidad de locus es la regla en lugar de la excepción Heterogeneidad de locus describe la situación en que la misma enfermedad puede ser causada por mutaciones en varios genes di ferentes. Es importante pensar en la función biológica del produc to gènico, y las moléculas con que interactúa, en lugar de esperar una relación uno a uno entre genes y síndromes. Como se comen ta en la sección 4.2.4, los síndromes clínicos suelen resultar de fa lla o mal funcionamiento de una vía del desarrollo o fisiológica; de igual forma, muchas estructuras y funciones celulares dependen de agregados proteínicos de múltiples componentes. Si se requiere el funcionamiento correcto de varios genes, entonces las mutacio nes en cualquiera de ellos pueden causar el mismo fenotipo, o uno muy similar. Una vez más las colágenas (fig. 16-4; sección 16.6.1) brindan buenos ejemplos. Ya se comentó que la colágena tipo I, la principal colágena de piel, huesos, tendones y ligamentos, está formado por triples hélices que comprenden dos cadenas a ( l) y una a(2). Las mutaciones en cualquiera de los genes COL1A1 o COL1A2 causan el mismo trastorno, osteogénesis imperfecta dominante. La coláge na tipo II forma fibrillas en cartílago y otros tejidos, inclusive el vitreo del ojo. Está constituida por hélices homotriméricas de cade nas COL2A1. Diferentes mutaciones en el gen C0L2A1 producen una gama de superposiciones de displasias esqueléticas que abarcan

483

el síndrome de Stickler, la displasia espondiloepifisaria y la displasia de Kniest. Un fenotipo similar puede resultar de mutaciones en la colágena tipo XI, un componente menor de la fibrilla tipo II. En todos estos casos el síndrome que se produce depende del efec to total en las fibrillas finales de colágena, en lugar del gen que es tá mutado.

16.7.3 Mutaciones en diferentes miembros de una familia génica pueden producir una serie de síndromes relacionados o superpuestos Las mutaciones en miembros de una familia génica con funciones parcialmente superpuestas pueden producir un grupo de fenoti pos parcialmente superpuestos que resultan difíciles de diferenciar en la clínica. Las mutaciones que afectan los receptores del factor de crecimiento de fibroblastos ilustran este hecho. Los 10 factores de crecimiento de fibroblastos rigen procesos importantes del desa rrollo a través de cuatro receptores de superficie celular, FGFR1 a 4. Casi todos los tejidos expresan múltiples FGFR, inclusive va riantes empalmadas de cada uno. Los FGFR son receptores de cinasas de tirosina que actúan en forma similar a la proteína RET descrita: la transducción de señal requiere dimerización del recep tor y esto puede comprender homodímeros o heterodímeros. Las mutantes de FGFR podrían producir un equilibrio alterado de las formas de empalme, cambiar el equilibrio de homodímeros y heterodímeros, reducir el señalamiento por un efecto negativo do minante o producir dímeros con actividad constitucional. Por tan to existe la posibilidad de efectos genéticos complejos. Varias mutaciones específicas de los genes de receptor originan una serie de trastornos dominantes del crecimiento esquelético (fig. 16-9). Las mutaciones en FGFR2 en 10q26 se encuentran en los síndromes de Crouzon, Jackson-Weiss, Pfeiffer y Apert, en tanto que distintas mutaciones específicas en FGFR3 en 4p l6 producen acondroplasia, displasia tanatofórica tipos 1 y 2, hipocondroplasia, síndrome de Crouzon con acantosis nigricans y craneosinostosis coronal de Muencke. Algunos pacientes con síndrome de Pfeiffer tienen una mutación en FGFR1. Para las descripciones clínicas, re ferencias y una introducción a la patología molecular de estos síndromes, véanse OMIM y Wilkie (1997). La naturaleza muy es pecífica de las mutaciones sugiere una ganancia de función y está demostrado que las mutantes de acondroplasia, displasia tanatofó rica y de Crouzon producen receptores con grados variables de activación constitutiva (independiente del ligando) cuando se transfectan en ciertos tipos de células (Naski y cois., 1996).

16.7.4 Las clasificaciones clínica y molecular son herramientas alternativas para pensar acerca de las enfermedades y cada una es válida en su esfera Los trastornos del tejido conjuntivo que se deben a mutaciones del gen de colágena, un tema recurrente en este capítulo, ilustran la di ferencia entre las clasificaciones clínicas y moleculares de las enfer medades (cuadro 16-7). ► Todas las enfermedades mendelianas pueden clasificarse con base molecular, primero por el locus relacionado y segundo por el alelo mutante particular en ese locus. ► Las enfermedades genéticas también pueden clasificarse clíni camente según sus síntomas y pronóstico. Las categorías clínicas

484

CAPÍTULO DIECISÉIS í PATOLOGÍA MOLECULAR

que se definen en esta forma tal vez no correspondan con exac titud a una clasificación molecular, pero pueden ser más útiles para la asesoría y el tratamiento de pacientes. Los nombres clínicos no son sólo convenciones. Evolucionan confor me el conocimiento de la genética subyacente avanza -las enfermeda des se agrupan entre sí (distrofias musculares de Duchenne y de Becker) o se dividen (cáncer de mama BRCA1 del cáncer de mama es porádico)-. Para establecer el diagnóstico molecular es esencial una cla sificación molecular y puede posibilitar una asesoría más precisa -p. ej., sólo el análisis molecular podría mostrar que los padres no afecta dos que tienen más de un niño afectado por osteogénesis imperfecta son mosaicos germinales en lugar de portadores de una forma recesi va de osteogénesis imperfecta (OI)-. Sin embargo, una clasificación molecular plena no siempre tiene utilidad clínica; p. ej., aunque la OMIM incluye una lista de 11 locus que causan síndromes de Usher (sordera-ceguera recesiva), en clínica sólo es útil para distinguir tres ti pos, cuya gravedad es variable. Por consiguiente una clasificación molecular ilumina en lugar de superar la clasificación clínica.

16.8

Patología m olecular de trastornos crom osóm icos

16.8.1 Los síndromes de microdeleción unen la brecha entre síndromes de gen único y cromosómicos Si el genoma humano de 3 000 Mb contiene 30 000 genes, una deleción de alrededor de una megabase, que es muy pequeña para ob

servarse bajo el microscopio, aún puede incluir una docena más de genes. El análisis de FISH y el arreglo-HGC (secciones 2.4.2, 17.3.3) revelan números crecientes de estas anormalidades cromosómicas submicroscópicas (cuadro 16-8). Desde el punto de vista de la patología molecular, corresponden a tres clases: ► Síndromes de gen único, en el que todos los efectos fenotípicos se deben a deleción (o en ocasiones duplicación) de un gen único. Por ejemplo, el síndromes de Alagille (MIM 118 450) se observa en pacientes con una microdeleción en 20pl 1. Sin embargo, 93% de los enfermos con Alagille no tiene una dele ción, sino que por el contrario incluye mutaciones de punto en el gen JAG1 localizado en 2 0 p ll. En todos los casos la causa del síndrome es haploinsuficiencia para JAG1. ► Síndromes de gen contiguo, que se observan sobre todo en varones con deleciones del cromosoma X. El caso clásico fue el niño 'BB' que sufría distrofia muscular de Duchcnne (DMD (MIM 310 200), enfermedad granulomatosa crónica (MIM 306 400) y retinitis pigmentosa (MIM 312 600), aunadas a re traso mental (Francke y cois., 1985). Tenía una deleción cromosómica en Xp21 que eliminó un grupo de genes contiguos y de manera incidental brindó a los investigadores los medios para clonar los genes cuya ausencia ocasionó dos de sus enfermeda des, DMD y la enfermedad granulomatosa crónica (sección 14.4.2). Otro grupo de síndromes de gen contiguo muestra de leciones de punto de Xp. Deleciones cada vez más grandes eli minan más genes y añaden más enfermedades al síndrome (Ballabio y Andria, 1992). Las microdeleciones son hasta cier to punto frecuentes en algunas partes del cromosoma X (p. ej~

FGFR1 8p11

FGFR2 10q25

A CA

H

T2

T1

FGFR3 4 p 1 6

Señal péptida

Región ácida

ti

m

TM

Cinasa

Cinasa 2

Fig. 16-9. Correlaciones entre fenotipo y genotipo en mutaciones FGFR. Se muestran tres de los cuatros receptores de factor de crecimiento de fibroblasto altamente homólogo. Cada cinasa de tirosina receptora tiene tres dominios extracelulares similares a inmunoglobulina (obtenidos por puentes S-S), un dominio transmembrana (TM) y dominios de cinasa de tirosina intracelulares pareados. Las mutaciones de sentido erróneo muy específicas se relacionan con una serie de displasia esqueléticas (acondroplasia A, hipocondroplasia C, displasia tanatofórica tipos 1 y 2, T1 y T2) y síndromes de craneosinostosis (Apert Ap, Crouzon C, Jackson-Weiss JW, Muencke U Pfeiffer P). Otras mutaciones pueden ocasionar la enfermedad cutis girata de Beare-Stevenson (CA) y algunas mutaciones en el dominio Ig3 de FGFR2 se vinculan con síndromes de Crouzon, Jackson-Weiss y Pfeiffer en diferentes familias.

16.8 I PATOLOGÍA MOLECULAR DE TRASTORNOS CROMOSÓMICOS

Xp21, Xq proximal) pero raras o desconocidas en otros (como Xp22.1-22.2, Xq28). La deleción de ciertos genes individuales y las deleciones visibles en regiones abundantes en genes serían letales sin duda. ► Síndromes de aneuploidía segmentaria. Las microdeleciones autosómicas rara vez son síndromes de gen contiguo verdade ros. Por lo general el fenotipo en heterocigotos depende sólo de un subgrupo de los genes eliminados, los que son sensibles a dosis (fig. 16-10). Varios síndromes bien definidos se producen por microdeleciones nuevas recurrentes (Budarf y Emanuel, 1997). Las regiones propensas a deleción están flanqueadas por

485

repeticiones largas, que permiten recombinaciones alineadas de modo erróneo (fig. 11-7). A menudo las repeticiones contienen secuencias transcritas que pueden hacer una estructura cromatínica más abierta y propensa a combinación. Las inversiones de algunas de estas regiones de tamaño megabase ocurren como polimorfismos no patógenos comunes que pueden predisponer a la eliminación por pareamiento erróneo de las repeticiones de flanqueo (Giglio y cois., 2001). Resulta muy difícil identificar qué genes en la región eliminada causan qué partes del fenotipo de estos síndromes de microdeleción. Tres estrategias son posibles:

Cuadro 16-7A. Clasificación clínica de las enfermedades del tejido conjuntivo que se mencionan en el texto y en el cuadro 16-7B. Enfermedad

MIM núm.

Características

0I tipo I (dividida según hallazgos dentales en IA, IB, IC)

166200 (166240)

Fragilidad ósea leve a moderada; escleróticas azules; estatura normal; pérdida de la audición (50%)

OI tipo II

166210

Fragilidad ósea muy grave; letal perinatal

OI tipo III

(166230)

Fragilidad ósea moderada a grave; deformación progresiva; estatura muy corta; con frecuencia pérdida de la audición

OI tipo IV (dividida según hallazgos dentales en IVA, IVB)

166220

Fragilidad ósea leve a moderada; escleróticas normales; estatura variable

DEE

183900

Estatura baja, cuello corto, displasia espondiloepifisaria

Síndrome de Stickler

108300

DEE leve, paladar hendido, miopía intensa, pérdida de la audición

Displasia de Kníest

156550

Estatura baja desproporcionada; cuello corto; DEE, etcétera

SED tipo VII

130060

Articulaciones y piel laxas

01, osteogenesis imperfecta (enfermedad de huesos frágiles); DEE, displasia espondiloepifisaria; SED, síndrome de Ehlers-Danlos.

Cuadro 16-7B. Clasificación molecular de las enfermedades del tejido conjuntivo que se mencionan en el texto y en el cuadro 16-7A. Gen

Localización

Mutaciones

Sindrome

C0L1A1

17q22

Alelos nulos

0 l tipo I

Deleciones parciales; sustituciones en la terminal C

01 tipo II

Sustituciones en la terminal N

01 tipos I, III o IV

Deleción del exón 6

SED tipo VII

Mutaciones de empalme; deleciones de exón

01 tipo I

Mutaciones en la terminal C

01 tipos II, IV

Sustituciones en la terminal N

01 tipo III

Deleción del exón 6

SED tipo VII

Mutaciones de punto

DEE

Mutación sin sentido

Sindrome de Stickler

Defecto en la conversión

Displasia de Kniest

Sentido erróneo

Acondrogénesis II, displasia espondilometaepifisaria

Mutación de empalme

Sindrome de Stickler

C0L1A2

C0L2A1

C0L11A2

7q22.1

12q13

6p21.3

486

CAPÍTULO DIECISÉIS ! PATOLOGÍA MOLECULAR

► encontrar a las personas que tienen un componente del síndro me heredado como padecimiento mendeliano causado por mutación de un gen único dentro de la región candidato; ► encontrar a las personas que tienen microdeleciones más pe queñas de lo normal y que sólo muestran características parcia les del síndrome; ► eliminar la región correspondiente en el ratón: cruzar los rato nes con la deleción con ratones transgénicos para genes indivi duales de la región y correlacionar el fenotipo con la extensión de la haploinsuficiencia restante. El síndrome de Williams (SWL) (WLS; MIM 194 050) constituye un buen ejemplo de los problemas. Las personas con SWL tienen una cara reconocible, retraso del crecimiento, durante la lactancia pueden padecer hipercalcemia que pone en peligro la vida y a me nudo presentan estenosis aórtica supravalvular (EASV). Además suelen tener retraso mental moderado, casi del mismo grado que el de las personas con síndromes de Down, pero poseen un perfil cog noscitivo y una personalidad muy característicos. Son muy socia bles y con frecuencia muy musicales, hablan notablemente bien pero tienen una incapacidad específica para manipular formas, (ha bilidad constructiva visuoespacial). El SWL se debe a una deleción de 1.6 Mb, resultado de la recombinación entre repeticiones de flanqueo, en especial en personas heterocigotas para una inversión común de la región total (Osborne y cois., 2001). Se identificaron alrededor de 20 genes en la región eliminada (Tassabehji y cois., 1999). La identificación de los genes importantes entre todos los eliminados en el SWL podría mostrar un camino para identificar determinantes genéticos de la cognición y la conducta humanas normales. Como se mencionó (sección 16.4.1), la estenosis aórtica supra valvular (EASV) puede deberse a deleción o alteración del gen de elastina. Este gen se encuentra dentro de la región crítica de Wi-

lliams y sin duda la haploinsuficiencia para elastina es la causa de la estenosis aórtica supravalvular que se observa en el síndrome de Williams. Aunque es posible que las características faciales también se deban a una deficiencia de esta proteína de tejido conjuntivo, re sulta obvio que no es el caso porque las personas con mutaciones de elastina simples suelen tener EASV pero no presentan la cara de Williams. Hasta la fecha ninguna otra característica del síndrome se atribuye convincentemente a ninguno de los otros genes en la re gión. Al parecer las personas con deleciones parciales de la región tienen sólo EASV o el síndrome completo. Una pregunta interesan te es si sería factible reconocer en ratones el fenotipo de Williams. También otros síndromes por microdeleción se relacionan con con ductas específicas y por tanto el descubrimiento de los genes constitutivos de estos síndromes es un área de gran interés e inves tigación en la actualidad.

16.8.2 Los principales efectos de las aneuploidías cromosomicas pueden deberse a desequilibrios de dosis en unos cuantos genes identificables Es probable que las monosomías y las trisomías deban sus fenoti pos característicos a unos cuantos efectos génicos mayores super puestos en muchas alteraciones menores del desarrollo. Los genes en que 50% de aumento de la dosis tiene un efecto mayor deben ser muy raros y por consiguiente ha de ser posible identificar los pocos genes que causan las principales características, por ejemplo, del síndrome de Down (SD). Estudios de pacientes con transloca ciones muestran que la región crítica de SD se encuentra en 21 q22.2; las trisomías de otras partes del cromosoma 21 no ocasio nan SD. En esta región se identificaron cuando menos dos genes candidato para las características del síndrome de Down: DYRK, un gen cuyos homólogos en Drosophila y en el ratón (minicerebro)

Cuadro 16-8. Síndromes relacionados con microdeleciones cromosomicas. Los síndromes causados por haploinsuficiencia de un gen aislado suelen observarse en pacientes que no tienen una microdeleción, sino una mutación de punto en el gen

Sindrome

MIM num.

Localización

Tipo de anomalía

Wolf-Hirschhorn

194190

4p16.3

Aneuploidía segmentaria

Maullido de gato

123450

5p15.2-p15.3

Aneuploidía segmentaria

Williams

194050

7q11.23

Aneuploidía segmentaria

Langer-Giedon

150230

8q24

Gen contiguo (TRPS1, EXT1)

WAGR

194072

11 p13

Gen contiguo (PAX6, WT1)

Prader-Willi

176270

15q11 -q13

Aneuploidía segmentaria (ausencia de copia paterna)

Angelman

105830

15q11 -q13

Ausencia de UBE3A materno

Rubinstein-Taybi

180849

16p13.3

Haploinsuficiencia para CBP

Miller-Dieker

247200

17p13.3

Gen contiguo {LIS1, YWHAE, etc.)

Smith-Magenis

182290

17p11.2

Aneuploidía segmentaria

Alagille

118450

20p12.1

Haploinsuficiencia para JAG1

Di George/VCFS

192430

22q11.21

Aneuploidía segmentaria

WAGR, tum or de Wilms, aniridia, anormalidades congénitas, retraso mental; VCFS, síndrome velocardiofacial.

BIBLIOGRAFÍA

Varones con deleciones del cromosoma X

487

Pacientes heterocigotos Paciente sin para deleciones autosómicas deleción M apa

Mapa X

1

autosómico

Xi +

A,

X2

A2

X3

A3

X4

A4

5

A5

A6 a7

A,8

Fenotipo del paciente:

X6

+ X,

+

3

+ X4

Flg. 16-10. Síndromes de microdeleción ligados a X y autosómicos. En el cromosoma X, la deleción de los genes X, o X5 es letal en varones. Los pacientes 1 a 3 muestran una serie anidada de síndromes de gen contiguo, en tanto que el paciente 4 tiene un síndrome de gen contiguo diferente. En el autosoma, sólo el gen A5 es sensible a dosis. Los pacientes 5 a 7, con deleciones de diferente tamaño, muestran el mism o fenotipo del paciente 8, que es heterocigoto para una mutación de punto con pérdida de la función en el gen A5.

producen defectos del aprendizaje sensibles a dosis (Aitafaj y cois., 2001) y DSCAM, una molécula de adherencia celular que se expre sa en el sistema nervioso en desarrollo y en el corazón (Barlow y cois., 2001). La monosomía y trisomía del cromosoma X despiertan interés particular porque la inactivación de X debería tornarlos asintomáticos en tejidos somáticos. Sin embargo, no todos los genes ligados a X están inactivados. Las anormalidades esqueléticas del síndrome

de Turner son causadas por haploinsuficiencia para SHOX, un gen homeobox en la región seudoautosómica Xp/Yp (sección 2.3.3, fig. 12-15) (Clement-Jones y cois., 2000). Es probable que otras carac terísticas somáticas surjan de haploinsuficiencia de otros genes que escapan a la inactivación de X y que tienen una contraparte Y fun cional (véase fig. 12-14). Puesto que sólo se conocen 18 de estos ge nes (Lahn y Page, 1997), la lista de posibles candidatos parece manejable.

Lecturas adicionales Dipple KM, McCabe ERB (2000) Phenotypes of patients with 'simple' Mendelian disorders are complex traits: thresholds, modifiers and system dinamics. Am. J. Hum. Genet. 66, 17291735. Scriver CR, Waters PJ (1999) Monogenic traits are not simple: lessons from phenylketonuria. Trends Genet. 15, 267-272.

Weatherall DJ (2001) Phenotype-genotype relationships in mono genic disease: lessons from the thalassaemias. Nature Rev. Ge net. 2, 245-255. Weatherall DJ, Clegg JB, Higgs DR, Wood WG (2001) The he moglobinopathies. En: The Metabolic and Molecular Basis of In herited Disease, 8a. ed. Edn (eds CR Scriver, AL Beaudet, WS Sly, D Valle). McGraw Hill, New York, pp. 4571-4636.

CAPÍTULO

DIECISIETE

Genética del cáncer Contenido del capítulo

Recuadro 17-1

Dos formas de establecer una serie de mutaciones sucesivas más probables

491

490

17.1

CAPÍTULO DIECISIETE

GENÉTICA DEL CÁNCER

Introducción

El cáncer es tanto una enfermedad como la etapa final natural de cualquier organismo multicelular. Todas las personas están familia rizadas con la idea darwiniana básica que señala que una población de organismos cuya capacidad de reproducción muestra variación hereditaria evolucionará por selección natural. Los genotipos que se reproducen más rápido o con mayor extensión llegarán a domi nar las generaciones posteriores, sólo para ser sustituidos a su vez por reproductores más eficientes aún. El factor determinante pue de ser un incremento en la tasa de mortalidad o una disminución de la misma. Justo lo mismo se aplica a la población de células que constituye un organismo multicelular como el hombre. El naci miento y la muerte celulares están controladas genéticamente y si la m utación som ática crea una variante que prolifera con mayor ra pidez, la clona mutante tenderá a hacerse cargo del organismo. Por consiguiente el cáncer puede considerarse como un proceso evolu tivo natural. Los cánceres son el resultado de una serie de mutaciones somá ticas y en ciertos casos también de una predisposición hereditaria. Pueden clasificarse según los tejidos de origen (los carcinomas de rivan de células epiteliales, las leucemias y los linfomas de precur sores de células sanguíneas, etc.) y la histología que se observa al microscopio (fig. 17-1). El uso reciente de arreglos de expresión para mostrar el patrón total de expresión génica en un tumor (véa se fig. 17-18) promete refinar aún más la clasificación. Estas divi siones son importantes para establecer el pronóstico y el tratamiento, pero no explican cómo evolucionó el cáncer. El obje tivo de la genética del cáncer es comprender la vía mutacional y se lectiva de múltiples pasos que permitió que una célula somática normal originara una población de células cancerosas proliferantes e invasoras. Conforme se descubren acontecimientos moleculares fundamentales, los patólogos disponen de nuevos indicadores pro nósticos. La genética del cáncer puede ser muy confusa. Cada tumor es individual. Existen tantos genes diferentes que adquieren mutacio nes en uno u otro tumor y a continuación interactúan en formas tan complejas que es fácil perderse en un mar de detalles. En este capítulo se intentará evitar confusiones mediante la concentración

en los principios de la tumorigénesis, como se comprende en la ac tualidad, en lugar de catalogar genes y mutaciones.

1 7 .2

Evolución del cáncer

Como ya se describió, las células se encuentran bajo una presión se lectiva potente para evolucionar a células tumorales. Pero si bien los tumores tienen mucho éxito como células, como organismos son fracasos desesperados. No dejan descendientes más allá de la vida de su huésped. Por tanto, a nivel del organismo total, hay un selección potente para mecanismos que evitan que una persona muera por un tumor, cuando menos hasta que tuvo éxito y crió a sus hijos. En consecuencia el hombre está regulado por dos grupos opuestos de fuerzas selectivas. No obstante, la selección para tumorigénesis es a corto término, en tanto que la selección para resistencia es a largo plazo. La evolución de una célula somática normal en un tumor ma ligno ocurre durante la vida de una persona y tiene que comenzar de nuevo con cada nuevo individuo. Sin embargo, un organismo con un buen mecanismo antitumoral lo transmite a su descendencia, en la que continúa en evolución. Mil millones de años de evolución do taron al hombre de mecanismos de engrane y superposición compli cados para protegerlo contra tumores, cuando menos durante su vida reproductiva. Las posibles células tumorales se reparan y regre san de nuevo a la línea o bien a destruirse por sí mismas (apoptosis). Ninguna mutación aislada puede evitar estas defensas y convertir una célula normal en otra maligna. Hace mucho tiempo los estudios de la dependencia del cáncer en la edad sugirieron que se requieren en promedio seis a siete mutaciones sucesivas para convertir una cé lula epitelial normal en un carcinoma invasor. En otras palabras, una célula normal puede convertirse en un tumor maligno sólo si la mi tad de una docena de defensas independientes es incapacitada por mutaciones (fig. 17-2). La posibilidad de que una célula aislada sufra seis mutaciones independientes es insignificante, lo que sugiere que el cáncer debe ser cada vez más raro. Sin embargo, dos mecanismos generales pueden permitir que la progresión ocurra (recuadro 17-1). No obstante, como la acumulación de todas estas mutaciones requie re tiempo, el cáncer es sobre todo una enfermedad de la vida pos-

Fig. 17-1. Histología de tum ores. Etapas en el desarrollo de un carcinoma. Tres cortes histológicos de mucosa bucal, teñidos con hematoxilina y eosina, que muestran las etapas del desarrollo de cáncer bucal. A) Epitelio normal. B) Epitelio displásico, que es un cambio potencialmente premaligno. El epitelio muestra crecimiento y maduración desordenados, células anormales e incremento de mitosis. C) Cáncer originado del epitelio superficial que invade los tejidos conjuntivos subyacentes. Los islotes del tum or (carcinoma) muestran diferenciación desordenada, células anormales y mayor número de mitosis atípicas. Los anatomopatólogos utilizan estos cambios de la arquitectura tisular para identificar y graduar los tumores. Cortesía del doctor Nalin Thakker.

17.3

Mutación num. 1

Mutación núm. 2

Crecimiento selectivo de la clona con mutación núm. 1

ONCOGENES

491

Mutación núm. 3

Crecimiento selectivo de la clona con mutaciones 1+2

Continuación de la evolución mediante selección natural

Fig. 17-2. Evolución del cáncer en múltiples etapas. Cada mutación sucesiva proporciona a la célula una ventaja en el crecimiento, de manera que forma una clona expandida, que en consecuencia presentan un blanco más grande para la mutación siguiente.

reproductiva, cuando la presión selectiva para mejorar aún más las defensas es poca. Si se consideran los genes que son blanco de estas mutaciones, es posible distinguir dos categorías amplias, aunque, como sucede siempre en biología, hay más medios para pensar respecto al cáncer que clasificaciones sin argumentos exclusivas. ► Oncogenes (sección 17.3). Son genes cuya actividad normal promueve la proliferación celular. Las mutaciones de ganancia de función en células tumorales crean formas que muestran ac tividad excesiva o inapropiada. Un alelo mutante aislado pue de afectar el fenotipo de la célula. Las versiones no imitantes se denominan con propiedad protooncogenes. ► Genes supresores de tumor (ST) (sección 17.4). Los produc tos de los genes ST inhiben acontecimientos que conducen al cáncer. Las versiones mutantes en las células de cáncer perdie ron su función. Algunos productos génicos de ST impiden la progresión inapropiada del ciclo celular, otros desvían células hacia la apoptosis, en tanto que varios mantienen estable el genoma y las tasas de mutación bajas para asegurar la replicación, la reparación y la segregación precisas del DNA celular. Es ne cesario investigar ambos alelos de un gen ST a fin de cambiar la conducta de la célula. Por analogía con un autobús, es posible imaginar que los oncoge nes son el acelerador y los genes supresores de tumor, el freno. La presión del acelerador (una ganancia de función dominante de un oncogen) o la falla de todos los frenos (una pérdida recesiva de función de un gen ST) determinarán que el autobús corra fuera de control.

17.3

Oncogenes

17.3.1 Histeria de los oncogenes Los oncogenes se descubrieron en el decenio de 1960 cuando se reco noció que ciertos cánceres de animales (en especial leucemias y linfomas) eran causados por virus. Algunos de los virus tenían genomas DNA hasta cierto punto complicados (virus SV40, papilomavirus), pero otros eran retrovirus de transformation aguda con genomas RNA muy simples. El genoma de un retrovirus estándar posee sólo tres uni dades de transcripción: gag, proteínas de codificación interna; poL, co dificación de polimerasa, y env, codificación de proteínas de envoltura (cada transcrito se corta para codificar varias proteínas). El descubri miento de que las propiedades transformantes de los retrovirus que se transforman en forma aguda se debían por completo a que poseían un gen extra, el oncogen, despertó una gran excitación. Durante poco tiempo algunos investigadores entusiasmados esperaban explicar la to talidad del cáncer mediante la infección con virus que llevan oncoge nes cuya acción podría bloquearse una vez que se identificaran. Algún tiempo después los investigadores descubrieron que los oncogenes virales eran copias de genes celulares normales, los p ro tooncogenes, que se incorporaron de manera accidental en las partí culas retrovirales. Las versiones virales eran “activadas” de alguna manera y ello les permitía transformar células infectadas. La mayor parte de los cánceres del hombre no depende de virus, pero de cual quier modo sus protooncogenes residentes se activaron. A finales del decenio de 1970 se desarrolló una valoración para detectar oncoge nes celulares activados. Células de fibroblastos del ratón NIH-3T3 se transfectaron con fragmentos de DNA aleatorios de tumores hu-

Recuadro 1~-1. Dos formas de estab lec er una serie de m utaciones sucesivas m ás probables El cambio de una célula epitelial normal en una célula cancerosa maligna tal vez requiera seis mutaciones específicas en la célula. Si una tasa de mutación típica es de 10 7 por gen por generación celular, resulta cada vez menos probable que una célula sufra tantas mutaciones (que es la ra zón por la que la mayoria de los humanos está viva). La probabilidad de que esto suceda a cualquiera de las 1013 células en una persona es 1013 x 1 0 ” 42 o 1 en 1029. No obstante, el cáncer ocurre por una combinación de dos mecanismos: ► algunas mutaciones incrementan la proliferación celular y crean una población blanco de células expandida para la siguiente mutación (fig. 17-2);

► algunas mutaciones afectan la estabilidad de la totalidad del genoma, a nivel del DNA o cromosómico, e incrementan el índice total de m u taciones. Como los cánceres dependen de estos dos mecanismos, se desarrollan en etapas, a partir de hiperplasia de tejido o crecimientos benignos, en tanto que las células de tumores malignos suelen anunciar su inestabili dad genómica por sus cariotípos caprichosos (fig. 17-10).

492 I CAPÍTULO DIECISIETE

GENÉTICA DEL CÁNCER

manos. Algunas de las células se transformaron y fue factible aislar el DNA humano causal de las transformadas elaborando una biblio teca genómica de fagos y seleccionando para la repetición humana específica Mu. Los oncogenes identificados en los fragmentos de transformación incluyeron muchos ya conocidos por estudios vira les. Véase Bishop (1983; Lecturas adicionales) para las descripciones de este trabajo inicial respecto a retrovirus y oncogenes celulares.

17.3.2 Funciones de los oncogenes El conocimiento funcional de los oncogenes inició en 1983 cuan do se descubrió que el oncogen viral v-sis (el prefijo v- denota un oncogen viral) se derivaba del gen del factor B del crecimiento de rivado de plaquetas celular normal (PDGFB). La expresión excesi va no controlada de un factor de crecimiento sería una causa obvia de hiperproliferación celular. En la actualidad se conocen las fun ciones de muchos oncogenes celulares (en sentido estricto, protooncogenes) (cuadro 17-1). Por fortuna resultó que controlaban justo la clase de funciones celulares que cabría predecir que estaban alteradas en el cáncer. Es posible distinguir cuatro clases amplias; ► factores de crecimiento secretados (p. ej., SIS)] ► receptores de superficie celular (como ERBB y FMS); ► componentes de sistemas de transducción de señal intracelulares (p. ej., la familia RAS y ABL); ► proteínas nucleares de enlace de DNA, inclusive factores de transcripción (como MYC, JUN)\ ► componentes de la red de ciclinas, cinasas dependientes de ciclinas e inhibidores de cinasa que rigen la progresión a través del ciclo celular (como MDM2). Si los oncogenes se definen como genes que sufren mutaciones ac tivadores dominantes en tumores, en la actualidad se conocen un poco más de 100.

17.3.3 Activación de protooncogenes Algunas de las mejores ilustraciones de la patología molecular en acción las proporcionan las diversas formas en que los protoonco-

genes pueden activarse (cuadro 17-2). La activación comprende una ganancia de función, que puede ser cuantitativa (un incremen to en la elaboración de un producto no alterado) o cualitativa (sín tesis de un producto modificado sutilmente como resultado de una mutación, o un producto nuevo a partir de un gen quimérico crea do por un reordenamiento cromosómico). Estos cambios son do minantes y por lo general sólo afectan un alelo aislado del gen. Blume-Jensen y Hunter (2001) presentaron ejemplos adicionales que ilustran los mecanismos que se describen a continuación.

Activación por amplificación Muchas células cancerosas contienen múltiples copias de onco genes con estructura normal. Con frecuencia los cánceres de ma ma amplifican ERBB2 y a veces MYC; un gen relacionado NMYC suele amplificarse en los neuroblastomas y rabdomiosarcomas en etapa tardía. Es posible que haya cientos de copias ex tra. Pueden existir como corpúsculos de cromatina pareados pequeños, separados de los cromosomas (dim inutos dobles), o in serciones en cromosomas normales (regiones que se tiñen d e m a nera hom ogénea, RTH). Los acontecimientos genéticos que los producen pueden ser muy complejos porque suelen contener se cuencias derivadas de varios cromosomas distintos (revisado por Pinkel, 1994). Se observan amplificaciones génicas similares en células expuestas a regímenes de selección artificial potentes -por ejemplo, los genes de reductasa de dihidrofolato amplificados en células seleccionadas para resistencia al metotrexato-. En todos los casos el resultado es un incremento considerable del nivel de expresión génica. La amplificación de oncogenes en tumores puede estudiarse mediante hibridación genóm ica comparativa (HGQ (Forozan y cois., 1997). El análisis también revela cualquier región de pérdida o aneuploidía de alelos, que puede indicar genes supresores de tumor (véase más adelante). En la prueba de HGC se utiliza una mezcla de DNA de células normales testigo y tumorales en hibridación competitiva. Las dos muestras se marcan con fluoros rojo y verde, mezclados, y se emplean como una sonda de hibridación. Se obser va la relación de la señal de hibridación roja con la verde. La HGC puede realizarse en dos formas:

Cuadro 1 7 -1 . Oncogenes ■virales y celulares. Enfermedad viral

v-onc

c-onc

Localización

Función

Sarcoma simiano

v-sis

PDGFB

22q13.1

Subunidad

Eritroleucemia de polios

v-erbb

EGFR

7p12

Receptor del factor de crecimiento epidérmico

Sarcoma felino de McDonough

v-fms

CSF1R

5q33

Receptor del factor estimulante de colonias de macrófagos

Sarcoma de la rata de Harvey

v-ras

HRAS

11 p15

Componente de la transducción de señal de la proteina G

Leucemia del raton de Abelson

v-abl

ABL

9q34.1

Cinasa de tirosina proteínica

Sarcoma 17 aviario

v-jun

JUN

1p32-p31

Factor de transcripción AP-1

Mielocitomatosis aviaria

v-m yc

MYC

8q24.1

Factor de transcripción de enlace de DNA

Osteosarcoma del raton

v-fos

FOS

14q24.3-q31

Factor de transcripción de enlace de DNA

Bdel factor de crecimiento derivado de plaquetas

En ocasiones los genes virales se designan v-src, v-m yc, etc., y sus correspondientes celulares c-src, c-m yc, etc. Las formas de los genes c-onc en células normales se denominan con propiedad protooncogenes. En la actualidad es frecuente ignorar estas distinciones y utilizar sólo el término onco genes para los genes normales. Las versiones anormales pueden describirse como oncogenes activados.

17.3

ONCOGENES

493

Cuadro 1 7 -2 . Cuatro formas de activación de (proto)-oncogenes. M e ca n ism o de activación

Oncogén

Tum or

Amplificación

ERBB2

Cáncer de mama, ovario, gástrico, pulmonar de célula no pequeña, de colon

NMYC

Neuroblastoma

HRAS

Cáncer de vejiga, pulmón, colon, melanoma

KIT

Tumores estromáticos gastrointestinales, mastocitosis

Reordenamiento cromosómico que crea un nuevo gen quimérico

[Many]

Véase cuadro 17-3

Translocación a una región de cromatina con actividad transcripcional

MYC

Translocación al locus de cadena pesada de la inmunoglobulina por t(8;14) en el linfoma de Burkitt

Mutación de punto

► hibridación genómica comparativa (HGC) estándar (fig. 17-3A) que hibrida las muestras mezcladas a dispersiones de cromoso mas normales en portaobjetos para microscopio (hibridación de fluorescencia in situ, sección 2.4.3). La relación de la señal de HFIS roja con la verde se grafica a todo lo largo de cada cromo soma y se eliminan regiones en las que la relación se desvía del 1:1 esperado, medido por un intervalo de confianza. Según la di rección de la desviación, esto marca regiones de amplificación o de pérdida de alelos en el tumor. La alteración más pequeña vi sible con esta técnica tiene alrededor de 3 Mb; ► el reordenamiento-HGC (fig. 17-3B) utiliza DNA microarreglado en lugar de cromosomas para la hibridación. El DNA en cada punto se hace mediante PCR-DOP (sección 5.2.4) de una clona BAC a partir de una localización cromosómica definida. Ello puede ofrecer una resolución mucho más alta, limitada sólo por el número de BAC en el arreglo. La mejor en la actualidad son 3 000 BAC para una resolución de 1 Mb. Una ventaja adicional sobre la HGC convencional es que cualquier secuencia amplifica da o eliminada se identifica de inmediato a nivel de las secuencias del DNA, en lugar de localizaciones por bandeo cromosómico.

Activación por mutación de punto Las tres familias génicas RAS, HRAS, KRAS y NRAS, que median el señalamiento mediante receptores acoplados a proteína G (Lowy y Willumsen, 1993), se activan en una gran variedad de tumores. El enlace de ligandos a los receptores desencadena el enlace de GTP a la proteína RAS, y GTP-RAS transmite la señal de manera progre siva en las células (véase fig. 3-5). Las proteínas RAS tienen activi dad de GTP-asa y GTP-RAS se convierte con rapidez en GDP-RAS inactivo. Las mutaciones de punto activadoras específicas en genes HAS suelen encontrarse en las células de una diversidad de tumores que incluye los cánceres de colon, pulmón, mama y vejiga. La pro teína RAS mutante tiene una actividad de GTP-asa reducida, de manera que GTP-RAS se inactiva más lentamente y da lugar a una respuesta celular excesiva a la señal proveniente del receptor.

Activación mediante una transtocación que crea un gen quimérico nuevo Este mecanismo es raro en carcinomas (tumores epiteliales) pero fre cuente en tumores hematológicos y sarcomas. El mejor ejemplo que se conoce es el cromosoma Philadelphia (Ph), un cromosoma acro-

céntrico pequeño que se observa en 90% de los pacientes con leucemia mieloide crónica. Este cromosoma es un producto de una transloca ción recíproca equilibrada 9;22. El punto de rotura en el cromosoma 9 se encuentra dentro de un intrón del oncogen ABL. La translocación une la parte 3' de la secuencia genómica ABL con la parte 5' del gen BCR (del inglés ¿reakpoint dbster región, región de punto de rotura del grupo,) en el cromosoma 22 y crea un gen de fusión nuevo (Chissoe y cois., 1995). Este gen quimérico se expresa para producir una cinasa de tirosina relacionada con el producto ABL pero con propiedades de transformación anormales (fig. 17-4A). En la actualidad se reconocen muchos puntos de rotura especí ficos de tumor y se identifican muchos oncogenes clonándolos (cuadro 17-3). En el sitio de red Cáncer Genome Anatomy Project (Mitelman y cois., 2002) es posible buscar una base de datos de unas 40 000 aberraciones cromosómicas en el cáncer.

Activación por transtocación en una región efe cromatina con actividad transcripeionaí El linfoma de Burkitt es un tumor de la niñez frecuente en regio nes palúdicas de Africa Central y Papua Nueva Guinea. Se piensa que los mosquitos y el virus Epstein-Barr desempeñan cierta fun ción en la causa, pero la activación del oncogen MYC es un hecho central. En 75 a 85% de los pacientes (fig. 17-4B) se observa una translocación cromosómica característica, t(8;l4) (q24;q32). El resto tiene t(2;8)(pl2;q24) o t(8;22)(q24;ql 1). Cada una de las translocaciones coloca el oncogen MYC cerca de un locus de inmunoglobulina, IG H en 14q32, IG K en 2pl2 o IGL en 22ql 1. A di ferencia de las translocaciones específicas de tumor que se muestran en el cuadro 17-3, las translocaciones del linfoma de Burkitt no crean genes quiméricos nuevos. Por el contrario, ponen el oncogen en un ambiente de cromatina que se transcribe de manera activa en células B que producen anticuerpo. Por lo general el exón 1 (que no es codificante) del gen MYC no se incluye en el material translocado. Con la supresión de sus controles normales corriente arri ba y su colocación en un dominio cromatínico activo, MYC se expresa en un nivel alto inapropiado. Sin embargo, es posible que no sea todo lo que sucede. Estas translocaciones se producen por la acción dirigida en forma errónea de las recombinasas especiales que participan en el reordenamiento del gen V-D-J de inmunoglobulina (sección 10.6) y a menudo el gen MYC translocado contiene mutaciones de punto nuevas inducidas como pane del mecanismo para generar una diversidad de anticuerpos.

494

CAPÍTULO DIECISIETE ¡ GENÉTICA DEL CÁNCER

A)

Análisis HGC-AR

B)

0.5 1.0 1.5

• • O• • • O• • • • • • © • o• • • • o • # 9 O O 9 © © © © © o © o© ©© c © • o

099009 00099 OOOOC 99 90©

0 0990 QOO§ o ooeooo© o

oo©co© ©0 0 ©® o© © o o coceo 0 900 O OOo o • o © o

© ••«•© •• © ©© O © © O' ©©O • 9O ©® - © ©© < ?•G>99 • © OO©©©©• © V?O • • ’*-• •©•' ©• ' ©©o O © o© s•

• • O• • © ©o o © o o • ©© o o ©©o o o © OC O O O O C © © Q ooooo# • o o ©© ooco© oc ooo OCOf) i GOOo o o >:,o o o o o c

© ©©©• ©• © O © © ©9 9 O ©o Ó©«© OSí © ©© : •• O« • © ©© ©C € ©©©©© ? o ©0 : ©©©« © • © © O© ©©O

••©©• ©©o © ©o © o ©o ©©©©© o ©o e ©©a © ceoooe ©o o O © O © O© o ©e ©o ©© a - ©o o ' o o© o

© © © © • 90 O 9 0880C 6 f t « » e

9 9 9 9 9 090 0000O0Q0009 09 O ' © © © © C O © ©

O©

0 0 6 0 0 9 * 0

o © o o ©

© • © • o c

= Dim(2p15p15) Nueva

Confirmada mediante FISH, 4-5 Mb

©••©•o©© c

Análisis HGC-AR

•©•©• ©o© ©

1

• ••© ••© oc

s

O ©o ©• ©© O 9 6 0 0 6 6 © O © OO OO O

©

©o

O© O : © © O© O

oo ooo© c © © :: o c e

o ©©

••©©• •©© ©

f Enh(1 q21 q21) Nueva

O© O© © • © G © © ©O © © © © ©

9 9 9 9 9 9 0 0 0

s

© G

©©©©©o

Confirmado por análisis de banda G

• •••• © 09 9 9 © © ©©© : © • « • • ©-• 9 99 9 0 9 9 0 9 9 9 0 0 ©00© ©O‘ © : © © C O O " © 3 © ©

©o :

O©r&O ©© © OOOOO© © ©©©o© o© • •

©

© f) Í- O« e ©

• «©■ : © ©-© ■ '.©©-. 8 0

©

« © *O > © © o © ©oto

© O©• • ©0©@ 0 9 9 0 0 9 9 9 9 9 © © ©¡a ©© © ©O ©© 9 ■e ©■> ;. © © © • O Oí'© o © . •>o ©or.© ©O 0 9 0© O O® 9 9 ©0 0 9 9990 0 99999 9

-9©

©

O © '' O © S ©

.. © © C>© © ©

© © © © c*o ©©o • • oc o •© ©

©

© v v. O ü O

Fig. 17-3. Hibridación genómica comparativa (HGC). A) HGC crom osom ica. Análisis de HGC de alta resolución de muestras de dos niños dism órficos y con retraso mental cuyos cromosomas bandeados G parecían normales. La línea amarilla es el trazo de HGC y la línea negra el intervalo de confianza de 99% para una relación 1:1. El primer caso tiene una deleción nueva pequeña que se confirm ó mediante hibridación de fluorescencia in situ (FISH); el segundo caso tiene una duplicación nueva que puede observarse en retrospectiva en los cromosomas bandeados G. Imágenes cortesía del doctor Claes Lundsteen, Copenhagen. B) Arreglo-HGC. Fragmentos de PCR-DOP de 321 BAC manchados en un portaobjetos, que a continuación se híbrido para una mezcla de DNA de una línea de células de tum or de mama (marcado verde) y DNA de referencia normal (marcado rojo). Los BAC que contienen DNA que se amplifica en el tum or se ven verdes, los que contienen DNA iluminado en el tum or se ven rojos y los que se encuentran donde el tum or no cambió se ven amarillos. Cada grupo se mancha por triplicado para permitir variaciones en la eficiencia de la hibridación. Cortesía del doctor J. Veltman, Nijmegen.

Muchos otros reordenamientos cromosómicos que se producen por el mismo mecanismo colocan uno u otro oncogen en la cercanía de un gen de mmurioglobulina (IGG) o un gen de receptor de célu la T ( TCR) (Sánchez-García, 1997). Estos reordenamientos son ca racterísticos de leucemias y linfomas, pero no de tumores sólidos.

1 7 .4

Genes supresores de tum or

17.4.1 El paradigma del retinoblastoma Stanbridge (1990; véase Lecturas adicionales) describió la base del conocimiento de los genes supresores de tumor (ST). Un hecho sobresaliente temprano fue el trabajo de Knudson en 1971 res pecto al retinoblastoma (revisado por Knudson, 2001). Es un cáncer agresivo de la niñez que se desarrolla a partir de retinoblastos, una población pasajera de células que se dividen con rapidez,

se diferencian mal y que, en la analogía del autobús que ya se co mentó, conducen de manera peligrosa y por consiguiente se transforman con relativa facilidad. Alrededor de 40% de los casos es familiar. Se heredan como un carácter dominante incompleta mente penetrante (MIM 180 200). Los casos familiares suelen ser bilaterales, en tanto que las formas esporádicas siempre son uni laterales. Knudson señaló que la distribución por edad de inicio de casos bilaterales era compatible con una mutación única, en tanto que los casos esporádicos seguían cinéticas de dos golpes. Razonó que todos los retinoblastomas incluían dos “golpes”, pe que en los casos familiares se heredaba un golpe (fig. 17-5). Un estudio elemental realizado por Cavenee y colaboradores (1983) comprobó la hipótesis de Knudson y estableció el paradigma pa ra las investigaciones de laboratorio de genes supresores de tumor (ST). Cavenee y colaboradores tipificaron material tumoral extirpado por medios quirúrgicos de pacientes con retinoblastoma esporádi-

ro

17.4 I GENES SUPRESORES DE TUMOR

A)

9

d e r (9)

22

Ph1

B)

der (8)

14

der (14)

BCR ABL

- - R - -B C R

IGH

M Y c - - y - - - - - - - /G H

ABL-

II I

s' h — * i * ii I limn 5'

8

495

Hi

5— i----- ■ ■ mm » ii mi mi

3'

A

5'

1 3'

MYC

3'

~2

.“¡T T.

5'

, C1

C3

i

3'

Gen de fusión

2

3

myc

8 .5 kb B C3 R /A B L m R N A

Proteína de fusión p210 (cinasa de tirosina con actividad constitucional)

3' C2

I

C1

G2

C3

IgH

Aumento de la expresión de proteína MYC con estructural normal (el exón 1 no es codificante)

Fig. 17-4. Reordenamientos cromosómicos que activan oncogenes. A) Activación por cambio cualitativo en t(9;22) en la leucemia mieloide crónica. El gen de fusión BCR-ABL quimérico en el cromosoma Philadelphia codifica una cinasa de tirosina que no responde a controles normales. Véase Chissone y colaboradores (1995) para mayores detalles. B) Activación por cambio cuantitativo en t(8;14) en el iinfoma de Burkitt. El gen MYC del cromosoma 8 está translocado en el gen de cadena pesada de inmunoglobulina. En células B esta región se transcribe de manera activa, lo que conduce a expresión excesiva de MYC.

co, utilizando una serie de marcadores del cromosoma 13 (se sabía que en ocasiones el retinoblastoma se relacionaba con cambios cro mosómicos en 13ql 4). Cuando compararon los resultados en muestras de sangre y tumor del mismo paciente, observaron varios casos en los que el DNA constitucional (sanguíneo) era heterocigoto para uno o más marcadores, pero al parecer las células tumorales eran homocigotas. Razonaron que lo observado era uno de los "golpes” de Rnudson: pérdida de una copia funcional de un gen supresor de tumor. Estudios ulteriores confirmaron esta interpreta ción al demostrar que en casos hereditarios siempre se perdía el alelo de tipo silvestre en esta forma. Mediante la combinación de análisis citogenéticos con estudios de marcadores de diferentes re giones de 13q, Cavenee y colaboradores pudieron sugerir varios mecanismos para la pérdida (fig. 17-6). Este trabajo tuvo dos implicaciones mayores. Primero, sugirió que los cánceres esporádicos y los familiares podían compartir me canismos moleculares. Segundo, insinuó dos formas de encontrar genes ST: ► mapeo y clonación posicional de los genes que causan cánceres familiares;

► estudio de tumores para pérdidas de material cromosómico es pecífico. El cuadro 17-4 incluye una lista de algunos de los genes ST que se identificaron por medio de estudios de cánceres familiares raros.

Complicaciones del paradigma del retinoblastoma En retrospectiva, el retinoblastoma es un ejemplo en extremo pre ciso de un mecanismo de dos golpes, tal vez porque, como se men cionó, los retinoblastos son células poco comunes. Varios otros cánceres siguen muy de cerca el ejemplo del retinoblastoma. APC, NF2y PTC (cuadro 17-4) son ejemplos en los que se identificó un gen ST mediante la investigación de un cáncer familiar raro que re sultó importante en el cáncer esporádico correspondiente, pero no siempre sucede así. ► Al parecer algunos cánceres siguen diferentes vías evolutivas en casos familiares y esporádicos. Por ejemplo, BRCA1 sólo se inac tiva en 10 a 15% de los cánceres de mama esporádicos y estos tu mores forman un subgrupo molecular identificable preciso de cánceres de mama. La inactivación, cuando ocurre, no se debe a

496

CAPÍTULO DIECISIETE } GENÉTICA DEL CÁNCER

Cuadro 17-3. Genes quiméricos producidos por reordenamientos cromosómicos específicos de cáncer. Tumor

Reordenamiento

Gen quimérico

Naturaleza del producto quimérico

LMC

t(9;22)(q34;q11)

BCR-ABL

Cinasa de tirosina

Sarcoma de Ewlng

t(1 1 ;22)(q24;q12)

EWS-FU1

Factor de transcripción

Sarcoma de Ewing (variante)

t(21 ;22)(q22;q12)

EWS-ERG

Factor de transcripción

Melanoma maligno de partes blandas

t(12;22)(q13;q12)

EWS-ATF1

Factor de transcripción

Tumor de célula redonda pequeña desmoplásico

t(1 1 ;22)(p13;q12)

EWS-WT1

Factor de transcripción

Liposarcoma

t(12;16)(q13;p11)

FUS-CHOP

Factor de transcripción

LMA

t(16;21)(p11;q22)

FUS-ERG

Factor de transcripción

Carcinoma papilar de la tiroides

inv(1)(q21;q31)

NTRK1 -TPM3(TRK oncogén)

Cinasa de tirosina

Leucemia linfoblastoide aguda precélula B

t(1 ;19)(q23;p13.3)

E2A-PBX1

Factor de transcripción

LLA

t(X;11)(q13;q23)

MLL-AFX1

Factor de transcripción

LLA

T(4;11)(q21;q23)

MLL-AF4

Factor de transcripción

LLA

t(9;11)(q21;q23)

MLL-AF9

Factor de transcripción

LLA

t(1 1 ;19)(q23;q13)

MLL-ENL

Factor de transcripción

Leucemia promielocítica aguda

t(15;17)(q22;q12

PML-RARA

Factor de transcripción + receptor de ácido retinoico

Rabdomiosarcoma alveolar

t(2;13)(q35;q14)

PAX3-FKHR

Factor de transcripción

LMC, leucemia mielolde crónica; LMA, leucemia mielógena aguda; LLA, leucemia linfoblastoide aguda. Obsérvese cómo el mismo gen puede participar en varios reordenamientos diferentes. Para mayores detalles véase Rabbitts (1994).

Tumor

Célula som ática en una persona normal

p e rs o n a n o rm a l; to d a s la s c é lu la s s o m á tic a s e n u n a p e rs o n a c o n re tin o b la s to m a fa m ilia r

Fig. 17-5. Hipótesis de dos golpes de Knudson. Supóngase que hay un millón de células blanco y que la probabilidad de mutación es 1CT5 por célula. El retinoblastoma esporádico requiere dos golpes y afectará a una persona en 10 0 00 (106 x 10 ~5 x 10~5 = 10 -4 ), en tanto que la form a familiar sólo necesita un golpe y será muy penetrante, puesto que (106 x 10“ 5 > 1). Véase Knudson (2001) para una tratamiento más complejo.

los mecanismos cromosómicos que se observan en el retinoblas toma (fig. 17-6) sino a metilación del DNA (sección 17.4.3). ► Con frecuencia algunos genes pierden la función de un alelo en tumores, pero el alelo que se conserva parece por completo fun cional. En ocasiones esto se debe a que el segundo alelo es inactivado por metilación, que no se detecta mediante alguno de los métodos experimentales utilizados, pero algunos casos parecen ser acontecimientos genuinos de un golpe. Es razonable postular que hay genes en los que la haploinsuficiencia es suficiente (sec ción 16.4.2) para proporcionar una ventaja en el crecimiento.

► Más rara vez, existen algunos casos en los que se observan tres golpes. En la poliposis adenomatosa familiar (sección 17.5.3’ ciertas mutaciones de la línea germen son “débiles” y confieren un fenotipo atenuado con menos pólipos. Los adenomas de es tos pacientes suelen tener dos mutaciones somáticas además de la mutación hereditaria. Una mutación somática inactiva el ale lo de tipo silvestre. Esto proporciona a las células una ventaja en el crecimiento, pero adquieren una ventaja adicional por una deleción cromosómica que elimina el alelo APC de la línea germinal parcialmente funcional.

17.4

GENES SUPRESORES DE TUMOR

497

Marcador A 1 - - - - 2

R B -------+

Marcador B 1 -- -- 2

Fig. 17-6. Mecanismos de pérdida del alelo de tipo silvestre en el retinoblastoma. A) Pérdida de la totalidad del cromosoma por falta de disyunción mitótica. B) Pérdida seguida de duplicación para dar (en este caso) tres copias del cromosoma Rb. C) Recombinación mitótica proximal al locus Rb (CO, seguida por segregación de ambos cromosomas que llevan Rb a una célula hija (C2); ésta fue la primera demostración de la recombinación mitótica en humanos, o de hecho en mamíferos. D) Deleción del alelo de tipo silvestre. E) Mutación de punto patógena del alelo de tipo silvestre (adaptado de Cavenee y cois., 1983). Las figuras inferiores muestran los resultados de la tipificación del DNA normal (N) y tumoral (T) de los dos marcadores A y B localizados como se muestra. Obsérvense los patrones de pérdida de heterocigosidad.

Cuadro 17-4. Cánceres familiares raros causados por mutaciones del gen supresor de tumor (ST). Enfermedad

MIM num.

Localización en el mapa

Gen

Poliposis adenomatosa del colon familiar

175100

5q21

APC

Cáncer de colon no polipósico hereditario

120435,12036

2p16,3p21.3

MSH2, MLH1

Cáncer de mama-ovario

113705

17q21

BRCA1

Cáncer de mama (inicio temprano)

600185

13q12-q13

BRCA2

Síndrome de Li-Fraumeni

151623

17p13

TP53

Síndrome de nevo de célula basal de Gorlln

109400

9q22-q31

PTC

Ataxia telangiectasia

208900

11q22-q23

ATM

Retinoblastoma

180200

13q14

RB

Neurofibromatosis 1 (enfermedad de Von Recklinghausen) 162200

17q12-q22

NF1

Neurofibromatosis 2 (schwannomas vestibulares)

101000

22q12.2

NF2

Melanoma familiar

600160

9p21

CDKN2A

Enfermedad de Von Hippel-Lindau

193300

3p25-p26

VHL

Pueden encontrarse referencias de los genes de enfermedades en ciona una lista más larga.

OMIMbajo el número citado. El cuadro 1 de Futreal y colaboradores (2001) propor

498

CAPÍTULO DIECISIETE

GENÉTICA DEL CÁNCER

Fig. 17-7. Cambios genéticos en tumores. A) Pérdida de heterocigosidad. La muestra de tejido normal (N) es heterocigota para el marcador D8S522 (flechas), en tanto que la muestra de tumor (T) perdió el alelo superior. Las bandas más altas en el gen son “ bandas de conform ación” , bandas subsidiarias producidas por secuencias de cada alelo dobladas de modo alternativo. Fotografía cortesía del doctor Nalin Thakker, St. M ary’s Hospital, Manchester, UK. B) In estab ilidad m icro sa télite en cánceres de colon no pollpósico hereditario. Análisis de secuenciador de fluorescencia de cinco microsatélites en tumores CCNPH. Los trazos negros provienen de DNA constitucional, los rojos de DNA del tum or del m ism o paciente. Las flechas indican nuevos alelos en los tumores. BAT26 y BAT40 son carreras (A)n, D2S123, D8S255 y D13S175 son repeticiones de dinucleótido (CA)n. Cortesía de Yvonne Wallis, West Midlands Regional Genetics Laboratory, Birmlngham, UK.

21 carcinomas bucales de célula escam osa D 8S264 D 8S262 D 8S518 D 8S277 D 8S265 D 8S552 D 8S511 D 8S549 D 8S254 D 8S 261 D 8S280 LP L D 8S258 D 8S282 D 8S560 D 8S298 D 8S133 D 8S87 \ D 8S283 \ ------ D 8 S 2 5 9 \ | ------ D 8 S 2 5 5 '------ D 8 S 5 3 8

¿ L o c a liz a c io n e s de TSG?

i

Fig. 17-8. Posibles genes supresores de tumor en el cromosoma 8p. La rejilla muestra resultados de la tipificación de DNA constitucional y tumoral de una serie de pacientes con tumores bucales, utilizando varios marcadores (D8S264, etc.) de las localizaciones indicadas en el cromosoma 8p (Wu y cois., 1997). El color rosa indica pérdida de heterocigosidad (LoH); las marcas verdes, retención; las amarillas, pruebas que proporcionaron resultado equívocos; las grises, pruebas que muestran inestabilidad microsatélite, y las áreas blancas indican cuando los marcadores no fueron informativos por homocigosidad constitucional. Obsérvese el patrón complejo de LoH en estos tumores, que es típico de estos estudios. Los datos sugieren la presencia de tres genes ST distintos en 8p.

17.5 I ESTABILIDAD DEL GENOMA ; 499

17.4.2 La selección de pérdida de heterocigosidad (LoH) se utiliza con amplitud para intentar identificar las localizaciones de genes supresores de tumor (ST) Cavenee y colaboradores (1983) observaron cómo los cambios ge néticos somáticos en el retinoblastoma causaban LoH en marcado res cercanos al locus RB. Estudios en otros cánceres confirman el cuadro general, aunque los mecanismos cromosómicos pueden ser diferentes (Thiagalingam y cois., 2001). Por tanto si se seleccionan muestras pareadas de sangre y tumor (por lo general tumores es porádicos) con marcadores espaciados a través del genoma se tie ne la esperanza de descubrir las localizaciones de genes ST (fig. 17-7). La prueba de LoH ha sido una labor mayor en la investigación del cáncer durante el último decenio, pero aún se está muy lejos de pre guntar si los resultados justifican el esfuerzo. Para obtener resultados significativos es necesario seleccionar un panel grande de tumores con marcadores espaciados en forma cercana. Se emplean marcadores microsatélite muy polimórficos para minimizar el número de casos no informativos en los que el DNA constitucional es homocigoto para el marcador o de otro modo puede usarse el arreglo-HGC (fig. 17-3B). Puesto que las células de cáncer avanzado pueden mostrar LoH en tanto como una cuarta parte de todos los locus, se requieren muestras grandes para separar los cambios específicos del fondo general. Los re sultados sugieren la presencia de un número muy grande de genes ST -la figura 17-8 muestra un ejemplo típico- y a pesar de los intentos para seguir estos estudios mediante clonación posicional se obtiene una tasa de éxitos baja.

C ontam in ació n dei e stro m a

Células tumorales

LoH aparente

La figura 17-9 ilustra un error en la interpretación de los datos de pérdida de heterocigosidad (LoH). Un problema general adicional es que los tumores suelen tener cariotipos muy anormales con innume rables anomalías numéricas y estructurales (fig. 17-10). Casi nunca se cuenta con información de los cariotipos de los tumores que se uti liza en estudios de LoH, pero la presentación de los resultados como en la figura 17-8 conduce con facilidad a una suposición no preten dida de deleciones intersticiales específicas que afectan un cromoso ma por otra parte normal. De hecho la LoH es un producto de la inestabilidad cromosómica y la reparación deficiente de roturas de DNA de doble cadena que son tan características de células tumorales. Es posible que algunas de las pérdidas observadas sean productos accesorios de patrones específicos de inestabilidad cromosómica, más que selección para la pérdida de un gen ST.

17.4.3 Con frecuencia los genes supresores de tumor son silenciados epigenéticamente por metilación Los genes ST pueden silenciarse por deleción (que se refleja por la pérdida de heterocigosidad) o mutaciones de punto, pero un tercer mecanismo muy frecuente es la metilación del promotor (véase sec ción 10.4). De manera global el DNA de la célula tumoral es hipometilado en comparación con el DNA de células normales, pero casi en cada tipo de neoplasia humana se encuentra metilación de dinucleótidos CpG específicos en los promotores de genes y se re laciona con silenciamiento transcripcional inapropiado del gen. Jo nes y Baylin (2002) listan muchos ejemplos. En algunos genes ST la metilación ocurre como una alternativa frecuente a la mutación de punto, en tanto que en otros (por ejemplo, RASSFlA en 3p21, HIC1 en 17pl3.3) la metilación es el único mecanismo conocido para la pérdida de función específica de tumor. Las técnicas están dar para selección de mutaciones pasan por alto estos cambios, de manera que es probable que su importancia aún se subestime. 1 7 .5

Estabilidad del genom a

\|»TSG1

La inestabilidad del genoma es una característica casi universal de las células cancerosas. La inestabilidad puede ser de dos tipos:

\|/TSG2

► inestabilidad cromosómica (INC), la forma más usual. Por lo general las células tumorales tienen cariotipos notablemente anormales (fig. 17-10), con múltiples cromosomas extra y faltantes, muchos reordenamientos, etc.;

TSG

► inestabilidad microsatélite (MIN), una inestabilidad a nivel del DNA que se observa en unos cuantos tumores, en especial algunos carcinomas de colon (fig. 17-7B).

Fig. 17-9. Una posible trampa en la interpretación de datos de LoH. El acontecimiento verdadero en este tum or es la deleción homocigota de TSG. A causa de la amplificación de material estromático contaminante (líneas pálidas), los datos de LoH muestran retención de heterocigosidad en el locus TSG, con LoH en dos regiones de flanqueo (rosa). El patrón sugiere la existencia de dos locus supresores de tum or falsos, ’PTSGI y 'PTSG2. La situación verdadera se revelaría mediante hibridación de fluorescencia in situ o con una prueba ¡nmunohistoquímica para el producto del gen TSG.

Es probable que la inestabilidad sea necesaria para permitir que una célula acumule suficientes mutaciones (recuadro 17-1). Algunos au tores argumentan que la inestabilidad es sólo un producto accesorio incidental de la evolución de un tumor y que el número de divisio nes celulares en poblaciones epiteliales es suficiente para que se acu mule el número necesario de mutaciones, inclusive con tasas estándar de mutación. Sin embargo, los tumores suelen mostrar INC o INM, pero no ambas, y esto sugiere que la inestabilidad no es una caracte rística al azar, sino un resultado de selección.

17.5.1 Inestabilidad cromosómica Las múltiples anormalidades cromosómicas que se observan en cé lulas tumorales son sobre todo aleatorias, aunque proporcionan

500

CAPITULO DIECISIETE

GENETICA DEL CANCER

I I 14

15

16

i 17

18

Fig. 17-10. Cariotipo multicolor con FISH (M-FISH) de una línea de células derivadas de leucemia mieloide humana. Obsérvense las numerosas anormalidades numéricas y estructurales (puntas de flecha) reveladas por el pintado cromosómico completo de 24 colores. Éstas incluyen t(5;15), der(7)t(7;15), der(8)ins(8;11), der(11)t(8;11), t(1 1 ;17) y der(Y)t(Y;12) -la última se muestra mal en esta célula. Imagen cortesía del doctor Lyndal Karney, Institute of Molecular Medicine, Oxford, UK, de Tosi y colaboradores, © 1999, reimpreso con autorización de Wlley-Liss Inc., una subsidiaria de John Wiley & Sons, Inc.

material para una selección más amplia de variantes de crecimien to más rápido. Pueden surgir en tres formas. ► Las células tumorales pierden el punto d e control d el huso (Jallepalli y Lengauer, 2001; véase más adelante). Es probable que lo anterior sea el principal origen de muchas anormalidades nu méricas. ► Las células tumorales son capaces de proseguir a través del ci clo celular a pesar de tener un DNA dañado. Las anormalida des cromosómicas estructurales pueden ser un producto accesorio de intentos de replicación del DNA o de mitosis con DNA dañado. ► Los tumores también pueden replicarse hasta el punto en que los telómeros son muy cortos para proteger los extremos de los cromosomas, lo que conduce a cierta clase de anormalidades estructurales (véase más adelante).

Punto de control del huso El punto de control del huso debe prevenir la segregación cromosómica en la mitosis hasta que todos los cromosomas están unidos de manera correcta a las fibras del huso. El mecanismo molecular no se comprende bien. Aunque se identifican unos cuantos genes candidato, se sabe que lo único que suele estar mutado en las célu las cancerosas es el gen APCque participa en la poliposis del colon. El APC codifica una proteína multifamiliar muy grande que tal vez participe en una diversidad de procesos celulares. En el colon se observa INC aun adenomas muy tempranos, y las células APC~~ tienen husos mitóticos anormales que conducen a inestabilidad cromosómica.

Sistema de señalamiento de daño del DNA Las células reparan en forma constante todas las clases de daño de su DNA. La respuesta normal a dicho daño es la detención del ci clo celular en tanto el daño se repara y una característica que mu chos cánceres comparten es la pérdida de dicho control. Los sistemas complejos asombrosos que detectan y señalan el daño del DNA se conservan en gran parte desde la levadura hasta el hombre (Zhou y Elledge, 2000). Participa una maquinaria multiproteínica llamada BASC (BRCA1, del inglés associated genom e surveillance complex: complejo relacionado de vigilancia del genoma) aunada a un grupo de otras proteínas. Varios genes supresores de tumor bien conocidos ponen en funcionamiento esta maquinaria: ► ATM es un componente de BASC y se encuentra en una parte temprana del mecanismo que detecta el daño. Esta proteína muy grande releva la señal a una diversidad de blancos corriente aba jo. La pérdida de la fondón de ATM causa ataxia telangiectasia (AT, MIM 208 900). Los homocigotos afectados sufren una pre disposición a varios cánceres, inmunodeficiencia, inestabilidad cromosómica y ataxia cerebelosa. Los portadores heterocigotos de ciertas mutaciones ATM específicas tienen mayor riesgo de cáncer de mama; ► complejos nibrina con proteínas MRE11 y RAD50. Los com plejos forman parte de BASC y tal vez desempeñan también otras funciones. La falta de nibrina ocasiona el síndrome de ro tura de Nijmegen (MIM 251 260). Esta afección se asemeja mucho a la AT desde el punto de vista clínico, pero incluye microcefalia y retraso del crecimiento en lugar de ataxia. La clo nación del gen NBS se describe en la sección 13.5.2;

17.5 | ESTABILIDAD DEL GENOMA

► BRCA1, el producto del primer gen que se implica en el cán cer de mama familiar (sección 15.6.1), es otra proteína muy grande con múltiples dominios funcionales que forma parte de BASC. La proteina BRCA1 también funciona en la recombi nación, la remodelación de cromatina y el control de la trans cripción (Scully y Livingston, 2000). ► BRCA2 es una proteína que no tiene similitud con BRCA1 pe ro comparte muchas funciones. Además de ser la causa de al gunos cánceres de mama hereditarios, una clase particular de mutaciones de BRCA2 ocasiona la forma B/D1 de la anemia de Fanconi (véase MIM 227 650), un síndrome autosómico rece sivo de anormalidades congénitas, insuficiencia progresiva de la médula ósea, hipersensibilidad celular al daño del DNA y pre disposición a cáncer. Al parecer las células con defectos en estas proteínas son en parti cular deficientes para reparar roturas de cadena doble. Es posible que otros tipos de daño no confíen tan intensamente en la detec ción mediante ese sistema para su reparación.

Telómeros y estabilidad cromosomica Como se comenta en la sección 2.2.5, los extremos de los cromo somas humanos están protegidos por una secuencia repetida (TTAGGG)n, que se conserva por un sistema enzimàtico especial que contiene RNA, la telomerasa. La telomerasa se encuentra en la línea germinal humana pero no en la mayor parte de los tejidos so máticos y la longitud del telómero declina 50 a 100 pb con cada generación celular. En cultivo prolongado, las células normales lle gan a un punto de envejecim iento en el que dejan de dividirse. Los fibroblastos deficientes en p53 y la proteina del retinoblastoma pRb, o que alojan oncoproteínas virales, continúan más allá del en vejecimiento y producen crisis. Casi todas las células mueren, pero las únicas con IO7 o casi que sobreviven muestran anormalidades cromosómicas mutables, adquirieron telomerasa y se tomaron in mortales. Tal vez la crisis represente el punto en que los telómeros son tan cortos que ya no pueden proteger los extremos cromosómicos contra el reordenamiento. Por tanto una causa de las anormalidades cromosómicas nota bles que se observan en células tumorales puede ser el agotamiento de telómeros hasta el punto de crisis a través de divisiones celulares excesivas (Maser y DePinho, 2002). Sin embargo, ello no explica la inestabilidad constante porque, de una manera u otra, las células tumorales siempre adquieren la capacidad para conservar sus teló meros y replicarse de manera indefinida. Ochenta y cinco a 90% de los cánceres metastásicos plenamente manifiestos tiene un por centaje mayor de telomerasa; el resto utiliza un mecanismo distin to. denominado ALT y basado en recombinación.

17.5.2 Reparación de defectos del DNA e inestabilidad a nivel del DNA Como se comentó, las células reparan en forma constante el daño Je su DNA (Hoeijmakers, 2001) y los defectos en la maquinaria de 'r í’aración subyacen a una diversidad de trastornos genéticos con propensión a cáncer. Los principales defectos son: ► defectos en la reparación de excisión de nucleótidos: las rotu ras de cadena única y los enlaces cruzados en el DNA que se dañaron por radiación ionizante, luz UV o mutágenos quími cos deben repararse antes de la siguiente ronda de replicación

501

(sección 11.6.1). Se observan defectos en algunas de las en zimas de reparación en varios síndromes con propensión a cáncer, en particular las diversas formas de xerodermia pig mentosa (XP; véase MIM 278 700). Los pacientes con XP son homocigotos para la pérdida hereditaria de mutaciones funcionales y no son capaces de reparar el daño del DNA causado por la luz UV. Son en extremo sensibles a la luz so lar y desarrollan muchos tumores en la piel expuesta; ► defectos en la reparación de excisión de bases: la reparación de fectuosa de la excisión de una base rara vez se observa en cán ceres humanos, pero una forma de cáncer de colon se debe a defectos en la enzima de reparación MYH (Al-Tassan y col., 2002 );

► defectos en la reparación de roturas de cadena doble: las rotu ras de cadena doble se reparan mediante recombinación homo loga o unión no homologa de extremos (Hoeijmakers, 2001). Ambos requieren la maquinaria ATM-NBS-BRCA1-BRCA2 mencionada; ► defectos en la reparación de errores de replicación: se detecta ron durante estudios de cáncer de colon, como se describe más adelante.

17.5.3 Cáncer de colon no polipósico hereditario e inestabilidad microsatélite Casi todo el cáncer de colon es esporádico. Los casos familiares co rresponden a dos categorías: ► La poliposis adenomatosa familiar (PAF o PAC; MIM 175 100) es un padecimiento autosómico dominante en el que el colon se cubre con cientos o miles de pólipos. Estos últimos (adenomas) no son malignos, pero si no se extirpan es casi se guro que uno o más de ellos evolucione a carcinoma invasivo. La causa es una mutación hereditaria en el gen supresor de tu mor (APQ (cuadro 17-4). ► El cáncer de colon no polipósico hereditario (CCNPH) (HNPCC; MIM 120 435, 120 436) también es autosómico dominante y de alta penetrancia; no obstante, a diferencia de la FAP, no existe una fase precedente de poliposis. Los genes del CCNPH se mapearon en dos localizaciones, 2pl5-p22 y 3p21.3. Estudios de pérdida de heterocigosidad en tumores de CCNPH arrojaron resultados novedosos e inesperados. En lugar de carecer de los alelos que se encuentran en el DNA constitucional, los espe címenes de tumor al parecer contenían alelos extra, nuevos, de los marcadores microsatélite utilizados. La figura 17-7B muestra un ejemplo. La LoH es una propiedad de regiones cromosómicas par ticulares, pero la inestabilidad microsatélite (MIN) en CCNPH es general. Aunque muchos tumores muestran inestabilidad ocasional de uno o unos cuantos microsatélite (véase, por ejemplo, fig. 17-8), la inestabilidad de alta frecuencia (definida de manera conveniente como > 29% de todos los marcadores estudiados, véase Tomlinson y cois., 2002) define una clase de tumores MIN+con características clinicopatológicas precisas. En un ejemplo maravilloso de pensamiento lateral Fishel y cola boradores (1993) relacionaron el fenómeno de MIN+con los llama dos genes mutadores en K coli y levaduras. Estos genes codifican un sistema de corrección de errores que controla el DNA recién sinteti zado para pares de bases incompatibles o asas pequeñas de inserción-

502 ¡ CAPÍTULO DIECISIETE | GENÉTICA DEL CÁNCER

Cuadro 17-5. Genes relacionados con la reparación del error de replicación del DNA. E. co li

Humanos

MutS

MSH2

2p16

35%

MSH3

5q11-q12

¿0%?

MSH6

2p16

5%a

MLH1

3p21.3

60%

MLH3

14q24.3

¿0%?

PMS2

7p22

Muy baja

MutL

Localización en el hombre

% de CCNPH

aCCNPH atípico de inicio tardío y cáncer endometrial. Véase Jiricny y IMystrom-Lahti (2000) para detalles.

deleción. Las mutaciones en los genes MutHLS que codifican el sis tema de E. coli conducen a un incremento general de 100 a 1 0 0 0 ve ces en las tasas de mutación. Fishel y colaboradores clonaron un

C a d e n a recién sin te tiza d a

hM utS a (MSH2 + MSH6)

o c o o o c

Movimiento impulsado por ATP

(1) R eg reso (2) R esin te sis

hM utL a (MLH1 + PM S2)

r

Fig. 17-12. Genealogía atípica del síndrome de Li-Fraumeni. Las afecciones malignas típicas del síndrome de Li-Fraumeni incluyen cáncer de mama bilateral diagnosticado a los 40 años de edad (I-2); tum or cerebral a los 35 años de edad (11-1); sarcoma de tejido blando a los 19 años de edad y cáncer de mama a los 33 años (II-3); cáncer de mama a los 32 años edad (II-5); osteosarcoma a los ocho años de edad (III-3); leucemia a los dos años de edad (III-4); sarcoma de tejido blando a los tres años de edad (III-5). 1-1 tuvo cáncer de colon diagnosticado a los 59 años de edad -s e asume que éste no se relaciona con el síndrome de Li-Fraumeni-, Genealogía de Malkin (1994).

homólogo humano de uno de estos genes, MutS, y demostraron que se mapea en la localización 2p de uno de los genes de CCNPH y que estaba mutado constitucionalmente en algunas familias con CCNPH. En todas se implicaron seis homólogos de los genes de E. coli en la reparación incompatible humana (Jiricny y Nystrom-Lah ti, 2000); véase cuadro 17-5 y figura 17-11. Los pacientes con CCNPH son constitucionalmente heterocigotos para una mutación de pérdida de función, casi siempre en MLH1 o MSH2. Sus células normales aún tienen un sistema de re paración funcional incompatible y no muestran el fenotipo MIN+. En un tumor, la segunda copia se pierde por uno de los mecanismos que se muestran en la figura 17-6. Se observa inestabilidad microsatélite en 10 a 15% de los carcinomas colorrectales, endometriales y del ovario, pero rara vez en otros tumores.

17.5.4 p53 y apoptosis

E x o n u clea sa P o lim erasa F a c to re s d e replicación

Fig. 17-11. Mecanismo de reparación incompatible. Los errores de replicación pueden producir pares de bases incompatibles o pequeñas asas de inserción/deleción. Son reconocidas por hMutSa, un dímero de las proteínas MSH2/MSH6, o en ocasiones por el dímero MSH2/MSH3 hMutSp. Las proteínas se translocan a lo largo del DNA, o enlazan el dímero MLH1/PMS2 hM utLa, a continuación ensamblan el “ reparosoma” completo que retrocede y sintetiza de nuevo la cadena recién sintetizada. Véase Jiricny y Nystrom-Lahti (2000).

Un contribuyente mayor a la inestabilidad del genoma es la pérdi da o la mutación de TP53, el gen que codifica el factor de trans cripción p53. Es probable que esta pérdida sea el cambio genético aislado más frecuente en el cáncer. Esto refleja la importancia cen tral de p53, que se resumió como el “guardián del genoma” (Vousden, 2000). Como ya se señaló, el ciclo celular se detiene en células con DNA dañado. Si el daño no es reparable se desencadena apop tosis. El p53 desempeña una función crucial en estos procesos. En condiciones normales los valores de p53 en un célula son bajos por que la proteína se degrada con rapidez. Las señales de una gama completa de sensores celulares de estrés, inclusive los sensores de daño, conducen a la fosforilación y la estabilización de p53. Ello in crementa la transcripción dependiente de p53 de genes, como p 2 jW A f i/ c i r i inhibe el ciclo celular, y PUMA y PIG3 que con trolan la apoptosis. Las células tumorales que carecen de p53 pue den continuar replicando DNA dañado y no sufren apoptosis. Sin

17.6 I CONTROL DEL CICLO CELULAR | 503

embargo, cabe señalar que la pérdida de p53 es un acontecimiento hasta cierto punto tardío en el desarrollo tumoral (véase por ejem plo, la fig. 17-17); es evidente que las etapas más tempranas de la evolución del tumor no se previenen mediante p53. Es posible eliminar (knocked out) p53 mediante deleción, muta ción o por la acción de un inhibidor como el producto génico MDM2 (que enlaza p53 y lo marca para su degradación; MDM2 también enlaza pRb, véase más adelante) o la proteína E6 del papilomavirus. TP53 se mapea en 17pl2 y es una de las regiones más frecuentes de pérdida de heterocigosidad en una gama amplia de tu mores. Con gran frecuencia las neoplasias que no pierden TP53 tie nen versiones mutadas del mismo. A fin de completar el cuadro de TP53 como un gen supresor de tumor (ST) se encuentran mutacio nes constitucionales en TP53 en familias con el síndrome de LiFraumeni que se hereda en forma dominante (MIM 151 623). Los miembros de la familia afectados sufren múltiples tumores prima rios, que suelen comprender sarcomas de tejido blando, osteosarcomas, tumores de mama, cerebro y corteza suprarrenal, y leucemia (fig. 17-12) Fig. 17-14. Puntos de control del ciclo celular.

17.6

Control del ciclo celu lar

Toda célula tiene tres conductas para elegir en cualquier época: per manecer estática, dividirse o morir (apoptosis). Algunas también tienen la opción de diferenciarse. Las células eligen una de estas op ciones en respuesta a señales internas y externas (fig. 17-3A). Los oncogenes y los genes supresores de tumor desempeñan funciones fundamentales en la generación y la interpretación de estas señales. A)

E sta sis D iferenciación M itosis A p o p to sis B)

S e ñ a le s

R e s p u e s ta s

R e s p u e s ta s

Una serie de controles impide que la célula pase a la fase S o mitosis con DNA dañado no reparado, o inicie la anafase de la mitosis hasta que todos los cromosomas están unidos de modo correcto a las fibras del huso. Es probable que haya un punto de control de daño del DNA adicional durante la fase S.

Aunque la vida sería muy simple si la señal y la respuesta se unie ran por una vía lineal única (fig. 17-13B), al parecer nunca sucede así. En lugar de ello la conducta de la célula está controlada por ra mificación múltiple, superposición y vías parcialmente redundantes (fig. 17-13C). Es probable que estas redes complicadas sean necesa rias para conferir estabilidad y resistencia a la maquinaria en extre mo compleja de una célula. Desde el punto de vista experimental es muy difícil descubrir el circuito genético preciso de los controles, en parte por su complejidad y además porque en experimentos de transfección o knockoutts difícil distinguir los efectos directos de los indirectos. Se espera que la expresión de microarreglos proporcione la clave de este problema. Para células como las cancerosas que deciden dividirse, el pro greso a través del ciclo está sujeto a varios puntos de control (fig. 17-14). Los tres principales son: ► el punto de control G1-S: la replicación de DNA se bloquea en presencia de un daño no reparado del DNA; el daño irrepara ble conduce a apoptosis. Tal vez hay un punto de control de daño adicional independiente dentro de la fase S; ► el punto de control G2-M: el ingreso de las células a la mitosis se bloquea a menos que la replicación del DNA y la reparación de cualquier daño estén completas;

Fig. 17-13. Opciones que tiene una célula y forma en que las elige.

► punto de control del huso: se describe en la sección 17.5.1.

A) En respuesta a señales Internas y externas, una célula elige entre estasis, mitosis, apoptosis y en ocasiones diferenciación. B) Una célula Imaginaria en la que las señales se enlazan a respuestas mediante

17.6.1 Punto de control G1-S

vías lineales no ramificadas de estimulación (-») o inhibición ( h ). Las células humanas no funcionan como ésta. C) En las células reales las señales avanzan hacia una red compleja de interacciones parcialmente redundantes, cuyo resultado final no es fácil predecir por medios analíticos.

La figura 17-15 muestra parte del circuito de este punto de control. Se piensa que es particularmente crítico porque está inactivado en la mayor parte de las células tumorales. Tres genes supresores de tu mor fundamentales, RB, TP53 y CDKN2A, son elementos centra les en la carcinogénesis y unos de los genes que se alteran con más frecuencia en células tumorales. Cada uno desempeña una función

504

CAPÍTULO DIECISIETE ¡ GENÉTICA DEL CÁNCER

Respuesta al daño del DNA

p16INK4A

D año irreparable: desencadena apoptosis

D año rep arab le: pausa para reparación

■►S

Fig. 17-15. Controles en la progresión del ciclo celular e integridad genómica mediada por los productos génicos fifi, TP53 y CDKN2A (INK4A). Estos controles forman cuando menos parte del punto de control del ciclo celular G1 -S. Véase Harbour y Dean (2000) para detalles.

en cánceres hereditarios. De hecho es probable que todas las célu las tumorales deban inactivar tanto los brazos Rb como p53 del sis tema a fin de que las células deriven los controles usuales del ciclo y eviten estimular apoptosis en respuesta al daño de DNA no repa rado o el señalamiento de crecimiento excesivo.

Función de pRb, el producto génico RB El gen RB se identificó por su participación en el retinoblastoma (sección 17.4.1), pero se expresa en forma amplia y ayuda a contro lar el ciclo de todas las células. En las células normales el producto génico, una proteína nuclear de 110 kDa, se inactiva por fosforila ción y se activa por desfosforilación. El pRb activo (desfosforilado) enlaza e inactiva el factor E2F de transcripción celular, cuya fun ción se requiere para la progresión del ciclo celular (fig. 17-15; pa ra mayores detalles véase Harbour y Dean, 2000). Dos a cuatro horas antes que la célula entre en la fase S, pRb se fosforila. Esto li bera la inhibición de E2F y permite que la célula proceda a la fase S. La fosforilación está regida por una cascada de ciclinas, cinasas dependientes de ciclinas e inhibidores de la cinasa de ciclina. Varias oncoproteínas virales (adenovirus E1A, antígeno SV40-T y proteí na E7 de papilomavirus humano) se unen y secuestran o degradan pRb, lo que favorece la progresión del ciclo celular.

Función de p16INK4A y p14ARF, los productos del gen CDKN2A El gen notable CDKN2A (antes llamado MTS1 o INK4A) en 9pl3 codifica dos proteínas no relacionadas en términos estructurales (fig. 17-16). Los exones la , 2 y 3 codifican la proteína INK4A o pl6. Un segundo promotor inicia la transcripción más corriente arriba en el exón 1(3. El exón 113 se empalma en los exones 2 y 3, pero el mar co de lectura se cambia, de manera que una proteína p l4 o ARF (del inglés Alternative Reading Frame, marco de lectura alternativo) no re lacionada en lo absoluto se codifica (el homólogo del ratón es pl9).

Ambos productos génicos funcionan en el control del ciclo ce lular (fig. 17-15). p 16 actúa corriente arriba de la proteína RB pa ra regular el punto de control del ciclo celular Gl-S. Las cinasas dependientes de ciclina inactivan pRb mediante fosforilación, pero p l6 inhibe la cinasa CDK4/6. Por consiguiente la pérdida de fun ción de p 16 conduce a la pérdida de función de RB y a un ciclo ce lular inapropiado. El otro producto del gen CDKN2A, p 14, media la detención de G1 al desestabilizar la proteína MDM2, el produc to del oncogén MDM2 que está amplificado en muchos sarcomas (Pomeranz y cois., 1998). La MDM2 enlaza p53 e induce su degra dación. En consecuencia p l4 actúa para conservar el nivel de p53. La pérdida de función de p l4 conduce a valores muy altos de MDM2, destrucción excesiva de p53 y por tanto pérdida de con trol del ciclo celular. Aunque algunas familias con melanoma múltiple muestran mu taciones hereditarias de CDKN2A, que suelen afectar sólo p l6, son mucho más frecuentes las mutaciones somáticas. La deleción homocigota del gen inactiva tanto los brazos RB como p53 del con trol del ciclo celular y éste es un acontecimiento muy usual en la tumorigénesis. Algunos tumores tienen mutaciones que afectan p l6 pero no p l4 (p. ej., inactivación del promotor l a por metilación). Esos tumores también tienden a poseer mutaciones de p53, lo que demuestra la importancia de inactivar ambos brazos del sis tema de control como se muestra en la figura 17-15.

17.7

In tegración de los datos: vías y capacidades

Como se comentó al inicio de este capítulo, la genética del cáncer puede ser muy confusa. Demasiados genes, muchas mutaciones, una infinidad de combinaciones... cada tumor es único. Pero lo que todos comparten es que cada neoplasia es el producto de la selección para un grupo específico de capacidades definibles y que, cuando se piensa en términos de vías en lugar de genes individuales, sólo hay

17.7

INTEGRACIÓN DE LOS DATOS: VÍAS Y CAPACIDADES

cm y con focos de carcinoma), para transformarse en carcino mas, que por último dan metástasis-,

Transcrito p16INK4A

Transcrito p14arf

-*■ U) o> 9

1

1ß

psüs Secuencia de codificación p16

► en la PAF, una copia de APC en 5q21 está mutada constitucio nalmente. Como hecho interesante, las mutaciones hereditarias rara vez sólo inactivan la proteína APC, por lo general producen una proteína truncada que ejerce una acción negativa dominan te (véase sección 16.4.3). Es evidente que la inactivación simple de un alelo APC no daría la ventaja de crecimiento necesaria. Las lesiones detectables más tempranas, los focos crípticos abe rrantes, carecen por completo de de expresión APC. Alrededor de una célula epitelial en 10S evoluciona a un pólipo, una tasa compatible con el acontecimiento determinante de pérdida del segundo alelo APC,

a

Secuencia de codificación p14 ^

No traducido

Fig. 17-16. Los dos productos del gen CDKN2A. El gen (que también se conoce como MTS e INK4A) codifica dos proteínas no relacionadas por completo. p16INK4A se transcribe de exones 1a, 2 y 3, y p14ARF de exones 1 p, 2 y 3 -pe ro con un marco de lectura diferente de los exones 2 y 3 -, Los dos productos génicos son activos en los brazos RB y p53 del control del ciclo celular respectivamente, como se muestra en la figura 17-15.

un número limitado de formas para nombrar estas capacidades. Hahn y Weinberg (2002) intentaron listar todas estas vías y dibujaron un “mapa de ruta” del cáncer.

17.7.1 Vías en el cáncer colorrectal El conocimiento de la evolución tumoral se desarrolló mejor en cánceres colorrectales, porque es posible estudiar todas las etapas del desarrollo del tumor en el colon resecado de pacientes con poliposis adenomatosa familiar. La figura 17-17 muestra estos pasos. Es posible elaborar esquemas similares pero más rudimentarios pa ra otros tumores en los que los datos no son tan abundantes. El es quema se basa en una serie de observaciones: ► los carcinomas malignos se desarrollan de epitelio normal del colon a través de focos crípticos aberrantes microscópicos hasta crecimientos epiteliales benignos llamados adenomas. Estos úl timos pasan por las etapas temprana (< 1 cm de tamaño), in termedia (> 1 cm pero sin focos de carcinoma) y tardía (> 1

Pérdida o m utación de APC en el gen de ST (5q)

E p ite lio n o rm a l

505

H ip o m e tila c ió n de DNA

E p ite lio h ip e rp ro life ra tiv o

A c tiv a c ió n de oncogen KRAS (12p)

► alrededor de 50% de los adenomas intermedios y tardíos, pero sólo cerca de 10% de los tempranos, tiene mutaciones en el on cogen KRAS (un relacionado de HRAS, cuadro 17-1). Por con siguiente es posible que a menudo se requieran mutaciones de KRAS para la progresión de adenomas tempranos a interme dios; ► alrededor de 50% de los adenomas y carcinomas tardíos mues tra pérdida de heterocigosidad 18q. Este hecho es más o menos raro en adenomas tempranos e intermedios. Parece probable que el gen importante sea SMAD4 (que también se conoce co mo MADH4) en lugar del candidato inicial, DCC (véase White, 1998); ► los cánceres colorrectales, pero no los adenomas, muestran una frecuencia muy alta de pérdida o mutaciones de TP53. El esquema de la figura 17-17 pretende mostrar la serie más usual de mutaciones, pero no todos los cánceres de colon siguen esta vía. Sólo cerca de 60% de estos cánceres tiene mutaciones de APC. Sin embargo, los tumores que carecen de mutaciones APC suelen te ner mutaciones activantes en la catenina |3, el principal blanco de la acción de APC corriente abajo (Fodde y cois., 2001). Más adelante en la progresión, los tumores de la PAF tienden a perder el cromosoma 18q, pero los del CCNPH son cromosómicamente estables y no pierden 18q. En ambos casos quizás la presión selec tiva sea la pérdida del señalamiento beta inhibidor del crecimien to por el factor de transformación del crecimiento (TGF). En la

Pérdida o m u tació n del gen ST en 18q (¿SMAD4?)

_ A denom a te m pra no

P é rd id a o m u ta c ió n d e TP53 en el ge n d e ST (17 p)

A denom a interm edio

, A denom a . tardío

C a rc in o m a

Fig. 17-17. Un modelo para el desarrollo del cáncer de colon en múltiples pasos. Véase el texto para mayores detalles. Éste es sobre todo un medio para pensar respecto a la form a en que se desarrollan los tumores, más que una descripción firm e. Es probable que cada cáncer colorrectal se haya desarrollado a través de las mismas etapas histológicas, pero los cambios genéticos subyacentes son más variados. Según Fearon y Vogelstein (1990), la figura ilustra una secuencia de acontecimientos en particular frecuente. Smith y colaboradores (2002) dudaron de la validez de este modelo porque, en su serie de 106 tumores, sólo siete tuvieron mutaciones en los tres, APC, KRAS y p53.

506

CAPÍTULO DIECISIETE

GENÉTICA DEL CÁNCER

PAF esto ocurre por pérdida del efector corriente abajo SMAD4 localizado en 18q. En el CCNPH, 90% de los tumores MIN+ tie ne mutaciones de cambio de marco en una carrera (A)8 en el gen del receptor II de TGFji. A menudo los tumores del CCNPH tie nen mutaciones de cambio de marco en el gen AXIN2, que codi fica otro componente de la vía APC-fi-catenina. Por tanto detrás de la heterogeneidad de acontecimientos moleculares, hay un cua dro mucho más regular de vías que deben inactivarse para que un tumor se desarrolle.

17.7.2 Un tumor con éxito debe adquirir seis capacidades específicas Una revisión importante y muy recomendable de Hanahan y Weinberg (2002) (véanse Lecturas adicionales) sugiere otra forma de concebir la evolución de un tumor. Los autores sugieren que los factores fundamentales en la transición de una célula normal a una célula cancerosa maligna son la adquisición de seis capacidades es pecíficas. La célula debe tornarse: ► independiente de señales externas de crecimiento; ► insensible a señales externas anticrecimiento; ► capaz de evitar la apoptosis; ► apta para la replicación indefinida; ► hábil para la angiogénesis sostenida; ► capaz de invadir y dar metástasis tisulares. Es posible que las metástasis no sean una capacidad seleccionada de manera específica. La aptitud para dar metástasis no es claramente ventajosa para ninguna célula y puede ser un efecto incidental del desarreglo genómico general de células tumorales avanzadas. Las otras cinco capacidades resultan de selección específica. Se sabe has ta cierto punto poco respecto a la angiogénesis, pero ya se comenta ron los sitios de oncogenes activados, la alteración del control del ciclo celular, la mutación p53 y la reactivación de la telomerasa a fin de obtener las cuatro primeras de estas capacidades. Cada aptitud puede adquirirse por una diversidad de cambios genéticos distintos, pero en cada caso la adquisición requiere ciertas vías específicas pa ra activarse o inactivarse. Las capacidades no siempre se adquieren en el mismo orden en diferentes tumores, pero los requerimientos para inestabilidad genómica y expansiones clónales sucesivas en eta pas intermedias (recuadro 17-1) imponen cierta regularidad en el proceso. La primera mutación de la evolución en múltiples pasos de un tumor es crítica porque debe conferir cierta ventaja para el crecimiento en una célula por otra parte normal que tiene intac tas todas sus defensas. Según la hipótesis d e l cela d or (Kinzler y Vogelstein, 1996), en una población celular en renovación deter minada un gen particular tiene a su cargo la conservación de un número constante de células. La mutación de un celador conduce a un desequilibrio permanente entre la división y la muerte celu lares, en tanto que las mutaciones de otros genes no tienen efec to a largo término si el celador funciona de modo correcto. De acuerdo con esta teoría, los genes supresores de tumor identifica dos en estudios de cánceres mendelianos son los celadores del te jido participante: NF2 para células de Schwann, VHL para células renales, etc. En el caso de la APC tal vez sea importante que esta proteína no sólo regula el valor de la catenina |3, un con trolador principal del crecimiento celular, sino que también pue de desempeñar una función fundamental en el punto de control

del huso (sección 17.5.1). Ya se señaló que aun en etapas muy tem pranas los adenomas muestran inestabilidad cromosómica. Es fac tible que una mutación aislada de APC (del tipo derecho) confiera ya una ventaja para el crecimiento en el epitelio del colon, en tan to que la mutación de un gen aislado BRCA1/2 no proporciona ventaja al epitelio ductal. Ello explicaría por qué la mutación APC es tan frecuente en el cáncer de colon esporádico, pero las mutacio nes BRCA1/2 son raras en el cáncer de mama esporádico (Lamlum y cois., 1999). Aún no se aclara con qué tanta frecuencia se ajustan a la teoría del celador cánceres como los de próstata o pulmón, que carecen de formas mendelianas.

17.8

¿Para qué sirve todo este conocim iento?

A la luz de las ideas expuestas en este capítulo resulta fácil observar que es disparatado hablar de “una curación del cáncer”. Sin embar go, los nuevos conocimientos conducen ya a un progreso impor tante en tres áreas: detección, diagnóstico y tratamiento. ► La detección del cáncer presintomático suele basarse en exa men físico, estudios (mamografía, etc.), valoraciones bioquímicas (antígeno específico de próstata) o métodos invasivos (colonoscopia, etc.). Por razones que aún no aclaran por completo, los tumores eliminan DNA. Métodos de PCR sensibles pueden amplificar DNA tumoral de la orina (en el cáncer vesical), las heces (en el cáncer de colon), la saliva o el esputo (en el cáncer bucal o pulmonar) o de la sangre en una diversidad de cánceres (Sidransky, 2002). Por fortuna los estudios de este DNA para mutaciones en TP53, APC, etc., metilación de promotor espe cífica o inestabilidad microsatélite permitirán una detección más eficaz y no invasiva. ► Como se mencionó al inicio de este capítulo, los métodos histológicos tradicionales de identificación del tumor y la asignación de la etapa se complementan cada vez más (pero no se sustituyen) mediante métodos moleculares (Lakhani y Ashworth, 2001). Lo anterior registra un mayor avance en leucemias, en las que la definición de los reordenamientos cromosómicos proporciona indicadores importantes de pro nóstico y tratamiento (véase, por ejemplo, Armstrong y cois., 2002). Hasta fecha reciente la complejidad de los cambios en tumores sólidos desafiaba un análisis sencillo, pero el perfilamiento de la expresión empieza a proveer clasificaciones útiles de subtipos, una vez más, con implicaciones para el pronóstico y el tratamiento. La figura 17-18 muestra ejem plos de aplicaciones recientes de arreglos de expresión en el cáncer. ► Los primeros tratamientos basados en el conocimiento de cam bios moleculares específicos ya se establecieron. El herceptín, un anticuerpo monoclonal contra el receptor ErbB2 de cinasa de tirosina, es una terapéutica eficaz en cánceres de mama que presentan amplificaciones del gen ERBB2, pero no para los que carecen de esta característica (De Bono y Rowinsky, 2002). Gleevec (Imatinib, ST-1571) es un inhibidor específico de la proteína de fusión BCR-ABL (fig. 17-4A) que logra resultados notables en leucemia mieloide crónica (Savage y Antman, 2002). Éstas son las primeras nuevas modalidades de fármacos antican cerosos diseñadas a partir del conocimiento de los acontecimien tos moleculares en tumores.

17.8 i ¿PARA QUÉ SIRVE TODO ESTE CONOCIMIENTO?

507

Fig. 17-18. Ejemplos del uso de arreglos de expresión para caracterizar tumores. A) Identificación del tejido de origen. Los patrones de expresión de 148 genes (hileras) clasifican 100 tumores (columnas) por origen. Pr, próstata; Bl, vejiga/uréter; Br, mama; Co, colorrectal; Ga, gastroesofágico; Ki, riñón; Li, hígado; Ov, ovario; Pa, páncreas; LA, adenocarcinoma de pulmón; LS, carcinoma de célula escamosa del pulmón. Rojo = presión génica aumentada, azul = expresión disminuida. Tomado de Su y colaboradores (2001). Cáncer Research 61, 7388-7393, con autorización de The American Association for Cáncer Research. B) Distinción de dos tipos de linfoma de célula B grande difuso. El agrupamiento de la expresión génica distingue tumores similares a centro germinal de tumores activados tipo B (barras de color naranja y azul). La supervivencia a los cinco años en los dos grupos es de 76 y 16%, respectivamente. Reproducido de Alizadeh y colaboradores (2000), con autorización de Nature Publishing Group. C) Sensibilidad a fármacos quimioterapéuticos. Los perfiles de expresión de 6 817 genes en 60 líneas de células tumorales se correlacionaron con la respuesta a 232 medicamentos. La figura muestra los patrones de expresión génica (hileras) en 30 líneas celulares (columnas) que predicen sensibilidad o resistencia a un fármaco, la citocalasina D. Tomado de Staunton y colaboradores (2001), con autorización de National Academy of Sciences, USA. D) Predicción del resultado clínico del cáncer de mama. Los patrones de expresión de 25 000 genes se calificaron en 98 cánceres de mama primarios. La figura muestra perfiles de 70 genes marcadores de pronóstico (columnas) en 78 cánceres (hileras). Todas los pacientes se sometieron a Intervención quirúrgica y radioterapia; las líneas amarillas dividen a los que se predijo (mediante dos criterios alternativos) que requerían quimioterapia adicional (arriba de la linea) de los que no necesitaban este tratamiento desagradable. Datos reproducidos de Van’t Veer y colaboradores (2002) con autorización de Nature Publishing Group.

508

CAPÍTULO DIECISIETE

GENÉTICA DEL CÁNCER

Lecturas adicionales Bishop JM (1983) Cellular oncogenes and retroviruses. Annu. Rev. Biochem. 52, 301-354. Hanahan D, Weinberg R (2000) The hallmarks of cancer. Cell 100, 57-70.

Stanbridge EM (1990) Human tumor supressor genes. Annu Rev. Genet. 24, 615-657.

Bibliografía Alizadeh AA, Eisen MB, Davis RE et a/. (2000) Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403, 503-511. Al-Tassan N, Chmiel NH, Maynard J et al. (2002) Inherited va riants of MYH associated with somatic G:C->T:A mutations in co lorectal cancer. Nature Genet. 30, 227-232. Armstrong SA, Staunton JE, Silverman LB et al. (2002) MLL translocations specify a distinct gene expresion profile that dis tinguishes a unique leukemia. Nature Genet. 30, 41-47. Blume-Jensen P, Hunter T (2001) Oncogenic kinase signalling. Nature 411, 355-365. Cavenee WK, Dryja TP, Phillips RA ef al. (1983) Expression of recessive alleles by chromosomal mechanisms in retinoblasto ma. Nature 305, 779-784. Chissoe SL, Bodenteich A, Wang Y-F ef al. (1995) Sequence and analysis of the human ABL gene, the BCR gene, and re gions involved in the Philadelphia chromosomal translocation. Genomics 27, 67-82. De Bono JS, Rowinsky EK (2002) The ErbB receptor family: a therapeutic target for cancer. Trends Mot. Med. 8(4 Suppl), S18S26. Fearon ER, Vogelstein B (1990) A genetic model for colorectal tumorigenesis. Cell 61, 759-767. Fishel R, Lescoe MK, Rao MRS ef al. (1993) The human muta tor gene homolog MSH2 and its association with hereditary non polyposis colon cancer. Cell 78, 539-542. Fodde R, Smits R, Clevers H (2001) APC, signal transduction and genetic instability in colorectal cancer. Nature Rev. Cancer 1, 5567. Forozan F, Karhu R, Kononen J ef al. (1997) Genome screening by comparative genome hybridization. Trends Genet. 13. 405409. Futreal PA, Kasprzyk A, Birney E ef al. (2001) Cancer and geno mics. Nature 409. 850-852. Hahn WC, Weinberg RA (2002) Modelling the molecular circuitry of cancer. Nature Rev. Cancer 2, 331-340. Harbour JW, Dean DC (2000) The Rb/E2F pathway: expanding ro les and emerging paradigms. Genes Dev. 14, 2393-2409. Hoeijmakers J (2001) Genome maintenance mechanisms for pre venting cancer. Nature 411, 366-374. Jallepalli PV, Lengauer C (2001) Chromosome segregation and cancer: cutting through the mystery. Nature Rev. Cancer 1, 109117. Jiricny J, Nystrom-Lahti M (2000) Mismatch repair defects In cancer. Curr. Opin. Genet. Dev. 10, 157-161. Jones PA, Baylin SB (2002) The fundamental role of epigenetic events in cancer. Nature Rev. Genet. 3, 415-428. Kinzler KW, Vogelstein B (1996) Lessons from hereditary colorec tal cancer. Cell 87, 159-170. Knudson AG (2001) Two genetic hits (more or less) to cancer. Na ture Rev. Cancer 1, 157-162.

Lakhani SR, Ashworth A (2001) Microarray and histopathologlcal analysis of tumours: the future and the past? Nature Rev. Can cer 1, 151-157. Lamlum H, Ilyas M, Rowan A ef al. (1999) The type of somatic mutation at APC in familial adenomatous polyposis is determi ned by the site of the germllne mutation: a new facet to Knudson's ‘two-hit’ hypothesis. Nature Med. 5, 1071-1075. Lowy DR, Willumsen BM (1993) Function and regulation of RAS. Annu. Rev. Biochem. 62, 851-891. Malkin D (1994) Germllne p53 mutations and heritable cancer. An nu. Rev. Genet. 28, 4443-4465. Maser RS, DePinho RA (2002) Connecting chromosomes, crisis and cancer. Science 297, 565-569. Mitelman F, Johansson B, Mertens F (eds) Mitelman Database of Chromosome Aberrations in Cancer (2002). http://cgap. nci.nih.gov/Chromosomes/Mitelman Pinkel D (1994) Visualizing tumor amplification. Nature Genet. 8. 107-108. Pomeranz J, Schreiber-Agus N, Liegois NJ et al. (1998) The Ink4a tumor suppressor gene product, p19Arf, interacts with MDM2 and neutralizes MDM2’s inhibition of p53. Cell 92. 713723. Rabbitts TH (1994) Chromosome translocations in human cancer. Nature 372, 143-149. Sanchez-Garcia I (1997) Consequences of chromosomal abnor malities In tumor development. Ann. Rev. Genet. 31, 429-453. Savage DG, Antman KH (2002) Imatinib mesylate - a new oral targeted therapy. New Engl. J. Med. 346, 683-693. Scully R, Livingston DM (2000) In search of the tumour-suppressor functions of BRCA1 and BRCA2. Nature 408, 429-432. Sidransky D (2002) Emerging molecular markers of cancer. Natu re Rev. Cancer 2, 210-219. Smith G, Carey FA, Beattie J ef al. (2002) Mutations in APC. Kirsten-ras, and p53-alternative genetic pathways to colorectal cancer. Proc. Natl Acad. Sci. USA 99, 9433-9438. Staunton JE, Slonim DK, Coller HA et al. (2001) Chemosensitivity prediction by transcriptional profiling. Proc. Natl Acad. Sci. USA 98, 10787-10792. Su Al, Welsh JB, Sapinoso LM ef al. (2001) Molecular classifica tion of human carcinomas by use of gene expression signatu res. Cancer Res. 61 7388-7393. Thiagalingam S, Laken S, Willson JKV et al. (2001) Mecha nisms underlying losses of heterozygosity in human colorectal cancers. Proc. Natl Acad. Sci. USA 98, 2698-2702. Tomlinson I, Halford S, Aaltonen L et al. (2002) Does MSI-low exist? J. Pathol. 197. 6-13. Tosi S, Giudici G, Rambaldi A ef al. (1999) Characterization of the human myeloid leukemia-derived cell line GF-D8 by multi plex fluorescence in situ hybridization, subtelomeric probes and comparative genomic hybridization. Genes Chrom. Cancer 24 231-241.

CAPÍTULO

DIECIOCHO

Pruebas genéticas en individuos y poblaciones Contenido del capítulo

512

18.1

CAPÍTULO DIECIOCHO | PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

Introducción

Los genetistas no tienen el monopolio del diagnóstico basado en DNA. Por ejemplo, la PCR es una herramienta central de micro biólogos y biólogos para identificar patógenos. Hematólogos, oncólogos y otros histopatólogos utilizan pruebas de DNA como base para establecer diagnósticos. Sin embargo, para los propósitos de este capítulo, las pruebas genéticas se definen como pruebas para factores mendelianos. Los factores pueden indicar el riesgo de una persona de desarrollar o transmitir una enfermedad (mendeliana o no), o emplearse con objeto de identificar a una persona e indicar su relación con alguien más. Siempre que sea posible los autores recurrirán a dos de las en fermedades mendelianas más frecuentes, fibrosis quística (FQ) y distrofia muscular de Duchenne (DMD) con el fin de ilustrar los diversos métodos de pruebas. Ambas incluyen genes grandes con heterogeneidad alélica extensa, pero además la FQ y la DMD con llevan grupos de problemas diagnósticos de DNA bastante diferen tes (cuadro 18-1). Entre ellos, muestran muchos de los problemas relacionados con las pruebas para enfermedades mendelianas. Co mo siempre, esta obra se concentrará en los principios y no en los detalles prácticos. El lector interesado en procedimientos específi cos encontrará información respecto a la “mejor práctica” para el diagnóstico de laboratorio de las enfermedades mendelianas más usuales en http//:www.cmgs.org. Ésta se acordó en reuniones de trabajo de consenso de la UK Clinical Molecular Genetics Society. El libro de Elles y Mountford (véase Lecturas adicionales) describe métodos de pruebas para una gama más amplia de padecimientos. Cuando un clínico lleva una muestra de DNA de un paciente a un laboratorio de pruebas diagnósticas, son tres las posibles pre guntas que el laboratorio podría intentar resolver: ► ¿El paciente tiene alguna mutación o algún gen que explicarían su enfermedad? Esta pregunta es incontestable ahora y lo será en el futuro. La prueba genética tiene que ser dirigida. Aun si es posible secuenciar el genoma entero de una persona como un procedimiento diagnóstico, sin una lista específica de can

didatos no se tiene un medio para decidir cuál de los varios mi llones de diferencias entre las secuencias del DNA de dos per sonas podría ser la causa de una enfermedad. ► ¿El paciente tiene alguna mutación en ese gen particular que pu diera causar su enfermedad? En la sección 18.3 se estudian las medidas estándar para responder esta pregunta, en tanto que en la sección 18.5 se expone una conducta alternativa, el ras treo génico. ► ¿El paciente tiene una deleción de tres bases del codón de fenilalanina 508 en su gen CFTFS En la sección 18.4 se conside ran las circunstancias en que este tipo de preguntas puede hacerse y los medios paras responderlas.

18.2

Elección del m a te ria l para pruebas: DNA, RNA o proteínas

El estudio genético casi siempre se efectúa mediante PCR con los métodos que se describen en la sección 5.2. Las pocas aplicaciones de Southern blotting comprenden pruebas para reordenamientos o alteraciones génicas mayores y mutaciones completas en X frágil y en la distrofia mió tónica (sección 16.6.4). La sensibilidad de la PCR permite emplear una gran variedad de muestras de tejidos, in clusive: ► muestras de sangre: son la fuente de DNA de adultos que más se utiliza; ► enjuagues o raspados bucales: puesto que no son invasivos, se prefieren en especial para programas de selección de poblacio nes. Los enjuagues bucales proveen suficiente DNA para unas cuantas docenas de pruebas y por lo general la amplificación del genoma completo (sección 5.2.4) permite efectuar pruebas más extensas en una muestra aislada; ► muestras de biopsia de vellosidades coriónicas: constituyen la mejor fuente de DNA fetal (mejor que los especímenes de amniocén tesis);

Cuadro 18-1. Contraste genético de la fibrosis quística y la distrofia muscular de Duchenne. Fibrosis quística

Distrofia muscular de Duchenne

Autosómica recesiva

Recesiva ligada a X

Mutaciones de pérdida de función

Mutaciones de pérdida de función

Gen muy grande: DNA genómico, 250 kb 27 exones mRNA de 6.5 kb

Gen gigante: DNA genómico, 2 400 kb 79 exones mRNA de 14 kb

Casi todas las mutaciones son cambios de nucleótido único

65% de las mutaciones corresponde a deleciones que incluyen uno o más exones completos 5% es duplicaciones 30% de mutaciones sin sentido, sitio de empalme, etcétera Las mutaciones en sentido erróneo son muy raras

Las nuevas mutaciones son en extremo raras

Las nuevas mutaciones son muy frecuentes

El mosaicismo no es un problema

El mosaicismo es frecuente

Poca recombinación intragénica

Punto crítico de recombinación (12% entre marcadores en cualquier extremo del gen)

Las pruebas genéticas en DMD y FQ requieren diferentes grupos de enfoques.

18.3 | ESTUDIO DE UN GEN PARA MUTACIONES

► una o dos células extraídas de embriones en etapa de ocho células, para el diagnóstico preimplantación después de la fe cundación in vitro; ► cabello, semen, etc., para investigaciones criminales; ► especímenes anatomopatológicos archivados, para tipifica ción de personas muertas cuando no se guardó DNA o para el estudio de tumores en busca de cambios genéticos. Sólo se cuencias cortas de 250 pb o menos pueden amplificarse con se guridad a partir de especímenes de tejidos fijados; ► tarjetas Guthrie: son tarjetas en las que se envía una gota de sangre seca a un laboratorio a fin de efectuar selección neona tal para fenilcetonuria (FCU) en el Reino Unido y en otras par tes. Puesto que para la prueba de selección no se usa toda la gota de sangre, las tarjetas, si se conservan, son fuentes posibles de DNA de un niño muerto.

El RNA tiene ventajas sobre el DNA, pero es más difícil de obtener y manejar La prueba mediante PCR-RT (véase sección 5.2.1) ofrece varias ventajas cuando es necesario estudiar un gen para mutaciones des conocidas. El estudio del DNA suele incluir amplificación y pruebas de cada exón por separado, y esto puede ser una labor importante en un gen con muchos exones. Puesto que casi todos los métodos de selección de mutaciones (cuadro 18-2) permiten estudiar frag mentos más grandes que el exón de tamaño promedio, es factible examinar un producto de la PCR-RT con un número más pequeño de reacciones. Asimismo sólo la PCR-RT puede detectar con segu ridad el empalme aberrante, que a menudo resulta difícil de prede cir a partir de un cambio en una secuencia de DNA, o que quizá se deba a la activación de un sitio de empalme críptico profundo den tro de un intrón (véase sección 16.4.1). No obstante, obtener RNA y trabajar con él es mucho menos cómodo. Las muestras deben ma nejarse con gran cuidado y procesarse con rapidez a fin de evitar que el mRNA se degrade, y quizás el gen de interés no se exprese en tejidos a los que se accede con facilidad. Además como muchas mutaciones originan mRNA inestable (véase secciones 11.4.4, 16.4.1), cabe esperar que el producto de la PCR-RT de una perso na heterocigota sólo muestre el alelo normal.

Las valoraciones funcionales de proteínas desempeñan una función en las pruebas genéticas Una valoración funcional basada en proteínas podría clasificar los productos de una serie alélica muy heterogénea en dos grupos sim ples -funcional y no funcional- lo que, después de todo, es la pre gunta esencial en la mayor parte de los diagnósticos. El problema con las valoraciones funcionales es que son específicas para una proteína particular. En contraste, la tecnología de DNA es genéri ca. Esto tiene ventajas obvias para el laboratorio de diagnóstico y además fomenta el desarrollo técnico porque cualquier técnica nue va puede aplicarse a muchos problemas.

18.3

Estudio de un gen para m utaciones

En la gran mayoría de las enfermedades, por ejemplo FQ y DMD, se observa una heterogeneidad alélica extensa (véase sección

j

513

16.3.2). Por consiguiente los estudios diagnósticos suelen incluir investigaciones para mutaciones que pudieran encontrarse dentro o cerca del (los) gen(es) importante(s). El cuadro 18-2 lista varios mé todos útiles y más adelante se describen con brevedad. Para detalles de laboratorio véase las obras de Cotton, Edkins y Forrest o de Elles y Mountford (Lecturas adicionales). La investigación de la totalidad de un gen candidato para variacio nes de secuencias en una serie grande de pacientes revelará muchas va riantes distintas. Puede ser muy difícil decidir cuál de ellas es patógena o no (y en consecuencia representa la mutación que se busca). El re cuadro 16-5 contiene algunos lincamientos para intentar decidirlo.

18.3.1 Métodos basados en secuenciación Ahora que los secuenciadores de fluorescencia automatizados cons tituyen el equipo estándar de laboratorio, la secuenciación se torna cada vez más atractiva como el principal medio para buscar una mutación (fig. 18-1). Otros métodos de examen sirven sobre todo para reducir la carga de secuenciación al definir el amplicón que de be secuenciarse. Conforme la secuenciación se tomó más barata y sencilla, la necesidad de reducir la carga disminuyó y varios méto dos alternativos dejaron de emplearse. En la actualidad se recurre a las alternativas de secuenciación directa sobre todo porque son rá pidas (cromatografía líquida desnaturalizante de alta ejecución, dHPLC), baratas (polimorfismos de conformación de cadena úni ca, SSCP) o proporcionan cierta información especial (prueba de truncamiento de proteína, PTT, y PCR cuantitativa). Como la secuenciación genera más datos que otros métodos, el requerimiento para análisis es mayor. Se cuenta con programas que informan en forma automática las diferencias entre la secuencia es tudiada y una estándar a condición de que la secuencia sea de bue na calidad. Esta última es crítica para evitar artefactos y detectar con seguridad sustituciones de bases en heterocigotos. Para la secuenciación de DNA genómico, cada exón suele am plificarse por separado, con quizá 20 pb de intrón de flanqueo. Es to resulta ineficiente porque el tamaño promedio del exón en genes humanos (145 pb) es bastante menor que las 500 a 800 pb que pueden leerse en una buena carrera de secuenciación. Las posibles soluciones comprenden utilizar PCR-RT o PCR de enlace de exón (PCR meta, Wallace y cois., 1999; fig. 18-2). Más adelante se descri be la resecuenciación basada en microarreglos (sección 18.4.1).

18.3.2 Métodos basados en la detección de compatibilidades erróneas o heterodúplex Muchas pruebas emplean las propiedades de heterodúplex para de tectar diferencias entre dos secuencias. Casi todas las mutaciones ocurren en la forma heterocigota (aun en padecimientos autosómicos recesivos, es probable que la persona afectada que nace de pa dres no consanguíneos sea un heterocigoto compuesto, con dos mutaciones diferentes). Los heterodúplex pueden formarse me diante el simple calentamiento del producto de la prueba de PCR del heterocigoto a fin de desnaturalizarlo seguido del enfriamiento lento. Para mutaciones en homocigotos, o ligadas a X en varones, es necesario añadir cierto DNA de tipo silvestre como referencia. Varias propiedades de los heterodúplex pueden aprovecharse: ► a menudo los heterodúplex tienen una movilidad anormal en gel de poliacrilamida no desnaturalizantes (fig. 18-3A, panel inferior). Se supone que los gel especiales (Hidrolink™, MDE™) mejoran la resolución. Éste es un método en particu

514

CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

Cuadro 1 8 -2 . Métodos para estudiar un gen en busca de mutaciones. El cuadro resume las ventajas y las desventajas de cada método para su empleo en un servicio de diagnóstico de rutina. Véase sección 18.3 para detalles.

Método

Ventajas

Desventajas

Southern blot, hibridación a sonda de cDNA

El único medio para detectar deleciones y reorde namientos mayores

Laborioso, caro Requiere varios p.g de DNA

Secuenciación

Detecta todos los cambios Caracterización completa de mutaciones

Costoso

Movilidad de heterodúplex en gel

Muy simple Barato

Secuencias sólo < 2 0 0 pb Sensibilidad limitada No revela la posición del cambio

dHPLC

Rápido, rendimiento alto Cuantitativo

Equipo costoso No revela la posición del cambio

SSCP

Simple, barato

Secuencias sólo < 2 0 0 pb No revela la posición del cambio

DGGE

Sensibilidad alta

La elección de los cebadores es fundamental Cebadores costosos No revela la posición del cambio

Corte químico de compatibilidad errónea

Sensibilidad alta Muestra la posición del cambio

Sustancias químicas tóxicas Experimentalmente difícil

PTT

Sensibilidad alta para mutaciones de terminación de cadena Muestra la posición del cambio

Sólo mutaciones terminales de cadena Costoso, dificultades técnicas Suele requerir RNA

PCR cuantitativa

Detecta deleciones en heterocigotos

Costoso

Microarreglos

Rápido Rendimiento alto Puede detectar y definir todos los cambios

Costoso Gama limitada de genes

dHPLC, cromatografía líquida desnaturalizante de alta ejecución; SSCR polim orfism o de conformación de cadena única; DGGE, electroforesis en gel de gradiente desnaturalizante: PTT, prueba de truncamiento de proteína.

lar simple. Si se estudian fragmentos no mayores de 200 pb de lar go, es factible detectar inserciones, deleciones y la mayor parte de las sustituciones de bases únicas (Keen y cois., 1991); ► los heterodúplex tienen perfiles de desnaturalización anormales. Esto se aprovecha en la cromatografía líquida desnaturalizan te de alta ejecución (dHPLC, fig. 18-4A) y la electroforesis en gel de gradiente desnaturalizante (DGGE, fig. 18-3B). En ambos casos la movilidad de un fragmento cambia de modo no table cuando se desnaturaliza. Estos métodos requieren ajustar se a la secuencia particular de DNA en estudio y por tanto son más adecuados para el análisis rutinario de un fragmento deter minado en muchas muestras. La dHPLC proporciona un ren dimiento alto, que se adapta bien a su uso. La DGGE requiere cebadores especiales con una extensión 5' poli (G;C) (una pin za GC); véase Sheffield y cois. (1992). Una vez que se optimizan, estos métodos tienen una sensibilidad alta; ► las bases con compatibilidad errónea en heterodúplex son sen sibles a cortes mediante sustancias químicas o enzimas. El de corte químico de compatibilidad errónea (CCM) (fig. 18-4B) es un método sensible para detectar mutaciones, con las venta jas de que puede analizar fragmentos muy grandes (más de 1 kb de tamaño) y de que la localización de la compatibilidad errónea

está indicada por el tamaño de los fragmentos generados. Sin embargo, utiliza sustancias químicas muy tóxicas, en particular tetróxido de osmio (aunque puede sustituirse por permangana to de potasio), y es experimentalmente muy difícil. Una alter nativa es el corte enzimàtico de compatibilidades erróneas (ECM) en el que se recurre a enzimas como la resolvasa de fa go T4 o la endonucleasa VII para lograr el mismo resultado sin las sustancias químicas tóxicas. Por desgracia, la calidad de los gel producidos deja mucho que desear en manos de la mayoría de las personas. De todos estos métodos, la mayor parte de los laboratorios de diag nóstico sólo dispone de la dHPLC en la actualidad.

18.3.3 Métodos basados en análisis de conformación de cadena única El DNA de cadena única tiende a doblarse y formar estructuras complejas estabilizadas mediante enlaces intramoleculares débiles, sobre todo enlaces de hidrógeno de pares de bases. Las movilidades electroforéticas de estas estructuras en gel no desnaturalizantes no sólo dependen de la longitud de sus cadenas sino también de sus conformaciones, que la secuencia de DNA rige. Los SSCP se detec-

18.3 í ESTUDIO DE UN GEN PARA MUTACIONES

A) Paciente

Testigo

B) Testigo

515

18.3.4 Métodos basados en traducción: prueba de truncamiento de proteína (PTT) La PTT (fig. 18-5) es una prueba específica para mutaciones de cambios de marco, sitio de empalme o sin sentido que originan un codón de terminación prematuro (Van der Luijt y cois., 1994). El material de inicio es un producto de la PCR-RT o en ocasiones un exón grande aislado en DNA genómico, como el exón 15 de 6.5 kb del gen APC o el exón 10 de 3.4 kb del gen BRCA1. La descompo sición de mRNA mediada sin sentido (sección 16.4.1), que en con diciones normales impide la producción de una proteína truncada, no ocurre porque en la valoración no hay empalme de exón con exón. Las ventajas e inconvenientes de la PTT consisten en que só lo detecta ciertas clases de mutación. No sería útil para fibrosis quística, en la que la mayor parte de las mutaciones no es truncan te. Pero las mutaciones en sentido erróneo son raras en la distrofia muscular de Duchenne (DMD), la poliposis adenomatosa del co lon o el cáncer de mama relacionado con BRCA1 y el hallazgo de cualquiera de estos cambios bien puede ser una coincidencia y no patógeno. La PTT tiene varias ventajas en estas enfermedades. Ig nora sustituciones de bases silenciosas o en sentido erróneo y (co mo los métodos de corte de compatibilidad errónea, pero a diferencia de los SSCP) revela el sitio aproximado de cualquier mu tación. Se desarrollaron diversas variantes para obtener resultados más limpios, que por lo general incorporan un paso de inmunoprecipitación -pero la PTT aún es una técnica exigente que no resulta fácil de efectuar bien.

18.3.5 Métodos para detectar deleciones

Fig. 18-1. Detección de mutación mediante secuenciación. A) una sustitución de base en ei exón tres. El pico doble (flecha) muestra una mutación heterocigota g.332C->T (p.P67L). B) deleción de una base 3659delC en el exón 19. La secuenciación corriente abajo de la deleción es confusa y refleja superposición de secuencias de los dos alelos en este heterocigoto. Los cambios se confirmarían mediante secuenciación de la cadena inversa. Cortesía del doctor Andrew Wallace, St Mary’s Hospital, Manchester, Reino Unido.

tan mediante amplificación de las muestras de DNA (que pueden ser los productos de la PCR-RT), desnaturalización, enfriamiento con rapidez y cargándolas en un gel de poliacrilamida no desnatu ralizante (fig. 18-3A). Los cebadores pueden ser radiomarcados o bien los productos no marcados detectarse con tinción argéntica. El patrón preciso de bandeo que se observa depende mucho de los decalles de las condiciones. Deben correrse muestras testigo para que sea posible observar diferencias del patrón de tipo silvestre. Puesto que el SSCP es muy barato y posee una sensibilidad razonable (al rededor de 80%) para fragmentos hasta de 200 pb de largo (Sheffield y cois., 1993), aún se utiliza con amplitud. Es posible combinar SSCP y análisis de heterodúplex en un mismo gel, como en la figu ra 18-3A. Un SSCP detallado, la huella didesoxi, analiza cada banda en una escalera de secuenciación por SSCP y se afirma que tiene una sensibilidad de 100% (Sarkar y cois., 1992).

La detección de deleciones de homocigotos o hemicigotos es senci lla: la secuencia eliminada no se amplifica por PCR. Es importante considerar explicaciones alternativas para la falta de amplificación: es posible que se deba a fracaso técnico de la PCR o a una sustitu ción de bases en uno de los sitios de enlace del cebador. Las de leciones pueden confirmarse con el empleo de cebadores alternativos o por Southern blotting. Alrededor de 60% de las mutaciones de la DMD lo constituyen eliminaciones de uno o más exones (véase fig. 16-3). En varones afectados, dos reacciones de PCR multiplex (que se muestran en la figura 18-6 y una prueba de exones en la parte 5' del gen) revelarán 98% de las deleciones. En casi todas estas últi mas se elimina más de un exón. Es necesario confirmar las delecio nes que al parecer afectan exones no contiguos y las de un exón aislado. El estudio de mujeres para observar si portan una deleción de distrofina es más difícil en conjunto e ilustra los problemas especia les que las deleciones de uno o más exones completos en heterocigotos implican. Estas deleciones no son detectables cuando el DNA genómico se amplifica exón por exón y se estudia por medio de se cuenciación, análisis heterodúplex o SSCP porque el alelo mutante no provee un producto. HFIS o HGC-arreglo permiten diagnosti car deleciones de tamaño megabase (fig. 17-3). Se requieren alter nativas para deleciones a escala de exón. La secuenciación o el análisis de PTT de productos de la PCR-RT deben captar cual quier cosa excepto una deleción génica completa, pero la descom posición del mRNA mediada sin sentido puede tornar invisible el transcrito mutante y en una prueba diagnóstica no siempre es fácil implementar métodos basados en RNA. Se cuenta con varios sistemas de PCR cuantitativa que pueden detectar deleciones heterocigotas en el DNA genómico. La reacción

516

CAPITULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

Oligo externo ^

a)

b)

Exón A

E xón A

O lig o s e n la z a d o re s d e P C R -m e ta

I

^

Exón C

Exón B Oligo interno

c)

d)

Exón A

Exón A

I I

Exón B

Exón C

Exón B

Exón C

Fig. 18-2. Principia de la PCR de enlace de exón (PCR meta). Es una técnica para superar la disparidad entre el tamaño promedio de los exones humanos (145 pb) y el tamaño óptimo del producto para la secuenciación (500 a 800 pb), en tanto conserva las ventajas de estudiar el DNA genómico. a) Dos a cinco exones (con ca. 20 pb de intrón de flanqueo, no se muestran para claridad) se amplifican mediante PCR con cebadores que portan enlazadores compatibles específicos en sus extremos 5’ . b) Conforme los cebadores se agotan, se forman concatámeros, guiados por los enlazadores. c) El concatámero deseado se amplifica en una segunda ronda de PCR con cebadores diseñados de manera específica, d) El producto puede diseñarse para que tenga cualquier combinación de exones dispuestos en cualquier orden. Véase Wallace, Wu y Elles (1999).

se limita a la fase exponencial temprana (fig. 5-2) cuando la canti dad de producto indica la de la plantilla. La acumulación de pro ducto se mide en tiempo real por fluorescencia y se compara con un estándar interno o paralelo. La señal fluorescente puede ser ge nerada por un colorante de enlace específico de DNA de cadena doble, como SYBR® Verde, o mediante el corte de un oligonucleótido específico de secuencia marcado con un colorante y un apaga dor (valoración TaqMan®). Una alternativa a la PCR de tiempo real es el método de Armour MAPH (hibridación multiplex con sonda amplificable) (2000) (recuadro 18-1). La MAPH permite un grado alto de multiplex (pueden compararse dosis de cuando me nos 50 secuencias cortas en un solo experimento), no requiere son das marcadas en forma especial ni maquinaria costosa, y es bastante adecuada para desarrollarse en un laboratorio modesto. Si está segregándose una deleción en una familia, la tipificación de mujeres para mapear microsatélites dentro de la deleción puede revelar no maternidad aparente, en la que una madre no transmi tió el alelo marcador a su hija a causa de la deleción (fig. 18-7). En estas familias la “no maternidad” demuestra que una mujer es una portadora, en tanto que la heterocigosidad (en la hija o la hermana de una portadora de la deleción) indica que una mujer no es por tadora. Se identificaron varios marcadores adecuados para este pro pósito en puntos críticos de deleción en los intrones. El método funciona mejor en familias con un varón afectado en el que la de leción puede definirse primero.

18.3.6 Métodos para detectar patrones de metilación del DNA La importancia de la metilación del DNA en el control de la expre sión génica se describió en la sección 10.4.2. La metilación excesiva o deficiente de dinucleótidos CpG es un mecanismo patógeno fre cuente en el cáncer (sección 17.4.3) y la expresión génica impronta (sección 16.4.4). Puesto que los productos de la PCR nunca se me dian, ninguno de los métodos descritos hasta el momento brinda in formación de los patrones de metilación en una muestra de DNA. Dos métodos principales se utilizan para verificar la metilación: ► Digestión mediante enzima de restricción. La HpaW sólo cor ta CCGG no metilado, en tanto que la Msp\ corta cualquier CCGG sea metilado o no. Por consiguiente los sitios CpG metilados dan lugar a que las dos enzimas provean diferentes fragmentos de restricción. De otro modo, una plantilla de PCR que contiene un CCGG puede digerirse con una Hpall antes de la amplificación; si el sitio no está metilado, la plan tilla se corta y la PCR no producirá producto alguno. ► Secuenciación con bisulfito (Thomassin y cois., 1999). Cuando se trata DNA de cadena única con bisulfito de sodio, la citosina, pero no la 5-metil citosina (5-MeC), se convierte en uracilo. Después del tratamiento con bisulfito el DNA se amplifica por PCR (con cebadores compatibles con la secuencia modifi cada) y se somete a secuenciación convencional. La citosina y

18.4 ! PRUEBAS PARA UN CAMBIO DE SECUENCIA ESPECIFICADO j 517

B)

A)

1 2

3 4

5

6

7 8

Fig. 18-3. Selección para mutaciones del gen CFTR. A) heterodúplex y análisis SSCP. El exón 3 se amplificó mediante PCR para DNA genómico. Tras la desnaturalización, las muestras se cargaron en un gel de poliacrilamida no desnaturalizante. Parte de cada producto se reasoció para proporcionar DNA de doble cadena. Éste corre más rápido en el gel y da las bandas heterodúplex que se observan en el grupo inferior. El DNA de cadena única corre con más lentitud en el mismo gel (panel superior). Las hileras 1 y 2 muestran el patrón típico de la secuencia de tipo silvestre. Pueden observarse patrones variantes en las hileras 3 a 8. La secuenciación reveló mutaciones de G85E, L88S, R75X, P67L, E60X y R75Q respectivamente. Cortesía del doctor Andrew Wallace, St M ary’s Hospital Manchester. B) electroforesis en gel de gradiente desnaturalizante. Los exones del gen CFJfí se amplifican mediante PCR en uno o más segmentos y se corren en geles de poliacrilamida a 9% que contienen un gradiente desnaturalizante de urea y formaldehído. La banda de cualquier amplicón que contiene una variante de heterocigoto suele cortarse en cuatro subbandas (flechas). En las hileras que se muestran, el sujeto A (hilera izquierda en cada panel) tiene una variante en el amplicón 6 y el sujeto B (hileras derechas) tiene variantes en los amplícones 17 y 24. La caracterización de las variantes demostró que el sujeto B era heterocigoto para R1070Q (exón 17). Otras variantes no fueron patógenas. Cortesía del doctor Hans Scheffer, University of Groningen, Países Bajos.

la 5-MeC en el espécimen original se muestran como timina y citosina, respectivamente, en la secuencia del producto de la PCR. Este método requiere controles muy cuidadosos para proporcionar datos seguros.

1 8 .4

Pruebas para un cam bio de secuencia especificado

Las pruebas para la presencia o ausencia de un cambio de secuencia conocido son un problema diferente y mucho más sencillo que el es tudio de un gen para la presencia de cualquier mutación. Las mues tras pueden genotipificarse siempre mediante secuenciación, pero la convencional no es un método eficiente si sólo la posición de un nucleótido aislado está controlándose. El cuadro 18-3 resume algunos de los principales métodos de genotipificación. Las compañías de biotecnología desarrollaron como equipos muchas variantes de estos métodos y otros. Las aplicaciones típicas comprenden: ► diagnóstico de enfermedades con heterogeneidad alélica limi tada (véase cuadro 18-4);

► diagnóstico en una familia. Quizá se necesiten métodos de examen de una mutación para definir la mutación familiar, pero una vez que se caracteriza, por lo general sólo es necesa rio estudiar a otros miembros de la familia para esa mutación particular; ► en investigación, para estudiar muestras testigo. Un problema usual en la clonación posicional es que un paciente presente un cambio de secuencia en un gen candidato. A continuación sur ge la pregunta, ¿este cambio es patógeno (y confirma que el gen candidato es el gen de enfermedad) o puede ser un polimorfis mo no patógeno? Un método usual consiste en seleccionar un panel de muestras testigo normales para la presencia del cam bio. Collins y Schwartz (2002) consideran el problema del nú mero de testigos que deben estudiarse; ► genotipificación de SNP. Aunque el objetivo en este caso no es encontrar una mutación patógena como en la forma anterior, el problema es idéntico: estudiar una muestra de DNA para una variante de secuencia predefinida. La tipificación median te SNP es la principal aplicación de los métodos de genotipifi cación de rendimiento muy alto (sección 18.4.2).

518

CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

A)

? g CS O c

tü ■Q O m n <

Tiempo (min)

B)

Tamaño del fragmento 140 210 280 350 420 49 0 56 0 630 70 0 77 0 84 0 910 98 0 1 0 5 0 1 1 2 0

Fig. 18-4. Examen para mutación. A) Examen para mutación de DIVID mediante cromatografía líquida desnaturalizante de alta ejecución (dHPLC). El exón 6 del gen de distrofina da un patrón distinto en un varón afectado (trazo en azul) y un testigo normal (trazo en rojo). La secuenciación reveló la mutación del sitio de empalme 73 8 + IG ^T . Puesto que es un padecimiento ligado a X, en varones la prueba de DNA debe combinarse con una cantidad igual de DNA normal con el fin de permitir que se formen heterodúplex. Cortesía del doctor Richard Bennett, Children’s Hospital Boston, MA, USA. B) Examen para mutación mediante corte químico de compatibilidades erróneas. Producto de la PCR meta con fluorescencia que contiene los exones 6 a 10 del gen NF2. Pista superior: muestra del paciente; se descubre una mutación por empalme heterocigota en el íntrón 6 de 600-3c->g mediante corte por hídroxilamina del producto de la PCR meta de 1 032 pb en fragmentos de 8 1 3 + 2 3 9 pb. Pista inferior: muestra testigo. Cortesía del doctor Andrew Wallace, St M ary's Hospital, Manchester, Reino Unido.

18.4.1 Se dispone de muchos métodos simples para genotipificar una variante especificada Pruebas para la presencia o ausencia de un sitio de restricción Una mutación por sustitución de bases que crea o suprime un sitio de reconocimiento de una enzima de restricción permite realizar una prueba directa simple de PCR para la mutación (fig. 7-6). Aun

que se conocen cientos de enzimas de restricción, casi todas reco nocen sitios palindrómicos simétricos y muchas mutaciones de punto no afectarán esas secuencias. Además los sitios para enzimas de restricción raras y ocultas no son adecuados para emplearse en diagnósticos rutinarios porque las enzimas son caras y a menudo de mala calidad. Sin embargo, en ocasiones puede introducirse un si tio de restricción diagnóstico mediante una forma de mutagenesis de PCR (sección 5.5.3) con el uso de cebadores elegidos con cui dado. La figura 18-8 muestra un ejemplo.

18.4

PRUEBAS PARA UN CAMBIO DE SECUENCIA ESPECIFICADO

Segmento de DMD 1EF

519

Segmento de DMD 2CD

Fig. 18-5. Examen de la mutación de DMD mediante la prueba de truncamiento de proteína (PTT). Una reacción acoplada de transcripción-traducción se utiliza para producir productos polipéptidos marcados codificados para un segmento de mRNA. Los segmentos que contienen codones de terminación prematura producen polipéptidos truncados. En este caso se usó PCR-RT para examinar la totalidad del gen de distrofina en 10 segmentos superpuestos en una serie de pacientes con distrofia muscular de Duchenne (DMD). Los polipéptidos de carrera más rápida identifican segmentos que contienen codones de terminación y el tamaño del producto anormal indica la posición del codón de detención dentro del segmento. Imagen cortesía del doctor J. T. den Dunnen y D. Verbove (Leiden, Países Bajos); para mayores detalles véase http://www.dm d.nl.

Fig. 18-6. Selección multiplex para deleciones de distrofina en varones. A) Productos de amplificación multiplex con PCR de nueve exones, utilizando muestras de 10 niños no relacionados con distrofia muscular de Duchenne/Becker. Los cebadores de la PCR se diseñaron de manera que cada exón, con alguna secuencia de flanqueo de intrón, proporcione un producto de PCR de tamaño diferente. Cortesía dei doctor R. Mountford, Liverpool Women's Hospital, Reino Unido. B) Interpretación: las líneas sólidas muestran exones eliminados en forma definitiva; las líneas de guiones indican la posible extensión de la deleción en dirección hacia exones no estudiados. No se observa deleción en las muestras 7 y 9; estos pacientes pueden tener mutaciones de punto o deleciones de exones que no se examinaron en esta prueba. Las tamaños de exón y el espaciamiento no están a escala. Compárese con la figura 16-3.

520 i CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

iRSaltl

Recuadro 18-1. H ibridac ión m ultiplex con sond a am p lificab le (M A P H ) Es un método muy versátil para comparar la dosis génica de un número de secuencias. El DNA genómico del paciente se gotea en un filtro de nai lon pequeño ( 2 x 3 m m ) y se híbrida a una mezcla de 40 sondas, cada una específica para un exón del gen de distrofina. Tras el lavado cuidado so, el filtro se coloca en una mezcla de PCR en la que se utiliza un par aislado de cebadores que se unen a una secuencia que se encuentra al final de cada sonda. Un cebador puede marcarse con fluorescencia para realizar el análisis en un secuenciador génico.

¡§ i i

Las sondas se diseñan de tal manera que sea posible distinguir los exones mediante la longitud del producto de la PCR y cuantificarse por el ta maño del pico en un secuenciador de fluorescencia o por las intensidades relativas de bandas en un gel manual. Como todas las sondas se am pli fican con el mism o par de cebadores, se evitan los problemas de una am plificación desigual que abundan en las PCR multiplex. Para detalles más amplios de MAPH véanse Armour y colaboradores (2000) y el sitio de red MAPH www.nott.ac.uk/-pdzjala/m aph/m aph.html

13 .

I j J lÜ J I i J

B U 41B:34_B0S_041.f*a/

i u

id

Paciente con duplicaci n

1a

II

/

A

k 1

/

A A

a aAaM Aa

Ia

a

a

¡i a

a

Aa

Paciente con deleci n

u

L i l i l í l i l i A j l I iÁ á M

ÍA Á

L A

k

fi

A

A A

A a L a M

L

A

a

li

a

*

AA

B U 45B:42_B06_M5.f» / Testigo

u

J t iíjjj L

BB 57B:50_B07_D57.f#a/

lIiilJl

lili

t i hk

KAAÁ

k

1

A /I A

a aLaaa

L

a

a

il

/

*

Aa

Se indican los exones duplicados/elim inados (deleci n)

Uso de MAPH para detectar deleciones y duplicaciones de exones del gen de distrofina. La comparación de los tamaños de los picos con el trazo testigo permite observar la duplicación de los exones 10 y 13 (y tal vez 11 y 12, que no se estudiaron en este multiplex) en el trazo superior, y la deleción del exón 18 en el trazo central. Imagen cortesía de los doctores J. T. den Dunnen y S. White Leiden, Países Bajos; para mayores detalles véase http://www.dmd.nl

A)

B)

STR45 Alelo 1 -

Fig. 18-7. Portadores de deleción en una familia con DMD revelados mediante no maternidad aparente. A) Genealogía. B) Resultados de la tipificación con el marcador intragénico STR45. El niño afectado 111-1 tiene una deleción que incluye STR45 (el carril 7 del gel es el blanco). Su madre II-2 y su tía II-3 no heredaron el alelo de STR45 de su madre 1-2, lo que muestra que la deleción se transmite en la familia. Al parecer I-2 es homocigoto para este marcador altamente polimórfico (carril 2), pero de hecho es homocigoto. La otra tía II-4 y su hermana III-2 son heterocigotas para el marcador y por tanto no portan la deleción.

18.4

PRUEBAS PARA UN CAMBIO DE SECUENCIA ESPECIFICADO

Uso de hibridación de oligonucleótido específico de alelo (ASO) Bajo condiciones de hibridación adecuadamente rígidas, estas sondas sintéticas cortas sólo se hibridan con una secuencia compatible a la perfección (sección 6.3.1). La figura 6-11 muestra el uso de la hibri dación dot-blot con sondas de ASO para detectar la sustitución de base única que causa la enfermedad de células falciformes. Con fines diagnósticos suele emplearse un procedimiento dot-blot inverso. Por ejemplo, en una selección para una serie de mutaciones de fibrosis quística definidas se usaría una serie de ASO específicos para cada alelo mutante, goteados en una membrana aislada que después se hí brida con el DNA de prueba marcado amplificado mediante PCR. El mismo principio de dot-blot inverso se aplica a una escala masivamente paralela en chips de DNA. Cientos a miles de sondas oligonucleótidas de 20 a 25 mer se anclan a un apoyo sólido en po siciones definidas (sección 6.4.3). El DNA en estudio se amplifica por PCR, se marca con fluorescencia y se hibrida al arreglo, solo o (de preferencia) en competencia con una secuencia de referencia ti po silvestre marcada con un color distinto. Cada sonda individual del chip se comporta como una prueba de ASO para una secuen cia específica en el DNA de prueba, pero sobre todo los chips pue den explorar toda la secuencia de un gen e informar cualquier sustitución de bases (fig. 18-9A). Las eficiencias de detección son excelentes en homocigotos, pero menos seguras en heterocigotos. Las inserciones sólo se detectan si se diseñaron de antemano oligonucleótidos para detectar una inserción específica. Una vez preparado todo, los sistemas de chip resultan rápidos y fáciles de emplear, aunque lejos de ser baratos. Sin embargo, es ne cesario definir con anterioridad la gama de mutaciones a detectar y diseñarlas dentro del chip. Por tanto su principal función en la de tección de una mutación puede ser para el examen inicial de mues tras a fin de captar las mutaciones frecuentes; para los casos difíciles se recurre a otros métodos.

Amplificación mediante PCR específica de alelo (prueba ARMS) El principio de la ARMS (sistema de amplificación de mutación re sistente) se muestra en la figura 5-4. Se llevan a cabo reacciones de PCR pareadas. En ambas reacciones un cebador (el común) es el mismo, el otro se presenta en dos versiones un poco diferentes, una específica para la secuencia normal y la otra específica para la se cuencia mutante. Suelen incluirse cebadores testigo adicionales pa ra amplificar alguna secuencia no relacionada de cada muestra a fin de controlar la correcta realización de la PCR. La localización del cebador común puede elegirse para que proporcione productos de diferente tamaño para distintas mutaciones, de manera que los pro ductos de la PCR de reacciones multiplex forman una escalera en un gel. Con el diseño cuidadoso del cebador también pueden pre pararse cebadores específicos de mutación para que provean pro ductos distinguibles. Por ejemplo, pueden marcarse con diferentes marcadores fluorescentes u otros, o proporcionarse extensiones 5' de tamaños diversos. La PCR multiplex específica de mutación es muy adecuada para seleccionar grandes cantidades de muestras pa ra un grupo determinado de mutaciones (fig. 18-10).

Valoración de ligadura de oligonucleótido (OLA) En la prueba de OLA para mutaciones por sustitución de bases se preparan dos oligonucleótidos que se hibridan a secuencias adya

I

521

centes en el blanco, con la unión establecida en la posición de la mutación. La ligasa de DNA no unirá de manera covalente los dos oligonucleótidos a menos que estén perfectamente hibridados (Nickerson y cois., 1990). Son posibles varios formatos para la prue ba, por ejemplo, una ELISA o, como en la figura 18-11, para aná lisis en un secuenciador de fluorescencia.

Minisecuenciación mediante extensión del cebador La minisecuenciación utiliza el principio de la secuenciación Sanger (fig. 7-2), pero sólo añade un nucleótido aislado. El extremo 3' del ce bador de secuenciación está situado justo corriente arriba del nucleó tido a genotipificar. La reacción mixta contiene polimerasa de DNA aunada a cuatro trifosfatos didesoxinucleótido marcados de manera distinta (ddNTP). La prueba de DNA actúa como una plantilla para la adición de un didesoxinucleótido marcado aislado al cebador. De una manera u otra, el nucleótido añadido al cebador se identifica (p. ej., corriendo el cebador extendido en un secuenciador de fluorescen cia) y ello permite identificar la base en la posición de interés. La minisecuenciación puede adaptarse con facilidad a un for mato basado en arreglos (APEX, extensión de cebador arreglada; Tonisson y cois., 2002) para revisar la secuencia completa de un gen en busca de sustituciones de bases en una operación (fig. 18-9B).

18.4.2 Métodos para genotipificación de alto rendimiento Las compañías de biotecnología desarrollan múltiples sistemas con objeto de resolver el desafío de la genotipificación de cantidades muy considerables de SNP para estudios de relación con enferme dades (sección 15.4.5). Weaver (2000) elaboró una lista de un gran número de tales sistemas. El método genético subyacente suele ser extensión de un cebador (minisecuenciación), hibridación de oli gonucleótido específico de alelo o enlace de oligonucleótido, como se describió antes, pero formateado para permitir la automatización y un rendimiento muy alto. Muchos sistemas intentan combinar esta tecnología genética con los desarrollos en microlíquidos de “la boratorio en un chip”. Los ejemplos de otros métodos comprenden la pirosecuenciacion y la espectrometría de masa (recuadro 18-2).

18.4.3 Pruebas genéticas para enfermedades por repetición de tripletos Las repeticiones expandidas que causan múltiples enfermedades neurológicas (cuadro 16-6) incluyen un grupo especial de pruebas espe cíficas de mutación (fig. 18-2). En las enfermedades por repetición de poliglutamina, como la de Huntington (HD), una reacción de PCR aislada establece el diagnóstico. Algunas de las otras afecciones por repetición expandida son un poco más difíciles por dos razones. Las mutaciones completas pueden tener cientos o miles de repeticio nes y no se amplifican con facilidad mediante PCR, en especial por que la mayor parte de estas repeticiones tiene un contenido alto de GC. Los alelos normales y premutación proporcionan productos de PCR limpios, pero en mutaciones completas quizá se requiera Southern blotting. Además, a diferencia de la HD, las mutaciones causan sobre todo enfermedad por pérdida de función y algunos indi viduos afectados tienen deleciones o mutaciones de punto que podrían no advertirse con el solo estudio de la repetición. Las distrofias miotónicas son las únicas enfermedades de “expansión grande” que pare cen por completo homogéneas desde el punto de vista mutacional.

522

CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

Cuadro 18-3. Métodos de pruebas para una mutación especificada. Método

Comentarios

Digestión de restricción de DNA amplificado mediante PCR; verificar el tamaño de los productos en un gel

Sólo cuando la mutación crea o suprime un sitio de restricción natural (fig. 7-6) o uno con ingeniería mediante el uso de cebadores de PCR especiales (fig. 18-8)

Hibridación de DNA amplificado mediante PCR a oligonucleótidos específicos de alelo (ASO) en una dot-blot o un chip génico

Método general para mutaciones de punto especificadas; los arreglos grandes permiten seleccionar para casi cualquier mutación

PCR mediante cebadores específicos de alelo (prueba ARMS)

Método general para mutaciones de punto; el diseño del cebador es fundamental (fig. 18-10) Puede adaptarse a la tecnología de chip Puede brindar lecturas cuantitativas de tiempo real por medio de tecnología TaqMan

Valoración de ligadura de oligonucleótido (OLA)

Método general para mutaciones de punto especificadas (fig. 18-11)

PCR con cebadores localizados en cualquier lado de un punto de rotura de transtocación

La amplificación satisfactoria muestra la presencia de la deleción sospechosa o el reor denamiento especificado

Revisar el tamaño de la repetición expandida

Enfermedades por repetición dinámica (sección 16.6.4) Las expansiones grandes requieren Southern blots, las más pequeñas pueden hacerse mediante PCR sola

Pyrosequencing

Método de alto rendimiento (recuadro 18-2)

SNAPshot

Minisecuenciacíón mediante extensión de cebador (sección 18.4.1)

Espectrometría de masa

Método de alto rendimiento (recuadro 18-2)

Cuadro 1 8 -4 . Ejemplos de enfermedades que muestran una gama limitada de mutaciones. Véase la sección 16.3 para un comentario más amplio de las razones por las que algunas enfermedades muestran una gama limitada de mutaciones en tanto que otras tienen una heterogeneidad alélica extensa

Entermedad

Causa

Comentarios

Enfermedad de células falciformes

Sólo esta mutación particular produce el fenotipo de célula falciforme

p.E6V en el gen HBB Véase figura 6-11

Acondroplasia

Sólo G380R produce este fenotipo particular; tasa de mutaciones muy alta

Dos cambios distintos, ambos producen p.G380R en el gen FGFR3 (fig. 16-9)

Enfermedad de Huntington, distrofia miotóníca

Mutaciones de ganancia de función

Repeticiones expandidas inestables Véase sección 16.6.4

X frágil

Mecanismo molecular común: expansión de una re petición inestable

Véase sección 16.6.4; se observan otras muta ciones, pero son raras

Enfermedad de Charcot-Marie-Tooth (HMSN1)

Mecanismo molecular común: recombinación entre repeticiones alineadas de manera errónea

Duplicaciones de 1.5 Mb en 17p11.2 (fig. 16.8); también ocurren mutaciones de punto

Talasemias a y p

La selección para heterocigotos origina que diferen tes mutaciones ancestrales sean comunes en distin tas poblaciones

Véase fig. 16-2 (talasemía a ) y cuadro 18-5 (talasemía (3)

Enfermedad de Tay-Sachs

Efecto fundador en judíos ashkenazis; ventaja de he terocigoto antiguo

Dos mutaciones HEXA comunes en ashkenazis: inserción de 4 pb en el exón 11 (73%); sitio de empalme donador en el exón 11 G-*C (15%)

Fibrosis quística

Mutaciones ancestrales comunes en poblaciones del norte de Europa, ventaja de heterocigoto antiguo

Véanse cuadro 18-6 y sección 4.5.3

18.5

Normal

Mutante

-In tró n -- | --Exón — DNA genómico

5' --

Cebador de PCR

3'-T en el sitio de empalme del intrón 4 del gen FACC no crea ni suprime un sitio de restricción. El cebador de la PCR se detiene un poco antes de esta base alterada, pero posee una compatibilidad errónea de base única (G en rojo) en una posición no critica que no impide que se hibride a las secuencias normal y mutante y amplifique ambas. La compatibilidad errónea en el cebador introduce un sitio de restricción AGTACT para Seal en el producto de la PCR de la secuencia normal. Se muestra el producto digerido mediante Seal de los pacientes homocigoto normal (N), heterocigoto (H) y homocitogo mutante (M). Cortesía de la doctora Rachel Gibson, Guy’s Hospital, Londres, Reino Unido.

18.4.4 El origen geográfico es una consideración importante para algunas pruebas La genética de población de enfermedades recesivas a menudo está dominada por efectos fundadores o por los efectos de la ven taja de heterocigotos. La resultante diversidad limitada de muta ciones en una población puede facilitar bastante las pruebas genéticas. La talasemia ¡3 y la fibrosis quística son ejemplos ade cuados. En estos dos padecimientos se describió un número muy considerable de mutaciones distintas en el gen importante, pero en cada uno unas cuantas mutaciones explican la mayor parte de los casos en cualquier población particular. En la talasemia P no es necesario estudiar el DNA para diagnosticar a portadores o personas afectadas -la hematología ortodoxa lo efectúa a la per fección- pero éste es el método de elección para el diagnóstico prenatal. Diferentes mutaciones predominan en poblaciones dis tintas (cuadro 18-5). A condición de que se cuente con muestras de DNA de los padres y se conozcan sus orígenes étnicos, casi siempre es posible encontrar las mutaciones parentales por me dio de una combinación pequeña de pruebas específicas, tras las cuales el feto puede revisarse con facilidad. En la fibrosis quística, la mutación F508del es la más frecuen te en todas las poblaciones europeas y se piensa que su origen es antiguo. Sin embargo, la proporción de todas las mutaciones que son F508del varía y por lo general son más altas en el norte y el oeste de Europa, y más bajas en el sur. Las pruebas para mutacio nes de FQ se dividen en dos fases. Primero se busca un número limitado de mutaciones especificadas, siempre F508del entre ellas, con los métodos que se describen en la sección 18.4. Como se muestra en el cuadro 18-6, no hay un límite natural obvio en tér minos de disminución de los resultados obtenidos en pruebas para mutaciones específicas. Cuando esta fase no revela la muta ción, entonces, si los recursos lo permiten, puede instituirse una selección para mutaciones desconocidas con el método que se describe en la sección 18.3 o, de otro modo, recurrirse al ras treo génico (fig. 18-13). El impacto de esta diversidad en las pro posiciones para selección de poblaciones se estudia más adelante (véase fig. 18-18).

Cuando una enfermedad recesiva es particularmente común en una cierta población, con una frecuencia sorprendente resulta de berse a más de una mutación. Un ejemplo es la enfermedad deTaySachs entre judíos ashkenazis, en la que se observan dos mutaciones HEXA comunes (cuadro 18-4). Es difícil explicar esta situación ex cepto si se asume que hubo una ventaja heterocigota sustancial en alguna época cuando la población fundadora era pequeña.

18.5

R astreo génico

El rastreo génico fue el primer tipo de método diagnóstico de DNA que se utilizó con amplitud. Emplea el conocimiento de la locali zación del locus de la enfermedad en el mapa, pero no el conoci miento del gen de la afección real. Por tanto es el único método disponible para genes que se mapearon pero no se clonaron. Casi todas las enfermedades mendelianas que constituyen el trabajo dia rio del laboratorio de diagnóstico pasaron a través de una fase de rastreo génico y después a las pruebas directas una vez que los ge nes se clonaron. La enfermedad de Huntington, la fibrosis quística y la distrofia miotónica son ejemplos familiares. Sin embargo, el rastreo génico puede tener una función aun cuando ya se clonó un gen. En el ambiente de laboratorio de diagnóstico no siempre es eficaz para el costo buscar de manera cuidadosa un gen grande con múltiples exones para encontrar cada mutación. Más aún, ninguno de los métodos de estudio de mutaciones que se describen en la sección 18.3 es 100% sensible, de modo que siempre se presentan casos en los que no es posible encontrar la mutación. En estas cir cunstancias el método de selección es el rastreo génico con marca dores enlazados. Los requisitos para el rastreo génico son: 1. mapeo adecuado de la enfermedad, de manera que puedan usarse marcadores que se sabe que están enlazados en forma es trecha con el locus de enfermedad; 2. la estructura genealógica y la disponibilidad de muestras deben permitir determinar la fase (véase a continuación); 3. diagnósticos clínicos confirmados en forma inequívoca y ningu na incertidumbre respecto a la localización del gen de enferme dad en el mapa.

524

CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

A) Tipo silvestre AGGTCGTATCCATGCCTTACAGTCCAGG Mutante A > C

AGGTCGTATCCCTGCCTTACAGTCCAGG Tipo silvestre

Célula

Oligo

10A

A G G TC G TA T a C aT G C C T T A C

Compatibilidad Hyb errónea 1 +

Mutante Compatibilidad Hyb errónea 2 -

10G

A G G T C G T A T g C aT G C C T T A C

1

+

2

10C

A G G T C G T A T C C aT G C C T TA C

0

++

1

+

10T

AG G T C G T A T tC a T G C C T T A C

1

+

2

-

-

11A

G G T C G T A T C aa T G C C T T A C A

1

+

2

-

11G

G G TCG TATCj) aT G C C TTA C A

1

+

2

-

11C

G G T C G T A T C C aTG C C TT A C A

0

+ i-

1

+

11T

G G T C G T A T C aaTG C C TT A C A

1

+

2

-

12A

G TC G TA TC C aTG C C TTA C A G

0

++

1

+

12G

G TC G TA TC C gTG C C TTA C A G

1

+

1

+

12C

G TCG TATCC CTG CC TTAC AG

1

+

0

++

12T

G TC G TATC Ct_T G C C TTA C A G

1

+

1

+

13A

T C G TAT C C a aG C C TTA C A G T

1

+

2

-

13G

TCGTATCCagGCCTTACAGT

1

+

2

-

13C

TCGTATCCacGCCTTACAGT

1

+

2

-

13T

TCGTATCCaTGCCTTACAGT

0

++

1

+

Tipo silvestre Célula A G

10

11

13

10

Mutante 11 12

13

C T

B) Tipo silvestre DNA blanco Cebador 1 Cebador 2

CTAGTTCGACGAGGTCGTATCCATGCCTTACAGTCCAGG CTAGTTCGACGAGGTCGTATCCCTGCCTTACAGTCCAGG Nucleótido añadido 5' CTAGTTCGACGAGGTCGTA 3' ddT-rojo 5' TAGTTCGACG AGGTCGTAT 3' ddC-azul

C eb ad o r3

5' AGTTCGACGAGGTCGTATC 3'

Cebador 4

5' GTTCGACGAGGTCGTATCC 3'

ddC-azul

Cebador 5

5' TTCGACGAGGTCGTATCCA 3'

No se añadió marcador ddG-amarillo (v. débil)

Cebador 6

5'

T C G A C G A G G T C G T A T C C A*

ddC-azul

Cebador 7

5' CGACGAGGTCGTATCC ATG 3

ddC-azul (débil)

Cebador 8

5' GACGAGGTCGTATCCATGC

C ebador9

5' ACGAGGTCGTATCCATGCC 3'

ddC-azul ddT-rojo

3'

Cebador 10

5' CGAGGTCGTATCCATGCCT 3'

Cebador 11

5' GAGGTCGTATCCATGCCTT

3'

ddT-rojo ddA-verde

Fig. 18-9. Arreglos de olígonucleótidos para detección de mutación. A) Principios de la detección de una mutación mediante hibridación. Los olígonucleótidos están arreglados en grupos de cuatro, cada uno de los cuales corresponde a las cuatro posibles bases en una posición determinada (sombreada). Las compatibilidades erróneas con la secuencia de tipo silvestre se muestran en el cuadro interior en rojo y las compatibilidades correctas en el cuadro superior en azul. La secuencia mutante tiene una sustitución A-*C en la posición 12 (rojo). Cuando las secuencias de tipo silvestre o mutante se hibridan al arreglo, el número de compatibilidades erróneas y la potencia de la hibridación se muestran a la derecha. El cuadro ilustra el aspecto. La figura 7-4 presenta un ejemplo real. B) Principios de un arreglo de minisecuenciación. Cada célula del arreglo contiene un oligonucleótido compatible con parte de la secuencia blanco. Los oligos se anclan por sus extremos 5 ’ . Después de la hibridación a la secuencia blanco se usan como cebadores para la extensión de una base aislada, utilizando PTü didesoxi marcados con color. Una compatibilidad errónea en el extremo 3 ' impide la extensión; las compatibilidades erróneas de una o dos bases desde el extremo proporcio nan una reacción débil.

18.5

RASTREO GENICO

525

18.5.1 El rastreo gènico incluye tres pasos lógicos El recuadro 18-3 ilustra la lógica esencial del rastreo genico. Puede aplicarse a enfermedades con cualquier modalidad de herencia. Siempre existe cuando menos un padre que pudo haber pasado el alelo de la enfermedad al probando y que pudo o no haberlo hecho en realidad. El proceso siempre sigue los mismos tres pasos:

Fig. 18-10. Prueba ARMS multiplex para detectar 29 mutaciones de fibrosis quística. Cada prueba se estudia con cuatro reacciones de PCR multiplex espe cíficas de mutación (A a D). Dentro de un multiplex cada producto es de un tamaño diferente. Si una de las 29 mutaciones está presente, se observa una banda extra. La identidad de la mutación es revelada por la posición de la banda en el gel y el carril que la contiene. Cada tubo amplifica también dos secuencias testigo -s o n las bandas superior e inferior en cada carril del gel-; difieren entre los carriles de tal manera que cada multiplex lleva su patrón característico propio. Obsérvese que los alelos normales de mutaciones F508del (banda en el carril B) no se valoran. Las muestras 1, 2 y 3 no exhiben bandas específicas de muta ción. En la muestra 4 las bandas extra en los carriles A y D muestran la presencia de F508del y 1898+1G ->A respectivamente, que indican que este DNA proviene de un heterocigoto compuesto. Cortesía del doctor Michelle Coleman, St. Mary’s Hospital, Manchester, Reino Unido; datos obtenidos mediante el equipo Elucigene™ de Orchid Biosciences.

35

40

45

50

55

1. distinguir los dos cromosomas en el (los) padre(s) importante(s), es decir, encontrar un marcador enlazado de modo cercano pa ra el que hay un heterocigoto; 2. determinar la fase, esto es, averiguar el cromosoma que porta el alelo de enfermedad; 3. estudiar qué cromosoma recibió la persona que consulta. La figura 18-13 ilustra un rastreo genico para una enfermedad autosómica recesiva. Las genealogías resaltan la necesidad tanto de una estructura genealógica apropiada (debe disponerse de DNA del niño afectado) como de tipos de marcador informativo. Aun si el niño afectado está muerto y es posible obtener la tarjeta Guthrie (sección 18.2), puede extraerse suficiente DNA para tipificación mediante PCR de una gota de sangre seca. En la actualidad la informatividad del marcador no es un gran problema. Con más de 10 000 microsatélites altamente polimórficos mapeados en la to talidad del genoma humano, siempre debe ser posible encontrar marcadores informativos que estén situados cerca del locus de en fermedad.

60

65

70

75

80

Fig. 18-11. Uso de la valoración de ligadura de oligonucleótido para estudiar 31 mutaciones de fibrosis quística conocidas. Después de la PCR multiplex, se realiza una OLA multiplex. Los oligonucleótidos de ligaduras se diseñan de modo que el tamaño y el color del marcado permitan distinguir los productos para cada mutación y su contraparte normal. Se observa un producto de ligadura del sitio de mutación de empalme 621 + 1g -»t. La persona puede ser un portador o un heterocigoto compuesto con una segunda mutación que no es una de las 31 detectadas por este equipo. Cortesía del doctor Andrew Wallace, St. M ary’s Hospital, Manchester, Reino Unido; datos obtenidos por medio del equipo de ABI Biosystems.

526 ; CAPÍTULO DIECIOCHO

PRUEBAS GENÉTICAS EN INDIVIDUOS Y POBLACIONES

Recuadro 18-2. Dos m étod o s para la g eno tipificación de alto ren dim iento Pyrosequencing®. Es un método para examinar tiras muy cortas de se cuencias adyacentes a un punto de inicio definido. Su principal aplicación se da en la tipificación de SNR en la que sólo una de dos bases se se cuencia. Pyrosequencing emplea una combinación ingeniosa de enzimas para acoplar la liberación de pirofosfato, que ocurre cuando se añade dNTP a una cadena de DNA en crecimiento, con la emisión de luz median te luciferasa (Fakhrai-Rad y cois., 2002). El método se desarrolló en un aparato que puede analizar en form a automática 10 000 muestras al día. Puesto que la producción es cuantitativa, es posible estimar las frecuen cias alélicas de un SNP en un análisis aislado de una muestra mancomu nada grande. (DNA)n

dNTP

Polimerasa

(DNA)n+1

Luz

18.5.2 La recombinación establece un límite fundamental en la precisión del rastreo génico Como el marcador de DNA que se utiliza para el rastreo génico no es la secuencia que causa la enfermedad, siempre es posible hacer una predicción errónea si la recombinación separa la enfermedad y el marcador. La fracción de recombinación, y por consiguiente la tasa de error, puede estimarse a partir de estudios de familias me diante análisis de enlace estándar (cap. 13). Casi en cualquier afec ción debe haber una elección adecuada de marcadores que muestren menos de 1% de recombinación con el locus de enfermedad. Lo an terior se deduce de las observaciones que indican que un nucleótido en 300 es polimórfico y que los locus separados 1 Mb muestran cer ca de 1% de recombinación (sección 13.1.5). En condiciones idea les se usa un marcador intragénico, por ejemplo, un microsatélite dentro de un intrón. Más adelante se menciona el problema espe cial del punto crítico de recombinación en la distrofia muscular de Duchenne. Nunca puede descartarse una recombinación entre el marcador y la enfermedad, aun en marcadores enlazados de manera muy es trecha, pero es posible reducir en forma considerable la tasa de error si se emplean dos locus marcadores, situados en lados opuestos del locus de enfermedad. Con estos marcadores de flanqueo o de puente, una recombinación entre cualquier marcador y la enferme dad también producirá un recombinante de marcador con marca dor, que puede detectarse (p. ej., III-l, fig. 18-14). Si se observa un recombinante marcador con marcador en la persona que consulta, entonces no es factible efectuar una predicción respecto a la heren

MALDI-TOF MS (del inglés, matrix-assisted láser desorption/lonization tim e-of-flight mass spectrom etry, espectrometría de masa de tiempo de vuelo de desorción/ionización con láser asistida por matriz). La espectro metría de masa (EM) mide la relación masa:carga de iones mediante su aceleración en un vacío hacia un blanco y programando su vuelo o m i diendo qué tan lejos se desvían los iones por un campo magnético (véase recuadro 19-7 para detalles más am plios). El problema del uso de EM en el análisis de moléculas grandes com o DNA o proteínas con siste en obtener iones de vuelo libre. La técnica de desorción/ionización con láser asistida por matriz (DILAM) soluciona este problema al incluir la macromolécula en una mancha pequeña de una sustancia que absor be la luz, que luego se vaporiza con un im pulso láser breve (M onforte y Becker, 1997). El tiempo de vuelo hacia el blanco es proporcional a la raíz cuadrada de la relación masa:carga. Si se aplica al DNA, la técnica puede medir la masa hasta de 20 kDa con una precisión de ±0.3% . La EM puede utilizarse com o una alternativa mucho más rápida de la electroforesis en gel para medir oligonucleótidos hasta de 100 nucleótidos de largo. Las aplicaciones típicas incluyen el análisis de productos de las reacciones de secuenciación de Sanger o la calibración de microsatélites. Para oligonucleótidos pequeños, la preci sión es suficiente para deducir la composición de bases directamente a partir de la masa exacta. De otro modo los SNP pueden analizarse me diante la extensión del cebador utilizando ddNTP de masa marcada. Las gotas de DNA a analizar pueden arreglarse en una placa y el aparato ioniza en form a automática cada gota a la vez. Los sistemas actuales pueden genotipificar decenas de miles de SNP por día y, com o la Pyrosecuencing, es posible hacer un fondo común de las muestras para me dir en form a directa las frecuencias de alelo.

cia de la enfermedad pero cuando menos se evita una predicción falsa. A condición de que no se observe un recombinante marcador con marcador, el único riesgo residual es el de recombinantes do bles. La verdadera probabilidad de un recombinante doble es muy baja a causa de interferencia (sección 13.1.3). Por tanto el riesgo de error por una recombinación inadvertida es mucho más pequeño que el de una predicción errónea debida a error humano en la ob tención y el procesamiento de las muestras de DNA. Tal vez un riesgo mayor es la heterogeneidad de locus inesperada, de manera que el locus de enfermedad verdadero en la familia en realidad es diferente del locus que se rastrea.

18.5.3 Cálculo de los riesgos en el rastreo génico A diferencia de las pruebas directas de mutación, el rastreo génico siempre incluye un cálculo. Los factores que deben considerarse en la estimación del riesgo final comprenden: ► probabilidad de una recombinación enfermedad con marcador y marcador con marcador; ► incertidumbre, a causa de estructura genealógica imperfecta o informatividad limitada de los marcadores respecto a quién transmitió qué alelo marcador a quién (véase fig. 13-5C para un ejemplo); ► incertidumbre, en cuanto a que alguien en la genealogía porte un alelo de enfermedad recién mutado (véase fig. 4-8 para un ejemplo de este problema en la DMD). Se dispone de dos métodos alternativos para realizar el cálculo.

18.5

RASTREO GÉNICO

527

C)

A)

EcoR I Tam año de m a rc a d o re s "]

□

£ c /X I

(C G G )n

E coR I

0 x 1 .9

□

- mm

m

m

P ro teín as

□ □ □ ■ ■

F ra g m e n to s se le c c io n a d o s (presa) D o m in io d e in te ra c c ió n

Fig. 19-19. Métodos de selección de matriz y de genoteca para elaborar mapas de interacción de proteínas a gran escala. A) M étodo de m atriz. El mism o conjunto de proteínas (1 a 5) se utiliza como señuelo (B1 a B5) y como presa (P1 a P5). Los resultados pueden dibujarse en una matriz. Los autoactivadores (p. ej., B4) y las proteínas presa “ adherentes” (p. e j„ P2 interactúa con muchos señuelos) se identifican y descartan. El resultado final se resume como una lista de interacciones que pueden ser heterodímeros (p. ej., B2 a P3) u homodímeros (como B5 a P5). B) M étodo de selección de genoteca. Identifica el dominio de interacción para cada proteína presa que interactúa con un señuelo determinado. Las proteínas presa adherentes se identifican como fragmentos de proteínas que suelen seleccionarse a pesar de la proteína señuelo. Reproducido de Legraín y colaboradores (2001) con autorización de Elsevier Science.

proteína esté localizada en la membrana. Pueden valorarse me diante la expresión de una genoteca de presas como híbridos SOS. Este sistema es útil para estudiar las interacciones de fac tores de transcripción, que autoactivarían el gen rastreador en un sistema convencional de dos híbridos. ► Los sistemas de dos híbridos de mamíferos, que pueden valorar interacciones entre proteínas con modificaciones postraduccionales auténticas.

19.4.7 El desafió de la proteómica de interacción es ensamblar un mapa de interacción funcional de la célula Los datos de interacción de proteínas proporcionan información funcional útil y, en la escala de la extensión del proteoma, quizá permitan que todas las proteínas en las células se liguen dentro de vías y redes funcionales. La asimilación y la presentación de estos datos es importante y con este propósito en mente se establecieron varias bases de datos (cuadro 19-2). Estos datos se derivan sobre todo de EM a gran escala y de selecciones de dos híbridos, pero es posible que exista una cantidad muy considerable de datos relacio nados respecto a interacciones de proteínas individuales “ocultos” en la bibliografía científica si se retroceden muchos años (véanse las líneas azules en la fig. 19-16). La extracción de esta informa ción y su integración con la obtenida de experimentos recientes de alto rendimiento serán un desafío. Como hecho relevante, se desarrollaron varias herramientas bioinformáticas para rastrear en !¿ bibliografía e identificar palabras clave que indiquen interac

ciones proteínicas de manera que los analizadores humanos pue dan escrutar bases de datos de interacción (Xenarios y Eisenberg, 2001).

Un segundo problema consiste en que no es simple representar redes de interacción de proteínas, por lo que un desafío importan te es la presentación clara de los datos (fig. 19-16). Sin embargo, como cabría esperar, proteínas con una función general similar (p. ej., transporte de membrana, reparación de DNA, metabolismo de aminoácidos) tienden a interactuar más entre sí y no con proteí nas no relacionadas en términos funcionales. En consecuencia es posible simplificar mapas complejos, como se muestra en la figu ra 19-20, si las proteínas relacionadas funcionalmente se agrupan en focos que representan procesos celulares básicos. Cabe señalar que estos procesos en sí mismos están enlazados en varias formas, por ejemplo, las proteínas que controlan la estructura de la cromatina tienen más interacciones con las que participan en la repara ción y la recombinación de DNA que las que se relacionan con el metabolismo de aminoácidos y la degradación de proteínas. Este tipo de presentación permite mostrar interacciones proteínicas de manera jerárquica y también proporciona un punto de refe rencia que abre la posibilidad de determinar interacciones nue vas. Tres cuartas partes de todas las interacciones proteínicas ocurren dentro del mismo grupo de proteínas funcionales, en tanto que la mayor parte de las otras tiene lugar con grupos fun cionales relacionados. Una interacción inesperada entre proteí nas que participan en procesos no relacionados debe considerarse con sospecha y estudiarse mediante valoraciones genéticas, bio químicas y físicas.

574 | CAPÍTULO DIECINUEVE ¡ MÁS ALLÁ DEL PROYECTO DEL GENOMA

Cuadro 19-2. Selección de bases de datos que incluyen información sobre interacciones de proteínas

Base de datos y comentarios

URL

Biomolecular Interaction Network Database (BIND) Lista de interacciones individuales proteina-proteina, vías y complejos. También una lista de interacciones de proteínas con otras moléculas.

http://www.bind.ca

Database o í Interacting Proteins (DIP) Lista de varios miles de interacciones proteina-proteina.

http://dip.doe-mbi.ucla.edu

Kyoto Encyclopedia of Genes and Genomes (KEGG). Un recurso extenso sobre vías de señalamiento y metabólicas que también incluye una sección dedicada a la estructura de proteínas complejas.

http://www.genome.ad.jp/kegg/

M e ta b o lis m o d e a m in o á c id o s F u s ió n d e m e m b ra n a \

D e g r a d a c ió n . d e p ro te ín a

M e io s is

M it o s is -

S ín te s is d e D N A

R e c o m b in a c ió n E s tru c tu ra c e lu la r

D o b le z d e la p ro te ín a

T ra n s lo c a c ió n d e p ro te in a

E s tré s c e lu la r M e ta b o lis m o d e á c id o s g ra s o s y e s te ró le s lip id o s M e ta b o lis m o d e c a rb o h id r a to s

\

T ra n s c rip c ió n P o l I

T ra n s c rip c ió n P o l III

Fig. 19-20. “Mapa de interacción de grupo funcional” simplificado del proteoma de la levadura. Los datos se derivan de un mapa complejo de interacciones Individuales, obtenido principalmente de selecciones de dos híbridos. Cada línea Indica que hay 15 o más interacciones entre las proteínas de los grupos conectados. Las conexiones con menos de 15 interacciones no se muestran porque ocurre un número pequeño de interacciones entre casi todos los grupos y a menudo tienden a ser falsas, es decir, basadas en resultado positivos falsos. Sólo se Incluyeron proteínas de levadura con anotación completa y se sabe que muchas proteínas pertenecen a varias clases funcionales. Reproducido de Tucker y colaboradores (2001) con autorización de Elsevíer Science.

19.4.8 La información de interacciones proteínicas con ligandos pequeños puede mejorar el conocimiento de los procesos biomoleculares y proveer una base racional para el diseño de fármacos Además de las interacciones proteina-proteina (véase antes) y las de proteína-ácido nucleico, las proteínas interactúan con un gran nú mero de moléculas pequeñas que funcionan como ligandos, sustra tos, cargas (en proteínas de transporte), cofactores y moduladores alostéricos. En todos los casos estas interacciones ocurren porque la superfìcie de la proteína y la molécula de interacción son comple mentarias en cuanto a forma y propiedades químicas, lo que signifi ca que el enlace conduce a una reducción de la energía libre. La base del diseño de fármacos es la identificación de moléculas que interac túan de modo específico con proteínas blanco y cambian sus activi

dades en las células. Casi todos los fármacos actúan a nivel de proteí nas y al hacerlo interactúan con la proteína, y alteran su actividad de una manera fisiológicamente benéfica. Los efectos secundarios rela cionados con los fármacos suelen reflejar interacciones inespecíficas con otras proteínas que producen acciones perjudiciales. Cuanto más se aprende respecto a la estructura y las interacciones de las proteínas con moléculas pequeñas, más información puede utilizarse para di señar fármacos con mayor eficacia y especificidad. Es posible investigar interacciones de proteína y ligando me diante la selección de alto rendimiento de un gran número de compuestos químicos, pero la cantidad de trabajo puede reducir se si se intenta primero modelar estas interacciones para definir compuestos guia adecuados. Si la estructura de la proteína blanco se conoce (véase antes), puede recurrirse a programas de computadora denominados algoritmos de atraco a fin de seleccionar bases de

[ BIBLIOGRAFÍA

datos de estructuras químicas e identificar posibles ligandos de in teracción con base en su complementariedad. Estos algoritmos in tentan fijar moléculas pequeñas dentro de sitios de enlace a partir de información de restricciones estéricas y energías de enlace. Los ejemplos incluyen AUTODOCK, LIGIN y GRAMM. Las bases de datos clínicos pueden seleccionarse no sólo con un sitio de en lace (búsqueda de interacciones moleculares complementarias) sino también con otro ligando (búsqueda de interacciones moleculares idénticas). Este proceso de diseño racional de fármacos condujo a la producción de varios medicamentos bien conocidos, como relenza y captopril.

19.5

Resumen

Los proyectos de genoma producen grandes cantidades de datos de secuencias que deben explorarse por medio de computadoras

j

575

para identificar genes y elementos reguladores. Una vez que se dispone de los genes, es necesario determinar sus funciones y có mo interactúan los diversos productos génicos entre sí. En este capítulo se comentó la forma en que el análisis de secuencias y es tructural puede utilizarse para obtener alguna información res pecto a la función de las proteínas y cómo el desarrollo de tecnologías de alto rendimiento para el análisis del transcriptoma y proteoma ayuda a relacionar estas funciones entre sí. Un com ponente de la genómica funcional que aún no se aborda es el uso de mutantes para estudiar funciones génicas. Puesto que ello in cluye la modificación genética de células y animales, el tema se pospuso hasta el siguiente capítulo, que considera el modo en que la manipulación de genes puede emplearse para estudiar la fun ción y la regulación génica, y construir modelos de enfermedades humanas.

Lecturas adicionales E isenberg D, M arcotte EM , X en arios I, Yeates TO (2000) Protein function in the post-genomic era. Nature 405, 823-827. H anash S (2003) Disease proteomics. Nature 422, 226-232. Lee KH (2001) Proteomics: a technology-driven and technology-limited discovery science. Trends Biotechnol. 19, 217-222. Lockhart DJ, W in ze le r (2000) Genomics, gene expression and DNA arrays. Nature 405, 827-836. Pandey A, M ann M (2000) Proteomics to study genes and genomes. Nature 405, 837-846.

P rim rose SB, Tw ym an RM (2002) Principles of Genome Analysis and Genomics. Blackwell Science Oxford UK. Various authors (1999) The Chipping Forecast. Nature Genet. 21, (Suppl.) 1-60. Various au th ors (2002) The Chipping Forecast II. Nature Genet. 32 (Suppl.) 465-551. Vorm O, King A , B ennett KL, Leber T, M ann M (2000) Proteln-interaction mapping for functional proteomics. In Proteomics: A Trends Guide 43-47.

Bibiografia A ebersold R, M ann M (2003) Mass spectrometry-based proteomics. Nature 422, 198-207. Aicher L, Wahl D, Arce A, Grenet O, Steiner (1998) New insights into cydosporine A nephrotoxicity by proteome analysis. Electrophoresis 19, 1998-2003. A lizadeh AA, Eisen M B , Davis RE, M a C, Lossos IS, R osenw ald A, B oldrick JC , S ab et H, Tran T, Yu X et at. (2000) Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403, 503-511. Altman RB, Raychaudhuri S (2001) Whole-genome expression analysis: challenges beyond clustering. Curr. Opin. Struct. Biol. 11, 340-347. A ltschul SF, M a d d e n , TL, S ch aeffe r AA, Zhang J, Zhang Z, M iller, Lipman DJ (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucl. Acids Res. 25, 3389-3402. A paricio S, C h ap m an J, S tupka E e f a/. (2002) Whole-genome shot gun assembly and analysis of the genome of Fugu rubripes. Science 297. 1301-1310. A udic S, C lav erle J (1997) The significance of digital gene expression profiles. Genome Res. 7, 986-995. B ittner M, M e ltzer P, C hen Y, Jiang Y, S eftor E, H endrix M, R adm ach er M , Sim on R, Yakhini Z, B en-D or A e t al. (2000) Molecular classification of cutaneous malignant melanoma by gene expression profiling. Nature 406, 536-540. Brenner S, Jonhson M , Bridgham J, G olda G, Lloyd DH, Jonson D, Luo S, M cC urdy S, Foy M , Ew an M e f al. (2000) Gene expression analysis by massively parallel signature sequencing (MPSS) on —■crobead arrays. Nat. Biotechnol. 18, 630-634. Brenner SE (1999) Errors in genome annotation. Trends Genet. 15, 132-133. =j-=nner SE (2001) A tour of structural genomics. Nature Rev. Genet. 2, 801-809.

Burton D (1995) Phage display. Immunotechnology 1, 87-94. C elis JE, Kruhoffer M, G rom ova I, Frederiksenb C e f al. (2000) Gene expression profiling: monitoring transcription and translation products using DNA microarrays and proteomics. FEBS Lett 480, 2-16. D er SD, Zhou A, W illiam s BR, S ilverm an RH (1998) Identification of genes differentially regulated by Interferon alpha, beta, or gamma using oligonucleotide arrays. Proc. Natl Acad. Sci. USA 95, 1562315628. D ujon B (1996) The yeast genome project: what did we learn? Trends Genet. 12, 263-270. Eddy SR (1998) Multiple alignment and sequense searches. Bioinformatics, A Trends Guide 5,15-18. Elgar G, Sandford R, Aparicio S, M acrae A, Vekatesh B, Brenner S (1996) Small is beautiful: comparative genomics with the pufferfish (Fugu rubripes). Trends Genet. 12, 145-150. Fields S, S tern g lan z R (1994) The two hybrid system: an assay for protein-interactions. Trends Genet. 10, 286-292. Franzen B, Auer G, A laiya AA, Eriksson E ef al. (1996) Assessment of homogeneity in polypeptide expression in breast carcinomas shows widely variable expression in highly malignant tumors. Int. J. Cancer 69, 408-414. G avin A C e f al. (2002) Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature 415, 141-147. G ene O ntology C onsortium (2000) Gene ontology: tool for the unifi cation of biology. Nature Genet. 25, 25-29. Gene O ntology Consortium (2001) Creating the gene ontology resource: design and implementation. Genome Research 1 1 ,1425-1433. G olub TR, Slonim DK, Tamayo R Huard C, G aasenbeek M, Mesirov JP, Coder H, Loh M L, Downing JR, Caligiuri M A e t al. (1999) Mole cular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286, 531-537.

CAPÍTULO

VEINTE

M anipulación gen ética d e células y anim ales Contenido del capítulo

578 ¡ CAPÍTULO VEINTE

20.1

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

G eneralidades de la tecnología de tran sferen cia gènica

Las células cultivadas y los animales experimentales se aprovechan con amplitud como sistemas modelo para estudiar los aspectos bioquímicos, fisiológicos y del desarrollo en la salud y la enferme dad en humanos. En épocas recientes estos estudios se beneficia ron de manera importante de la tecnología de transferencia gènica, que permite introducir secuencias específicas de DNA en el genoma de células animales (transgénesis). Antes de contar con las técnicas de transferencia gènica, la única forma en que la genética de las células y los animales podía alterarse era mediante mutagénesis, un proceso que comprende el uso de radiación o sus tancias químicas potentes para generar modificaciones aleatorias en el genoma. Una de las ventajas que la tecnología de transferencia gènica ofrece consiste en que permite añadir secuencias de DNA nuevas preparadas in vitro al genoma. Estas secuencias adicionales pueden ser genes que otorgan nuevas funciones {ganancia d e función) o ele mentos que inhiben la expresión de genes endógenos (pérdida de función). En otro nivel, la tecnología de transferencia gènica permi te modificar el genoma en una form a precisa y predeterm inada, de manera que pueden diseñarse mutaciones e introducirse en genes particulares in vivo (envío dirigido de genes). Aunada a métodos complicados para regular la expresión de genes, la tecnología de transferencia gènica incrementa mucho la capacidad para estudiar y controlar el modo en que los genes funcionan y para elaborar mo delos de enfermedades en ratones. La transferencia gènica a células de mamíferos cultivadas se do cumentó por primera vez al inicio del decenio de 1960, cuando se observó que las células humanas captaban e incorporaban DNA genómico fragmentado de su medio de cultivo (Szybalska y Szybalski, 1962). Aunque se requirió algún tiempo para descubrir los factores que rigen la transferencia de DNA, la introducción de DNA en muchos tipos de células ya era un procedimiento rutina rio hacia principios del decenio de 1970. Casi al mismo tiempo se produjeron los primeros animales transgénicos. Éstos contienen la misma secuencia de DNA adicional en cada célula y se generan extendiendo los principios de la transferencia gènica a células que contribuyen a la línea germinal de los animales. Los primeros ani males transgénicos fueron ratones que contenían parte de la se cuencia de DNA SV40 (virus simiano 40), producidos mediante la simple inyección de DNA en las cavidades del blastocele de em briones antes de la implantación (Jaenisch y Mintz, 1974). Desde entonces se desarrollaron procedimientos seguros para la modifi cación genética de ratones y muchas otras especies, inclusive orga nismos modelo invertebrados (moscas de la fruta y nematodos) así como peces, ranas, aves, ratas y varios mamíferos domésticos y ga nado. En fecha más reciente tuvo un impacto mayor otro método experimental que comprende la manipulación genética de anima les. En 1997 se anunció una nueva era en genética cuando se pu blicó el primer éxito en la clonación de mamíferos (Wilmut y cois., 1997). Esto incluyó la transferencia del núcleo de una célula adulta al interior de un oocito enucleado (transferencia nuclear de células somáticas) y luego la tecnología se aplicó como una vía alternativa para la producción de animales modificados genética mente. En la primera parte de este capítulo se describen los principios y métodos de la transferencia gènica, y las estrategias para la mani pulación genética de animales. En el resto del capítulo y en el 21 se

comenta la forma en que se aplican estos métodos, dirigidos a las siguientes áreas de investigación biomédica. ► Estudio de la expresión y la función génicas (el presente ca pítulo). Las células de animales cultivadas se emplean con am plitud para investigar la función génica y la regulación de la expresión de genes. La razón para ello es simple: las células ani males proporcionan el fondo genético correcto y un contexto bioquímico para el estudio de genes de animales. Este contex to no puede duplicarse con precisión mediante sistemas expe rimentales in vitro. La capacidad para añadir genes o eliminar o alterar en forma selectiva genes específicos en animales pro porciona una base potente para el análisis funcional en el con texto del organismo completo. ► Aplicaciones en genómica funcional (este capítulo). Es posi ble estudiar las funciones génicas a una escala global mediante la creación de genotecas mutantes insercionales de la extensión del genoma, genotecas de atrapamiento de genes y el desarro llo de técnicas de knockdown de genes de alto rendimiento ba sadas en la interferencia de RNA (sección 20.2.6). Estas técnicas se aplican a una gama de animales modelo desde el nematodo Caenorhabditis elegans\v3&xiL el ratón, y también a célu las humanas en cultivo; complementan las diversas estrategias genómicas funcionales y se estudian en el capítulo 19. ► Creación de modelos de enfermedad (este capítulo). La na turaleza proporcionó algunos modelos animales de enfermeda des y otros se generaron mediante mutagénesis aleatoria, pero no d e una manera predeterminada. La tecnología de transferen cia génica permite crear genotipos mutantes específicos en ani males y en consecuencia incrementa la posibilidad de semejar enfermedades humanas a niveles genético y fenotípico. En una extensión más limitada, también posibilita modelar la patogé nesis en células cultivadas. ► Producción de proteínas recombinantes (cap. 21). Las cé lulas cultivadas y los animales transgénicos se utilizan como “biorreactores” para producir proteínas recombinantes. Los sistemas de mamíferos muestran ventajas particulares para producir proteínas humanas terapéuticas porque las proteí nas recombinantes experimentan modificación postraduccional auténtica. ► Desarrollo del potencial para terapéutica génica (cap. 21). Es posible que la transferencia de genes a células humanas per mita corregir o mejorar defectos genéticos.

20.2

Principios de la tran sferen cia génica

20.2.1 La transferencia génica puede utilizarse para nuevas secuencias de DNA funcionales en células animales cultivadas, en forma pasajera o estable La transferencia génica se emplea para añadir genes nuevos y fun cionales a células animales, lo que a menudo significa que las célu las adquieren la capacidad de expresar una o más proteínas nuevas. Ello se describe como ganancia de función. La secuencia adicional de DNA se conoce como transgen, aunque puede contener uno, dos o incluso más genes reales. En ocasiones se denomina “DNA

20.2 j PRINCIPIOS DE LA TRANSFERENCIA GENICA | 579

extraño” pero es erróneo porque resulta perfectamente aceptable in troducir copias extra de un gen endógeno y en realidad este méto do puede ser muy útil para estudiar la función génica. Es posible aplicar de manera general, y se prefiere, el término alternativo “DNA exógeno”. Los transgenes pueden introducirse en células cultivadas por medio de una diversidad de métodos de transporte virales y no virales, que se resumen en el recuadro 20-1. El destino del transgen es importante. En algunos casos se con serva de manera pasajera en las células huésped, en tanto que en otros se constituye en una parte permanente del genoma. El desti no del transgén depende de las propiedades del virus cuando la transferencia génica mediada por virus se usa. Algunos sólo son adecuados para expresión pasajera, mientras que otros son capaces de causar infecciones latentes y la expresión del transgen a largo término puede ser posible. Los retrovirus son inusuales porque una copia de DNA del genoma viral se integra en el genoma del huésped poco después de una infección. Por consiguiente es posi ble recurrir a retrovirus recombinantes para crear líneas celulares transformadas de modo estable. La introducción de DNA mediante transfección en células de animales cultivadas casi siempre se realiza en forma de plásmidos bacterianos que no pueden replicarse en animales. Aunque es po sible que una gran proporción de las células capte el DNA al principio, poco después se descompone y cualquier expresión transgénica es pasajera. La longevidad del plásmido depende de la calidad del DNA y la línea de células huésped. El DNA de plásmi dos de buena calidad persiste uno a dos días en un gran porcenta je de células, pero en algunos casos tal vez dure mucho más (p. ej., el DNA plásmido puede permanecer hasta 80 h en la línea HEK293). En una proporción muy pequeña de células transfectadas, parte del DNA plásmido se integra en el genoma y produce una transformación estable. Éste es un acontecimiento tan raro que deben emplearse estrategias de selección potentes a fin de identificar las transformaciones estables. La estrategia general con siste en incluir un gen marcador seleccionable en el plásmido o cotransfectar las células con dos plásmidos, uno que contiene el transgén primario y otro que comprende un marcador seleccionable. El gen con el marcador estable confiere a las células una pro piedad que les permite sobrevivir en presencia de un agente selectivo, como un antibiótico, que destruye células no transforma o s (recuadro 20-2). En esta forma pueden obtenerse líneas celuu es transformadas de modo estable. De manera alternativa pueden transfectarse células con un vec tor plásmido que contiene un origen de replicación viral, en cuyo ciso el transgen se conserva y replica episómicamente. En algunos it-iores, el origen facilita la replicación rápida, incontrolable, del rem id o , lo que conduce a valores pasajeros altos del transgén, pe*: i continuación destruye las células. Se observa así en células I OS transfectadas con plásmidos que portan un origen de replicano n SV40. En contraste, los vectores que contienen el origen de rer-lició n latente del virus Epstein-Barr (EBV) se conservan en un z __nero moderado de copias y, si se incluyen marcadores selecciotiz.es apropiados, pueden usarse para obtener líneas de células —-.'Tormadas en forma estable. En resumen, pueden utilizarse métodos de aporte génico tanto «cates como no virales para introducir nuevos genes en células animius de manera pasajera o estable. La transformación estable pueie -C-crarse mediante integración retroviral, conservación episómica i .¿30 término de un vector de replicación o integración de DNA a: «epíicante en uno de los cromosomas de la célula huésped.

20.2.2 La producción de animales transgénicos requiere la transferencia génica estable a la línea germinal Aunque los métodos antes comentados resultan adecuados para la transformación de células en un plato de cultivo, es más difícil exten der esta tecnología a animales completos. Es imposible introducir de manera uniforme DNA en todas las células de un animal adulto. Por consiguiente, para producir un animal por completo transgénico (uno que contiene el mismo transgén en el mismo contexto en cada célula), éste debe desarrollarse a partir de un cigoto transgénico. Esto se logra mediante la transferencia génica estable a la línea germ inal y puede efectuarse en una de dos formas (fig. 20-1): ► Directa, mediante la introducción selectiva de DNA en células germinales, los gametos derivados de las mismas o en el huevo justo después de la fecundación. Si el DNA se integra antes de la primera división del cigoto, cada célula resultante del animal contendrá el mismo transgen. ► Indirecta, por medio de introducción no selectiva de DNA en el embrión antes que la línea germinal se forme. En esta etapa las células embrionarias son totipotentes, o cuando menos pluripotentes, lo que significa que pueden formar cualquiera de los tipos de células del embrión en desarrollo. Como el DNA se integra después de la primera división del cigoto, sólo algu nas de las células del embrión incorporarán el transgen. Sin embargo, si esas células contribuyen a la línea germinal del em brión se producirán gametos transgénicos y la generación sub secuente de animales será transgénica. El cuadro 20-1 resume los métodos de transferencia génica en ani males y en seguida se comentan en detalle.

La transferencia génica directa a células precursoras de la línea germinal es el procedimiento estándar para producir moscas de la fruta transgénicas La introducción de DNA en células germinales puede ser un medio muy útil para acceder a esta línea celular porque conduce a la produc ción de gametos transgénicos. Este método no se emplea en mamífe ros ya que, aunque las células germinales primordiales de mamíferos son hasta cierto punto íaciles de aislar, cultivar y transfectar, resulta difícil inducir las células modificadas para que contribuyan a la línea germi nal cuando se reintroducen en un animal huésped. Sin embargo, la modificación directa de células germinales es el método rutinario pa ra producir moscas de la fruta transgénicas. En Drosophila melanogaster la integración cromosómica eficiente se logra con secuencias de un elemento transposable que se conoce como elemento P. El transgen se inserta entre las dos secuencias terminales del elemento P y luego se inyecta en el polo plasmático de un embrión joven, que es el sitio donde se encuentran los núcleos del polo celular (células precursoras de la línea germinal). La enzima transposasa que se requiere para la transposición del elemento P se suministra mediante la inyección con currente de un plásmido y esto facilita la integración aleatoria del transgen en el genoma de uno o más de los núcleos del polo celular. Sólo una copia del transgen suele incorporarse.

El DNA puede mezclarse con espermatozoos o núcleos de estos últimos e introducirse en huevos no fecundados La modificación directa de gametos es otra forma de generar ani males transgénicos. Se diseñaron dos métodos muy distintos: apor-

580 i CAPÍTULO VEINTE I MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

Recuadro 20-1. Métodos de transferencia génica a células animales en cultivo Cuatro clases generales de metodología de transferencia genica pueden aplicarse a células animales cultivadas, pero las que más se utilizan son la transducción y la transfección. Pueden emplearse variaciones de estos mé todos a fin de introducir DNA en células humanas in vivo (sección 21.5). ► TRANSDUCCIÓN. Es una transferencia génica mediada p o r virus, es decir, el DNA extraño se empaca dentro de una partícula viral. Los vi rus animales evolucionaron en varias formas para introducir su DNA o RNA en células y por esta razón muchos virus se aprovechan co mo vectores de transferencia génica. Incluyen: a) virus que facilitan la expresión transgénica pasajera de alto nivel, por ejemplo, adenovirus, virus Sindbis, virus del Bosque Semliki, virus de vaccinia, baculovirus (en células de insectos, que apo yan la replicación de baculovirus); b) virus que se conservan en un estado episómico latente y facilitan la expresión transgénica estable a largo plazo, com o virus Epstein-Barr, virus del herpes simple, baculovirus (células de mamí feros, que no apoyan la replicación de baculovirus); c) virus que se integran en el genoma y pueden usarse para trans form ación estable permanente, por ejemplo, retrovírus, virus adenorrelacionados. ► TRANSFECCIÓN. Comprende el uso de artimañas químicas o físi cas a fin de inducir a las células para que capten DNA del medio de cultivo y por último el DNA encuentra su camino al núcleo. Cabe se ñalar que, en sistemas bacterianos, transfección se refiere a la cap tación de DNA viral (fago) desnudo en tanto que transform ación denota la captación de DNA plásmido genómíco desnudo. En célu las animales transfección denota la captación de cualquier DNA desnudo en tanto que transform ación suele referirse a un cambio estable y permanente del genotipo si se utiliza en el contexto de transferencia génica. Existen numerosos métodos de transfección diferentes que incluyen: a) transfección química. Cuando se mezcla DNA con cloruro de cal cio en presencia de un amortiguador de fosfato se forma un pre cipitado de fosfato de calcio y DNA fino. Éste se asienta en la membrana plasmática de células cultivadas y es captado por endocitosis. El DNA también puede form ar complejos solubles con otras sustancias químicas, entre ellas DEAE-dextrán (dietilaminoetil-dextrán) o el detergente polibreno. Las células que no se re cubren con fosfato del calcio pueden responder mejor a estas alternativas; b) transfección mediada por liposomas (fig. 21-8). El DNA puede encapsularse en vesículas lípidas artificiales conocidas como lipo somas que se fusionan con la membrana plasmática y depositan su carga en el citosol. Es posible incrementar la eficiencia de la transfección si el liposoma se deriva de envolturas virales, que a menudo contienen proteínas que fortalecen la fusión con la mem brana. Éstas vesículas se denominan virosomas. De otra manera pueden emplearse membranas celulares reales como vehículo de transporte. Ésta es la base de la fusión del protoplasto, en la que protoplastos bacterianos cargados con DNA se centrifugan en cé lulas de mamíferos cultivadas y la fusión con las mismas se indu ce utilizando políetilenglicol (PEG). Una técnica similar recurre a eritrocitos fantasma (eritrocitos sin hemoglobina);

te de DNA mediado por espermatozoo e integración mediada por enzima de restricción. El aporte de DNA mediado por espermatozoo aprovecha el hecho de que la cabeza de los espermatozoos se enlaza de modo es-

c) lipofección. A diferencia de la transfección mediada por liposo mas, en la que el DNA se encapsula en una vesícula lípida, la //'pofección comprende la formación de un complejo DNA-lípido (lipoplex) que es captado con eficiencia por endocitosis. Por consiguiente la lipofección tiene más en común con la transfec ción química que la transfección mediada por liposoma. En fecha más reciente se popularizaron vehículos de transporte génico ba sados en polímero catiónico Ipoiiplexos). Son tan eficientes co mo lo lipoplexos pero tienen la ventaja de que pueden utilizarse con polímeros específicos para modificar las propiedades físicas del vehículo de transporte. Está demostrado que en algunos ca sos es factible form ar complejos con propiedades diferentes a distintas temperaturas, lo que permite la liberación controlada de DNA (Yokayama, 2002). Esto podría tener gran utilidad para la transferencia génica in vivo a sitios particulares en el cuerpo (cap. 2 1); d) electroporación. En este método se someten células a un pulso eléctrico breve que ocasiona la aparición de poros pasajeros, de tamaño de nanómeros, en la membrana plasmática. Sí el DNA es tá presente en la solución amortiguadora a una concentración su ficiente, se captara a través de estos poros; e) endocitosis mediada por receptor (lig. 21-9). En este método se fija DNA al ligando de un receptor de superficie celular que se recicla mediante endocitosis. El DNA se libera durante el procesa miento del receptor. En circunstancias normales el endosoma que contiene el complejo receptor-ligando-DNA se fusiona con un lisosoma y el DNA se degrada, pero esto puede evitarse medíante la inclusión de péptidos adenovirales en el complejo de transfec ción ya que éstos alteran endosomas. Este método puede usarse para dirigirse a tipos de células específicos con base en su espe cificidad de receptor. TRANSFERENCIA DIRECTA. Comprende la introducción física direc ta de DNA en las células. El ejemplo obvio es la microinyección, que en ocasiones se usa en células cultivadas que son resistentes a otros métodos de transferencia génica pero suele aplicarse a huevos, cigo tos o embriones tempranos de animales. Otro método de transferen cia directa es el bombardeo de partículas, que incluye la aceleración de microproyectíles recubiertos con DNA a alta velocidad hacia el in terior de las células. Aunque puede emplearse en células cultivadas, es un procedimiento de elección para la transfección de células en cortes de tejidos y también puede aplicarse a la transferencia génica in vivo (sección 21.5.4). TRANSFERENCIA GÉNICA BACTERIANA. Por lo general comprende el uso de bacterias ínvasoras, vivas, que se lisan dentro de la célula animal y liberan su cargamento de DNA (Higgins y Portnoy, 1998). En el caso de las especies de Salmonella ocurre lisis en una vesícu la fagocítica, en tanto que en otras especies (p. e j„ Listeria m onocytogenes y Shigeila flexneri) la lisis ocurre después que la bacteria escapa de la vesícula. Asim ism o las bacterias pueden unirse a la su perficie celular y transferir DNA a través de un pilo. En Agrobacterium tumefaciens se utiliza este método para transferir DNA a plantas y también puede infectar células de animales cultivadas (Kunik y cois., 2001).

pontáneo a DNA in vitro. Por tanto se utilizan espermatozoos co mo vehículos para transporte aunque e l gen om a d e l gam eto en s: m ismo no se m odifica. La IICE (inyección intracitoplásmica de espermatozoos) es un tratamiento para la infecundidad que con-

20.2 ¡ PRINCIPIOS DE LA TRANSFERENCIA GÉNICA I 581

Recuadro 20-2. M arcadores seleccionabies para células animales CATEGORÍAS DE GEN MARCADOR SELECCIONABLE

GENES MARCADORES AMPLIFICABLES

Un gen marcador seleccionable confiere una propiedad que permite que las células transformadas establemente sobrevivan y crezcan en presen cia de un agente particular que destruye o restringe el crecimiento de las células no transformadas. Esto se conoce como selección positiva por que se seleccionan células con base en que portan el gen marcador (son positivas para el gen marcador). La selección positiva es esencial para aislar las muy pocas células en un plato de cultivo que se transformaron de manera estable durante la transfección con DNA no replicante. Las cla ses principales de gen marcador seleccionable son dos: marcadores seleccionables endógenos y marcadores seleccionabies dominantes,

Si el agente selectivo que se elige es un inhibidor competitivo del produc to del gen marcador, entonces puede recurrirse a la selección gradual para amplificar el gen marcador y lograr una expresión transgénica de al to nivel. Este sistema funciona porque el locus transgénico en células transform adas establemente suele contener múltiples copias tándem del marcador seleccionable y del transgen primario. Si la concentración del agente selectivo se incrementa, se seleccionan las células con los núme ros de copias más altos porque expresan el marcador a los valores más altos. Estas células pueden experimentar acontecimientos de recombina ción que incrementan de modo adicional el número de copias y median te el aumento progresivo de la presión de selección se seleccionan células con arreglos transgénicos amplificados masivamente. La amplifi cación es un proceso aleatorio y el transgen primario se coamplifica jun to con el gen marcador. Un ejemplo de este marcador es el gen del ratón dhrf, que codifica la enzima reductasa de dlhidrofolato. Ésta puede am plificarse mediante selección gradual con el inhibidor competitivo metotrexato.

► Los marcadores seleccionabies endógenos son genes que se en cuentran en el genoma de las células huésped. Por consiguiente la selección sólo puede aplicarse a células que carecen de una copia funcional de ese gen. Un ejemplo es el gen TK que la enzima cinasa de tim id ina codifica. Esta enzima convierte la timidina libre en monofosfato de tim idina como parte de la vía de salvamento de nucleósidos. En circunstancias normales la vía de salvamento no es esencial porque también pueden sintetizarse nucleótidos de timidina nuevos a partir del monofosfato de uridina. Sin embargo, la célula se torna dependiente de la actividad de TK si la vía nueva se bloquea con el inhibidor am inopterina. Por tanto si las células T K ' (que carecen de un gen TK funcional) se desarrollan en un medio HAT (que contie ne aminopterina y timidina), sólo las células transformadas en forma estable con un gen marcador TK son capaces de sobrevivir. ► Los marcadores seleccionabies dominantes no se encuentran en el genoma de la células huésped y confieren una propiedad por comple to nueva, como la resistencia a antibióticos. La ventaja de estos mar cadores consiste en que pueden emplearse en cualquier tipo de célula, es decir, no se requieren mutantes. Por ejemplo, el neogén de £ coli codifica la enzima fosfotransferasa de neomicina. Ésta inactiva anti bióticos aminoglucósidos como G418 y permite que las células trans formadas establemente se seleccionen mediante la sola adición de

GENES MARCADORES CONTRASELECCIONABLES Un marcador contraseleccionable confiere una propiedad que destruye células transformadas de manera estable, en tanto permite que las no transformadas sobrevivan. Esto se conoce com o selección negativa porque las células se seleccionan con base en que carecen del gen mar cador (son negativas para el gen marcador). Estos marcadores son útiles para ablación celular si se expresan bajo el control de promotores restrin gidos. También se emplean para identificar tipos particulares de modifi cación genética, por ejemplo, para diferenciar entre los acontecimientos de envío dirigido de genes y los de integración aleatoria en células ME (sección 20.2.4). Algunos marcadores contraseleccionables destruyen células en forma directa (p. ej., ricino, toxina diftérica), en tanto que otros requieren la presencia de un agente selectivo (p. ej., puede usarse TK pa ra selección negativa en presencia de análogos tóxicos de timidina como ganciclovir).

G418 al medio de cultivo.

siste en inyectar cabezas de espermatozoos en el citoplasma del óvu lo. La IICE se emplea para introducir cabezas de espermatozoos re cubiertas con DNA plásmido en huevos de mamíferos. En el primero de estos experimentos se fijaron espermatozoos de ratón en plásmidos que contenían el gen para la proteína verde fluorescente (PVT) y se inyectaron en oocitos aislados. Casi todos los huevos in yectados mostraron actividad de PVF, pero sólo 20% produjo rato nes transgénicos, lo que sugirió que el transgén no se integró en el genoma celular en la mayor parte de los casos (Perry y cois., 1999). La misma técnica se aplicó en monos rhesus; no obstante, aunque varios embriones mostraron actividad de PVF pasajera, no se en contró que alguno fuera transgénico. La integración mediada por enzima de restricción (IMER) es él método establecido para producir ranas transgénicas. A dife rencia de la transferencia génica mediada por espermatozoos, el ge noma del gameto se modifica durante el procedimiento de transferencia. Se aíslan núcleos de espermatozoos, se descondensan v se mezclan con DNA plásmido. Después se tratan con cantidades limitadas de una enzima de restricción para introducir muescas. En seguida los núcleos descondensados se trasplantan en huevos no fe cundados, donde las muescas se reparan y se produce la integración

del DNA plásmido en el genoma. El procedimiento de transferen cia debe completarse con rapidez porque los núcleos son muy frá giles (Kroll y Amaya, 1996).

La microinyección de DNA en el huevo fecundado es un medio establecido para producir ratones transgénicos y se usa para la valoración de expresión pasajera en peces y anfibios Aunque se producen ratones transgénicos mediante la inyección de DNA en el citoplasma de los huevos fecundados, una técnica más eficiente, y ya establecida, consiste en introducir DNA directamen te en el pronúcleo masculino justo después de la fecundación. La figura 20-2 muestra el método. El transgen microinyectado se inte gra de manera aleatoria en el DNA cromosómico, por lo general en un sitio y como múltiples copias (no es raro encontrar 50 copias o más como concatámeros cabeza a cola). El transgen puede integrar se de inmediato, en cuyo caso el ratón resultante es transgénico. Sin embargo, es más usual que el DNA se integre después de una a dos divisiones celulares y en estas circunstancias el ratón resultante es un mosaico que contiene células tanto transformadas como no

582

CAPÍTULO VEINTE

j

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

Fig. 20-1. Múltiples vías por las que es posible producir ratones genéticamente modificados. Los cuadros unidos por líneas interrumpidas muestran el ciclo de vida del ratón y representan todas las etapas en que es posible efectuar una modificación genética: células germinales, gametos, cigoto, blastocisto y adulto. La parte inferior de la figura muestra otro ratón como una fuente de células donadoras para transferencia nuclear y procedimientos de trasplante celular. Las flechas rojas indican el ingreso de DNA exógeno. Las flechas gruesas señalan los métodos de transferencia génica que más se utilizan en ratones.

Cuadro 20-1. Transferencia génica a animales: resumen de blancos y métodos para transformar la línea germinal Células blanco

Método

Células germinales

Transfección de células germinales primordiales cultivadas (mamíferos) Inyección en el embrión en el sitio de desarrollo de la célula germinal (Drosophila)

Espermatozoos

Fijación de

DNA a cabezas de espermatozoos (mamíferos) DNA en núcleos de espermatozoos descondensados (Xenopus)

Introducción de Huevo/cigoto

Microinyección en el citoplasma del huevo (aves, anfibios, peces, C. elegans) Mlcroinyección pronuclear (mamíferos) Transferencia retroviral (mamíferos, primates) Transferencia nuclear

Blastocisto

Microinyección en el blastocele (mamíferos) Transferencia de células ME (ratón) Transferencia retroviral (mamíferos, aves)

Células ME (seguidas p o r transferencia celular)

Transfección: adición transgénica Transfección: envío dirigido de genes Transferencia retroviral

Células somáticas (seguidas p o r transferencia nuclear)

Transfección: adición transgénica Transfección: envío dirigido de genes Transferencia retroviral

20.2

transformadas. Cuando las células transformadas contribuyen a la línea germinal, el transgén se pasa a la generación de ratones si guiente y esto puede verificarse mediante PCR, Southern blotting o una prueba para expresión de transgen. La transmisión a la línea germinal puede lograrse hasta en 40% de huevos de ratón microinyectados. Por desgracia, aunque la técnica se aplica a otros mamífe ros, la tasa de transmisión es mucho más baja (< 1%). Ello se debe en parte a la dificultad para manejar los huevos y en otra a las tasas de supervivencia más bajas. La microinyección también se utiliza para introducir DNA en huevos de peces y anfibios pero, a diferencia de lo que ocurre en ma míferos, este DNA tiende a persistir en estado episómico y experi mentar replicación extensa. El DNA plásmido inyectado puede incrementarse 50 a 100 veces en las etapas tempranas del desarro llo. Se piensa que esto indica que no ocurre transcripción durante el desarrollo temprano de peces y anfibios, de manera que hay una acumulación extensa de enzimas y proteínas necesarias para la replicación del DNA. La consecuencia es que es posible usar los huevos de peces y ranas como sistemas de expresión pasajera. Sin embargo, parte del DNA se integra y, si la transmisión a la línea

P ro n ú cleo

PRINCIPIOS DE LA TRANSFERENCIA GÉNICA

583

germinal se establece, entonces pueden producirse líneas transgénicas. Aunque este método no se aplica en ranas por los intervalos de generación prolongados, es el procedimiento estándar para produ cir peces transgénicos.

Aunque la transferencia génica retrovirai se emplea para producir mamíferos y aves transgénicos, su principal aplicación es crear mosaicos en el desarrollo Es posible transferir genes a células no seleccionadas de embriones muy tempranos utilizando vectores retrovirales porque después de la infección una copia de DNA del vector se integra de modo estable en el genoma del huésped. La infección de embriones de ratón an tes de la implantación mediante retrovirus murinos recombinantes o inyección de retrovirus en embriones de ratón postimplantación temprana ocasiona la transformación estable de algunas células y por tanto la producción de mosaicos que pueden originar descendencia transgénica. Se logran resultados similares en pollos por medio de retrovirus aviario. No obstante, a causa de varias limitaciones de la transferencia génica retrovirai (la cantidad limitada de DNA extra-

P ro núcleo

Fig. 20-2. Desarrollo de ratones transgénicos mediante microinyección pronuclear. Se construyen pipetas de vidrio muy finas con equipo especializado: una, la pipeta de sostén, tiene un diámetro que puede ajustarse a parte de un oocito 'ecundado y por consiguiente conservarlo en su sitio, en tanto que la pipeta de microinyección posee una punta muy fina que se utiliza para perforar el Docto y después el pronúcleo m asculino (porque es más grande). A continuación una solución acuosa del DNA de deseado se lleva directamente dentro del pronúcleo con la pipeta. Las clonas de DNA Introducidas pueden integrarse en el DNA cromosómlco en muescas y form ar transgenes, que suelen contener múltiples coplas de cabeza a cola. Después de extraer la micropipeta, los oocitos sobrevivientes se reimplantan en los oviductos de * -rubras adoptivas seudogestantes (que se aparearon con un macho vasectomizado; el acto de apareamiento puede iniciar cambios fisiológicos en la • í'- b ra que estimulan el desarrollo de ios embriones implantados). Los ratones recién nacidos que resultan del desarrollo de los embriones implantados revisan mediante PCR en cuanto a la presencia de la secuencia de DNA deseada (Gordon, 1992).

584

CAPÍTULO VEINTE

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

ño que puede incorporarse y la tendencia de los transgenes retrovirales a sufrir silenciamiento) esta técnica no se utiliza con amplitud para generar ratones o aves transgénicos. Por el contrario, se prefie re para producir mosaicos que pueden usarse para estudiar la expre sión y la función génicas en el desarrollo de vertebrados. En fecha más reciente la inyección de retrovirus recombinantes en el espacio perivitelino de oocitos aislados permitió producir ganado transgénico (Chan y cois., 1998) y el primer primate transgénico obtenido al guna vez, un mono rhesus llamado ANDi (Chan y cois., 2001).

La transfección de células madre embrionarias permite producir ratones transgénicos Las células madre embrionarias (ME) de ratón se derivan de em briones de 3-5 a 4.5 días poscoito y surgen de la masa celular inter na del blastocisto (véase recuadro 20-3). Las células ME pueden cultivarse in vitro y es fácil transfectarlas con los métodos que se describen en el recuadro 20-1. Sin embargo, permanecen pluripotentes y contribuyen extensamente a todos los tejidos de un ratón, inclusive la línea germinal, cuando se reinyectan en un blastocisto huésped y se reimplantan en una madre adoptiva seudogestante. El embrión en desarrollo es una quimera que contiene dos poblacio nes de células derivadas de diferentes cigotos, los del blastocisto y las células ME implantadas. Éste difiere del mosaico en que las cé lulas pueden ser genéticamente distintas pero derivadas del mismo cigoto (fig. 4-10). Si el blastocisto y las células ME se derivan de ra tones con diferentes colores de pelambre, la descendencia quiméri ca puede identificarse con facilidad por sus pelajes en parches. La transmisión del transgén a la línea germinal también puede confir marse seleccionando la descendencia de apareamientos entre qui meras (por lo general machos) y hembras con un pelambre de color recesivo al de la cepa de la que las célula ME se derivaron (véase fig. 20-3). Una de las ventajas de las células ME radica en que pueden mantenerse de manera indefinida en cultivo y por tanto tienen to das las conveniencias relacionadas con las células cultivadas. Es po

sible transformar millones de células con técnicas de transfección simples y verificar la modificación genética deseada en la etapa de cultivo celular con marcadores seleccionables como neo (recuadro 20-2). En contraste, los otros procedimientos comentados requie ren el procesamiento manual de huevos o embriones individuales, de manera que sólo es posible efectuar un número pequeño de ex perimentos. Además, como no hay forma de seleccionar los huevos y los embriones transformados, la integración del transgen debe ve rificarse en los ratones resultantes. Sin embargo, la mayor ventaja de las células ME es su propensión a la recorribinación homóloga, que permite la modificación genética mediante el envío dirigido de genes (sección 20.2.5). En fecha reciente se derivaron líneas de cé lulas ME de pollos y humanos (véanse recuadro 20-3 y comentario en la sección 21.3.3), pero aún no es posible derivar líneas de célu las ME seguras, vigorosas, a partir de mamíferos domésticos.

La transferencia nuclear puede emplearse para producir mamíferos domésticos modificados genéticamente, pero su tasa de éxito es muy baja Las principales técnicas útiles para generar ratones transgénicos (microinyección pronuclear y transfección de células ME) no son eficientes o prácticas en la mayor parte de otros mamíferos. Por esta razón se desarrollaron métodos alternativos basados en la tec nología de transferencia nuclear, que consiste en reemplazar el núcleo de un oocito con el núcleo de una células somática, que el oocito reprograma después y se torna capaz de recapitular la totali dad del desarrollo a pesar del estado diferenciado de la célula dona dora. La tecnología no es nueva en sí misma. Se ha recurrido a ella por más de 50 años para generar anfibios clonados y ha permitido pro ducir mamíferos clonados a partir de células embrionarias desde fi nales del decenio de 1980. En 1995 se demostró por primera vez que era factible clonar mamíferos a partir de núcleos de células cul tivadas (Campbell y cois., 1996) y el primer mamífero clonado a partir de una célula adulta se produjo en 1997 (Wilmut y cois.,

Recuadro 20-3. Aislamiento y manipulación de células madre em brionarias de mamíferos El embrión propiamente dicho de mamíferos se deriva de la masa de cé lulas internas (MCI) de un blastocisto (sección 3.7.3). Evans y Kaufman (1981), y Martin (1981) aislaron por primera vez las células madre (ME) embrionarias de ratón de blastocistos. El procedimiento consiste en co locar un embrión preimplantación de 4.5 días (blastocisto) en una monocapa de células nutrientes, que proporcionan tanto una matriz para la fijación como factores proteínicos secretados que inhiben la diferencia ción de células ME recién formadas. Tras la fijación del blastocisto, las células de la MCI proliferan. En un tiempo apropiado la MCI se extrae fí sicamente con una micropipeta, se dispersa en grupos pequeños de cé lulas y se siembran nuevas células nutrientes. Las colonias se examinan al microscopio para buscar la morfología caracteristlca. A continuación se captan, dispersan en células únicas y se siembran de nuevo en capas nutrientes. Por último las células con una morfología uniforme pueden aislarse y establecerse líneas celulares. El término célula M E' se intro dujo para diferenciar estas células madre derivadas de embriones de las células del carcinoma embrionario (CE), que se derivaron de teratocarcinomas. En general las células ME tienen un potencial de desarrollo me nos restringido que las células del carcinoma embrionario (CE). Las dos clases de células son pluripotentes y las células ME pueden originar to dos los tipos de células adultas, inclusive las de la línea germinal. Sin em

bargo, no son totipotentes en el mism o sentido que el oocito fecundado: si se implantan en un útero no son capaces de originar un embrión. En al gunos casos se informa que las células CE contribuyen a la línea germi nal en quimeras, pero cuando se inyectan células ME de ratón en un blastocisto aislado de una cepa diferente y se implantan en una madre adoptiva seudogestante contribuyen a quimeras y en particular a la línea germinal en una form a más consistente. Esta propiedad es la que ha he cho que las células ME de ratón sean tan valiosas para la investigación. No obstante, cabe señalar que las células ME que se utilizan para formar con éxito quimeras de línea germinal se derivan de una cepa de ratón ais lada (129) en combinación con una cepa de embrión huésped única (C57BIV6). En esta combinación, las células ME son vigorosas y contri buyen a la línea germinal. Los investigadores buscaron durante muchos años células ME en otros mamíferos y aunque éstas se aislaron de varias otras especies además del ratón, el gran éxito en la formación de quimeras de línea germinal en el ratón no fue paralelo. En fecha reciente se aislaron células madre em brionarias humanas del blastocisto (Thomson y cois., 1998) y se deriva ron de células germinales primordiales (Shamblott y cois., 1998). Las aplicaciones médicas potenciales de las células ME humanas y las impli caciones éticas de su uso se comentan en el capítulo 2 1 .

20.2

PRINCIPIOS DE LA TRANSFERENCIA GÈNICA ¡ 585

129 B lasto cisto a islad o a

*

C élu las ME cu ltiv ad as

M asa d e célu las in te rn a s

I

R eim plantar en m ad re a d o p tiv a ^

Envío dirigido d e g e n e s o inserción d e tra n sg e n

Iny ectar d en tro

3

C 57B 10/J C 57B 10/J

de la cavidad del blastocisto de una cepa de ratón diferente C élu las ME m o d ificad as g e n é tic a m e n te

Q uim era A paream iento

Ratón que contiene (heterocigoto) modificación genética en todas las células nucleadas

Fig. 20-3. Células ME modificadas genéticamente para transferir DNA extraño o mutaciones específicas en la línea germinal del ratón. Se cultivaron células de la masa celular interna después de extirpar los oviductos y aislar blastocistos de una cepa de ratón adecuada (129). Estas células madre embrionarias (ME) retienen la capacidad de diferenciarse en distintos tipos de tejidos en el ratón adulto. Las células ME pueden modificarse genéticamente cuando están en cultivo mediante la inserción de DNA extraño o por la introducción de una mutación sutil. Las células ME modificadas pueden inyectarse luego en blastocistos aislados de otra cepa de ratón (p. ej., C57B10/J, que tiene un color de pelambre negro que es recesivo al color agutí de la cepa 129) y después implantarse en una madre adoptiva seudogestante de la misma cepa que el blastocisto. El desarrollo subsecuente del blastocisto introducido produce una quimera que contiene dos poblaciones de células (inclusive células de la linea germinal) que se derivan de cigotos diferentes (por lo general lo evidencia la presencia de placas de pelambre de diferentes colores). El retrocruzamiento de quimeras puede producir ratones que son heterocigotos para la modificación genética. El interapareamiento subsecuente de mutantes heterocigotos genera homocigotos.

1997). La figura 20-4 resume el procedimiento que siguieron Wilmut y colaboradores. En el experimento original sólo 29 de un to tal de 434 oocitos se desarrollaron hasta la etapa transferible y sólo uno de ellos se desarrolló hasta el término —la famosa oveja conoci da como Dolly (véase fig. 20-4B)-. El éxito en la clonación de ani males adultos forzó a aceptar que las modificaciones del genoma que en alguna época se consideraban irreversibles pueden revertir se y que es posible reprogramar los genomas de células adultas me diante factores oocitarios para tornarlas totipotentes de nuevo. Es

indudable que la clonación de animales, en especial la de ratones, beneficiará la investigación del control de la expresión génica du rante el desarrollo y los procesos básicos de la diferenciación somá tica, la mutación somática y los procesos del envejecimiento y la reparación (Wakayama y cois., 1998). En el capítulo 21 se estudian los beneficios médicos prácticos y las implicaciones éticas de la clo nación de animales y humanos, pero por el momento el método só lo se considera como otra forma de generar animales transgénicos. El hecho esencial es que si el núcleo donador se obtiene de una cé

586

CAPITULO VEINTE

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

lula que se transfectó y contiene un transgen adicional, entonces el animal que se desarrolla a partir del oocito manipulado será transgénico. Esto lo demostraron por primera vez Schnieke y colabora dores (1997) quienes transfectaron fibroblastos de oveja cultivados con el gen humano para factor de coagulación sanguínea IX y pro dujeron una oveja transgénica clonada llama Polly que contenía la proteína recombinante en su leche. De igual forma se produjeron ovejas clonadas a partir de células somáticas cultivadas cuyo genoma se alteró mediante el envío dirigido de genes (véanse más ade lante y McCreath y cois., 2000).

20.2.3 El control de la expresión transgénica es una consideración importante en cualquier experimento de transferencia génica La presencia de un transgen en una célula o animal transgénico no es suficiente por sí misma para producir un producto funcional. A fin de que lo anterior ocurra, el transgén también debe expresarse. Por consiguiente el control de la expresión génica tiene una importancia fundamental en la tecnología de transferencia génica. La expresión transgénica se regula mediante las secuencias que se encuentran en el elemento de expresión y, cuando el transgen se integra, también por factores intrínsecos al genoma del huésped. En general el aspecto más importante del diseño del constructo es la estructura del promotor, que se comenta más adelante. Sin embargo, la expresión robusta re quiere asimismo un sitio de poliadenilación y tal vez otras considera ciones, como la optimación del sitio de inicio de la traducción y la inclusión de una señal dirigida a proteínas adecuada.

El promotor transgénico define los patrones espacial y temporal básicos de la expresión Los experimentos de transferencia génica en líneas celulares suelen be neficiarse del uso de promotores constitutivos muy activos, que dan lugar a que el transgen se exprese en forma potente y constante. Estos promotores suelen derivarse de virus, que evolucionaron para expre sar sus genes en muchos tipos de células diferentes. Los elementos re guladores que más se utilizan en células de mamíferos comprenden el promotor e intensificador temprano SV40, el promotor e intensificador de repetición terminal larga (RTL) del virus del sarcoma de Rous y el promotor temprano inmediato de citomegalovirus humano. Mu chos vectores de expresión disponibles en el comercio los incluyen. En animales transgénicos, a menudo es deseable la expresión del transgen en tejidos o etapas particulares del desarrollo. De igual forma, en líneas celulares quizá sea necesario restringir la expresión del transgen a etapas particulares del ciclo celular o encender el transgen sólo cuando la célula se diferencia. El patrón de expresión deseado puede lograrse mediante el enlace del transgen a un pro motor específico de célula o especifico de etapa apropiado. Por ejemplo, el gen de enolasa específico de neurona sólo se expresa en neuronas maduras. Un elemento regulador corriente arriba de 1.8 kb de largo es suficiente para conferir la expresión del transgen específi co de neurona en ratones transgénicos e incrementar la expresión es pecífica del transgen en neuroblastos cultivados en diferenciación (Forss-Petter y cois., 1990; Sakimura y cois., 1995). El control máximo de la expresión del transgen tanto en líneas ce lulares como en animales lo ejercen promotores inducibles, que pueden encenderse y apagarse por el control del aporte de un ligan do químico particular. Por lo general con este ligando se modifican las estructuras de los factores de transcripción que estos promotores

regulan. Se utilizan varios promotores inducibles de manera natural que incluyen el promotor de metalotioneína del ratón y el promotor de RTL del virus del tumor mamario del ratón, ambos inducibles mediante dexametasona (una hormona sintética). Además el promo tor de metalotioneína puede inducirse mediante iones de metales pe sados, como Zn2+. El ligando inductor puede añadirse al medio de células cultivadas y administrarse a los animales en el agua que be ben. Por lo general las “fugas”, es decir, un valor de expresión de fon do alto, y los valores hasta cierto punto bajos de inducción obstaculizan el uso de estos promotores endógenos. También pueden ocurrir efectos indeseables originados por la coactivación de genes endógenos que responden al mismo ligando y en animales transgéni cos es posible que las tasas de captación y eliminación del ligando en distintos órganos sean diferenciales. Sin embargo, en fecha más re ciente se desarrollaron sistemas prometedores que utilizan compo nentes heterólogos. Por ejemplo, el operón E, coli tet es la base de la expresión inducible regulada por tetraciclina (fig. 20-5A) que permi te la producción de líneas celulares transformadas muy inducibles y de animales transgénicos (véase Saez y cois., 1997). Se diseñaron otros sistemas basados en el operón de £ coli lac y la hormona de Drosophila ecdisona. De manera alternativa la expresión inducible puede lo grarse mediante dimerización inducida químicamente (DIQ), en la que un factor de transcripción funcional se ensambla a partir de dos componentes en presencia de un ligando equivalente (Belshaw y cois., 1996). Una desventaja de todos estos sistemas de expresión es que la inducción ocurre a nivel de la transcripción, de manera que puede haber un retraso importante antes que una respuesta a la in ducción se observe y un retraso similar entre la eliminación del estímu lo inductor y el regreso al estado basai. Cuando la inducción y la descomposición rápidas son esenciales, se cuenta con sistemas indu cibles que actúan a nivel de las proteínas. En uno de estos sistemas el transgen blanco se expresa como una fusión con el receptor de estro geno, que en condiciones normales se secuestra en un complejo inac tivo con Hsp90 (fig. 20-5B). En presencia de estrògeno, o su análogo tamoxifeno, el receptor de estrògeno se libera y la proteina a la que está fusionado puede activarse (Littlewood y cois., 1995).

Los efectos de la posición y la estructura del locus influyen la expresión de transgenes integrados Una observación frecuente es que los animales transgénicos deriva dos de manera independiente que llevan el mismo elemento trans génico no siempre muestran el mismo nivel o patrón de expresión del transgen. Esto se debe a que la integración transgénica ocurre de manera aleatoria, por lo que tanto la posición como la estructu ra del locus transgénico varían. Los efectos de la posición se origi nan por la influencia de elementos reguladores locales y la estructura de la cromatina. Por ejemplo, el transgén puede integrar se cerca de un intensificador que modifica su patrón de expresión o dentro de un dominio de heterocromatina que suprime la expre sión por completo. Es posible que la estructura del locus transgéni co también influya en la expresión. Por ejemplo, si dos copias del transgen se disponen como una repetición invertida, entonces pue de generarse RNA en horquilla que conduce a interferencia del RNA (véase sección 20.2.6). Varios otros aspectos de la estructura del locus pueden desencadenar defensas celulares contra DNA in vasor y conducir a silenciamiento transgénico por metilación nue va del DNA. Estos fenómenos son menos evidentes en líneas celulares transformadas porque éstas se seleccionan con base en su capacidad para expresar con potencia un gen marcador.

20.2 ¡ PRINCIPIOS DE LA TRANSFERENCIA GENICA | 587

A)

Células d e glándula m am aria d e oveja d e 6 a ñ o s d e edad Aislar oocitos ovulados Aislar y cultivar las células

Eliminar crom osom as Cultivar en m edio sin suero

O ocito “renucleado” Transferir a oveja adoptiva GCATACAT< TATACGAAGTTAT

Fig. 20-9. Estructura de la secuencia de reconocimiento lo x R Obsérvese que la secuencia central de 8 pb que está flanqueada por las repeticiones invertidas de 13 pb es asimétrica y confiere orientación.

20.2 i PRINCIPIOS DE LA TRANSFERENCIA GÉNICA

i

593

A)

Envío dirigido d e g e n e s en células ME loxP

R atón con locu s blanco flan q u ead o p o r sitio s loxP

R atón tran sg én ic o co n gen e n la za d o a un pro m oto r e sp ecífico d e célula, P Cre

M lox P

E xpresión d e Cre e sp ec ífica d e tejido /célula i

S eleccio n ar célu las ME tipo 1

lox P

Deleción específica de tejido o célula de A en el locus blanco

Fig. 20-10. El envió dirigido de genes puede usarse con el sistema de recombinación Cre-/oxP a fin de inactivar un gen en un tipo de célula deseado. A) Ilustración de un método de recombinación homologa estándar con células ME de ratón, en las que se introducen tres sitios loxP junto con un marcador M en un locus A blanco (por lo general un gen pequeño o un exón interno cuya eliminación podría causar una mutación de cambio de marco). La transfección subsecuente de un gen de recombinasa Cre y la expresión pasajera de este gen dan por resultado recombinación entre los sitios loxP introducidos para proporcionar diferentes productos. Los recombinantes tipo 1 se emplean para generar ratones en los que el locus está flanqueado por sitios loxR Estos ratones pueden aparearse con ratones transgénicos desarrollados con anterioridad B) que llevan un constructo integrado que consiste en el gen de recombinasa Cre enlazado a un promotor específico de tejido. La descendencia que contiene tanto el locus blanco flanqueado por loxP como el gen Cre expresa el gen Cre en el tipo de célula deseado y la recombinación resultante entre los sitios toxP en estas células ocasiona la inactivación del locus A blanco específica de tejido.

deben permitir producir knockouts funcionales. Varias maneras per miten dirigirse a mRNA específicos para inactivación y al parecer todas incluyen la formación de una molécula de mRNA que es de doble cadena cuando menos en parte. Ciertos genes son regulados por RNA antisentido endógenos que se conocen como RNA tem porales pequeños (stRNA, véase sección 9.2.3). Al parecer éstos actúan enlazándose al transcrito e inhibiendo el procesamiento de mRNA o la síntesis de proteínas. Por tanto una estrategia de inhi bición génica inicial fue la introducción de RNA antisentido o de oligonucleótidos antisentido en las células. Los efectos inhibido res pasajeros se observan después de la introducción directa de es tas moléculas pero es posible lograr una inhibición permanente mediante la transformación de células, o animales, con un trans

gen antisentido que sintetiza en forma constitutiva RNA antisen tido. Este hecho lo demostraron por primera vez Katsuki y colabo radores (1988) en ratones, quienes tuvieron éxito en la reducción del valor de proteína básica de mielina a 20% del normal por me dio de la expresión de un cDNA antisentido contra el gen de pro teína de mielina y la producción consecuente de una fenocopia del mutante shiverer. El RNA antisentido también suele expresarse con el uso de un promotor inducible a fin de regular el crecimiento de células en cultivo (Sklar y cois., 1991). Al inicio se supuso que el efecto del RNA antisentido era estoiquiométrico (es decir, se requiere una molécula antisentido pa ra bloquear la traducción de un transcrito y después se destruyen ambos). Por consiguiente debe ser posible una inhibición más po-

594 | CAPÍTULO VEINTE i MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

A ) 1. Uso d e envío dirigido d e genes secuencial para introducir el sitio loxP (► ) m ás un gen m arcad or [m] ) dentro d e dos localizaciones d esead as en diferentes crom osom as CEN TEL TEL = Q » M i! 12 CEN TEL-

2. E x p o n e r los c ro m o s o m a s q u e c o n tie n e n lo x P a re c o m b in a s a C re

B) 1. U so d e l e n vío d irig id o d e g e n e s s e c u e n c ia l p a ra in tro d u cir el sitio lo x P m á s un g e n m a rc a d o r d e n tro d e d o s lo c a liza c io n e s d e s e a d a s q u e fla n q u e a n la región c ro m o s ó m ic a a elim in a r ( v w ) CEN TEL

2. P e rm itir q u e o c u rra “re c o m b in a c ió n ” in tra c ro m o s ó m ic a en p re s e n c ia d e re c o m b in a s a C re

CEN =►@2 = CEN

X

=W +

=

■TEL

CEN

12

TEL

■15

mü-

TEL

■ 12/15 TEL

* 1 5 /1 2

TEL

Fig. 20-11. La ingeniería cromosómica puede realizarse por medio de sistemas Cre-/oxR A) Uso de inserción dirigida de sitios loxP para facilitar una translocación cromosómica. Véase Smith y colaboradores (1995) para un ejemplo práctico. B) Uso de la inserción dirigida de sitios loxP para permitir el modelado de una microdeleción mediante recombinación intracromosómica. Véase RamírezSolís y colaboradores (1995) para un ejemplo práctico y otros ejemplos de recombinaciones intracromosómicas.

tente si la molécula inhibidora se recicla, de manera que muchos transcritos se destruyan antes que se degrade por sí misma. Ésta es una ventaja percibida de las ribozimas, enzimas de RNA que segmentan catalíticamente moléculas de RNA (sección 21.6). Se diseñaron constructos en los que se incorpora un centro catalíti co de ribozima dentro de un transgen antisentido para facilitar la destrucción de transcritos específicos. Estos constructos se utili zan mucho en líneas celulares, en especial para estudiar la inhibi ción de oncogenes y combatir la infección por HIV (véase Welch y cois., 1998), pero sólo se expresan de manera infrecuente en ra tones transgénicos. Un ejemplo útil es la inhibición dirigida de glucocinasa de mRNA específicamente en células (3 pancreáticas mediante la expresión de un transgen de ribozima de glucocinasa antisentido controlado por el promotor de insulina, lo que crea un modelo de diabetes (Efrat y cois., 1994). En fecha reciente se desarrollaron ribozimas cuya actividad puede controlarse por mo dulación alostérica (llamadas maxizimas) y se usaron para inhibir

de modo condicional la expresión génica (Kuwabara y cois., 2000; Famulok y Verma, 2002). Como hecho sorprendente, al parecer en la mayor parte de los ca sos los constructos de ribozima no se desempeñan mejor que los RNA antisentido correspondientes que carecen del centro catalítico ribozima, lo que sugiere que el RNA antisentido puede tener un efecto más potente de lo que cabría predecir sólo por el enlace estoiquiométrico. Un indicio respecto a la base de este fenómeno es la ca pacidad, en algunos casos, del RNA en sentido que se expresa en células de mamíferos para inhibir la expresión de un gen endógeno correspondiente, un fenómeno que se conoce como cosupresión (Bahramian y Zabl, 1999). La cosupresión está bien documentada en plantas y parece que incluye la formación de especies aberrantes de RNA que son parcialmente de doble cadena. Las investigaciones de la capacidad del RNA antisentido y el RNA en sentido para silen ciar genes en el nematodo C. elegans condujeron a descubrir un fe nómeno nuevo denominado interferencia por RNA en la que la

Cuadro 2 0 -2 . Resumen de métodos para interferir con la expresión génica endógena sin mutación del gen blanco

Interferencia a nivel del RNA

Interferencia a nivel de la proteína

RNA antisentido

Dominantes negativos

Oligonucleótidos antisentido

Anticuerpos, intracuerpos

Ribozimas o maxizimas

Aptámeros, intrámeros

Desoxirribozimas RNA en sentido (cosupresión) dsRNA (interferencia por RNA) siRNA (interferencia por RNA)

20.3 i USO DE LA TRANSFERENCIA GÉNICA PARA ESTUDIAR IA EXPRESIÓN Y LA FUNCIÓN GÉNICAS i 595

introducción simultánea de RNA en sentido y antisentido corres pondiente a un gen particular condujo a un silenciamiento genico po tente, de larga duración y muy específico (Fire y cois., 1998). La interferencia por RNA es un mecanismo de defensa celular muy conservado, que también se observa en células de mamíferos (los hu manos entre ellos). Se estimula por la presencia de RNA de doble cadena (dsRNA) y origina la degradación de mRNA de cadena única que tiene la misma secuencia que la molécula inductora. El mecanismo de interferencia por RNA es complejo y com prende la degradación de la molécula de dsRNA en dúplex cortos, de unos 2 1 a 2 5 p b d e largo, mediante una endonucleasa específi ca de dsRNA llamada Dicer (fig. 20-12). Los dúplex cortos se co nocen como RNA de interferencia pequeño (siRNA). Estas moléculas se enlazan con el mRNA correspondiente y ensamblan una endonucleasa de RNA específica de secuencia denominada complejo silenciador inducido por RNA (CSIR) que muestra una eficacia extraordinaria y reduce el mRNA de la mayor parte de los genes a valores no detectables. Cabe destacar que se sabe que la misma enzima Dicer procesa los RNA temporales pequeños antes comentados que interfieren con la expresión de genes endógenos. En la actualidad se identifican moléculas de RNA similares, que se supone que tienen funciones reguladoras endógenas, en muchos otros organismos, aun en los humanos, y se describen como microRNA (mi RNA, véase sección 9.2.3). Se cree que las diferentes ac tividades de los micro-RNA (bloqueo de la traducción) y los RNA de interferencia pequeños (degradación catalítica) pueden reflejar la estructura de sus precursores y las enzimas que los procesan an tes de Dicer. Los micro-RNA son de cadena única y derivan de dú plex imperfectos que abultan y forman asas, en tanto que los siRNA son de doble cadena y suelen derivarse de dúplex perfectos (Pasquinelli, 2002, Voinet, 2002). Es posible que ocurra cierta in teracción entre estas vías (fig. 20-12). El RNA de interferencia puede emplearse tanto en células como en embriones porque es un fenómeno sistèmico -al parecer los siRNA son capaces de moverse entre células de manera que el dsRNA que se introduce en una parte del embrión puede ocasionar silencia miento en la totalidad del mismo—. Del mismo modo que se in troduce dsRNA directamente en células (mediante transfección) o embriones (por inyección u otros métodos), es posible expresar transgenes dobles para los RNA en sentido y antisentido o un constructo de repetición invertida que genera RNA en horquilla que actúa como sustratos para Dicer. La introducción o expresión de moléculas largas de dsRNA es adecuada para el silenciamiento gènico en la mayor parte de los mímales, en embriones de mamíferos y en líneas celulares embrio- arias. Sin embargo, la respuesta de interferón, que es una resruesta general (no específica de secuencia) a moléculas de dsRNA unos 30 pb de largo, oculta los resultados de la interferencia por RNA en células de mamíferos adultos. Este problema suele evitar se mediante la administración directa de siRNA sintetizados en for—; química o enzimàtica, o por la expresión de minitransgenes, por : general basada en genes endógenos que producen RNA peque ro? p. ej., el gen U6 snRNA). Durante los tres últimos años la injcrferencia por RNA emergió de una oscuridad relativa para invertirse en el medio disponible más prometedor para el análisis -;onal de alto rendimiento en células y animales (véase más ade¿z-ii , y en la actualidad promete formar la base de una nueva cla* completa de agentes terapéuticos (sección 21.6). Tuschl y : --j-.i.-ct '2002) presentan una revisión general útil de la interfepor RNA y sus aplicaciones.

La función génica también puede bloquearse a nivel de proteínas Aun si un transcrito sobrevive y se traduce, es posible bloquear la función génica a nivel de las proteínas y el resultado es una fenoco pia de pérdida de función. Si el producto del gen endógeno blanco funciona como un multímero, quizá sea factible producir una ver sión mutante dominante negativa del gen que puede expresarse a valores altos en la célula o en animales transgénicos. En este caso las copias funcionales de la proteína se secuestrarán dentro de comple jos inactivos. Este método se aplica de manera amplia para blo quear funciones de receptores porque muchos de ellos funcionan como dímeros (p. ej., Amaya y cois., 1991). De otro modo puede ser posible expresar un anticuerpo que re conoce la proteína blanco y la neutraliza. La inactivación funcional puede lograrse mediante la introducción directa de anticuerpos en la célula o el animal, o por expresión del anticuerpo de un transgén, en cuyo caso suele denominarse intracuerpo (Richardson y Marasco, 1995). También pueden enlazarse oligonucléotidos de DNA o RNA a proteínas e inhibir su actividad en una forma espe cífica. Estas se conocen como aptámeros, o si se expresan dentro de la célula, intrámeros (Famulok y cois., 2001).

20.3

Uso de la tran sferen cia génica para estudiar la expresión y la función génicas

20.3.1 La expresión y la regulación génicas pueden investigarse por medio de genes rastreadores Uno de los primeros usos de las líneas de células transformadas y de organismos transgénicos fue el análisis de la regulación génica, que es la identificación de las secuencias necesarias para atributos específicos de la expresión génica. La regulación génica puede in vestigarse mediante el estudio de la forma en que la deleción de di ferentes segmentos de DNA corriente arriba del gen, o en ocasiones en el primer intrón, afecta su expresión. Es claro que el sistema más apropiado para estudiar la expresión de genes humanos son las cé lulas de humanos, y una forma lógica de proceder es la introduc ción de constructos que contienen diferentes cantidades de secuencias de DNA de flanqueo seguida del análisis de la expresión génica. Sin embargo, esto deja el problema de la manera de seguir la expresión del gen humano introducido en presencia de un ho mólogo endógeno que quizá se exprese en la misma célula. A fin de abordar este problema las posibles secuencias reguladoras se clonan en un vector comente arriba de un gen rastreador, un gen que pro duce una proteína que puede detectarse y cuantificarse con una va loración simple (recuadro 20-4). La figura 20-13 muestra el método general paia mapear elemen tos reguladores en líneas celulares. El empleo de diferentes líneas celu lares, algunas de las cuales expresan el gen endógeno correspondiente, puede aportar evidencias de elementos promotores que posibilitan la expresión génica en líneas celulares permisivas y la impiden en líneas celulares no permisivas. Asimismo es posible localizar elementos para expresión génica inducible valorando diferentes constructos promoto res en la misma línea celular en presencia o ausencia de inducción. El estudio de los patrones de expresión del rastreador en animales trans génicos permite realizar un análisis más refinado de la expresión géni ca específica de células ya que identifica elementos que controlan la

596

CAPÍTULO VEINTE

i

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

B)

A)

I I II IIII II III III II III iii i i i i iiI Ii j ......... 1 < rd e -’

i

Dicer

Dicer

I

5 '-p l l l l l l l O H -3' stRNA/miRNA

5 ' p i n r n r 0 H "3

3 '-H 0 111: - LL P-5' siRNA I

3 '-H O tt \ / m m p-5 '

i i i i 11 i i i i 11 i 11 i i i i i i i i i i i

mRNA

pjm

1-------y------ 1 3'UTR Sitio co m p lem en tario

An

Inhibición d e trad u cc ió n

te s É 5 ' - p T r m ^ O H -3' 3'-H O 1 1 I I LLL P -5'

i

OH-3' ..........i i i i i .......................................... .1.11 AAA...An mRNA

i

.................I I I I I I I I I I I

ULLLLL

C o rte endon ucleolítico Fig. 20-12. Comparación de las vías stRNA (miRNA) y siRNA en C. elegans. Mediante el reconocimiento de tipos específicos de RNA precursores, las proteínas relacionadas com o ALG-1/ALG-2 y RDE-1 pueden influir parcialmen te en el procesamiento por medio de DICER. A) Se piensa que el stRNA (miRNA), que es de cadena única, forma pares de bases de manera imperfecta con la UTR 3 ' del mRNA, lo que reprime el inicio de la traducción. B) El siRNA, que es de doble cadena y tiene un extremo saliente 3 ' de dos nucleótídos, se incorpora dentro del complejo de silenciamiento inducido por RNA (CSIR). El siRNA sirve como guía para CSIR y, en el pareamiento de bases perfecto, el mRNA blanco se corta en la parte media del dúplex formado con el siRNA. Es posible que los miRNA que se parearon en forma perfecta con su blanco se incorporen en el CSIR. Modificado de Voinet (2000) con autorización de Elsevier Science.

expresión génica en tipos de células o etapas del desarrollo particula res. Sin embargo, deben obtenerse resultados similares con varias lí neas transgénicas derivadas de manera independiente a fin de evitar la interpretación errónea de patrones de expresión causados por efectos de posición (véase sección 20.2.3).

20.3.2 La función génica puede investigarse generando mutaciones con pérdida de función y ganancia de función, y fenocopias Las funciones génicas no siempre se establecen mediante la alteración o la inhibición debida a redundancia genética Cuando es posible realizar estudios a nivel celular, la interferencia por RNA se considera el método de elección para generar efectos de pérdida de función (sección 20.2.6). Las funciones de varios genes ya se establecieron mediante interferencia por RNA en cultivos de células de mamíferos, entre ellos el gen que codifica la proteína de selección vacuolar TsglOl, que se demostró que es esencial para la gemación del HIV (Garrus y cois., 2001). Tuschl y Borkhardt (2002) citan muchos otros ejemplos, inclusive el análisis de genes que participan en la división celular, la mediación del DNA, el se

ñalamiento de células y el paso a través de la membrana. El medio más directo para estudiar la función de un gen en el contexto de un organismo completo es el envío dirigido de genes (sección 20.2.4). En muchos casos estas mutaciones son en extremo informativas y pueden revelar muchos datos de la función génica. En la actualidad se efectúan tantos experimentos de knockout génico en ratones, que se establecieron bases de datos en Internet para catalogar todos los re sultados con base en el fenotipo (cuadro 20-3). No obstante, en un número sorprendentemente grande de casos las mutaciones knoc kout parecen tener muy poco efecto fenotípico. Lo anterior puede deberse a re d u n d an cia genética, que es la presencia de otro gen ca paz de desempeñar la función del gen inactivado. Como resultado, en ocasiones se requieren knockouts de dos o aun tres genes para de terminar las funciones precisas de algunos genes. Un ejemplo informativo se refiere a los genes MyoD y Myf-'j, que se expresan temprano en el desarrollo del ratón. Los cDNA clonados correspondientes a estos dos genes tienen una gran capa cidad para inducir la expresión de proteínas específicas de músculo en muchas líneas celulares distintas. Como ambos genes codifican factores de transcripción, al parecer son candidatos excelentes para reguladores miogénicos. Sin embargo, resultó sorprendente que cuando se produjeron mutaciones knockout, en ninguno de los ca sos se observó un fenotipo notable. Al parecer el desarrollo muscu-

20.3

USO DE LA TRANSFERENCIA GÉNICA PARA ESTUDIAR IA EXPRESIÓN Y LA FUNCIÓN GÉNICAS I 597

Recuadro 20-4. Genes rastreadores para células animales Los genes rastreadores codifican proteínas que pueden detectarse y cuantificarse mediante valoraciones simples y no costosas. Es posible emplearlos para observar y medir la eficiencia de la transferencia y la ex presión génicas, e investigar la localización de proteínas intracelulares. Varios genes rastreadores se usan en animales. El gen cat del transposón £ coli Tn9 codifica la enzima acetiltransferasa de cloranfenicol, que transfiere grupos acetilo de acetil-CoA al anti biótico cloranfenicol. Se utiliza un formato de valoración estándar in vitro (Gorman y cois., 1982). Se mezclan lisados celulares con cloranfenicol marcado con 14C, se incuban y luego se separan mediante cromatografía de capa delgada. La actividad de CAT se determina midiendo las cantida des relativas de cloranfenicol acetilado y sin acetilar con un contador fosforimager o de centelleo. El gen lacZ de E. coli codifica la enzima galactosidasa (3, que descom pone lactosa y compuestos relacionados. Se dispone de varios sustratos derivativos especializados que incluyen ONPG, que origina un producto amarillo soluble y se usa para valoraciones colorimétricas in vitro, y X-gal, que da lugar a un precipitado azul y se emplea en valoraciones in situ (Hall y cois., 1983). Este gen se utiliza con mayor amplitud con X-gal co mo un marcador histológico para mostrar patrones de expresión génica en animales transgénicos. El gen gusA de E. coli, que codifica la enzima glucuronidasa (3, puede emplearse de manera similar. El gen luc de la mosca de fuego americana (Photinus pyralis) codifica la enzima luciferasa, que cataliza la oxidación de luciferina en una reac ción que requiere oxígeno, ATP y iones magnesio (de Wet y cois., 1987). La reacción libera un destello luminoso cuya intensidad es proporcional

lar fue normal en ratones knockout MyoD y se retrasó un poco en ratones knockoutMyf-b (Rudnicki y cois., 1992). Tiempo después se demostró que los genes tienen funciones equivalentes y cada uno puede compensar por completo la ausencia del otro. De hecho en ratones normales los dos factores de transcripción reprimen mutua m ente los genes, de manera que el knockout de un gen ocasiona un incremento compensador en la expresión del otro. El fenotipo me nor de ratones knockout m y fb refleja el inicio un poco más tempra no de la expresión. Los knockout dobles muestran una ausencia catastrófica de desarrollo muscular y los ratones mutantes mueren justo después de nacer a causa de asfixia.

Las funciones génicas pueden establecerse mediante experimentos de ganancia de función si la dosis, la actividad o la distribución del producto génico son críticas Cuando las mutaciones con pérdida de función o fenocopias no son informativas, pueden ser útiles células transformadas y anima les transgénicos que muestran ganancias de función que afectan el mismo gen. Los genes MyoD y Myf-'b constituyen un caso pertinen te. Se sabía que estos genes codificaban reguladores importantes del desarrollo muscular por sus efectos en células cultivadas. De igual forma se identificaron muchos oncogenes y se les asignaron funcio nes con base en que pueden ocasionar la proliferación incontrola ble de células cultivadas. La ganancia de función puede generarse mediante la expresión excesiva de un producto génico normal o la expresión de una versión mutante del gen hiperactiva. En animales transgénicos también pueden ser útiles los experimentos de ganan cia de función. Un ejemplo clásico se refiere al gen Sry, que se de mostró de manera concluyente que es un determinante mayor del

al valor de actividad de la enzima. Esto puede detectarse con un luminómetro o un contador de centelleo y la valoración es más de 100 veces más sensible que las valoraciones convencionales con CAT, ga lactosidasa (3 o glucuronidasa 3 . Puesto que la señal luminosa emitida también disminuye con rapidez, la luciferasa puede ser útil para vigilar los cambios rápidos en los valores de expresión génica. En contraste, CAT, galactosidasa |3 y glucuronidasa (3 son proteínas muy estables, de manera que pueden determinar con eficiencia cuándo se enciende un gen, pero persisten después que se apaga. Los genes de luciferasa de otros organismos tienen actividades un poco diferentes y las reaccio nes liberan luz a distintas longitudes de onda, lo que permite la vigilan cia simultánea de varios genes. El gen glp de la medusa Aequoria victoria codifica la proteína verde fluorescente (PVF), un marcador bioluminescente que emite una fluo rescencia verde brillante cuando se expone a luz azul o ultravioleta (Ikawa y cois., 1999). La actividad de PVF se mide cuantificando la emi sión de luz, pero a diferencia de la luciferasa, la proteína no requiere un sustrato y puede emplearse para valorar los procesos celulares en un tiempo real. Las proteínas de fusión de PVF se utilizan mucho para es tudiar la localización de proteínas en la célula y el tránsito de proteínas al interior de las células y entre las mismas. Una gama de variedades de PVF es útil para el marcado doble y también se dispone de proteí nas fluorescentes de otros colores. Una proteína fluorescentes mutante que cambia de fluorescencia verde a roja con el tiempo puede aplicarse a la caracterización de la expresión génica temporal (Terskikh y cois., 2000).

desarrollo masculino por su expresión en ratones transgénicos con dos cromosomas X. Estos ratones, que la naturaleza pretende que sean hembras, resultaron varones (Koopman y cois., 1991). Otro ti po de ganancia de función es la expresión ectópica, en la que un transgén se expresa fuera de los dominios espacial o temporal nor males del gen endógeno correspondiente. Existen muchos ejemplos útiles de este método que incluyen genes del desarrollo. Por ejem plo, los genes Hox que se expresan fuera de sus dominios normales alteran la formación normal de patrones del embrión y generan de fectos en las extremidades y el esqueleto (Burke, 2000). Los experimentos de expresión ectópica también pueden ser útiles para demostrar redundancia genética. Por ejemplo, los genes engrailed En-1 y En-2 del ratón son genes contenedores de homeobox que al parecer desempeñan funciones cruciales en la formación del cerebro. El mutante knockout En-1 mostró anormalidades cere brales importantes como se esperaba, pero de manera sorprenden te, los knockout En-2 sólo tuvieron defectos menores. La expresión En-1 inicia 8 a 10 h antes que la de En-2, lo que sugiere que la pro teina En-1 compensa la falta de En-2 en knockouts En-2. A fin de valorar la posibilidad de redundancia funcional, Hanks y colabora dores (1995) emplearon una variante del procedimiento knockout que se conoce como knock-in génico, en el que el constructo blan co contenía el gen En-2 dentro de una región de homología de En-1 (inclusive los elementos reguladores normales En-1). El objetivo fue reemplazar la secuencia de codificación En-1 endógena con la de En-2 para producir ratones con dos genes En-2, uno expresado en la misma forma que En-1 en embriones normales (véase fig. 20-14). Puesto que el ratón knockout En-1 resultante tuvo un fenotipo nor mal, se demostró que el gen En-2 knocked-in desempeñaba funcio nes equivalentes a las de En-1 (Hanks y cois., 1995).

598

CAPÍTULO VEINTE

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

-170 +11 (A ( ATG) +

(*• SR Q PO

NM

L

K

J

I HG F E D

C

B A

A ctivida d relativa de luciferasa (%)

-211

-9 H n

= 6

-1 0 5 - 9 n

— H JA 7 = 3

-2 7 9 -2 7 9

-6 4 -1 4 4

--E

f—

H n =4

--O

-2 7 9 -2 0 2

-------1n = 5

-4 ] n = 4

P ro m o to r m e n o r

—| n = 12

Fig. 20-13. Análisis de deleción de la región promotora del gen del factor VIII humano. Si todos los elementos necesarios para la expresión del gen humano están presentes, habrá una expresión de alto nivel del gen rastreador cuando el constructo se transfecta en un tipo apropiado de célula humana cultivada. A continuación puede elaborarse una serie de constructos de deleción progre sivos mediante enzimas de restricción o la enzima exonucleasa III de E. cotí que digiere desde el extremo 3' del DNA de doble cadena. De otro modo puede diseñarse una serie de productos de amplificación de PCR cubriendo las regiones de interés y luego clonados en un vector de expresión apropia do. Las barras de la izquierda indican secuencias de tamaño variable corriente arriba del gen del factor VIII humano (F8). Los cuadros de la parte supe rior señalan secuencias corriente arriba que se piensa que son sitios de unión de proteínas. Los cuadros de la derecha indican el nivel de actividad de luciferasa en relación con la secuencia Intacta, con base en n experimentos de replicación. A partir de la actividad de luciferasa observada en las dife rentes clonas de expresión, el mapa de deleción muestra que todos los elementos necesarios para la actividad máxima del promotor se localizan en la región de -2 7 9 a - 6 4 , que incluye sitios de enlace de proteínas B, C y D. Reproducido de Figueiredo y Brownlee (1995) con autorización de The Ame rican Society for Biochemistry and Molecular Biology.

20.3.3 Los análisis de la función génica a gran escala por mutagénesis insercional e interferencia sistemática del RNA son partes fundamentales de la genómica funcional Los experimentos descritos se diseñaron para investigar la expresión y la función génicas en forma individual. Sin embargo, como se co menta en el capítulo 19, la inmensa cantidad de información de se cuencias y la lista al parecer interminable de genes no caracterizados que resultó de los proyectos del genoma determinan que hoy en día sea necesario estudiar las funciones de los genes a escala de la exten sión d el genoma. La mutagénesis de saturación se usó para análisis funcional durante muchos años y estos estudios se basaron en el empleo de radiación o mutágenos químicos potentes, como la etilnitrosourea (ENU) y el etilmetanosulfonato (EMS), para generar poblaciones de mutantes que representaban cada gen en el genoma. Hasta fecha reciente era usual dirigirse a aspectos bioquímicos, fisio lógicos o del desarrollo específicos de la especie en investigación y la

mayor parte de los mutantes se descartaba. Sin embargo, en los úl timos años el cambio de enfoque de estudios de genes individuales a la genómica funcional modificó el concepto fundamental y en la actualidad se realizan programas de mutagénesis en toda la exten sión del genoma con el fin de reunir tantos mutantes que afectan tantos procesos biológicos como sea posible. El objetivo final es en samblar una genoteca de mutantes amplia como un recurso central para todos los investigadores. Por ejemplo, los primeros programas de mutagénesis con ENU en toda la extensión del genoma en rato nes comprendieron la selección de una cifra pasmosa de 40 000 lí neas de ratones para fenotipos con importancia médica, inclusive bioquímica clínica, alérgica, inmunológica, respuesta a estímulos fi siológicos, defectos del desarrollo y la conducta (Hrabe de Angelis y Balling, 1998; Hrabe y Angelis y cois., 2000; Nolan y cois., 2000). Estos programas se encuentran en curso y los resultados se actualizan con regularidad en los sitios de red que se listan en el cuadro 20-3. Los mutágenos químicos y la radiación tienden a inducir muta ciones de punto. Si bien éstas pueden ser “realistas” porque repre

20.3 j USO DE LA TRANSFERENCIA GÉNICA PARA ESTUDIAR LA EXPRESIÓN Y LA FUNCIÓN GÉNICAS

599

Cuadro 2 0 -3 . Recursos en Internet para transgénesis y mutagénesis de mamíferos, y trampas génicas en animales y selecciones de RNAi a gran escala Recurso

URL

Ratones transgénicos y recursos de mutagénesis dirigida Jackson Laboratory, base de datos de ratones mutantes por envío dirigido de genes

http://jaxmice.jax.org/index.shtml

TBASE, base de datos de ratones mutantes transgénicos y por envío dirigido de genes, conservados por el Jackson Laboratory

http://tbase.jax.org

Base de datos de knockout génico Frontiers en Science

http://www.bioscience.org/knockout/knochome.htm

Base de datos de knockout del ratón BioMedNet

http://biomednet.com/db/mkmd

Recursos de mutagénesis con ENU en ratones Mutagénesis con ENU en el proyecto de genoma humano alemán

http://www.gsf.de/ieg/groups/enu-mouse.html

Base de datos de mutagénesis con ENU, MRC mutabase

http://www.mgu.har.mrc.ac.uk/mutabase

Recursos de trampas génicas (para ratón y Drosophila,) German Gene Trap Consortion

http:/tikus.gsf.de

Lexicon Genetics

http://www.lexgen.com/omnibank/omnibank.htm

Proyecto Berkeley del genoma de Drosophila

http://www.fruitfly.0rg/p disrupt/index.html

Recursos de interferencia por RNA en C. eiegans Información generai

http://www.wormbase.org

RNAi

http://www.rnai.org

sentan los tipos de mutaciones que causan muchas enfermedades en humanos, un problema importante es que la identificación de los cambios estructurales precisos en el DNA de un animal mutante aislado suele requerir un método de clonación posicional labo rioso. La alternativa consiste en utilizar la transferencia génica como un método de mutagénesis. En este caso el mutágeno es una secuencia de DNA insercional, un transgen por cualquiera otro nombre, que ocasionalmente se integra en un gen preexistente y lo altera. Esta estrategia tiene una ventaja importante sobre la mutagénesis por radiación y la química: deja un marcador de secuencia en el locus que se muta. Como resultado, es posible la caracteriza ción molecular rápida del locus mutado (recuadro 20-5). En Dro sophila se utilizan elementos P como mutágenos insercionales y se introducen de modo directo en la línea germinal (sección 20.2.2). La células ME proveen un medio para introducir estas mutaciones en el ratón, ya que puede emplearse la integración aleatoria de se cuencias de DNA a fin de recuperar inserciones en cualquier nú mero de genes. No obstante, como sólo alrededor de 3% del genoma del ratón está representado por genes, la mayor parte de los acontecimientos de inserción aleatorios no causa alteración génica. El método de atrapamiento génico se diseñó para incrementar la posibilidad de recuperar inserciones en genes (Evans y cois., 1997). El principio básico es que el transgen contiene un gen ras treador defectuoso o un marcador seleccionable que sólo se expre sa si el constructo se inserta dentro de un gen. Por ejemplo, el transgen puede comprender un gen rastreador con un sitio aceptor de empalme corriente arriba. Si éste se integra dentro de un gen, se comporta como un exón adicional. Cuando el gen interrumpido se transcribe, el gen rastreador transcrito se empalma a los exones co rriente arriba y, cuando se traduce, debe conservar su actividad ras

treadora. La ventaja de este método es que el gen rastreador se expresa en el mismo patrón que el gen interrumpido, aun en el es tado heterocigoto, de modo que puede obtenerse información res pecto al gen (su perfil de expresión) aun si la interrupción es letal en sí misma en el estado homocigoto. Una desventaja radica en que la expresión del rastreador se basa en la expresión del gen interrum pido, por lo que si el gen no se expresa tampoco el rastreador lo hace. Este problema se abordó mediante la expresión del gen ras treador a partir de su promotor (constitutivo), pero haciendo que la poliadenilación dependa del gen circundante (véase fig. 20-15). Tal enfoque se aplicó a gran escala y un informe reciente describe la alteración y la identificación de secuencias de 2 000 genes en cé lulas madre embrionarias de ratón (Zambrowicz y cois., 1998). Se encuentran en curso dos iniciativas importantes en ratones, una or ganizada por el Germán Gene Trap Consortium, cuyo fin es produ cir y caracterizar 20 000 líneas de genes atrapados (Wiles y cois., 2000), y otra establecida por la compañía estadounidense Lexicón Genetics. En ambos casos se mantienen bases de datos de secuencias de flanqueo insertadas. Pueden consultarlas los investigadores que deseen identificar un gen interesante en sus experimentos si desean obtener líneas de ratones en las que ese gen se inactivo. También se encuentra en curso un programa de atrapamiento génico en Drosophila (Berkeley Drosophila Genome Project, véase Spradling y cois., 1995, 1999), que no sólo considera la alteración génica mediada por elemento P, sino también la activación génica mediada por ele mento P. El último método (marcado de activación, recuadro 20-5) comprende el uso de elementos P que incorporan un promotor po tente dirigido que ve hacia afuera. Una vez integrados, estos constructos activarán cualquier gen endógeno adyacente. Esto permite utilizar la mutagénesis insercional para generar mutaciones tanto

600 i CAPÍTULO VEINTE I MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

T ran scrip ció n

PA

n* -j

loxP

|---------i-------/ w w w \ G en En-1 's endógeno

lóxP

-) neo M

Z 3 -------------b-------------Û

V e c to r

knock-in E n-2

T ran scrip ció n -----------*■

loxP

pA

loxP

ÍK > C Z >

1 .

_ /W v N ^ v V \

P ro m o to r

En-1

Fig. 20-14. El método knock-in génico reemplaza la actividad de un gen cromosómico por la de un gen introducido. El gen En-1 que se muestra en la parte superior tiene dos exones y las secuencias de codificación se muestran con cuadros llenos. También se seña lan su sitios promotor (P) y de polladenilación (pA). El vector del gen blanco (“vector knock-in” ) contiene secuencias del gen En-1 clonado que com prenden una secuencia corriente arriba a que alberga el promotor En-1 y un segmento interno b que abarca el extremo 3' del exón 1, el intrón único y la secuencia de codificación 5' del exón 2. La secuencia de codificación del gen En-2 separa estas dos secuencias. Dos casetes marcadores incluyen un gen de cinasa de timidlna (tk) y un gen de resistencia a neomicina (neo), ambos impulsados por un promotor de cinasa de fosfoglicerato (que se elige porque la cinasa de fosfoglicerato se expresa en células ME). El gen neo está flanqueado por secuencias loxP. El resultado del procedimiento diri gido al blanco es el reemplazo de las secuencias endógenas a y b pero la secuencia de codificación 5 ' del gen En-1 se elimina. El gen En-2 knockedin es controlado porel promotor En-1 (Hanks y cois., 1995). Nótese que el término “knock-in" también se aplica a cualquier procedimiento en el que un gen endógeno se inactiva por inserción de un nuevo gen que después se expresa, aun si el último tiene como fin servir como un gen rastreador co mo iacZ.

Recuadro 20-5. Vectores complicados utilizados para mutagénesis insercional Cualquier secuencia de DNA puede usarse como un vector de inserción y en tanto la secuencia no se encuentre ya en el genoma huésped, emplear se como marcador para identificar el gen interrumpido en hibridación sim ple o en valoraciones basadas en reacción en cadena de la polimerasa (PCR). Sin embargo, la inclusión de ciertas características adicionales puede añadir funcionalidad a los vectores de inserción y revelar Informa ción adicional respecto al gen interrumpido y su producto, o inclusive ayu da a clonar secuencias de flanqueo que rodean el inserto. Atrapamiento génico. El vector de inserción incluye un gen rastreador como IacZ corriente abajo de un sitio aceptor de empalme, de manera que el gen rastreador sólo se expresa si el vector se integra dentro de un gen. Una variante del atrapamiento génico, también llamada atrapa miento de promotor, comprende un gen rastreador virgen sin un promo tor. Éste sólo se activa si se inserta corriente abajo de un promotor activo (Evans y cois., 1997). En ambos casos la expresión del gen ras treador depende del gen interrumpido. La ventaja es que el gen rastrea dor (que puede aportar información funcional) simula el patrón de expresión del gen interrumpido pero la desventaja consiste en que los genes no expresados no tienen expresión de rastreador. Esta restricción puede eliminarse expresando el gen rastreador de un promotor consti tutivo pero tornando la poliadenilación dependiente del gen interrumpi do (Zambrowicz y cois., 1998). Atrapadores intensificadores. El vector de inserción incluye un gen ras treador como IacZ corriente abajo de un promotor mínimo (por lo general

una caja TATA) que sólo apoya la transcripción de fondo propia. Cuando el constructo se integra dentro de la influencia de un intensifícador endó geno, el gen rastreador simula la expresión del gen controlado por ese ¡ntensificador (O’Kane y Gehring, 1987). Por la distancia larga en que los intensificadores pueden actuar, esta estrategia rara vez es útil para iden tificar genes, pero los intensificadores específicos de células pueden aprovecharse para otros propósitos, como el control de la expresión Cre (véase sección 20.2.5) o la activación de un marcador seleccionable ne gativo para ablación celular (recuadro 20-2). Marcadores de activación. El vector de inserción contiene un promotor potente que ve hacia afuera. Si el elemento se integra adyacente a un gen, ese gen será activado por el promotor, lo que tal vez genere un fenotipo de ganancia de función a través de expresión tópica o excesiva (Rorth y cois., 1998). Rescate de plásmido. El vector de inserción contiene el origen de replicación y el marcador de resistencia a antibióticos de un plásmido bacte riano. Esto significa que si el DNA genómico de la línea de inserción transgénica se digiere con una enzima de restricción, se diluye y circula por medio de ligasa de DNA, el inserto y sus secuencias de flanqueo in mediatas formarán un plásmido funcional. Si todo el conjunto de círculos de DNA genómico en masa se utiliza a fin de transformar bacterias, sólo las células que contienen el plásmido sobrevivirán. Ésta es una forma rá pida de clonar e identificar las secuencias génicas que rodean el sitio de inserción (Perucho y cois., 1980).

20.4 j CREACIÓN DE MODELOS DE ENFERMEDAD MEDIANTE TRANSFERENCIA GÉNICA Y TECNOLOGÍA.. . I 601

de ganancia como de pérdida de función. El cuadro 20-3 presenta las fuentes de Internet para todos los programas anteriores. La interferencia por RNA (sección 20.2.6) es otro método que puede ser útil para la anotación funcional de alto rendimien to. Hasta ahora este método de k n ock -dow n génico sólo se apli có a escala global en el nematodo C. elegans, pero mostró un gran potencial en células de mamíferos y quizá sea el único adecuado para la anotación rápida y directa de genes humanos, cuando menos aquellos cuyas funciones pueden determinarse a nivel ce lular. Se llevaron a cabo varios experimentos a gran escala en C. elegans que comprendieron la síntesis de miles de moléculas de dsRNA y su administración sistemática a gusanos por microinyección, remojamiento o alimentación (Gonczy y cois., 2000; Maeda y cois., 2001; Fraser y cois., 2000). En fecha más reciente se realizó una selección heroica en la que se generaron casi 17 000 cepas bacterianas, que expresaba cada una un dsRNA diferente, lo que representa 86% de los genes del genoma de C. elegans (Kamath y cois., 2003). Más de 10% de esos gusanos mostró fenocopias letales reproducibles de infertilidad, crecimiento o desarrollo.

20.4

C reación de m odelos de enferm edad m ediante tran s fe re n c ia génica y tecnología de envío dirigido de genes

Los modelos de enfermedades en humanos tienen importancia cru cial en la investigación médica. En particular los modelos animales permiten realizar el examen detallado de la base fisiológica de la en fermedad y ofrecen un sistema de evidencias de primera línea para es tudiar la eficacia de tratamientos novedosos antes de efectuar pruebas clínicas en humanos. Los cultivos celulares constituyen un recurso al ternativo aunque más limitado para el modelado de enfermedades, sobre todo en términos de investigar los efectos bioquímicos de la en fermedad y la respuesta a fármacos. Aunque para muchos trastornos individuales en humanos no se cuenta con un buen modelo animal, se dispone de algunos modelos animales representativos de todas las clases principales de afecciones en humanos: enfermedades determi nadas genéticamente, afecciones causadas por agentes infecciosos, cánceres esporádicos y padecimientos autoinmunitarios (véanse Lei-

T ran scrip ció n

pA

—► E1

P

E2

E3

•H P r o m o to r P o lia d e n ila c ió n +

j íT

I-

G en d e la c é lu la h u é s p e d __________ / V v V W S A

SD

P ro m o to r+ P o lia d e n ila c ió n -

In te g ra c ió n del tra n s g e n y e x p re s ió n d e m R N A

1 E1 1. |

a, |

b |[

c 2- I

... 8

I A A A A A A ...A /1 E3 E4 |[ l A A A A A A ...A n

S e le c c ió n p o r a c tiv id a d d e l g en ra s tre a d o r

S e le c c ió n m e d ia n te el g en m a rc a d o r

Fig. 20-15. El atrapamiento génico usa un transgen de expresión defectuosa para seleccionar acontecimientos de integración cromosómica que ocurren dentro de un gen o cerca del mismo. Se muestra un gen de un espécimen de célula huésped con los cuatro exones (E1 a E4) en la parte superior junto con su promotor (P) y la señal de poliadenilación (pA). También se muestran dos posibilidades para un vector de atrapamiento clínico. El transgen 1 incluye un gen rastreador que carece de un promotor. Tiene dos secuencias exónicas a y b, una señal de poliadenilación (pA) y una secuencia corriente arriba que contiene una secuencia aceptora de empalme (AE). En este ejemplo el transgen 1 se integra en el intrón 1 del gen de la célula huésped. Durante la transcripción del promotor endógeno la secuencia aceptora de empalme ayudará a que los exones del transgén se empalmen con la secuencia del primer exón del gen endógeno, lo que produce un transcrito de fusión. La selección se basa en que este transcrito tiene una actividad funcional rastreadora (véase Evans y cois., 1997). El transgen 2 tiene un gen marcador (resistencia a fármacos, p. ej., /V-acetiltransferasa de puromicina) aunado a un promotor que funciona en células madre embrionarias (ME) (casi siempre un promotor de cinasa de fosfoglicerato) y una secuencia donadora de empalme corriente abajo, pero carece de una señal de poliadenilación. De nuevo la integración tiene como fin permitir la expresión pero en esta ocasión del promotor del transgen, y la se cuencia donadora de empalme ayuda a que el transcrito de RNA se empalme a exones huéspedes corriente abajo.

602

CAPÍTULO VEINTE

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

terycols., 1987; Darling y Abbott, 1992; Clarke 1994; Bedell y cois., 1997). Algunos modelos animales de enfermedades en humanos se originaron en forma espontánea; otros se produjeron de manera arti ficial por diversas vías (cuadro 20-4). hasta hace poco tiempo la ma yor parte de modelos de enfermedades en animales disponibles la constituían los que surgieron de modo espontáneo o que se indujeron en forma artificial mediante mutagénesis aleatorias. En fecha más re ciente las tecnologías de envío dirigido de genes y transgénicas pro porcionaron medios directos para obtener modelos de enfermedades en animales y celulares, y las mutaciones dirigidas en el ratón son par ticularmente valiosas. Es de interés que cada vez sea más claro que los fenotipos de enfermedad debidos a mutaciones comparables en hu manos y ortólogos de ratón con frecuencia muestran diferencias con siderables (sección 20.4.6).

20.4.1 Modelado de la patogénesis de enfermedades y tratamiento farmacológico en cultivos de células Muchos aspectos de la patogénesis de una enfermedad tienen un componente celular que puede estudiarse con efectividad ex vivo. Los ejemplos abarcan los defectos de reparación del DNA de la xerodermia pigmentosa y la anemia de Fanconi, las características de envejecimiento celular prematuro del síndrome de Werner, la desor ganización citoesquelética que se observa en la neurofibromatosis y, por supuesto, la proliferación incontrolable del cáncer. Cuando estos fenotipos están presentes, es más fácil desarrollar modelos celulares que animales porque los defectos de ganancia de función pueden mo delarse mediante la simple transferencia de un transgén dominante que causa la enfermedad dentro del tipo de célula apropiado, en tan to que los modelos de pérdida de función hoy día pueden desarro llarse con eficiencia mediante interferencia por RNA. Los modelos celulares pueden basarse en líneas de células humanas y en muchos ca sos no se requiere un modelo artificial porque es posible aislar células de individuos con la enfermedad correspondiente. Desde luego los animales son más apropiados porque proporcionan un contexto de organismo completo, necesario para estudiar las enfermedades sin fe notipo celular apreciable (p. ej., temblor esencial). Sin embargo, para muchas enfermedades pueden utilizarse modelos celulares como una

primera línea de investigación que permite seleccionar muchos com puestos básico e identificar fármacos candidatos prometedores que se estudian en modelos animales en una etapa posterior.

20.4.2 Puede ser difícil identificar modelos de enfermedad en animales generados de manera espontánea o inducidos por mutagénesis aleatoria Modelos espontáneos de enfermedad en animales Los fenotipos humanos mutantes, en especial los que se relacionan con síntomas de enfermedad obvios, se sujetan a un escrutinio in tenso: casi todos los individuos que sufren un trastorno que re quiere asesoría médica. Si presentan un fenotipo no descrito con anterioridad su caso bien puede referirse a expertos que a menudo documentarán el fenotipo en la bibliografía médica. Con base en la motivación de los individuos afectados y sus familias, los médicos y los investigadores médicos interesados, y el tamaño grande de la población para selección (la población global total actual es de más de 6 000 millones de individuos), el proceso de selección es nota blemente eficaz para fenotipos humanos mutantes. En contraste, muchos fenotipos de enfermedades en animales no se registran. Só lo un porcentaje pequeño de la población animal es cautiva y el re gistro de fenotipos mutantes espontáneos depende en gran parte del examen de colonias de animales desarrolladas con fines de in vestigación y, en menor grado, poblaciones de ganado y mascotas. Sólo es probable que destaquen mutantes con anomalías externas obvias. A pesar de la dificultad para identificar mutantes espontá neas en animales, varios fenotipos animales se describieron como probables modelos de enfermedades humanas (véase cuadro 20-5 para algunos ejemplos). En algunos casos el fenotipo mutante ani mal es bastante similar al fenotipo clínico correspondiente, pero otros muestran una divergencia considerable a causa de las diferen cias de especie en las vías bioquímicas del desarrollo (véase Erickson, 1996; Wynshaw-Boris, 1996). Además las diferencias fenotípicas pueden dar por resultado diferentes clases de mutación en locus or tólogos.

Cuadro 2 0 -4 . Clases de modelos animales de enfermedad Proceso

Ejemplos

A) Espontáneo

Mutación de línea germinal -> trastorno hereditario Mutación somática -» cáncer

B) Intervención artificial o generada artificialmente

Apareamiento selectivo para obtener cepas genéticamente susceptibles a enfermedad

Comentarios

Infectar cepas de animales con el patógeno microbiano importante Manipular el ambiente para inducir enfermedad sin causar mutación

Por ejemplo, la inyección de pristane, un aceite coadyuvante sintético, en la dermis de ratas produce un modelo de artritis

Mutagénesis in vivo con un mutágeno potente como rayos X o mutágenos químicos potentes como etilnitrosourea (ENU)

Se establecieron programas de mutagénesis química grandes para producir ratones mutantes y peces cebra (sección 20.4.2)

Modificación genética de células en huevos fecundados o células de embrión temprano y apareamiento subsecuente de animales (tecnologías transgénica y de envío dirigido de genes)

Secciones 20.1 a 20.3

20.4 j CREACIÓN DE MODELOS DE ENFERMEDAD MEDIANTE TRANSFERENCIA GÉNICA Y TECNOLOGÍA.. .

603

Cuadro 20-5. Ejemplos de mutantes espontáneas en animales Mutante en animales

Características fenotípicas y patogénesis molecular

Ratón N0D

Diabético, pero sin obesidad. Simula la diabetes mellitus dependiente de insulina humana

Ratón mdx

Distrofia muscular ligada a X debida a mutaciones en el gen de distrofina del ratón. El mutante original mdx tiene una mutación sin sentido pero el fenotipo es mucho más leve que el de la distrofia muscular de Duchenne (DMD)

Perro hemofílico

La mutación en sentido erróneo en el gen canino del factor IX causa pérdida completa de función. El homólogo humano es la hemofilia B

Conejo hiperlipidémico hereditario de Watanabe (WHHL)

Hiperlipidémico como resultado de la deleción de cuatro codones del gen de receptor de lipoproteína de baja densidad (LDLR)\ el homólogo humano es la hipercolesterolemia familiar

Cerdos ateroescleróticos

Hipercolesterolemia notable. Actividad de receptor de LDL normal pero apolipoproteínas variantes, inclusive apolipoproteína B

Ratón Splotch

Pigmentación anormal; la superposición fenotípica con el síndrome de Waardenburg sugiere que es un modelo animal para esta enfermedad, lo que se confirmó medíante la identificación de mutaciones en genes homólogos humano y murino PAX

Pez damisela NF

Neurofibromas extensos sugieren que pudo ser un homólogo de la neurofibromatosis tipo 1 en humanos

Mutagénesis aleatoria por sustancias químicas y radiación Los métodos clásicos para producir mutantes en animales incluye ron exposición controlada a sustancias químicas mutágenas o a do sis altas de rayos X. Con estos métodos se obtuvieron grandes cantidades de Drosophila y ratones y, como se comentó, se llevaron a cabo selecciones mutágenas eficientes a gran escala tanto en rato nes como en peces cebra (que ofrecen ciertas ventajas como un modelo animal; véase recuadro 20-6). Sin embargo, un problema importante de las mutaciones inducidas por sustancias químicas o radiación es que en esencia se generan en forma aleatoria. Para identificar un fenotipo mutante de interés es necesario realizar una selección laboriosa para mutantes mediante el examen cercano de los fenotipos después de la mutagénesis. Los fenotipos mutantes descritos en estos estudios, lo mismo que las mutantes espontáneas, muestran una predisposición clara a fenotipos con anormalidades externas obvias, que se atribuye a la facilidad para identificarlos. No obstante, el empleo de estos métodos permitió crear varios mode los importantes de enfermedades humanas.

20.4.3 Los ratones tienen una gran utilidad como modelos animales de enfermedades humanas en gran parte porque pueden crearse mutaciones específicas en un locus predeterminado Se describen fenotipos de enfermedades producidas de manera es pontánea y artificial en una gama amplia de especies animales con di ferentes potenciales para modelar enfermedades en humanos. Los invertebrados, como Drosophila y C. elegans, y aun las células de le vadura, pueden proporcionar ciertos modelos de enfermedad útiles, que reflejan la existencia de algunas proteínas y vías muy conservadas durante toda la evolución (véase sección 3.9.2). Vertebrados distan tes en términos evolutivos como el pez cebra ofrecen también ciertas ventajas como organismos modelo y se usan para modelar ciertas en fermedades en humanos (recuadro 20-6). Aunque cabría esperar que los mamíferos proveyeran mejores modelos de enfermedades, por

una diversidad de razones, los que se relacionan más de cerca con el hombre, los grandes monos, no son muy útiles para constituir mo delos de enfermedades. En su lugar, otros mamíferos, en especial los ratones, se emplean con amplitud a fin de modelar enfermedades de humanos (recuadro 20-6). En los modelos de enfermedades en ani males que se inducen de manera artificial por exposición a sustancias químicas mutágenas o radiación, o que se originan de manera espon tánea, no existe un control artificial, o es muy pequeño, sobre el fenotipo resultante y a menudo la identificación de un modelo de en fermedad en animales es casual. La gran ventaja de los modelos de enfermedades en ratones transgénicos/envío dirigido de genes consis te en que pueden desarrollarse a voluntad modelos de enfermedades es pecíficas. A condición de que se disponga de las clonas génicas importantes, que incluyen genes mutantes en algunos casos, pueden producirse ratones con una alteración deseada en un gen blanco se leccionado. De esta manera es posible modelar todas las principales clases de enfermedades, trastornos hereditarios, cánceres, trastornos infecciosos y afecciones autoinmunitarios (cuadro 20-6; Smithies, 1993; Clarke, 1994; Bedell y cois., 1997). En casi todos los casos se recurre a métodos transgénicos/envío dirigido de genes para modelar trastornos génicos únicos pero cada vez más se intenta producir modelos de ratones con enfermedades genéticas complejas, como la enfermedad de Alzheimer, la ateroesclerosis y los efectos de la hiper tensión esencial (Petters y Sommer, 2000).

20.4.4 Es posible modelar mutaciones con pérdida de función mediante envío dirigido de genes y mutaciones con ganancia de función por expresión de genes mutantes dominantes Modelado de mutaciones de pérdida de función en ratones mediante envío dirigido de genes Se piensa que muchos fenotipos de enfermedades, en esencia todos los trastornos que se heredan en forma recesiva y muchos de heren

604

CAPÍTULO VEINTE

MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

Cuadro 20-6. Ejemplos de modelos de enfermedades humanas en ratones transgénicos o de envío dirigido de genes Enfermedad humana o fenotipo anormal

Gen

Método para construir el modelo

Fibrosis quística

CFTR

inactivación insercional mediante envío dirigido de genes

Talasemia ß

HBB (globina-ß)

Inactivación insercional mediante envió dirigido de genes

Hípercolesterolemia y ateroesclerosis

Genes de apolipoproteína, por ejemplo, APOE

Inactivación insercional mediante envío dirigido de genes

Enfermedad de Gaucher

GBA

Inactivación insercional mediante envío dirigido de genes

Síndrome de X frágil

FMR1

Inactivación insercional mediante envío dirigido de genes

Síndrome de Gerstmann-SträusslerScheinker (GSS)

Gen de proteina prión (PRNP)

Integración del gen prión de ratón mutante

Ataxia espinocerebelosa tipo 1 (AEC1)

SCA1 (ataxina)

Integración del gen de ataxina humana mutante con repetición de tripletos expandida

Enfermedad de Alzheimer

APP (proteína precursora de amiloide-ß)

Integración de cDNA de APP mutante de longitud completa bajo control de un promotor de factor de crecimiento derivado de plaquetas

cia dominante, se deben a pérdida de función génica. El medio más sencillo para modelar una enfermedad por trastornos génicos úni cos de este tipo es preparar un ratón knockout. El primer paso con siste en aislar el gen ortólogo del ratón y utilizar un segmento del mismo para knockout el gen endógeno en células ME de ratón me diante el envío dirigido de genes (sección 20.2.4). Después de in yectar las células ME modificadas genéticamente en el blastocisto de una madre adoptiva, a fin de continuar el desarrollo, se obtienen ratones fundadores con la mutación dirigida en una proporción mensurable de sus células germinales. Estos ratones pueden apa rearse entre sí y la descendencia seleccionarse en cuanto a la presen cia de la mutación deseada y la existencia del alelo de tipo silvestre por medio de valoraciones de PCR de células obtenidas de hemo rragias de la cola. El fenómeno de envío dirigido de genes preten de crear un alelo nulo (que carece por completo de expresión génica), pero en ocasiones el resultado puede ser una m u ta ción co n fu g a y el alelo mutante conserva cierta expresión génica. Por ejem plo, algunos de los productos génicos normales pueden obtenerse mediante empalme aberrante que “brinca” el segmento de DNA in sertado. Esto explicaría las diferencias en la gravedad de los modelos de ratón de fibrosis quística descritos por Snouwaert y colabo radores (1992), y Dorin y colaboradores (1992). Asimismo pueden ocurrir variaciones en el fenotipo a causa de genes modificadores por el uso de distintas cepas de ratones (véase sección 20.4.6).

Modelado de mutaciones de ganancia de función mediante la expresión de un gen mutante dominante Este diseño experimental general se utiliza con frecuencia aunado a la técnica de microinyección pronuclear de transferencia génica. La enfermedad a modelar debe ser alguna en la que la presencia de un DNA introducido sea suficiente por sí misma para inducir patogé nesis y puede incluir mutaciones de ganancia de función heredita rias y cánceres esporádicos causados por oncogenes. Para modelar estos trastornos es necesario clonar un gen mutante o diseñar uno mediante mutagénesis in vitro si se requiere. Luego el gen mutante se inserta como un transgen, por ejemplo, por microinyección en oocitos fecundados. Como no es necesario que el gen mutante in troducido se integre en una localización específica, son suficientes

genes mutantes humanos aunque en algunos casos se emplean ge nes mutantes de ratón. Los dos ejemplos siguientes ilustran este método. ► Un ejemplo inicial tuvo como fin valorar si la sustitución de una leucina que se encuentra en el codón 102 en un gen de proteí na prión en un paciente con síndrome de Gerstmann-Straussler-Scheinker (GSS) era patógena. Se diseñó por medios artificiales una mutación equivalente en un gen de proteína prión de ratón clonado y el gen mutante se inyectó después en oocitos fecundados con objeto de producir ratones transgénicos. Estos últimos mostraron neurodegeneración espontánea, que simulaba la que se observa en el síndrome humano (Hsiao y cois., 1990). Una variedad de otros experimentos en los que se usaron transgenes de proteína prión han sido muy útiles para comprender los priones (Gabizon y Taraboulos, 1997). ► Las repeticiones de tripletos expandidas que causan trastornos neurodegenerativos (véase sección 16.6.4) constituyen otro tipo de mutación con ganancia de función. La ataxia espinocerebelosa tipo 1 (AEC, en inglés SCA1) es un trastorno de herencia dominante que resulta de la expansión inestable de una repetición del tripleto CAG en el gen de ataxina. Se caracteriza por degeneración de las células de Purkinje del cerebelo, las vías espinocerebelosas y algunas neuronas del tallo encefálico. Se produjeron ratones transgénicos mediante la introducción de uno de dos transgenes derivados de un promotor específi co de células de Purkinje: el gen de ataxina humano normal (SCA1) y un gen de ataxina mutante que contenía una repe tición CAG expandida. Aunque los dos tipos de transgén se expresaron, sólo los ratones con el alelo expandido desarrolla ron ataxia y degeneración de células de Purkinje, lo que con firmó la hipótesis de ganancia de función (Burright y cois., 1995).

Modelado de cánceres humanos en ratones También se dedican grandes esfuerzos a construir modelos de cán ceres en ratones (véase Ghebranious y Donehower, 1998; Macleod yjacks, 1999).

20.4 1 CREACIÓN DE MODELOS DE ENFERMEDAD MEDIANTE TRANSFERENCIA GÉNICA Y TECNOLOGÍA.. .

605

Recuadro 20-6. Potencial de animales para el modelado de enfermedades en humanos Los primates deben proporcionar ios mejores modelos animales de enfer medades humanas porque se relacionan de manera muy cercana con el hombre (véase sección 12.4.2). Los humanos y los grandes monos mues tran similitudes de desarrollo, anatómicas, bioquímicas y fisiológicas exten sas. Sin embargo, es costoso crear primates y el tamaño de las poblaciones en cautiverio es muy pequeño. También influye la sensibilidad pública. Si bien en principio algunos se oponen a toda experimentación en animales, quienes piensan que se justifica en interés de la investigación médica sue len sentirse más cómodos con la experimentación en animales de laborato rio pequeños como ratones y ratas. Más importante aún, los primates no son muy adecuados para la experimentación; tienen una vida comparativa mente larga y son menos fecundos que los roedores, y por consiguiente es más difícil organizar experimentos de crianza. Con base en el rápido desa rrollo de métodos terapéuticos novedosos para una gama de trastornos humanos (véase cap. 21), el retraso prolongado necesario para realizar ex perimentos de pruebas entre primates promovió el estudio de modelos alter nativos. Los ratones son los modelos animales de enfermedad humana que más se utilizan. Son pequeños y pueden mantenerse en colonias de crianza hasta cierto punto baratas. Tienen un periodo de vida corto (-2 a 3 años), un tiempo de generación breve (-3 meses) y son prolíficos (una hembra promedio producirá cuatro a seis camadas de seis a ocho crías). Puesto que se aparean con facilidad, es posible arreglar proble mas de apareamiento complejos para producir cepas endogámicas recombinantes y cepas congénicas (Taylor, 1989; véase recuadro 14-2), y su tiempo de generación y periodo de vida cortos significan que los efectos de la transmisión de una mutación patógena pueden vigilarse con cierta facilidad a través de varias generaciones. Como resultado, la genética de un ratón de laboratorio se estudió de manera extensa duran te decenios y se registraron los fenotipos de muchas mutantes (Lyon y Searle, 1989). La mayor parte de estas mutantes se originó de modo es pontáneo dentro de colonias de crianza. Unas cuantas también se pro dujeron en forma artificial, al inicio mediante mutagénesis con rayos X o sustancias químicas pero cada vez más por mutagénesis de envío diri gido de genes e insercional. El mapeo con cruzamiento retrógrado interespecifico (Avner y cois., 1988; véase recuadro 14-2) y la disponibilidad de numerosos marcadores polim órficos (se mapearon alrededor de - 9 000 marcadores de repetición de dinucleótidos) facilitan el mapeo de las mutantes de ratón. Puesto que las regiones sintónicas de los genomas del ratón y humano están bien documentadas (véase fig. 12-11), es ta información es útil para identificar trastornos genuinamente homólogos por gen único en el ratón y el hombre. Las ratas son comparativamente grandes y más accesibles para expe rimentos fisiológicos, farmacológicos y conductuales, en especial en estudios cardiovasculares y neuropsiquiátricos. Tienen un tiempo de ge neración más prolongado (11 semanas) y las colonias de crianza son más costosas. Algunas clases de trastornos humanos (p. ej., hiperten sión y trastornos conductuales) no tienen buenos modelos en ratones y por tanto se basan en modelos en ratas. Se construyeron mapas genéti cos y físicos densos del genoma de la rata y en fecha muy reciente se obtuvo la secuencia del genoma (véase sección 8.4.4).

► Ganancia de función. La enfermedad se debe a la activación inapropiada de un protooncogén y puede modelarse mediante el desarrollo de un ratón transgénico. El oncogén apropiado se introduce en el genoma del ratón por integración transgénica simple. ► Pérdida de función. La enfermedad se debe a la inactivación de un gen supresor de tumor y puede modelarse mediante la

El pez cebra constituye el modelo ideal del desarrollo de vertebrados ya que se desarrolla en forma externa, tiene embriones robustos como las ranas y un intervalo de generación similar al de los ratones pero produce 40 veces más descendencia en el mismo periodo, y los embriones son transparentes como los de Drosophila y C. elegans. La genética del pez cebra muestra avances: desde mediados del decenio de 1990 se efectua ron selecciones de mutantes a gran escala, la tecnología de transferencia génica es rutinaria y en la actualidad se cuenta con mapas genéticos y fí sicos densos además de recursos de marcador de secuencia expresado (MSE). Los genomas del pez cebra y del hombre muestran un grado mo derado de sintenia. Muchos de los fenotipos mutantes identificados en selecciones genéticas del pez cebra semejan estados patológicos huma nos y proporcionan modelos de enfermedad útiles sobre todo en las áreas de trastornos hemopoyéticos, enfermedades cardiovasculares y afecciones renales. Por ejemplo, el gen sauternes es el ortólogo del pez cebra del ALAS2 humano, que codifica sintasa de aminolevulinato 8, la primera enzima en la biosintesis de hem. El mutante del pez cebra prove yó el primer modelo animal de anemia sideroblástlca congénita, que es causada por la pérdida de función de ALAS2 (Brownlie y cois., 1998). De forma similar el gen drácula es el ortólogo del pez cebra del FECH huma no, que codifica ferroquelatasa, la última enzima de la biosintesis de hem. La mutación proporciona un modelo para la protoporfiria eritropoyética (Childs y cois., 2000). En fecha reciente se revisaron otros modelos (Dooley y Zan, 2000). Los genomas del pez cebra y humano muestran ciertas similitudes aunque, a causa de la divergencia evolutiva considerable en tre humanos y peces cebra, cabe esperar que la importancia de las mu tantes del pez cebra para enfermedades en el hombre se limite a trastornos que afectan vías que están muy conservadas. Se produjeron varios mutantes de pez cebra que son buenos modelos de enfermedades humanas y por consiguiente pueden usarse para estudiar fármacos can didatos, inclusive modelos de enfermedad de Alzheimer, trastornos de la biosintesis de hem, cardiopatías congénitas, enfermedad poliquística del riñón y cáncer. Aunque los invertebrados y las levaduras están separados de los hu manos por millones de años de evolución, aún se conserva un núcleo de genes y vías esenciales. Por consiguiente los organismos simples como la levadura Saccharomyces cerevisiae y el nematodo Caenorhabditis elegans constituyen modelos útiles de algunas enfermedades, cuando menos en cuanto a que proporcionan un sistema de prueba pa ra fármacos, aun si no el fenotipo total no tiene importancia particular. Por ejemplo, la vía de señalamiento de insulina está conservada por completo entre humanos y nematodos, por lo que estos últimos pue den emplearse como modelos para la diabetes. De igual forma es po sible modelar en levaduras enfermedades que afectan funciones celulares muy elementales (como los defectos de la helicasa del DNA en el síndrome de Bloom). Cabe destacar que tanto la levadura como C. elegans pueden manipularse como microorganismos y en conse cuencia seleccionarse en lotes con grupos de compuestos básicos y fármacos candidatos.

creación de ratones knockout por envío dirigido de genes. Por ejemplo, varios modelos se generaron a través de la activación de los homólogos del ratón de los genes TP53 y RB1 pero los fenotipos sólo muestran una similitud amplia con los feno tipos humanos correspondientes, el síndrome de Li-Fraumeni y el retinoblastoma respectivamente (véase también sección 20.4.6).

606 [ CAPÍTULO VEINTE ¡ MANIPULACIÓN GENÉTICA DE CÉLULAS Y ANIMALES

20.4.5 La atención se dirige cada vez más al uso de animales transgénicos para modelar trastornos complejos Modelado de trastornos cromosómicos Se cuenta con pocos modelos de ratón de trastornos cromosómicos humanos. En algunos casos esto se debe a la conservación insufi ciente de sintenia entre las dos especies. Con base en el ejemplo del síndrome de Down (trisomla 21), el cromosoma 21 humano com parte una región sinténica grande con el cromosoma 16 del ratón (véase fig. 12.11), pero los ratones con trisomía 16 no son mode los adecuados del síndrome de Down porque mueren in útero. De hecho no cabría esperar que el ratón con trisomía 16 fuera un buen modelo de trisomía 21 humana porque los dos cromosomas no son por completo equivalentes. Los genes en las 2 a 3 Mb distales del cromosoma 21 humano tienen ortólogos en los cromosomas 17 y 10 del ratón, y algunos genes en el cromosoma 16 del ratón tienen ortólogos en cromosomas distintos del cromosoma 21 humano. Pa ra producir un modelo más adecuado de síndrome de Down en el ratón la atención se dirigió a la región crítica del síndrome de Down en 21q21.3-q22.2 (que se dedujo de la observación de los fenotipos de pacientes con síndromes de Down raro con trisomía 21 parcial). Dentro de esta región, el gen del m inicerebro humano en 21q22.2 puede ser un locus que contribuye de manera impor tante a los defectos de aprendizaje relacionados. Los ratones trans génicos en los que un YAC de 180 kb contiene el gen de m inicerebro humano de 100 kb pero aparentemente ningún otro gen desarrollan defectos del aprendizaje (Smith y cois., 1997). Reeves y colaboradores (1995) mostraron que un ratón con trisomía 16 segmentaria, Ts65Dn, obtenida mediante los métodos estándar de ratones radiados presentó déficit de aprendizaje y conducta. Kola y Hertzog (1998) discuten otros modelos producidos en fecha más reciente. Cabe esperar que los esfuerzos futuros para modelar tras tornos cromosómicos aprovechen el envío dirigido de genes utili zando Cre-ZoxP. Como se describe en la sección 20.2.5, este sistema ofrece un gran potencial para la ingeniería del genoma y puede usarse a fin de preparar translocaciones cromosómicas en posi ciones definidas o en cromosomas preseleccionados. También cabe esperar que los YAC transgénicos sean importantes en la investiga ción de la expresión excesiva de genes en otros trastornos cromosó micos y en afecciones que se deben a dosis génicas aberrantes en regiones grandes, como la enfermedad de Charcot-Marie-Tooth tipo 1A, causada por expresión excesiva como resultado de una duplicación de 1.5 Mb en la región del gen PMP22 (véase fig. 16-8).

Modelado de enfermedades complejas El enfoque en genética humana se desplaza cada vez más a la com prensión de la patogénesis de enfermedades genéticas complejas co mo ateroesclerosis, hipertensión esencial y diabetes. Estos trastornos tienen una causa compleja con múltiples componentes genéticos y ambientales. Aunque ya se obtuvieron ciertos modelos valiosos de animales para algunos de estos trastornos, se espera que en el futuro los métodos de envío dirigido de genes proporcionen modelos adi cionales que se requieren con urgencia (Smithies y Maeda, 1995). En tanto se identifiquen genes adecuadamente prometedores que participan en la patogénesis, entonces pueden utilizarse experimen tos de endogamia para obtener distintas combinaciones de genes de

enfermedad entre sí y puede valorarse el efecto de los diferentes fondos genéticos en distintas cepas de ratones y de diferentes fac tores ambientales. Es posible que este método no sea tan atemo rizante como parece porque se considera cada vez más que muchos fenotipos de enfermedades complejas se deben sobre to do a la combinación de unos cuantos genes de susceptibilidad mayor. Por ejemplo, un modelo digénico de espina bífida oculta se generó de manera casual en la descendencia obtenida de la cru za de un ratón heterocigoto para la mutación Patch (Pdgfrb-, recep tor de factor de crecimiento derivado de plaquetas) con un ratón homocigoto para la mutación ondulada (Pax-1) (véase Helwig y cois., 1995). En otros casos estos modelos digénicos pueden sugerir posibles tratamientos. Por ejemplo, el cruzamiento de ratones mu tantes rds (que muestran degeneración retiniana) con ratones trans génicos que expresan Bcl-2 (que protege las células de la apoptosis) condujo a una disminución de la degeneración de la retina (Nir y cois., 1000).

20.4.6 Una variedad de diferencias entre el humano y el ratón puede dificultar la construcción de modelos de enfermedades humanas en ratones No es raro que los modelos de enfermedad en ratones espontá neas o generadas de manera artificial muestren fenotipos que son muy distintos a los trastornos humanos correspondientes. Por ejemplo, el envío dirigido de genes para inactivar varios genes supresores de tumor en ratones a menudo produce modelos decep cionantes en ratones como en los knockout de TP53 y RB1 (retinoblastoma). Suelen presentarse problemas para lograr el tipo de mutación deseada, por ejemplo, por la posibilidad de ex presión con fu ga en knockouts antes comentada, o quizá la expre sión de un transgen se afecte por diversos factores como los efectos de la posición que se señalan en la sección 20.2.3 que cau san un fenotipo inesperado. Sin considerar estas posibilidades, existen varias áreas en las que cabría esperar que las diferencias en tre ratones y humanos resultaran en fenotipos de enfermedad di vergentes para mutaciones en genes ortólogos (Erickson 1989, 1996: Wynshaw-Boris, 1996). ► D iferen cia s en las vías bioq u ím icas. Aunque por lo general las vías bioquímicas en mamíferos se conservan bien, se cono cen algunas diferencias entre las vías de humanos y ratones. Al parecer la retina humana depende mucho de la función preci sa del producto del gen RB1, pero no las retinas de otros verte brados. Como resultado, no se describen mutantes espontáneas de retinoblastoma en ratones y esta afección no es una caracte rística de ratones knockout R bl. Sin embargo, en fecha recien te se demostró que R bl es necesario para el desarrollo normal de la placenta en el ratón. Los ratones knockout muestran una proliferación excesiva de células trofoblásticas y una alteración importante de la arquitectura normal del laberinto placentario que origina disminución de la vascularización y transporte pla centario reducido (Wu y cois., 2003). Otro ejemplo lo propor cionarían las vías de degradación de gangliósido. En tanto que las mutaciones en el gen humano HEXA, que codifica hexosaminidasa, producen el trastorno de depósito lisosómico grave, enfermedad de Tay-Sachs, la inactivación de Hexa ortólogo del ratón causa la acumulación anormal de gangliósido en neuro nas sin los déficit de neuronas motoras o del aprendizaje que se observan en humanos (Wynshaw-Boris, 1996).

I BIBLIOGRAFÍA [ 607

► D iferen cia s en la s vía s d e l d esa rrollo. Las diferencias en las vías del desarrollo de humanos y ratones no se comprenden bien pero cabe esperar que sean importantes para algunos sis temas orgánicos, como el cerebro. ► T iem po absolu to. Es posible que la enorme diferencia entre los periodos de vida promedio de ratones y humanos dificulte mu cho modelar en ratones ciertos trastornos del hombre en los que la enfermedad tiene un inicio tardío. ► D iferen cia s en e l fo n d o gen ético . Esto refleja la importancia de los genes modificadores. Casi todas las poblaciones humanas son exogámicas. Sin embargo, las cepas de laboratorio de ratones son muy endogámicas. Con frecuencia un fenotipo particular puede variar de manera notable en diferentes cepas de ratones por las diferencias en sus alelos en otros locus (genes modifica dores), que pueden interactuar con el locus de interés. Un ejemplo útil de la importancia del fondo genético es el ratón M in neoplasia intestinal múltiple,) que se generó mediante mutagénesis de ENU y dio por resultado mutaciones en el gen del ratón Apc. Las mutaciones en el gen humano ortólogo, APC, causan poliposis adenomatosa del colon y cánceres coló-

nicos relacionados, y se considera que el ratón Min es un mode lo adecuado para estos trastornos. No obstante, el fondo gené tico modifica notablemente el fenotipo del ratón Min. Por ejemplo, el número de pólipos en el colon en ratones que por tan APCMm depende mucho de la cepa de ratón. Se observa una variabilidad fenotípica similar en familias humanas en las que diferentes miembros de la misma familia pueden tener fenoti pos de tumor muy distintos aunque posean mutaciones idénti cas en el gen APC. Aunque parte de la variabilidad podría deberse a factores ambientales, la participación de genes modi ficadores se sospecha con firmeza. El ratón Min proporciona un sistema genético bien definido para mapear e identificar genes modificadores (Dietrich y cois., 1993; MacPhee y cois., 1995). La reciente conclusión de las secuencias del genoma del ratón y la rata identificó varios genes humanos que al parecer no tienen co rrespondientes en roedores. Los ejemplos incluyen el gen seudoautosómico SHO X (cuyas deficiencias sustentan el síndrome de Leri-Weill y pueden contribuir en forma significativa al síndrome de Turner; véase Clement-Jones y cois., 2000) y el gen del síndro me de Kalman, KAL1.

Lecturas adicionales Kunh R, Schwenk F (1997) Advances ¡n gene targeting methods. Curr. Opin. Immunol. 9, 183-188. Popko B (ed.) (1998) Mouse Models of Human Genetic Neurological Disease. Plenum Press, New York. Shastry BS (1998) Gene disruption in mice: models of development and disease. Mol. Cell. Biochem. 181, 163-179, Sikorski R, Peters R (1997) Transgenics on the internet. Nature Biotechnol. 15, 289.

TBASE: una base de datos de mutaciones transgénicas/dirigidas en http://www.gdb.org/Dan/tbase.HtmI. Muller U (1999) Ten years of gene targeting: targeted mouse mu tants, from vector design to phenotype analysis. Mechanisms of Development 82, 3-21.

Bibliografía Amaya E, Musci TJ, Kirschner MW (1991) Expression of a domi nant negative mutant of the FGF receptor disrupts mesoderm formation in Xenopus embryos. Cell 66, 257-270. Avner P, Amar L, Dandolo L, Guenet JL (1988) Genetic-analysis of the mouse using interspecific crosses. Trends Genet. 4, 18-23. Bahramian MB, Zabl H (1999) Transcriptional and posttranscriptional silencing of rodent alpha 1 (I) collagen by a homogous trans criptionally self-silenced transgene. Mot. Cell. Biol. 19, 274-283. Bedell MA, Jenkins NA, Copeland NG (1997) Mouse models of human disease. Part II. Recent progress and future directions. Genes Dev. 11, 11-43. Belshaw PJ, Ho SN, Crabtree GR, Schreiber SL (1996) Con trolling protein association and subcellular localization with a synthetic ligand that induces heterodimerization of proteins. Proc. Natl Acad. Sci. USA 93, 4604-4607. Brownlie A, Donovan A, Pratt SJ ef a/. (1998) Positional cloning of the zebrafish sauternes gene: a model for congenital sidero blastic anaemia. Nature Genet. 20, 244-250. Burke AC (2000) Hox genes and the global patterning of the somi te mesoderm. Curr. Top. Dev. Biol. 47, 155-181. Burright EN, Clark HB, Servadio A et a/. (1995) SCA1 transge nic mice - a model for neurodegeneration caused by CAG trinu cleotide expansion. Cell 82, 937-948. Campbell KHS, McWhir J, Richie WA, Wilmut I (1996) Sheep clo ned by nuclear transfer from a cultured cell line. Nature 380, 64-67.

Capecchi M (1989) The new mouse genetics: altering the genome by gene targeting. Trends Genet. 5, 70-76. Chan AWS, Homan EJ, Ballou LU, Bums JC, Breenel RD (1998) Transgenic cattle produced by reverse transcribed gene transfer in oocytes. Proc. Natl Acad. Sci. USA 95, 14028-14033. Chan AWS, Chong KY, Martinovich C, Simerly C, Shatten G (2001) Transgenic monkeys produced by retroviral gene transfer into mature oocytes. Science 291, 309-312. Childs S, Weinstein BM, Mohideen M-A PK et al. (2000) Zebrafish dracula encodes ferrochelatase and its mutation provides a model for erythropoietic protoporphyria. Current Biol. 10, 1001-1004. Clarke AR (1994) Murine genetic models of human disease. Curr. Opin. Genet. Dev. 4, 453-460. Clement-Jones M, Schiller S, Rao E, Blaschke RJ, Zuniga A, Zeller R et al. (2000) The short stature homeobox gene SHOX is involved in skeletal abnormalities in Turner syndrome. Human Molecular Genetics. 9, 695-702. Dai Y, Vaught TD, Boone J, Chen S-H et al. (2002) Targeted dis ruption of the a-1,3-galactosyltransferase gene in cloned pigs. Nature Biotechnol. 20, 251-255. Darling SM, Abbott CM (1992) Mouse models of human single gene disorders. 1. Nontransgenic mice. BioEssays, 14, 359-366. De Wet JR, Wood KV, De Luca M, Helsinki DR, Subramani S (1987) Firefly luciferase gene: structure and expression in ma mmalian cells. Mol. Cell. Biol. 7, 725-737.

CAPÍTULO

VEINTIUNO

Nuevas conductas para el tratam iento de enferm edades Contenido del capítulo 21.1

El tratam iento de una enfermedad genética y la terapéutica genética de una afección no son lo mismo

612

21.2

Tratamiento de anormalidades genéticas

612

21.3

Uso del conocimiento genético para mejorar los tratamientos existentes y desarrollar nuevas terapéuticas convencionales

612

21.4

Principios de la terapéutica génica

618

21.5

Métodos para insertar y expresar un gen en una célula o tejido blanco

619

21.6

Métodos para reparar o inactivar un gen patógeno en una célula o tejido

627

21.7

Algunos ejemplos de intentos de terapéutica génica humana

628

Recuadro 21-1 Informe del Panel de los NIH de 1995 sobre terapéutica génica (informe Orkin-Motulsky)

Recuadro 1 de ética Ética de la clonación humana Recuadro 2 de ética Terapéutica con línea germinal y tratamiento génico somático Recuadro 3 de ética Diseño de niños

621

616 619 62 2

612

2 1. 1

CAPÍTULO VEINTIUNO

i

NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

El tra ta m ie n to de una enferm edad genética y la te ra p éu tic a genética de una afección no son lo m ism o

Al llegar al final de este libro, un capítulo sobre el tratamiento de be considerar de forma razonable dos temas bastante diferentes: ► Tratamiento de una enfermedad genética ► Terapéutica genética de una afección Esta última tiene a su vez varias facetas: ► Genotipificación de individuos para predecir su patrón de res puestas favorables y adversas a los tratamientos farmacológicos. ► Uso del conocimiento de la genética y la biología celular para reconocer nuevos blancos para el desarrollo de fármacos. ► Empleo del conocimiento sobre genética y biología celular pa ra desarrollar terapéuticas basadas en células. ► Uso de técnicas genéticas para producir fármacos, vacunas y otros agentes para el tratamiento de enfermedades. ► Empleo directo de las técnicas genéticas para el tratamiento de la enfermedad. Estos temas representan la mayor parte de la investigación médica del siglo XXI. Se requerirían varios libros, escritos por grupos de ex pertos, para hacer justicia a esta área tan inmensa; así pues, sólo se proporcionan revisiones muy sucintas de los primeros temas de la lista, antes de concentrarse en el último: el uso de las técnicas ge néticas para el tratamiento de una enfermedad. En los recuadros de ética se comentan de forma breve algunos asuntos éticos relevantes suscitados por estos adelantos.

21.2

Tratam ien to de anorm alidades genéticas

Se ha difundido de forma errónea la idea de que si una enfermedad es genética su tratamiento es imposible. En realidad, no existe en lo absoluto alguna conexión entre la causa y la posibilidad de tratar una afección. Un niño profundamente sordo debe recibir los auxi liares para la audición o un implante coclear con base en sus sínto mas y la situación de la familia, sin importar si la pérdida de la audición es genética o no. La terapéutica médica ortodoxa dirigida a aliviar los síntomas de la anormalidad es tan aplicable a enferme dades genéticas como a cualquiera otra. Sin embargo, es cierto que para muchos padecimientos genéti cos los tratamientos existentes no son satisfactorios. En una encues ta realizada hace 20 años (Costa y cois., 1983) se estimó que la terapéutica mejoró la capacidad de reproducción sólo en 11% de los trastornos mendelianos, la adaptación social en 6% y sólo en 15% prolongó el periodo de vida al normal (de quienes tenían una longevidad reducida). Sin duda, las cifras serían mucho mejores en la actualidad, pero no de manera notable. Los errores innatos del metabolismo son el mejor subgrupo candidato de enfermedades mendelianas para terapia convencional. El conocimiento bioquímico detallado proporciona muchos posi bles puntos de ingreso para intervenir, entre ellos los siguientes:

► Limitación de sustrato. Todas las personas conocen el éxito de los tratamientos dietéticos con la fenilcetonuria (aunque inclu so en pacientes tratados de modo satisfactorio, el desarrollo cog noscitivo es en promedio la mitad de una desviación estándar abajo del normal). Otros errores innatos más responden igual de bien a la terapéutica dietética. ► Restitución de un producto deficiente, como la hormona ti roidea para lactantes con hipotiroidismo congénito. ► Uso de vías alternativas para eliminar metabolitos tóxicos. Los tratamientos son variables, desde la hemorragia simple co mo una terapéutica muy eficaz para la hemacromatosis hasta al uso del benzoato para incrementar la excreción de nitrógeno en pacientes con trastornos del ciclo de la urea. ► Utilización de inhibidores metabólicos, como el fármaco NTBS que bloquea la vía de la tirosina y mejora en gran medi da el pronóstico de la tirosinemia tipo 1 (Lindstedt y cois., 1992). Treacy, Valle y Scriver comentan de forma detallada estos ejemplos y muchos otros más y su capítulo se recomienda a los lectores inte resados en esta área (véase las lecturas adicionales). Aún es cierto que a pesar de muchos trabajos, relativamente pocas anomalías ge néticas tienen tratamientos del todo satisfactorios y de ahí el énfa sis en las conductas novedosas que se describen más adelante, que se aplican por igual a todas las enfermedades, genéticas o no.

21.3

Uso del conocim iento genético para m ejorar los tratam ien to s existentes y desarrollar nuevas te ra p éu tic as convencionales

21.3.1 La farmacogenética promete incrementar la efectividad de los medicamentos y reducir los efectos secundarios peligrosos Rara vez los fármacos son eficaces en la totalidad de los pacientes a quienes se prescriben. Por ejemplo, entre las clases de medicamen tos indicados más a menudo: ► 15 a 35% de los individuos no reacciona a los bloqueadores be ta o sólo de forma inadecuada. ► 7 a 28% de los enfermos no muestra respuesta, o es inapropia da, a los inhibidores de la enzima conversora de angiotensina. ► 9 a 23% de los individuos responde de manera inadecuada a los inhibidores selectivos de la recaptación de serotonina. ► 20 a 50% de las personas reacciona de modo inadecuado a los antidepresivos tricíclicos. En algunos casos (en especial en enfermedades psiquiátricas), los pacientes con el mismo diagnóstico clínico pueden tener en reali dad distintos trastornos, de los cuales sólo uno responde a un agen te determinado. Sin embargo, en la mayor parte de estas personas las fluctuaciones de la respuesta dependen de diferencias en la ab sorción, distribución, metabolismo y eliminación de los medica mentos y la variabilidad de los receptores blanco.

21.3 | USO DEL CONOCIMIENTO GENÉTICO PARA MEJORAR LOS TRATAMIENTOS EXISTENTES.

Estas variaciones individuales dependen en buena medida de combinaciones de polimorfismos comunes en un número limitado de genes. Comparada con los problemas de hallar factores genéti cos de susceptibilidad en anormalidades comunes (cap. 15), la identificación de las variedades subyacentes de las reacciones indi viduales a medicamentos es un problema mucho más fácil de tra tar. La investigación puede enfocarse en un área definible de la bioquímica y es factible revisar in vitro muchas hipótesis. Por con siguiente, parecería factible la quimérica prescripción específica para individuos. Se utilizaría cierto tipo de equipo basado en chips en el consultorio clínico para genotipificar al sujeto para unos cuantos cientos de polimorfismos comunes. Los resultados determinarían los medicamentos que serían seguros y eficaces en su caso. Los pe simistas aducirían que a las compañías farmacológicas no les inte resa asegurar que sus medicamentos sólo se indiquen en los casos en que pueden actuar (aunque tienen un interés muy notorio en evitar que se prescriban cuando pueden causar un efecto secunda rio peligroso). En promedio, cuestan unos 800 millones de dólares y se requieren 10 a 15 años para desarrollar un compuesto desde el indicio inicial hasta colocar el fármaco en el mercado, además de que muchos agentes prometedores fracasan después en el proceso por reacciones adversas en una minoría de individuos. Se conocen algunos ejemplos de variantes genéticas que afec tan las reacciones a los medicamentos (cuadro 21-1). Estos efectos pueden tener una importancia clínica real. Las dosis de isoniacida apropiadas para acetiladores rápidos tienen el riesgo de causar una neuropatía periférica en acetiladores lentos. Los pacientes con las variantes R144C o I359L del gen CYP2C9 pueden sufrir anticoa

613

gulación excesiva y hemorragia si reciben la dosis estándar de sos tén de warfarina. Un “metabolizador deficiente” CYP2D6 tal vez no obtenga beneficio con analgésicos que contienen codeína, pero si se prescribe nortriptilina quizá requiera una dosis diaria de sólo 10 a 20 mg, en tanto que un metabolizador ultrarrápido podría necesitar 500 mg al día. Wolf y colaboradores (2000) notificaron que en los individuos sometidos a medicamentos psiquiátricos, que son sustratos de CYP2D6, se observan reacciones farmacoló gicas adversas en los enfermos con mutaciones que inactivan el gen CYP2D6.

21.3.2 Las compañías farmacéuticas realizan grandes inversiones en genómica para identificar nuevos blancos farmacológicos Se afirma que la enorme diversidad de medicamentos en el merca do sólo actúa hoy en día a través de unos 400 blancos. La investi gación genómica expandió en inmensa proporción el número de posibles blancos disponibles para investigar por compañías farma céuticas; desde unos cuantos cientos hasta hace 10 años tal vez 50 000 en la actualidad. De hecho, la superabundancia de posibles blancos es casi una perturbación para las compañías de biotecno logía. Puede utilizarse la interferencia por RNA (sección 20.2.6) para identificar genes en los que un medicamento inhibidor pro duciría un efecto útil, antes de investigar la selección a gran esca la tal vez necesaria para reconocer posibles inhibidores. A largo término se tiene la esperanza de que surjan de este esfuerzo clases de fármacos por completo nuevos.

Cuadro 21-1. Ejemplos de variaciones genéticas que afectan la respuesta a medicamentos Véase Wolf y colaboradores (2000) para más detalles.

Frecuencia en la población

Ejemplos de fármacos afectados

60% (europea caucásica) 20% (oriental)

Isoniacida, procainamida, sulfonamidas

Actividad baja

(baja)

6-mercaptopurina, azatioprina

Actividad baja (inactiva mutaciones)

6% (europea caucásica) 1% (oriental)

Falta de activación: codeína

Actividad ultraelevada (amplificación génica en tándem)

2-7% (europeos caucásicos)

Inactivación lenta: fármacos psiquiátricos, como nortriptilina, clozapina, haloperidol, imipramina, mianserina; fármacos cardiovasculares, como propranolol.

Citocromo P-450 CYP2C9

Actividad baja

0.2% ?

Ibuprofeno, warfarina, tolbutamida

Citocromo P-450 CYP2C19

Actividad baja

4% (europea caucásica) 23% (oriental)

Mefenitoina, proguanilo

Receptor adrenérgico (3 ADRB2

Varios PNU (aún no es claro cuáles son Importantes)

ND

Reacciones variables al albuterol en asma

Receptor ERBB2

Aumentado en algunos cánceres de mama

---

Herceptina (es eficaz sólo cuando está aumentado ERBB2)

Enzima/proteína

Variante

Transferasa de N-acetilo

Acetiladores lentos

Metiltransferasa de tiopurina Citocromo P-450 CYP2D6

ND, datos no disponibles.

614 | CAPÍTULO VEINTIUNO ! NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

También son importantes los estudios genómicos o proteómicos de microorganismos patógenos como guías para el desarrollo de nuevas vacunas o tratamientos. Los patógenos microbianos figuran en particular en la lista de prioridades para secuenciaciones del genoma (véase recuadro 8-8) y de ellos un notable estudio reciente es el del parásito del paludismo Plasmodium falciparum (Gardner y cols., 2002). Se analizan secuencias para identificar enzimas especí ficas del patógeno, no del huésped, que podrían ser blancos para inhibidores o enzimas faltantes que tornan al parásito vulnerable a la interferencia con el aporte de un nutrimento esencial. Las pro teínas de virulencia o los productos génicos que se expresan tem prano en una infección son blancos prometedores para fármacos. Pueden identificarse mediante estudios de ordenamiento de expre sión y por comparación del contenido de genes o la expresión génica en cepas virulentas y no virulentas. Se utilizan medidas proteómicas (como MALDI-TOF MS; véase recuadro 19-4) para reconocer proteínas en la superficie de células patógenas que po drían ser blancos para vacunas.

21.3.3 Los tratamientos basados en células prometen transformar el potencial de los trasplantes Los tratamientos basados en células pueden considerarse como ex tensiones naturales de los métodos vigentes de trasplante, pero los adelantos en el conocimiento de las células madre ofrecen la espe

ranza de extender de forma radical la gama actual de opciones. En teoría, las posibilidades son interminables -cualquier tejido u órga no dañado o gastado podría renovarse o crearse de nueva cuenta con células madre apropiadas y éstas podrían someterse a cualquier clase de manipulación genética por adelantado-. Daley (2002) pro porciona una valoración juiciosa de la forma en que pueden con cretarse estas esperanzas a mediano plazo. Las células madre pueden definirse como células que se autorrenuevan y además dan lugar a una progenie diferenciada (véase sec ción 3.3). Es probable que se encuentren en todas las etapas del desarrollo y todos los tejidos. Existe un gradiente de células madre embrionarias (células ME), que tienen el potencial de producir to da la línea germinal y de células somáticas de un organismo, hasta las células madre multipotenciales pero restringidas a tejidos (fig. 21-1). Desde hace muchos años se estudian las células ME de ra tón, pero el aislamiento de células ME humanas que efectuaron Thomson y colaboradores en 1998 impulsó la terapéutica con cé lulas madre en la investigación médica y también en el debate éti co. Este último deriva del método de producción de las células ME, que de modo inevitable comprende la destrucción de un embrión humano temprano. Para conocer diversos argumentos, véase la se rie de cartas publicada en el New England Journal o f M edicine (2002;346:1619-1622), que cobraron relevancia tras la revisión de Weissman (2002). Quienes se oponen al uso de células ME suelen sugerir que no es necesario emplearlas, dado que las células madre

Células musculares diferenciadas

Células diferenciadas del sistema hematopoyético

Células neurales diferenciadas

Células de la línea germen

Células ME pluripotentes

Células madre multipotentes específicas de tejido

Células diferenciadas de forma terminal

Fig. 21-1. Células madre. Todas las células madre pueden renovarse por sí mismas y dar lugar a una progenie más diferenciada. Las células madre embrionarias (ME) pueden producir todos los tipos de células somáticas y de la línea germinal del organismo; las células madre restringidas a tejidos tienen un potencial más limitado. En la actualidad, existen controversias en cuanto a que las células madre restringidas a tejidos puedan transdiferenciarse en una célula característica de un tejido diferente y en qué grado.

21.3

I

USO DEL CONOCIMIENTO GENÉTICO PARA MEJORAR LOS TRATAMIENTOS EXISTENTES. . .

adultas restringidas a tejidos pueden funcionar igual de bien. Otros arguyen que pocas de las líneas de células madre adultas disponi bles están bien caracterizadas y que su potencial de crecimiento y diferenciación es muy limitado para que constituyan un sustituto adecuado de las células madre embrionarias (ME). Las líneas actuales varían de manera considerable en cuanto a la proporción de crecimiento en cultivo y la gama de células diferen ciadas que pueden producir. Cabe preguntarse hasta qué grado pueden transdiferenciarse las células madre restringidas a tejidos si se hace migrar un tejido diferente y se adquieren las propiedades de las células madre de dicho tejido. Existen muchas afirmaciones, pe ro pocas se han formulado con rigor. Como herramientas de inves tigación, son muy importantes las células madre de todas las clases. Pueden permitir la identificación de los factores que controlan la posible diferenciación y la forma de llevarla a cabo. Si eso conduce a una capacidad de controlar y canalizar la diferenciación, podrían emplearse células madre para una gama casi ilimitada de ingeniería tisular y reparación de tejidos. El uso de células madre obtenidas de un donador aún deja el problema del rechazo del trasplante. Este inconveniente podría so lucionarse con el uso de la tecnología de trasplante nuclear que pro dujo a Dolly la oveja. Se reemplazaría el núcleo de un oocito por otro del receptor del trasplante y células ME aisladas del blastocisto resultante (fig. 21-2). En teoría, sería factible utilizar estas célu las para producir células madre, tejidos o incluso órganos completos para trasplante sin ningún riesgo de rechazo. Este proce dimiento se denomina clonación terapéutica y es el tema de una aca lorada controversia ética y política (véase el recuadro 1 de ética).

j

615

21.3.4 Proteínas recombinantes y vacunas Es posible producir proteínas recombinantes mediante clonación de expresión en microorganismos o ganado transgénico Muchas proteínas terapéuticas que se extraían con anterioridad de fuentes animales o humanas pueden elaborarse como proteínas recombinantes mediante clonación de expresión (Russell y Clarke, 1999). En la sección 5.6 se describen las técnicas y problemas de la clonación de expresión. La insulina humana recombinante se ex pendió por primera vez en 1982 y en el cuadro 21-2 se incluyen va rios ejemplos subsecuentes. El uso de proteínas recombinantes evita muchos de los problemas de seguridad de los productos ex traídos en forma natural. Muchos hemofílicos contrajeron sida por factor VIII humano contaminado con HIV y algunos niños murie ron por enfermedad de Creutzfeldt-Jakob después de inyecciones de hormona del crecimiento extraída de glándulas hipófisis de ca dáveres humanos. Las bacterias son los huéspedes más simples para clonación de expresión. Es posible desarrollar grandes volúmenes de cultivos y pueden definirse y controlarse los medios para evitar la contamina ción. Sin embargo, los polipéptidos que se producen en bacterias no son idénticos a las proteínas humanas naturales. Casi todas las proteínas humanas terapéuticas están glucosiladas y las bacterias no reproducen los patrones humanos de glucosilación. Por esta razón hay un interés creciente en los sistemas de expresión de mamíferos. Éstos pueden ser cultivos celulares, pero una alternativa atractiva la representan los animales transgénicos. Por ejemplo, podría fusio-

Célula somática de donador

C lo n a c ió n re p ro d u c to ra

O o c ito B la s to c is to

C élu la s d ife re n c ia d a s p a ra tra s p la n te

C lo n a c ió n te ra p é u tic a

Fig. 21-2. Clonaciones reproductora y terapéutica. En ambos procedimientos se trasplanta el núcleo de una célula somática del donador a un oocito enucleado, que a continuación se estimula para desa rrollarse hasta la etapa de blastocisto. Para la clonación reproductora se implanta el blastocisto en un útero con la esperanza de que se desarrolle hasta un niño. La clonación reproductora humana está prohibida en la mayor parte de los países. Para la clonación terapéutica se extraen células ME de la masa celular interna del blastocisto, que a continuación se destruye. Las células ME se utilizan como una fuente de células donadoras clonadas o, en potencia, de tejidos u órganos. Hay controversias sobre la clonación terapéutica humana porque incluye la destrucción de un embrión humano. El em brión podría ser alguno sobrante de una clínica de fecundación in vitro (FIV) o crearse de manera especial para este propósito.

616

CAPÍTULO VEINTIUNO

NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

narse un gen humano clonado con un gen de oveja, cabra o cerdo que exprese una proteína para la leche e insertarse en la línea ger minal del animal. Esto lleva a la idea del pharming. Se conservarían rebaños de animales transgénicos que producen una proteína hu mana deseada a un valor alto en su leche (Velander y cois., 1997). De manera alternativa, podría inducirse que pollos transgénicos pusieran huevos ricos en un producto deseado. Asimismo son cada vez más comunes las plantas transgénicas. Las plantas no replican patrones de glucosilación específicos de se res humanos, pero tienen muchas ventajas para clonación de expre sión en términos de costo y seguridad. Por ejemplo, hay un enorme interés en producir cepas de arroz mediante ingeniería para contra rrestar la deficiencia de vitamina A, que es un problema de salud pública importante cuando menos en 26 países de África, Asia y América Latina (Ye y cois., 2000).

Anticuerpos elaborados de forma genética por ingeniería Los reordenamientos génicos complicados de los linfocitos B (sec ción 10.6) proporcionan a todas las personas un repertorio enorme de diferentes anticuerpos como un sistema de defensa contra innu merables antígenos extraños. Las moléculas de anticuerpo actúan como adaptadores: tienen sitios de enlace para antígeno extraño en el extremo variable (V) y sitios de enlace para moléculas efectoras en el extremo constante (C). El enlace de un anticuerpo puede ser

M

suficiente por sí mismo para neutralizar ciertas toxinas y virus, pe ro más a menudo el anticuerpo enlazado desencadena al sistema de complemento y la destrucción mediada por células. Los anticuerpos terapéuticos que se producen de modo artifi cial están diseñados para ser monoespecíficos. Por tradición, éstos eran anticuerpos m onoclonales (Acm) secretados por hibridomas, células inmortalizadas producidas mediante la fusión de linfoci tos B que liberan anticuerpo de un ratón o una rata inmunizados con células de un tumor inmortal de linfocitos B de un ratón. Los hibridomas se propagan como clonas individuales, cada una de las cuales puede proporcionar una fuente permanente y estable de un Acm único. Infortunadamente, el potencial terapéutico de los Acm que se producen en esta forma es limitado. Aunque es posible pro ducir Acm de roedores contra patógenos y células humanas, tienen una vida media corta en el suero humano y pueden activar la pro ducción de anticuerpos humanos antirroedor. Además, sólo algu nas de las diferentes clases pueden estimular funciones efectoras humanas. Estos problemas pueden tratarse mediante ingeniería de anti cuerpo. Diferentes exones de los genes de inmunoglobulina codifican distintos dominios de la molécula de anticuerpo. Por consiguiente, el mezclado de exones a nivel del DNA permite construir anticuer pos con combinaciones novedosas de dominios proteínicos. Las aplicaciones iniciales de la ingeniería de anticuerpos produjeron anticuerpos humanizados (fig. 21-3) en los que se reemplaza una

■

R ecu ad ro i ck é tic a . Etica de ia clonacion humana

Los argumentos sobre la ética de la clonación humana deben diferenciar la clo nación reproductora de la terapéutica, incluso si la decisión final es que ambos tipos no son éticos. Las legislaciones en muchos países han considerado proyectos que buscan suprimir todo tipo de clonación, o bien establecer una diferencia entre clonación reproductora (proscrita) y terapéutica (permitida). La clonación reproductora se dirige a producir un niño clonado. Las ob jeciones para la clonación reproductora se basan en tres hechos: uno práctico, uno de principios y otro mal concebido. ► El argumento práctico destaca la baja tasa de éxito de todos los ex perimentos de clonación de mamíferos y, por consiguiente, el hecho de que muchos animales clonados que nacen tendrán anormalidades de importancia, tal vez porque los procedimientos actuales no reprograman con seguridad las modificaciones epigenéticas de la célula donadora (Dean y cois., 2001). Éste es un hecho simple y, desde lue go, cualquier intento de clonación reproductora humana en el estado actual de conocimientos sería notablemente inmoral. Los adelantos posteriores del conocimiento podrían eliminar esta objeción, aunque aún no se aclara de qué forma podria saberse sin llevar a cabo los ex perimentos no éticos. ► El argumento de principios señala que los seres humanos deben va luarse por sí mismos y no tratarse como instrumentos para lograr un propósito. Se acepta del todo este argumento, pero cabría preguntar por qué no se aplica en la misma medida a padres ambiciosos que deciden que su niño de tres años se convierta en un campeón de te nis o un violinista virtuoso. ► El argumento mal concebido considera las clonas como sólo indivi duales en parcial medida o tal vez no del todo humanas. Gran parte

de la ansiedad - y asimismo del ironía- sobre la clonación reproduc tora se debe a idear un cuadro de clonas como cierta clase de zombis programables. Es muy extraño, ya que todos conocen las clonas y saben perfectamente que son por entero humanas e individuales. Las clonas con ingeniería serian incluso menos idénticas que los ge melos MZ, ya que es muy probable que el donador seria un multimi llonario de edad avanzada obsesionado por lograr una falsa inmortalidad, en tanto que la clona sería 60 años más joven y nace ría en un ambiente por completo diferente. Para citar un ejemplo tri llado: incluso si alguien tuviera éxito para clonar a Hitler, no hay nada que lleve a imaginar una clona para exterminar judíos. Los argumentos en favor de la clonación reproductora se basan en los casos en los que sólo hay una opción para que una pareja tenga niños -por ejem plo, si una mujer tuvo un trastorno mitocondrial grave podria embarazarse con un oocito donado (que proporcionada las mitocondrias) dentro del que se transplantó el núcleo de una de las células somáticas del compañero-. La clonación terapéutica (fig. 21-2) comprende la producción de células madre embrionarias en las que el núcleo procede de una célula somática de donador. Esto se lleva a cabo para proporcionar al donador una fuente de cé lulas, tejidos u órganos trasplantares compatibles. En este caso, el debate ético es más complicado. Muchas personas objetan la idea de crear un em brión específico para este propósito o incluso utilizar embriones sobrantes de las clínicas de fecundación in vitro. Otras personas que se oponen se re fieren a una “pendiente deslizable” : sí se permite la clonación terapéutica, quizá será imposible evitar que operadores inescrupulosos llevaran los em briones clonados a programas de clonación reproductora. Quienes propo nen lo contrario, arguyen que si la clonación terapéutica es la única forma de curar enfermedades devastadoras seria inmoral no proceder.

21.3 [ USO DEL CONOCIMIENTO GENÉTICO PARA MEJORAR LOS TRATAMIENTOS EXISTENTES... j 617

Cuadro 21-2. Ejemplos de productos farmacéuticos obtenidos mediante clonación de expresión Producto

Tratamiento de

Insulina

Diabetes

Hormona del crecimiento

Deficiencia de hormona del crecimiento

Factor VIII de coagulación sanguínea

Hemofilia A

Factor IX de coagulación sanguínea

Hemofilia B

Interferón a

Leucemia de células piliformes; hepatitis crónica

Inferferón p

Esclerosis múltiple

Interferón y

Infecciones en pacientes con enfermedad granulomatosa crónica

Glucocerebrosidasa

Enfermedad de Gaucher

Activador del plasminógeno tisular

Trastornos trombóticos

Hormona estimulante de granulocitos y macrófagos

Neutropenia consecutiva a quimioterapia

Leptina

Obesidad

Eritropoyetina

Anemia

parte mayor o menor del Acm del roedor por el equivalente hu mano. Por último, se elaboraron anticuerpos que sólo llevan las re giones determ inantes d e com plem entaridad (RDQ del Acm del roedor -son las secuencias hipervariables del sitio de unión de antígeno (fig. 21-3B)-. Adelantos más recientes evitaron la produc ción de hibridomas mediante la tecnología de exhibición de fago (Hoogenboom y cois., 1998; sección 5.6.2). Estos sistemas permi ten elaborar combinaciones innovadoras de dominios de anticuer po. Una clase muy prometedora de derivados de anticuerpos es la de los fragm entos variables de cadena única (Fvcu; fig. 21-3Q. És tos tienen casi toda la especificidad de enlace de un Acm, pero en un polipéptido no glucosilado único que puede elaborarse a gran escala en células bacterianas, de levadura o incluso de plantas (Stó-

ger y cois., 2000). Hudson (1999) revisó muchas de las moléculas promisorias por ingeniería relacionadas con anticuerpos que han comenzado a valorarse en estudios clínicos. Los adelantos relacionados se encaminan a simular la especifi cidad de enlace de anticuerpos en diferentes contextos. Pueden emplearse genes de anticuerpo con ingeniería para producir anti cuerpos intracelulares no secretados (intracuerpos) con el fin de enlazar moléculas específicas dentro de una célula (Marasco, 1997). Los intracuerpos pueden ser útiles si el mero acto de enla ce inhibe el blanco. Ello puede ser una propiedad en extremo útil ya que, a diferencia de las moléculas pequeñas, los intracuerpos no se limitan a dirigirse a clases de proteínas específicas (cinasas, cana les de iones, etc.). Más aún, los intracuerpos pueden usarse para

P é p tid o e n la z a d o r

C)

A n tic u e rp o d e fra g m e n to v a ria b le d e c a d e n a ú n ic a (Fvcu)

Fig. 21-3. ingeniería de anticuerpos. A) Los anticuerpos monoclonaies (Acm) comunes son anticuerpos monoespecificos de roedores sintetizados mediante hibridomas y que se preparan tras fusionar células B de ratones o ratas inmunizadas con células de un tumor inmortal de linfocitos B de ratón. Los seres humanos pueden producir anticuerpos antirroedores que neutralizan a los Acm. B) Este problema puede minimizarse mediante ingeniería del Acm de tal manera que toda la mo lécula sea de origen humano excepto las regiones hipervariables determinantes de la complementaridad (RDC) que determinan la especificidad. C) Fvcu son cadenas polipéptidas únicas modificadas por ingeniería. Según sea la longitud del enlazador, conectan su blanco como monómeros : . trímeros. Los multímeros enlazan su blanco con mayor potencia que los monómeros.

618 i CAPÍTULO VEINTIUNO ¡ NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

transportar moléculas efectoras que pueden activar funciones es pecíficas cuando ocurre el enlace de antígeno. Es probable que el mejor ejemplo de lo anterior sea la fusión de la caspasa 3 a intracuerpos (Tse y Rabbits, 2000). Se prepararon intracuerpos conju gados con caspasa 3 contra cada molécula proteínica separada de una enfermedad acompañada de proteína de fusión como bcr-abl. En células cancerosas, ambos intracuerpos enlazan la proteína de fusión, lo cual hace posible que se dimerice la caspasa 3 y por con siguiente desencadena apoptosis selectiva de células que contienen la proteína de fusión. Una alternativa de los anticuerpos recombinantes es el uso de péptidos cortos como compañeros de enlace para proteínas blanco específicas (Hoppe-Seyler y Butz, 2000). De hecho, pueden aban donarse por completo las interacciones de proteina con proteína en favor de moléculas de DNA o RNA (aptámeros). Las ventajas fun damentales del empleo de DNA o RNA son la capacidad para am plificar DNA y producir la molécula deseada a gran escala. A partir de un fondo común grande de oligonucleótidos aleatorios, se utili zan rondas repetidas de selección y amplificación para aislar molécu las que enlazan e inhiben una proteína blanco con afinidad similar a anticuerpos convencionales (White y cois., 2000).

Vacunas modificadas de modo genético mediante ingeniería Puede aplicarse la tecnología de DNA recombinante a antígenos y anticuerpos. Es posible incapacitar microorganismos patógenos mediante modificación genética de tal manera que pueda emplear se con seguridad una vacuna viva atenuada. Podrían usarse plan tas modificadas de modo genético para producir vacunas comestibles. Es posible llevar a cabo cambios para que un antíge no mejore su visibilidad para el sistema inmunitario, de tal forma que produzca una respuesta mayor. En la actualidad se encuentran en estudios clínicos muchas vacunas de DNA o RNA. De manera característica, son plásmidos diseñados para expresar un antíge no de un patógeno o un tumor a una concentración alta después de administrarse por inyección intramuscular (Reyes-Sandoval y Erti, 2001). En esta sección se proporcionó una revisión general y breve de la muy amplia gama de aplicaciones del conocimiento y las técnicas genéticas en investigación médica y farmacéutica; a con tinuación se comentan con mayor detalle las posibilidades de in tervenciones genéticas directas en procesos patológicos mediante terapéutica gènica.

21.4

Principios de la terapéutica gènica

El tratamiento gènico incluye la modificación genética directa de células del paciente para lograr un objetivo terapéutico. Hay distin ciones básicas en los tipos de células modificadas y la variedad de la modificación efectuada. ► La terapéutica gènica de linea germinal produce una modifica ción transmisible permanente. Esto podría lograrse si se modifica ra un gameto, un cigoto o un embrión temprano. El tratamiento de línea germinal se suprimió en muchos países por razones éticas (véase el recuadro 2 de ética).

► La terapéutica gènica de células somáticas se enfoca en mo dificar células o tejidos específicos del paciente en una forma li mitada al propio enfermo. Todos los estudios clínicos y protocolos sobre terapia gènica actuales se basan en la terapéu tica de célula somática. Las células somáticas podrían modificarse en varias formas dife rentes (fig. 21-4). ► La suplementación gènica (llamada asimismo aumento gèni co) se dirige a proporcionar una copia funcional de un gen de fectuoso. Es posible utilizar esta modalidad para el tratamiento de padecimientos con pérdida de función (sección 16.4) en los que el proceso patológico resulta de la falta de función actual de un gen. La fibrosis quística sería un candidato típico. No es ade cuada para padecimientos con pérdida de función en los que ya se llevó a cabo un daño irreversible, por ejemplo a través de cier ta falla en el desarrollo embrionario. La terapéutica del cáncer incluiría la suplementación gènica para incrementar la reacción inmunitaria contra un tumor o reemplazar un gen supresor de tumor defectuoso. ► La restitución gènica es más ambiciosa: el objetivo es reempla zar un gen mutante por una copia que funciona de modo co rrecto o corregir una mutación in situ. Se requiere el reemplazo gènico para enfermedades con ganancia de función en las que el gen mutante residente efectúa una función errónea. ► La inhibición dirigida de expresión gènica es en particular im portante en enfermedades infecciosas en las que las funciones esenciales del patógeno son los objetivos. Puede usarse también para silenciar oncogenes activados en el cáncer, amortiguar res puestas indeseables en afecciones autoinmunitarias y tal vez silen ciar un alelo mutante con ganancia de función en un trastorno hereditario. ► La destrucción dirigida de células específicas es una aplica ción particular para el tratamiento del cáncer. Las expectativas sobre la terapéutica gènica siguieron un curso fluttuante durante los últimos 15 años ya que a ciclos de optimis mo excesivo le siguieron brotes de pesimismo desbordado. Un im portante informe de los US National Institutes of Health de 1995 intentó inyectar bases reales (recuadro 21-1). Desde entonces se observó un crecimiento optimista (que sólo se alteró por la muerte de Jesse Gelsinger) suscitado de nueva cuenta por el tratamiento con éxito de niños con inmunodeficiencia combinada grave y ate nuado una vez más por las noticias de un primer niño y a continua ción un segundo que desarrollaron leucemia, casi con certeza como resultado del tratamiento (más adelante se describen más detalles de todos estos acontecimientos). Tal vez una causa de dichas reac ciones exageradas es la confusión sobre las escalas de tiempo natu rales de este trabajo. Debido a que muchas veces pueden iniciarse pruebas diagnósticas en el transcurso de semanas tras clonarse un gen, tal vez las personas esperan que el tratamiento no se retrase de masiado, en tanto que en realidad el desarrollo de un fármaco sigue un lapso de décadas. Desarrollar la terapéutica gènica práctica es un proceso que lle vará mucho tiempo; de manera adicional, informes del éxito del

21.5 I MÉTODOS PARA INSERTARY EXPRESAR UN GEN EN UNA CÉLULA O TEJIDO BLANCO I 6 19

progreso desencadenan preocupaciones éticas centradas alrededor de la idea de “diseñar niños” (véase el recuadro 3 de ética). No obs tante, muchos laboratorios académicos y comerciales trabajan ar duamente en esta área y se han aprobado más de 600 protocolos de estudios clínicos relacionados con terapéutica génica. En la figura 21-5 se muestran estadísticas de la base de datos de estudios clíni cos conservada en www.wiley.co.ulc/genetherapy/clinical. El libro de Templeton y Lasic (lecturas adicionales) comenta más a fondo muchos de los temas que se exponen en el resto de este capítulo.

21.5

Métodos para insertar y expresar un gen en una célula o tejido blanco

21.5.1 Es posible transferir genes a células receptoras en el laboratorio (ex vivo) o dentro del cuerpo del paciente (in vivo) La transferencia génica ex vivo comprende la transferencia de genes clonados al interior de células desarrolladas en cultivo. Se seleccionan

las células que se transformaron de forma satisfactoria, se expanden mediante cultivo celular in vitro y a continuación se restiruven al pa ciente. Para evitar el rechazo por el sistema inmunitario. siempre que es posible se utilizan las células del enfermo (células autólogasy fig. 21-6). Este método se emplea en células que son accesibles para ex tracción inicial y que pueden inducirse para injertarse v sobrevivir por un tiempo prolongado después de la restitución. Los ejemplos incluyen células del sistema hemopoyético, células de la piel, etc. La transferencia génica in vivo es la única opción en tejidos en los que no es posible cultivar células del receptor in vitro en canti dades suficientes (p. ej., células cerebrales) o en los casos en que no es posible implantar otra vez con eficiencia en los pacientes células cultivadas. El blanco tisular es una consideración importante. El vector de la transferencia génica puede colocarse de forma directa dentro del tejido blanco o inyectarse en la circulación general y di señarse de tal manera que sólo lo capte el tipo de célula deseado. Debido a que no existe una forma de seleccionar y amplificar célu las que captaron y expresaron el gen extraño, el éxito de este méto do depende de la eficiencia general de la transferencia y expresión génicas.

lÉ É t tH La terapéutica génica con linea germinal supone llevar a cabo un cambio genético que pueda transmitirse a través de las generaciones. Con toda probabilidad, esto se haría mediante la manipulación genética de un em brión antes de la implantación, pero podría ocurrir como un producto ac cesorio de un tratamiento dirigido a células somáticas que afectó de forma incidental las células germinales del individuo. La terapéutica con células somáticas trata sólo ciertas células del cuerpo del sujeto sin tener efecto alguno en la línea germinal. Por razones sólo técnicas, en la actualidad la terapéutica con línea germinal no es una opción real e incluso habrá pro blemas éticos cuando se resuelvan los problemas técnicos y en muchos países la ley prohíbe la manipulación genética de la línea germinal.

2pq:tf, en la que q es la frecuencia del alelo de enfermedad y p = 1 -q . Puesto que cada portador tiene una copia del alelo de enfermedad en tanto que cada persona afectada posee dos, la proporción de alelos de enfermedad que se encuentran en la persona afectada es 2qz/(2pq + 2q2) que se simplifica a q. Por consiguiente, para una enfermedad rece siva que afecta a una persona en 10 000 (qr2 = 1/10 0000, q = 0.01), sólo 1% de los alelos de la enfermedad se halla en la persona afectada. Evitar o no que un sujeto afectado transmita sus genes patológicos (mediante terapéutica de línea germinal o por la opción más drástica de la esterilización como precio del tratamiento) tiene muy poco efec to en la frecuencia de la afección en generaciones futuras.

► En favor de la terapéutica de línea germinal se argumenta que resuel ve el problema en un solo paso y para siempre. ¿Por qué dejar en los descendientes de la persona el riesgo de una enfermedad si podría eliminarse también éste?

► En trastornos dominantes de penetrancia completa, todos los alelos de la enfermedad los lleva la persona afectada y para los recesivos li gados a X la proporción es 1/3. Pero el sueño de eliminar estas en fermedades de una vez y para siempre de la población fracasa debido a las ecuaciones del recuadro 4-7, que muestran que la mayor parte de las enfermedades dominantes o ligadas a X importantes se con serva en la población en gran parte por mutación recurrente.

► El principal argumento contra la terapéutica de línea germinal señala que estos tratamientos sólo son experimentales. No es posible prever todas las consecuencias y el riesgo se reduce al mínimo al asegurar que sus efectos se limitan al paciente tratado. Esto implicaría que una vez que se cuente con experiencia suficiente en terapéutica somática, será ético proceder a la terapéutica con línea germinal. Sin embargo, por fortuna, el tratamiento inicial se lleva a cabo con el consentimien to informado, pero las generaciones ulteriores no tienen elección. Es to conduce a la responsabilidad de no imponer ideas o productos personales en generaciones futuras de tal manera que, con base en este argumento, la terapéutica de línea germinal nunca será ética. El argumento en favor debe formularse contra el fondo genético de la po blación. Las ecuaciones que se establecen en la sección 4.5 son muy im portantes en este caso; además, existe un argumento práctico sólido que señala que no se requiere la terapéutica de línea germinal. ► En padecimientos recesivos la persona afectada lleva sólo una propor ción muy pequeña de los genes enfermos; la gran mayoria se encuen tra en heterocígotos sanos. La ecuación de Hardy-Weinberg proporciona la relación de portadores y afectados en una población como sigue:

► Una tercera objeción, y convincente, es que la terapéutica de línea germi nal no es necesaria. Es muy probable que las parejas candídatas tuvieran trastornos mendelianos dominantes o recesivos (riesgo de recurrencia de 50 y 25%, respectivamente). Si estuvieran disponibles seis embriones de fecundación in vfro (FIV) de la pareja, parecería una locura seleccionar a los afectados y someterlos a un procedimiento incierto, en lugar de tan sólo seleccionar el 50 o 75% de los no afectados para reimplantarios. El argumento que señala que la terapéutica somática implica menos ries gos que la terapia de línea germinal parece incontrovertible. En particular, en la terapéutica de linea germinal no podrían utilizarse los vectores no in tegrantes más seguros. Convence menos el argumento general de que no es ético imponer las elecciones personales a generaciones futuras. Tal vez sea cierto, pero en verdad esto siempre se lleva a cabo. Seria más fá cil considerar este argumento con seriedad si los gobiernos mostraran la misma preocupación para no imponer un cambio de clima o sobrepoblación masiva en generaciones futuras.

620 I CAPÍTULO VEINTIUNO í NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

A)

Terapéutica de au m ento gènico

Gen X rv /\B B - A _ rv

^ Células enfermas

B)

©©© Fenotipo normal (aumento del producto gènico X)

C orrección dirigida de la m utación gènica Gen X

-'"x/xBB/vrv

Células enfermas (gen X mutante)

□E m

C)

©©©

I

Fenotipo normal (mutación génica corregida para restablecer el gen funcional)

Gen corregido

Inhibición dirigida de la expresión génica m e je Ollgonucleótido antisentldo, siRNA, ▼ ribozima, Células enfermas / 'w r-A A A A etc. que contienen el gen Inhibición — -o mutante o 'f ' perjudicial m NI IC I ■ I

D)

(

,' )

'• (

)

(

)

Bloqueo de la expresión del gen patógeno

Destrucción directa d e células enferm as

Toxina génica

Células enfermas Gen profármaco

Células destruidas por toxina expresada

AAÂA.

“* • © © © ^ Células enfermas Fármaco

Fig. 21-4. Procedimientos de terapéutica génica. Véase el texto para más detalles. siRNA, RNA pequeño de Interferencia, véase sección 21.6.

O o o Células destruidas por el fárm aco

21.5 | MÉTODOS PARA INSERTARY EXPRESAR UN GEN EN UNA CÉLULA O TEJIDO BLANCO j 621

21.5.2 Pueden diseñarse vectores para integrarse en los cromosomas de la célula huésped o permanecer como episomas Para lograr la expresión génica por tiempo prolongado, sería acon sejable al parecer integrar el gen extraño dentro de un cromosoma de la célula huésped -de preferencia una célula madre-. A conti nuación se replica el vector siempre que se divide la célula hués ped o sus hijas. Sin embargo, la integración conlleva ciertos problemas y riesgos. La integración de la mayor parte de los vec tores ocurre en sitios aleatorios y es diferente en distintas células del individuo. El ambiente cromosómico local puede tener efectos impredecibles en la expresión del vector -tal vez nunca se exprese, lo haga a un nivel indeseablemente bajo o se exprese por un tiempo corto y a continuación se silencie de modo irreversible—. Peor aún, la integración puede alterar la expresión de genes endógenos. El punto de inserción podría ocurrir en la secuencia de un gen endó geno, que conduciría a la inactivación insercional de dicho gen. La mayor preocupación es que la inserción de un vector muy expresa do puede activar a un oncogen adyacente, algo similar a la activa ción de M YC en el linfoma de Burkitt (fig. 17-4S); en realidad, esto es lo que al parecer sucedió en dos de los niños tratados con éxito de inmunodeficiencia combinada grave (Check, 2002, 2003). En apariencia, cuando menos en una de las 10 células T modificadas en cada uno de los dos niños, una inserción retroviral aleatoria activó al oncogén LM02. Poco tiempo después del trata miento había 50 diferentes sitios de inserción entre las células T del paciente, pero al final esta clona única superó a todas las otras y condujo a una forma nueva de leucemia de célula T. A menos que esto sea el resultado de algún aspecto evitable del vector o el protocolo utilizado en estos casos particulares, es probable que es ta experiencia conduzca a un rechazo general de vectores que se in tegran de forma aleatoria como medios para la terapéutica génica. Como se muestra en la figura 21-55, eso sería un inconveniente notorio para todo el campo. Por todas estas razones, parece probable que los vectores que permanecen como episomas extracromosómicos se constituyan en

los medios principales para la terapia génica. Su desventaja es la li mitada duración de la expresión génica. Si se dividen de forma ac tiva las células blanco, los episomas tienden a diluirse a medida que crece la población celular. Por consiguiente, no existe la posibilidad de lograr una curación permanente y quizá se requieran tratamien tos repetidos. Para algunos propósitos, por ejemplo destruir células de cáncer o combatir una infección aguda, ello no es un problema porque no se requiere expresión a largo plazo. Más aún, si algo an da mal, un gen no insertado es autolimitante en una forma en que no lo es el gen insertado en un cromosoma.

21.5.3 Los virus son los vectores utilizados con más frecuencia para la terapéutica génica Ningún sistema de transferencia génica es ideal; todos tienen sus li mitaciones y ventajas. Sin embargo, los vectores para transferencia génica empleados de manera más regular son los virus de mamífe ros por su gran eficiencia de transducción a células humanas. La fi gura 21-5-8 muestra que casi en 70% de los protocolos aprobados se usan vectores virales. Se han desarrollado varios sistemas virales diferentes (véase la revisión de Kay y cois., 2001).

Vectores oncorretrovirales Los retrovirus son virus RNA que poseen una transcriptasa inversa que les permite sintetizar una copia de cDNA de su genoma. Los retrovirus llevan un complejo nucleoproteínico (complejo de preintegración) al interior del citoplasma de las células infectadas. Este complejo transcribe de modo inverso el genoma viral RNA y en se guida integra el cDNA resultante en un sitio aleatorio único en un cromosoma de la célula huésped. La integración requiere que el cDNA retroviral tenga acceso a los cromosomas del huésped y só lo es capaz de llevarlo a cabo cuando se disuelve la membrana nu clear durante la división celular. Por esta razón, estos retrovirus sólo pueden infectar células en división. Eso limita las posibles células blanco; algunas células blanco; importantes, como las neuronas ma duras, nunca se dividen. Sin embargo, la propiedad de transducir

Recuadro 21-1. Informe del Panel de los NIH de 1995 sobre terapéutica génica (informe Orkin-Motulsky) Los NIH convocaron a una reunión para valorar el estado actual y promi sorio de la terapéutica génica y emitir recomendaciones sobre la investi gación futura patrocinada por los NIH en esta área. El informe se notificó en diciembre de 1995 (www4.od.nih.gov/oba/rac/panelrep.htm). Entre los hallazgos cabe señalar los siguientes:

► Aún existen problemas de consideración en todos los aspectos bási cos de la terapéutica génica. Las principales dificultades a nivel bási co incluyen escasez en todos los vectores de transferencia génica actuales y un conocimiento inadecuado de la interacción biológica de estos vectores con el huésped.

► La terapéutica génica somática es un progreso lógico y natural de la apli cación de la ciencia biomédica fundamental de la medicina y ofrece un potencial extraordinario, a largo plazo, para el tratamiento y corrección de enfermedades humanas, incluidos los trastornos hereditarios y ad quiridos, cáncer, sida, etcétera.

► Conceder demasiado valor a los resultados de laboratorio y estudios clinicos por investigadores y sus patrocinadores -sean académicos, federales o industriales- condujo al error y la amplia percepción de que la terapéutica génica tiene más éxito y está más desarrollada de lo que en realidad está. Esos cuadros imprecisos amenazan la con fianza en la integridad del campo y pueden obstaculizar el progreso a la aplicación exitosa de la terapéutica génica para enfermedades humanas.

► Si bien las expectativas y promesas de la terapéutica génica son considerables, en la actualidad aún no se demuestra de modo defi nitivo la eficacia clínica en ningún protocolo de terapéutica génica, a pesar de afirmaciones anecdóticas de éxitos terapéuticos y el inicio de más de 100 protocolos aprobados.

Casi todas las observaciones son pertinentes en la actualidad, aunque te habido una curación definitiva (véase sección 21.7.1).

622 | CAPÍTULO VEINTIUNO ¡ NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

Recuadro 3 de ética. Diseño de niños La frase publicitaria “diseño de niños” incluye dos grupos de preocupa ciones: ► Las personas utilizarán la fecundación in vitro y el diagnóstico preimplantación para seleccionar embriones con ciertas cualidades desea das y rechazar el reslo aun si son normales. Esto contrasta con el uso del mismo procedimiento para evitar el nacimiento de un niño con una enfermedad grave. ► Las personas usarán las tecnologías terapéuticas que se describen en este capítulo, no para el tratamiento de enfermedades sino para el mejoramiento genético, es decir, dotar a personas normales desde el punto de vista genético de cualidades superiores. El primer caso ya existe en forma de selección del sexo antes de la implan tación y unos cuantos casos de gran publicidad en los que una pareja bus có asegurar que su siguiente niño pudiera proporcionar un trasplante compatible para salvar la vida de un niño enfermo. Los casos actuales in cluyen un trasplante de células madre de sangre del cordón. Esto no perjudicaria al niño (seria diferente si se propusiera donar un riñón). A menudo se sugiere que estos casos son el inicio de una pendiente en deslizamien to que conducirá inevitablemente a demandas para especificación más ex tensa del genotipo del niño -com o lo resume la frase “diseñador de niños” . Esto es erróneo. Seleccionar para fines de compatibilidad HLA significa ele gir sólo uno de cada cuatro embriones. Casi todos los procedimientos de fecundación in vitro (F1V) producen sólo un puñado de embriones y por lo

general se implantan dos a tres para maximizar la posibilidad de éxito. La selección en múltiples criterios no es consistente con contar con suficien tes embriones para implantar. De manera más general, la naturaleza dotó a la humanidad de un método simple y muy aceptable de hacer niños, algo muy eficaz para la gran mayoria de las parejas, y es difícil imaginar que la mayor parte de las personas lo abandone en favor de un procedimiento len to y prolongado, desagradable e invasivo que cuesta una fortuna y tiene una tasa de éxito baja. El mejoramiento genético es un problema difícil o así será una vez que se tenga alguna idea de los genes mejorables. Por una parte, se presupone que los padres hacen todo lo que pueden para proporcionar a sus niños un buen inicio en la vida; por la otra, las opciones disponibles sólo para los in dividuos ricos se consideran como la compra de una ventaja injusta, cuando menos en Gran Bretaña. Tal vez, por fortuna, aún parece lejano el momento de identificar los genes adecuados, incluso si se dispusiera de las técnicas. Los intentos para producir animales mejorados en sentido gené tico no han sido un éxito y en algunos casos se han observado fracasos espectaculares (véase Gordon, 1999). A largo plazo, las posibilidades de ben ser Inmensas y con toda seguridad habrá muchos problemas éticos di fíciles de afrontar. Un signo de que las personas aún no piensan en forma realista sobre ello es que siempre colocan a la inteligencia en la parte su perior de su lista de atributos deseables: ¿estas personas nunca han com parado los estilos de vida de los profesores y los jugadores de fútbol?

A ) P ro to c o lo s p o r e n fe rm e d a d

■ i C á n c e r (n = 4 0 3 ), 6 3 .4 % IM E n fe rm e d a d e s m o n o g é n ic a s (n = 78), 1 2 .3 % f I I l ü E 3 I I

E n fe rm e d a d e s in fe c c io s a s (n = 41), 6 .4 % E n fe rm e d a d e s v a s c u la re s (n = 51), 8 .0 % O tra s e n fe rm e d a d e s (n = 12), 1 .9 % M a rc a d o g é n ic o (n = 49 ), 7 .7 % V o lu n tario s sa n o s (n = 2), 0 .3 %

B) P ro to c o lo s p o r v e c to r

■ E l □ □ □ □ im g g 1 1

R e tro v iru s (n = 21 7), 34.1 % A d e n o v iru s (n = 1 7 1 ), 2 6 .9 % L ip o fe c c ió n (n = 77), 12.1 % D N A d e s n u d o /p lá s m id o (n = 70 ), 1 1 .0 % V irus p o x (n = 39), 6.1 % V irus a d e n o rre la c io n a d o s (n = 15), 2 .4 % R N A d e tra n s fe re n c ia (n = 6), 0 .9 % V irus del h e rp e s s im p le (n = 5), 0 .8 % O tro s (n = 11), 1 .7 % N /C (n = 25), 3 .9 %

Fig. 21-5. Estudios clínicos de terapéutica gènica. A) Distribución por enfermedad. B) Distribución por vector. Las figuras incluyen todos los protocolos aprobados para estudios clínicos terminados, e n . curso o pendientes, incluidos en la lista de diciembre del 2002. Reproducido con autorización a partir de www.wiley.co.uk/genetherapy/clinical.

21.5 | MÉTODOS PARA INSERTAR Y EXPRESAR UN GEN EN UNA CÉLULA O TEJIDO BLANCO

623

Gen X clonado

Fig. 21-6. Terapéutica génica in vivo y ex vivo. Siempre que es posible, se extraen células del paciente, se modifican en el laboratorio y se devuelven al enfermo (terapéutica génica ex vivo; flechas verdes). Esto permite tratar sólo las células apropiadas y pueden revisarse estas últimas antes de restituirse para comprobar que se logró el cambio deseado. En muchos tejidos no es posible y es necesario modificar las células dentro del cuerpo del paciente (terapéutica génica in vivo\ flecha azul).

sólo células en división puede resultar una ventaja en el tratamiento del cáncer. Las células cancerosas que se dividen de manera activa en un te jido que habitualmente no se divide, como el cerebral, pueden infec tarse en forma selectiva y destruirse sin un riesgo mayor para las células normales. Dada la capacidad de los retrovirus nativos para transformar cé lulas, es crucial tratar mediante ingeniería los vectores de la tera péutica génica de tal manera que se elimine esta posibilidad. Se ha puesto un gran ingenio en el diseño de sistemas que pueden pro ducir sólo virus incapacitados de manera permanente. En condicio nes normales, los retrovirus tienen tres unidades de transcripción, gag, p o ly env y un elemento psi RNA de acción cis reconocido por proteínas virales que empacan el RNA en partículas infecciosas. En el vector se reemplazan gag, p o l y en v por el gen terapéutico, con una capacidad máxima de clonación de 8 kb. Este vector se empa ca en una célula especial que puede contribuir a las funciones gag, p o l y env necesarias, pero que no contiene un genoma retroviral in tacto (fig. 21-7). Los retrovirus son muy eficientes para transferir DNA al inte rior de las células y en casi todos los estudios clínicos iniciales de terapéutica génica se usaron vectores retrovirales. Sin embargo, la preocupación cada vez mayor sobre el riesgo de mutagénesis insercional ha desplazando el énfasis principal hacia vectores no inte grantes.

Vectores adenovirales Los adenovirus son virus DNA que causan infecciones benignas de las vías respiratorias superiores en seres humanos. Pueden

producirse en títulos altos (mucho mayores que los retrovirus) y transducirse de forma eficiente a células en división y las que no se dividen. El genoma lineal del DNA de doble cadena perma nece sin integrarse como un episoma dentro del núcleo celular. Como se explicó, esto tiene ventajas en la seguridad y desventa jas en la expresión obtenida a corto plazo. Al igual que en los vectores retrovirales, los adenovirales están incapacitados y sólo confían en el empacamiento celular para proporcionar funciones vitales. El genoma de adenovirus es relativamente grande y los diferentes vectores tienen secciones variables de deleción del ge noma (Yeh y Perricaudet, 1997). Todos los vectores “sin intesti no” eliminaron genes virales y pueden acomodar hasta 35 kb de DNA terapéutico. El gran problema con los vectores adenovirales es su inmunogenicidad (Kafri y cois., 1998). Aunque se ha administrado con se guridad una vacuna viva de adenovirus de replicación competente a varios millones de reclutas del ejército estadounidense durante varias décadas (para protección contra infecciones adenovirales na turales), en varios estudios clínicos de terapéutica génica constitu yeron un problema las reacciones inmunitarias indeseables. Jesse Gelsinger murió en septiembre de 1999, dos días después de reci bir 6 X 1013 partículas adenovirales recombinantes por inyección intrahepática en un estudio clínico de fase I de terapéutica génica para deficiencia de transcarbamilasa de ornitina. Los pacientes en otros estudios clínicos sufrieron reacciones inflamatorias menores pero de consideración. Más aún, debido a que estos vectores no se integran, la expresión génica es de corto término. Los adenovirus recombinantes de primera generación empleados en estudios clí nicos de terapéutica génica de fibrosis quística mostraron que la

624

CAPÍTULO VEINTIUNO

NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

A) G e n o m a retroviral

5 'h

gag

V

B) G e n o m a d e l v e c to r

pol

5 ' |--------- — li------------------ P

env

" I -------- 1 3 ' G en te ra p é u tic o

V

C ) C é lu la d e e m p a c a m ie n to M

G e n o m a s d e l v e c to r

P ro teín as g a g /p o l

A ^ A ^ N ú c le o

P ro te ín a s en v

m

Fig. 21-7. Preparación y empacamiento de un vector retroviral de terapéutica génica. Se eliminan los genes gag, pol y env del genoma retroviral y se reemplazan por el gen terapéutico. Se conserva la secuencia psi; ésta la reconocen pro teínas virales para ensamble de RNA en una partícula viral. Las células empacadas proporcionan las funciones de gag, pol y env, pero los genes se en cuentran en moléculas separadas y no hay secuencia psi. Esto se lleva a cabo para reducir al mínimo el riesgo de producir virus de replicación competentes. Los genomas virales recombinantes se empacan en partículas virales infecciosas, pero de replicación deficiente, que brotan de la célula y se recuperan del sobrenadante. Reimpreso con autorización de Somia y Verma (2000), Nature Review Genetics, © 2000 Macmillan Magazines Ltd.

expresión transgénica declinó después de unas dos semanas y fue insignificante alrededor de cuatro semanas después. Sería necesa rio repetir la administración para sostener la expresión, que sólo podría exacerbar la reacción inmunitaria. Es posible que los vecto res adenovirales encuentren su principal aplicación en los casos en que se requiere un valor alto de expresión pero transitorio, por ejemplo para destruir células cancerosas.

Virus vectores adenorrelacionados Los virus adenorrelacionados (AAV) son virus DNA de cadena úni ca no patógenos que dependen de la coinfección por un virus cola

borador adeno o herpes para replicarse. El AAV humano no modi ficado se integra en el DNA cromosómico en un sitio específico en 19ql3.3-qter. Ésta es una propiedad muy conveniente que propor ciona la ventaja de expresión a largo plazo sin el riesgo de mutagénesis insercional que es un gran problema con los retrovirus. Infortunadamente, la especificidad de integración la proporciona la proteína viral rep y el gen rep se elimina en los vectores utilizados para transferencia génica. Como en otros sistemas, las funciones necesarias para producir partículas virales (incluido rep) las sumi nistra una célula de empacamiento. Se ha observado deleción del 96% del genoma de AAV en vectores basados en AAV. Esto propor ciona un grado elevado de seguridad porque los vectores recombi-

21.5

MÉTODOS PARA INSERTAR Y EXPRESAR UN GEN EN UNA CÉLUIA O TEJIDO BIANCO | 625

nantes no contienen genes virales. Sin embargo, el genoma AAV es muy pequeño e incluso estos vectores con deleciones muy altas só lo pueden incluir insertos hasta de 4.5 kb.

Lentivirus Son retrovirus especializados que tienen el útil atributo de infec tar células que no se dividen (Vigna y Naldini, 2000). Al igual que otros retrovirus, se integran en los cromosomas del huésped en forma aleatoria y permiten la posibilidad de expresión génica a largo plazo pero con todas las implicaciones de seguridad que conlleva la integración. El HIV humano es la base de la mayor parte de los vectores lentivirales y, de manera comprensible, cau sa nerviosismo por el riesgo de generar de manera inadvertida la replicación del virus competente. El genoma de HIV es más com plejo que el gag, p o ly env de los retrovirus estándar (véase fig. 2113) y se dedicó mucho trabajo a eliminar genes innecesarios y generar líneas de empacamiento en tanto se conserva la capacidad de infectar células que no se dividen. Los vectores que se autoinactivan proporcionan un elemento adicional de seguridad (Miyoshi y cois., 1998).

Virus del herpes simple como vectores Los vectores HSV son trópicos para el sistema nervioso central (SNC). Son virus complejos con un genoma de DNA de doble ca dena de 152 kb que contiene cuando menos 80 genes. Pueden es tablecer infecciones latentes durante toda la vida en ganglios sensoriales en los que existen como elementos extracromosómicos no integrados. Podría aprovecharse el mecanismo de latencia para

A)

permitir la expresión a largo plazo de los genes transferidos, que se diseminarían por fortuna a través de una red sináptica. Sus princi pales aplicaciones serían el aporte de genes al interior de neuronas para el tratamiento de enfermedades como la de Parkinson y tumo res del sistema nervioso central. La capacidad del inserto es cuando menos de 30 kb. Los vectores prácticos se encuentran aún en una etapa inicial de desarrollo (Fink y Glorioso, 1997).

21.5.4 Los sistemas vectores no virales evitan muchos de los problemas de inseguridad de los virus recombinantes, pero las tasas de transferencia génica son casi siempre bajas En el laboratorio es relativamente fácil llevar DNA extraño al inte rior de las células y algunos de los métodos tienen posibilidades en terapia génica si se demuestra que no es posible resolver los proble mas de seguridad de los sistemas virales. Sin embargo, en la actua lidad todos adolecen de una tasa baja de transferencia génica y duración de la expresión corta.

Liposomas Los liposomas son vesículas sintéticas que se forman de manera es pontánea cuando se mezclan ciertos lípidos en solución acuosa. Por ejemplo, los fosfolípidos pueden formar vesículas de doble capa que simulan la estructura de membranas biológicas, con los grupos fos fato hidrofílicos en la parte exterior y las colas lipídicas hidrofóbicas en la interior. El DNA por transferir se empaca in vitro con los lipo somas y se utilizan de modo directo para transferencia génica a un tejido blanco in vivo (fig. 21-8). Los liposomas catiónicos tienen

Lípido A gua

C) T ran sferir

C élu la b la n co

N ú cleo

Fig. 21-8. Uso de liposomas para el aporte de genes in vivo. A) Los liposomas son vesículas sintéticas que se forman de manera espontánea en solución acuosa cuando se mezclan ciertos lípidos. Pueden llevar una carga de superficie positiva (catiónica) o negativa (aniónica), según sea la química de los lípidos utilizados. B) Se transporta el cargamento de DNA dentro de liposomas aniónicos o se une a la superficie de liposomas catiónicos. C) El transporte de DNA ocurre cuando se fusiona un liposoma con la membrana plasmática de una célula.

626 I CAPÍTULO VEINTIUNO ! NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

una carga de superficie positiva y enlazan DNA en el exterior; los liposomas amónicos poseen una carga de superficie negativa y se for man con el DNA en el interior. La cubierta lipídica permite que sobreviva el DNA in vivo, se enlace a células y se endocite en el in terior de éstas. Los liposomas catiónicos son los empleados más a menudo en experimentos de transferencia génica (véase Huang y Li, 1997, para referencias). A diferencia de los vectores virales, es fácil preparar los complejos de DNA y lípido y no hay límite en cuanto al tamaño del DNA que se transfiere. Sin embargo, la eficiencia de transferencia génica es baja y el DNA introducido no está diseñado para integrarse en el DNA cromosómico. Como resultado, cual quier expresión de los genes insertados es transitoria.

Inyección directa o bombardeo de partículas En algunos casos es posible inyectar de manera directa DNA con una jeringa y aguja dentro de un tejido blanco, como el músculo. Por ejemplo, este método se consideró para la distrofia muscular de Duchenne. En los estudios iniciales se investigó la inyección intra muscular de un gen de distrofina en un modelo de ratón, mdx (Acsadi y cois., 1991). Debido al enorme tamaño del gen de distrofina natural, se usó un minigén que comprendía el cDNA de la distro fina ajustado con secuencias reguladoras para asegurar una expre sión de alto nivel, como un promotor viral potente. En un método alternativo de inyección directa se utilizan técnicas de bombardeo de partículas (biolística o “pistola de genes”): se recubren con DNA pelotitas de metal y se disparan con una pistola especial dentro de las células. Con este método simple y seguro en términos compa rativos, se tuvo éxito en la transferencia génica a varios tejidos dife rentes. Sin embargo, con cualquiera de estos métodos de inyección

directa es muy mala la eficiencia de la transferencia génica y no se integra de forma estable el DNA inyectado. Esto puede implicar menos problemas en tejidos como el músculo, que no prolifera con regularidad y en el cual puede continuar la expresión del DNA in yectado durante varios meses.

Endocitosis mediada por receptor En este método se acopla el DNA por transferir a una molécula blanco que puede enlazarse a un receptor de superficie celular espe cífico, lo cual induce endocitosis y transferencia del DNA al interior de la célula. Por ejemplo, los hepatocitos depuran asialoglucoproteínas del suero mediante receptores en su superficie celular. Una asialoglucoproteína que se enlaza de manera covalente a polilisina enlaza de modo reversible DNA por una interacción electros tática entre la polilisina de carga positiva y el DNA de carga negativa. Si se administra el complejo en el hígado por infusión a través de las vías biliares o del lecho vascular, los hepatocitos lo captan de forma selectiva. En un método más general se utiliza el receptor de transferrina que se expresa en muchos tipos de célu las, pero es relativamente abundante en células en proliferación y hematopoyéticas (fig. 21-9). En condiciones normales, las sustancias que se internalizan en esta forma se llevan a lisosomas y es necesario proporcionar cierto mecanismo de escape para que el DNA llegue al núcleo celular. Una posibilidad es transferir de manera concurrente adenovirus o proteínas de éstos, que alteran de modo específico el endosoma temprano y permiten que escape el contenido. La eficiencia de la transferencia génica puede ser alta, pero el método no está diseña do para permitir la integración de los genes transferidos.

Fig. 21-9. Transferencia génica a través de endocitosis mediada por receptor. Después de enlazar el ligando, se invagina la membrana plasmática y a continuación se pellizca, con lo cual deja el complejo de receptor-ligando en una vesícula intracelular, el endosoma. El ligando podría ser un adenovirus que lleva un gen terapéutico, como se muestra en este caso, o DNA terapéutico enlazado a alguna otra molécula para la que la célula blanco posee un receptor específico. En condiciones normales, los endosomas se dirigen a lisoso mas para degradación. Para expresarse, el DNA extraño debe escapar de alguna manera del endosoma, antes que suceda lo anterior, y llegar al núcleo. Los adenovirus alteran de manera específica los endosomas y permiten un escape eficiente.

21.6

21.6

MÉTODOS PARA REPARAR O INACTIVAR UN GEN PATÓGENO EN UNA CÉLULA O TEJIDO

Métodos para re p arar o in activar un gen patógeno en una célula o tejido

Los métodos que se describieron en la última sección tienen co mo fin, de una manera u otra, insertar un gen deseado dentro de una célula o tejido blanco y hacer que se exprese a un nivel y por algún tiempo apropiados para el problema clínico particular. No obstante, algunos problemas requieren una conducta diferente. Los padecimientos originados por ganancia d e fu n ció n de un gen (sección 16.5) o un efecto dom inante negativo (sección 16.4.3) no se benefician de esta forma de tratamiento. Si el problema es un gen residente que actúa de un modo perjudicial, la única solución es eliminar o inactivar el gen agresor. Los ejemplos típicos son pa decimientos mendelianos dominantes (además de los secundarios a haploinsuficiencia, sección 16.4.2), oncogenes activados en célu las cancerosas y reacciones inmunitarias inapropiadas en enferme dades autoinmunitarias. También sería factible tratar enfermedades infecciosas al inhibir un gen o un producto génico específico del patógeno. Para lograr lo anterior se intentan varias medidas. Puede des truirse el gen agresor o prevenir su expresión mediante disminución de la transcripción, destrucción del transcrito o inhibición del pro ducto proteínico. Cualquiera que sea el método empleado, debe lle varse al interior de la célula blanco alguna clase de agente o vector y hacer que funcione ahí. A este respecto, los problemas del aporte y expresión eficientes son similares a los descritos en la sección ante rior. En afecciones dominantes u oncogenes activados existe el pro blema adicional de diseñar un agente que ataque de manera selectiva el alelo mutante sin afectar el alelo normal. Esta área se considera la segunda onda de la terapéutica génica. Los estudios actuales a este respecto se dirigen a demostrar el principio siguiente: es probable que los tratamientos prácticos sólo se desarrollen una vez que se ob serve que funcionan de modo satisfactorio las terapéuticas de au mento de genes.

21.6.1 Reparación de un alelo mutante mediante recombinación homologa En muchas técnicas de ingeniería genética estándar en organismos inferiores se utiliza la recombinación homologa para reemplazar una secuencia por otra, de tal manera que es natural considerar su uso para reparar un gen mutante patógeno. En la recombinación homologa de fragmento pequeño se usa uno de los métodos están dar para llevar un dúplex de DNA de 400 a 800 pb, que contiene la secuencia de tipo silvestre dentro de la célula blanco (Goncz y cois., 2001). Se han publicado pruebas del principio, pero ha resul tado difícil lograrlo con la eficiencia suficiente para que sea útil des de el punto de vista terapéutico.

21.6.2 Inhibición de la traducción mediante oligonucleótidos antisentido Los oligonucleótidos antisentido (de manera característica de 12 a 30 nucleótidos de largo) pueden inhibir la traducción de mRNA

62^

complementario mediante la formación de un dsRNA o una hé lice doble de DNA-RNA (Galderisi y cois., 1999). En algunos or ganismos, como el nematodo C. elegans, se convierte con eficiencia el dsRNA en moléculas de RNA de interferencia pequeñas (siRNA), que inactivan transcritos homólogos por el mecanismo mal comprendido pero muy eficiente de iRNA (véase más adelante). En los seres humanos no sucede al parecer lo anterior. Las célu las humanas no tienen, o en escasa medida, la enzima Dicer ne cesaria para elaborar siRNA. En lugar de ello, el dsRNA o el DNA-RNA se descomponen mediante RNA-asa de H. Esta en zima degrada el RNA pero no la cadena de DNA de un dúplex RNA-DNA, lo cual permite en consecuencia que las moléculas de DNA antisentido se comporten en forma semicatalítica. La molécula antisentido suele modificarse de forma química para tornarla más resistente a nucleasas celulares. Enlaces fosforotioato sustituyen enlaces fosfodiéster o se emplean ácidos nucleicos péptidos cuando se reemplaza la totalidad de la estructura básica de azúcar fosfato con un marco estructural péptido sintético re sistente a la nucleasa. Esto conlleva la desventaja de toxicidad inespecífica y asimismo el vector antisentido debe sintetizarse en forma química y exógena, en tanto que los oligos antisentido no modificados pueden producirse en el interior de la célula de un plásmido apropiado. Los oligos antisentido tienen efectos bas tante impredecibles. En algunos casos se silencia con eficiencia y de manera específica el gen blanco, pero con frecuencia hay po co efecto o acciones inespecíficas. Los dsRNA mayores de unos 30 pb de largo suelen inducir la producción de interferón, que conduce a una supresión general de la traducción. En 1998, el primer medicamento antisentido que llegó al mercado fue el vivatreno, un DNA modificado por fosforotioato para el trata miento de infecciones por citomegalovirus en pacientes con sida.

21.6.3 Destrucción o reparación selectiva de mRNA por una ribozima En el transcurso de los años se descubrió un número cada vez mayor de casos en que las moléculas de RNA funcionan como enzimas (nbozimas, véase Doudna y Cech, 2002). Por ejemplo, participan RNA catalíticos en telomerasas (que actúan en el DNA), en el empalme intrón-exón (por acción en el RNA) y como la transferasa de peptidilo de ribosomas (actúa en polipéptidos). Las moléculas de RNA tienen muchas propiedades que las tornan aptas para actuar como enzimas. Forman una diversidad de estructuras tridimensionales por virtud de las cuales pueden enlazarse de forma específica a DNA, RNA o mo léculas proteínicas y tienen muchos grupos hidroxilo y amino poten cialmente reactivos. Los terapeutas génicos se interesan sobre todo en las ribozimas que cortan RNA blanco en una forma específica de secuencia. En la naturaleza, los RNA de autocorte generan cadenas de la longitud del genoma mediante el corte específico de sitio de concatámeros en vi rus RNA que se replican mediante un mecanismo circular en enro llamiento. Los ejemplos naturales incluyen las ribozimas en cabeza de martillo (40 nt), horquilla (70 nt), HDV (virus delta humano, 90 nt y VS (satélite Varkud; 160 nt) (Doudna y Cech, 2002). Las ribozi mas en cabeza de martillo pueden convertirse mediante ingeniería genética en enzimas de corte trans muy versátiles, cuya secuencia de

628

CAPÍTULO VEINTIUNO

NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

RNA blanco puede especificarse al ajustar la ribozima en secuen cias complementarias (fig. 21-10). Tal y como ocurre con los oligonucleótidos antisentido (véase antes), la ribozima puede tornarse resistente a nucleasas en la célula mediante modificación química, pero a continuación debe suministrarse de modo exógeno en lugar de producirse por transcripción natural dentro de una célula blan co transfectada. Los primeros estudios clínicos de fase I de ribozimas se iniciaron en 1998 y se encuentran en curso estudios clínicos de fase II en los que se utilizan ribozimas dirigidas al mRNA del re ceptor VEGF para inhibir la angiogénesis en tumores de mama y colorrectales (Sullenger y Gilboa, 2002). Debido a que la especificidad de las secuencias de las ribozimas está controlada por pareamientos de bases que se comprenden bien, pueden diseñarse con facilidad para degradar de manera específica un mRNA mutante en una enfermedad dominante, en tanto dejan intacto el transcrito de tipo silvestre. De manera más ambiciosa, se diseñaron ribozimas para reparar transcritos mutantes mediante reacciones de transempalme en las que se corta una secuencia mutanre predeterminada del mRNA y se reemplaza por la secuencia de tipo silvestre (Sullenger y Gilboa, 2002). Se ha demostrado que to das estas ideas actúan en sistemas experimentales, pero aún es ne cesario determinar si pueden desarrollarse terapéuticas prácticas.

21.6.4 Inhibición selectiva del alelo mutante mediante interferencia por RNA (iRNA) Ésta es la técnica que ha suscitado mayor atención en la actualidad. Como se describe en la sección 20.2.6, es posible inhibir de mane ra específica y muy eficiente la expresión génica en una gran varie dad de organismos mediante RNA de interferencia pequeños (siRNA). Son RNA de doble cadena de 21 a 23 nt con terminales 5’ fosforiladas y extremos salientes 3' 2-nt. En muchos organismos se cortan con eficiencia dsRNA más largos en siRNA mediante la enzima Dicer. Esto no actúa en células humanas, pero es posible

5 '---------- X XX XX XX X XX X iG U C l x x x x x x x x x x x x

3' YYYYYYYYYYYCA qc

- AAAAAAAA 3'

YYYYYYYYYYYY 5' .gV

ga

A* U Gu

G 'C G *C A G GU

Componente catalítico

Fig. 21-10. Empleo de una ribozima en cabeza de martillo de corte trans para destruir un mRNA mutante. Las ribozimas en cabeza de martillo naturales son autocortantes. Para los propósitos de la terapéutica génica, se separa la cadena que con tiene el sitio por cortar (blanco) de la cadena catalítica (la ribozima por ingeniería). Al diseñar la ribozima con la secuencia (YYYY..) comple mentaria del blanco (XXXX...) es posible dirigirse de modo específico a cualquier RNA deseado.

generar siRNA en estas últimas mediante la transcripción de vecto res de DNA adecuados. Se diseñan los transcritos de tal manera que puedan retroceder para formar horquillas en asa con vástago. El vastago es de 19 a 29 pb y está diseñado para ajustarse al blanco y el asa es de 6 a 9 nt. En la actualidad, el iRNA es un medio de la boratorio muy eficiente para crear fenotipos con pérdida de fun ción. Menos claro es si resulta factible desarrollarlo para un medio práctico de tratamiento, aunque la posibilidad es estimulante.

21.7

Algunos ejem plos de intentos de te ra p é u tic a génica hum ana

En la figura 21-5^4 se muestran los 600 protocolos de terapéutica gé nica aprobados, 63% para el cáncer y sólo 12% para trastornos monogénicos. Otro 6 % corresponde a enfermedades infecciosas y 8 % a padecimientos vasculares. A continuación se proporcionan revisio nes generales breves y algunas referencias sobre el progreso de la te rapéutica génica en varias áreas importantes. A pesar del limitado número de estudios clínicos, las enfermedades monogénicas siempre ocupan un sitio primordial en la agenda de la terapéutica génica y el primer éxito definitivo se logró en esa área.

21.7.1 El primer éxito definitivo: curación d.e la inmunodeficiencia combinada grave ligada a X Desde la década de 1990, muchas publicaciones notificaron el in tento exitoso para tratar la inmunodeficiencia combinada grave (IDCG) autosómica recesiva. Se transfectaron ex vivo linfocitos T de un niño afectado con deficiencia de desaminasa de adenosina con un vector retroviral que contenía un gen ADA funcional, se expandieron en cultivo y se restituyeron al paciente. Más adelan te, otros enfermos recibieron un tratamiento similar, hasta con 10 a 12 terapéuticas por individuo. Varios sujetos refirieron mejorías clínicas notables. Sin embargo, ninguno de los pacientes dejó de recibir tratamiento con un preparado enzimàtico, lo que determi nó que sea incierta la magnitud de la mejoría atribuida a la tera péutica génica. El primer éxito indudable se consiguió en un padecimiento relacionado, IDCG ligada a X (Cavazzana-Calvo y cois., 2000; véase fig. 21-11). Una vez más, el tratamiento fue ex vivo con el uso de un vector retroviral que codificaba la cadena 7 c del gen re ceptor de citocina IL2R. Se incubaron durante tres días células de médula ósea que expresaban CD34, un marcador de células ma dre hematopoyéticas, con el vector retroviral, con lo cual aumen tó en este lapso cinco a ocho veces de número y a continuación se regresaron al paciente (fig. 21-11). Nueve de los 11 enfermos tratados se curaron y pudieron llevar una vida normal (HaceinBey-Abini y cois., 2002). No obstante, como se mencionó, dos de ellos desarrollaron después leucemia, casi con certeza como resul tado de la activación insercional del oncogén LM 02 (Check, 2002, 2003). Se suspendieron en poco tiempo a nivel mundial todos los estudios clínicos que incluían transducción retroviral de grandes fondos comunes de linfocitos, mientras no se compren dieran del todo estos acontecimientos trágicos; al momento de es-

21.7

ALGUNOS EJEMPLOS DE INTENTOS DE TERAPÉUTICA GÉNICA HUMANA

C é lu la s m a d re C D 3 4 + e n riq u e c id a s m e d ia n te a n tic u e rp o co n c u e n ta s m a g n é tic a s

A s p ira c ió n d e 3 0 -1 5 0 mi d e m é d u la ó s e a b a jo a n e s te s ia g e n eral

Infusión d e 1 4 -3 8 m illo n e s d e cé lu la s p o r kg d e p e so co rp o ral

629

V e c to r retroviral q u e lle va el g en re c e p to r d e c ito c in a yc

T ra n s d u c ir cé lu la s en b o ls a d e p lá stic o d u ra n te tre s días; las cé lu la s se m u ltip lic an c in co a o c h o v e ce s.

Fig. 21-11. Terapéutica génica de la enfermedad por inmunodeficiencia combinada grave ligada a X (IDCG-X). Éste es el primer éxito claro de la terapéutica génica. De 11 niños de uno a 11 meses de edad que se trataron en el Necker-Enfants Malades Hospital, París, nueve se curaron. Véase Hacein-Bey-Abini y colaboradores (2002). Infortunadamente, dos de los nueve desarrollaron con posterioridad una for ma de leucemia, casi con seguridad como resultado de la activación del oncogen LM02 por la inserción cercana del vector retroviral.

cribir este libro, aún no es posible precisar cuántos de ellos se su perarán alguna vez.

21.7.2 Intentos de terapéutica génica para la fibrosis quística Entre las enfermedades mendelianas, la fibrosis quística debería ser una de las más susceptibles a la terapéutica génica. El problema se debe a la falta del canal de cloruro codificado por CFTR, sobre to do en el epitelio de las vías respiratorias. Estudios de pacientes con alelos CFRT parcialmente activos sugieren que sería suficiente 5 a 10% de la cantidad normal para producir una buena respuesta clí nica. Esto evitaría cuando menos la progresión de la enfermedad y revertiría algunos efectos secundarios. El aporte génico específico de tejido podría llevarse a cabo mediante un inhalador en aerosol. Se han publicado cuando menos 18 estudios clínicos de terapéuti ca génica para fibrosis quística (FQ) (Davies y cois., 2001). En los estudios clínicos iniciales se usaron adenovirus, que infectan de ma nera natural células pulmonares que no se dividen. A dosis altas, es tos virus indujeron en ocasiones reacciones inflamatorias y, en

especial después de la muerte de Jesse Gelsinger consecutiva a ade novirus (véase antes), en la actualidad se consideran con cierta cau tela. En cuatro de los cinco estudios clínicos más recientes se emplearon liposomas o virus adenorrelacionados (AAV). Varios es tudios clínicos demostraron transferencia génica y expresión por tiempo breve, pero es claro que todos estos estudios se encuentran bastante lejos de la posibilidad de aplicación clínica. Un problema de consideración es la barrera física de moco y glucocálix que cubre las células epiteliales de las vías respiratorias, en particular en los pulmones infectados de pacientes con fibrosis quística. Pueden llevarse agentes de terapéutica génica al interior de las vías respiratorias, pero se necesitan vehículos más complicados para permitir la transducción eficiente de células epiteliales. Asi mismo, un problema es la transfección de las células correctas. Los adenovirus tienden a infectar células basales del epitelio, en tanto que los grados más altos de expresión natural de CFTR se observan en glándulas submucosas. Como ideal, deben enviarse células ma dre porque las células epiteliales de superficie tienen un periodo de vida de sólo 120 días, de tal manera que sería necesario repetir la administración repetida con todos los problemas consiguientes de la reacción inmunitaria.

630

CAPÍTULO VEINTIUNO i NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

21.7.3 Intentos de terapéutica génica para la distrofia muscular de Ouchenne Estudios de mujeres portadoras de la distrofia muscular de Duchenne (DMD) y pacientes con la distrofia muscular de Becker, menos grave, mostraron que en enfermos con DMD sería benéfico restituir alrededor de 20% de la expresión normal del gen de la distrofina. Sin embargo, la terapéutica génica para DMD afronta el doble problema del enorme tamaño del gen de la distrofina (2.4 Mb) y de llevarlo a las células de los músculos esquelético y cardiaco. Véase Chamberlain (2002) para una revisión del progreso. Incluso el cDNA es muy gran de, de 14 kb, para muchos vectores. Con base en la observación de un sujeto que experimentó una deleción de los exones 17 a 48 del gen de la distrofina (46% de la secuencia de codificación), pero que sólo sufría distrofia de Becker leve, se preparó un minigen de 6.3 kb que pudo ajustarse en vectores adenovirales y retrovirales. Es impor tante no desencadenar reacciones inmunitarias de mediación celular; el uso de un promotor específico de músculo para llevar el transgen ayuda a minimizar este problema. Los virus adenorrelacionados mos traron una buena persistencia en el músculo, cuando menos en rato

nes sanos, y también los plásmidos son vehículos prometedores. Pa ra el éxito del tratamiento es preciso llevar los vectores no sólo al in terior del músculo esquelético, sino también al corazón y el diafragma y hasta la fecha aún no se resuelve este problema. Un mé todo alternativo consiste en incrementar la expresión de utrofina (MIM 128240), una molécula parecida a la distrofina que en condi ciones normales enlaza el complejo de actomiosina a la membrana de la célula muscular justo en la unión neuromuscular. Un locus autosómico separado codifica la utrofina y permanece intacto en niños con distrofia muscular de Duchenne. También se intentó en la DMD la terapéutica celular median te el trasplante de mioblastos en músculos de niños afectados. En algunos estudios el paciente ocasional mostró ciertas fibras muscu lares positivas a distrofina, pero en ningún enfermo se observó me joría clínica. Se afirma que las células madre administradas mediante trasplante de médula ósea pueden ser capaces de migrar a los mús culos y actuar como células madre musculares (Ferrari y cois., 1998). Si se confirma, ello ofrece una esperanza real de tratamiento de la DMD mediante los métodos que curaron la inmunodeficiencia combinada grave.

Cuadro 2 1 -3 . Ejemplos de estudios clínicos de terapéutica génica para el cáncer Se trata sobre todo de estudios de fase 1 (seguridad básica); en esta etapa del desarrollo, casi ninguno de los estudios clínicos tiene como fin beneficiar en términos clínicos a los pacientes. Véase la base de datos de estudios clínicos de los NIH (www4.od.nih.gov/oba/rac/clinicaltrial.htm) para un examen amplio.

Trastorno

Células alteradas

Medidas de terapéutica génica

Cáncer de ovario

Células tumorales

Inyección intraperitoneal de retrovirus o adenovirus que codifican p53 de longitud completa o cDNA de BRCA1, con la esperanza de restablecer el control del ciclo celular

Cáncer de ovario

Células tumorales

Inyección de adenovirus que codifica un anticuerpo scFv a ErbB2; se espera inactivar una señal de crecimiento

Melanoma maligno

Linfocitos que infiltran el tumor

Extraer LIT del tumor extirpado y expandirlos en cultivo; infectar los LIT ex vivo con un vector retroviral que expresa el factor de necrosis tumofal a e introducirlos en el paciente. Se espera que los LIT se dirijan a las células tumorales restantes y el TNF a las destruya. Véase la figura 21- 4 f para el principio

Diversos tumores

Células tumorales

Transfectar células tumorales con un retrovirus que expresa un antígeno de superficie celular, por ejemplo HLA-B7, o una citocina, como IL-12, IL-4, GM-CSF o IFN -y. Se espera que esto incremente la inmunogenicidad del tumor, de tal manera que lo destruya el sistema inmunitario del huésped. Con frecuencia se efectúa ex vivo mediante células tumorales radiadas en proporción letal. Véase la figura 21- 4 f para el principio

Cáncer de próstata

Células dendríticas

Tratar células dendríticas autólogas con un antígeno tumoral o cDNA que expresa el antígeno para cebarlas e inducir una mejor reacción inmunitaria a las células tumorales. Véase la figura 21-4 f para el principio

Glioma maligno (tumor cerebral)

Células tumorales

Inyectar un retrovirus que expresa cínasa de timidina (TK) o desaminasa de citosina (CDA) en el tumor. Sólo se infectan las células tumorales en división, no las células cerebrales circundantes que no se dividen. A continuación, tratar con ganciclovir (las células positivas a TK lo convierten en fosfato de gcv tóxico) o 5-fluorocitosina (las células positivas a CDA lo convierten en 5-fluoruracilo). Se destruyen de forma selectiva células infectadas con virus (en división). Véase la figura 21-12

Tumores de cabeza y cuello

Células tumorales

Inyección de adenovirus 0NYX-015 mediante ingeniería en el tumor. El virus sólo puede replicarse en células con deficiencia de p53, de tal manera que lisa de manera selectiva células tumorales. Este tratamiento fue eficaz cuando se combinó con quimioterapia sistémica.

LIT, M ocitos infiltrantes de tumor; TNF, factor de necrosis tumoral; IL, interleucína; GM-CSF, factor estimulante de granulocitos y macrófagos; IFN, interferón.

21,7 ¡ ALGUNOS EJEMPLOS DE INTENTOS DE TERAPÉUTICA GÉN1CA HUMANA ! 631

21.7.4 Terapéutica génica para el cáncer Más de 60% de todos los protocolos de estudios clínicos de tera péutica génica aprobados se enfoca en el cáncer (fig. 21-5). En el cuadro 21-3 se incluye una lista de varios ejemplos, que se eligie ron para ilustrar la gama de métodos. Pueden mencionarse los si guientes: ► Suplementación génica para restaurar la función de genes supresores de tumor. ► Inactivación génica para prevenir la expresión de un oncogen activado. ► Manipulación genética de células tumorales para desencadenar apoptosis.

Im plantación estereo táctica guiada por resonancia de células productoras d e vector (CPV) en tum ores del S N C in situ

► Modificación de células tumorales para tornarlas más antigénicas, de tal manera que el sistema inmunitario destruya el tumor. ► Modificación de células dendríticas para incrementar una reac ción inmunitaria específica de tumor.

B)

► Uso de virus oncolíticos manipulados por ingeniería para des truir de modo selectivo células tumorales. ► Modificación genética de células cancerosas para que éstas, pe ro no las células no tumorales circundantes, conviertan un pro fármaco no tóxico en un compuesto tóxico que las destruya (fig. 21- 12).

Células productoras d e ve cto r dentro del tum or

21.7.5 Terapéutica génica para las enfermedades infecciosas: HIV H IV-l, como el patógeno viral más importante en seres huma nos, es el blanco de enormes esfuerzos de investigación en toda rama importante de la ciencia médica. Ha sido relevante la ma nipulación genética en dos áreas. Gran parte del trabajo se cen tra en intentos para desarrollar vacunas modificadas de forma genética por ingeniería; además, muchos investigadores consi deran la manipulación genética de las células huésped para tor narlas resistente al HIV. En la base de datos de los NIH de estudios clínicos (www4.od.nih.gov/oba/rac/clinicaltrial.htm) se halla una lista de casi 40 protocolos de estudios clínicos que incluyen transferencia génica y que se enviaron entre 1992 y 2001. Casi todos son similares en principio al método que curó la IDCG-X. Se transfectan células madre hematopoyéticas con un gen del que se tiene la esperanza de que inhiba la replicación de HIV, por lo general en un vector retroviral, y se devuelven las células tratadas al paciente. Debido a que la principal anomalía del Sida es la infección y destrucción de linfocitos, éste es un medio natural para tratar de impedir que evolucione la infec ción por HIV a sida. El HIV es un retrovirus. La partícula viral madura consiste en dos copias idénticas del genoma RNA de cadena única, aunadas a algunas proteínas de centro, incluidas en una envoltura de glucoproteínas virales y lípidos captados de la membrana de la célula huésped cuando germina el virus (fig. 21-13). Al igual que los ge nes g a g ,p o ly en v que comparten todos los retrovirus, la replicación de HIV requiere las proteínas reguladoras Tat y Rev. Estas últimas, y las secuencias de RNA viral a las que se enlazan (TAR y RRE),

Células tum orales infectadas con retrovirus, pero no las células norm ales

D)

El ganciclovir destruye las células infectadas

Fig. 21-12. Terapéutica génica in vivo para tumores cerebrales. Se modifica por ingeniería un retrovirus para producir la cinasa de timidina del virus del herpes simple (HSV-TK). Se inyectan las células productoras del vector (CPV; azul) en el tumor cerebral. Debido a que los retrovirus in fectan células en división, infectan las células tumorales (rosa) pero no el tejido cerebral normal circundante (verde). Se administra por vía intraveno sa el profármaco no tóxico ganciclovir (gcv). En las células TK+ se convier te el gcv en trifosfato de gcv muy tóxico y se destruyen las células.

632 ¡ CAPÍTULO VEINTIUNO ! NUEVAS CONDUCTAS PARA EL TRATAMIENTO DE ENFERMEDADES

Fig. 21-13. Ciclo de vida del virus HIV-1. Éste es un retrovirus con un genoma RNA. Al igual que otros retrovirus, son genes gag, pol y env. Una transcriptasa inversa hace una copia de DNA que se integra como un provirus dentro de los cromosomas del huésped. Se empacan mRNa y proteínas virales en partículas de virus que brotan de la membrana de la célula huésped. A diferencia de los retrovirus simples, el HIV-1 codifica dos proteínas reguladoras, Tat y Rev, que enlazan las secuencias TAR y RRE, respectivamente, en el genoma viral y son esenciales para la replicación del virus. Éstos son los principales blancos de la terapéutica génica de HIV.

son los blancos de elección para muchos de los intentos de tornar resistentes los linfocitos a HIV. Las medidas incluyen las siguientes: ► Uso de RNA antisentido. Se han elaborado retrovirus que co difican RNA antisentido a TAR, mRNA tat y rev superpuestos y mRNA p o l y env. ► Empleo de RNA decodificante. Un retrovirus que se dirige a la expresión de alto nivel de un transcrito que contiene la se cuencia RRE podría secuestrar toda la proteína Rev y evitar la replicación de HIV. ► Utilización de mutantes dominantes negativos. Algunos vec tores retrovirales codifican una proteína Rev mutante, RevMIO. Ésta enlaza el RRE pero no ensambla después los complejos multiproteínicos necesarios para que salga el RNA del núcleo. ► Uso de ribozimas. Varios grupos prepararon retrovirus que co difican ribozimas. RRz2 es una ribozima en cabeza de martillo dirigida contra la región reguladora tat, también se emplea otro tipo, la ribozima en horquilla, para cortar el genoma de HIV.

► Empleo de intracuerpos. Se han usado retrovirus que codifi can anticuerpos intracelulares scFv (véase sección 21.3.4) para intentar inactivar las proteínas reguladoras Tat o Rev o la glucoproteína de recubrimiento gpl60. En las etapas iniciales de la infección por HIV se observa un recam bio masivo de linfocitos, a medida que el sistema inmunitario lu cha por destruir las células infectadas. Si la reacción inmunitaria fuera bastante más eficaz, tal vez podría contenerse a los virus en esa etapa. Además de los esfuerzos para desarrollar vacunas, tam bién existen trabajos dedicados a modificar las células T de tal mo do que destruyan células infectadas con mayor eficiencia. Se han diseñado retrovirus para que las células T CD8+expresen un recep tor de célula T quimérico que dirija su respuesta citotóxica a célu las infectadas por HIV. Pueden consultarse pormenores de estos métodos en la base de datos de los NIH incluida en la sección “enfermedades infecciosas” (iclick en Scientific Abstract para cualquier protocolo de interés). In

BIBLIOGRAFÍA

vitro, las células manipuladas muestran con frecuencia una gran re sistencia a la infección por HIV in vivo se demostraron injertos de médula ósea a largo plazo (varios meses o hasta uno a dos años) en unos cuantos estudios clínicos. Hay que preguntar si es posible que ocurra el injerto a un grado suficiente para proporcionar un fondo

633

común de linfocitos resistentes a HIV de utilidad clínica. El injer to de alto grado podría lograrse tras destruir primero la médula existente del paciente con sustancias químicas citotóxicas y radia ción, si bien llevarlo a cabo en un sujeto con sida sería una medida desesperada.

Lecturas adicionales Base de datos de los NIH de estudios clínicos de terapéutica génica: www4.od.nih.gov/oba/rac/clinicaltriai.htm Base de datos Wiley de protocolos de terapéutica génica aprobados: www.wiley.co.uk/genetherapy/clinical Templeton NS, Lasic DD (eds) (2000) Gene Therapy. Therapeutic Mechanisms and Strategies. Marcel Dekker, New York.

Treacy EP, Valle D, Scriver CR (2001) Treatment of genetic Disease. In: Metabolic and Molecular Basis of Inherited Disease, 8th End (eds CR Scriver, AL Beaudet, WS Sly, MD Valle). McGraw-Hill, New York.

Bibliografía Acsadi G, Dickson G, Love DR et al. (1991) Human dystrophin expresion in mdx mice after intramuscular Injection of DNA con structs. Nature 352, 815-818. Cavazana-Calvo M, Hacein-Bey S, de Saint Basile G et al. (2000) Gene therapy of human severe combined immunodefi ciency (SCID)-X1 disease, Science 288, 669-672. Chamberlain JS (2002) Gene therapy of muscular dystropy. Hum. Mol. Genet. 11, 2355-2362. Check E (2002) A tragic setback (News Feature). Nature 420, 116118. Check E (2003) Second cancer case halts gene-therapy trials (News Feacture). Nature 421, 305 Costa T, Scriver CR, Childs B (1983) The effect of mendellan dis ease on human health: a measurement. Am. J. Med. Genet. 21, 231-242. Daley GQ (2002) Prospects for stem cell therapeutics: myths and medicines. Curr. Opin. Genet. 12, 607-613. Davies JC, Geddes DM, Alton EWFW (2001) Gene therapy for cystic fibrosis. J. Gene Med. 3, 409-417. Dean W, Santos F, Stojkovic M et al. (2001) Conservation of methylation reprogramming in mammalian development: Aberrant reprogramming in cloned embryos. Proc. Natl Acad. Sci. USA 98, 13734-13738. Doudna JA, Cech TR (2002) The chemical repertoire of natural ribozymes. Nature 418, 222-228. Ferrari G, Gusella-De Angelis G, Coletta M et al. (1998) Muscle regeneration by bone marrow-derived myogenic progenitors. Science 279, 1528-1530. Fink DJ, Glorioso JC (1997) Engineering herpes simplex virus vec tors for gene transfer to neurons. Nature Med. 3, 357-359. Galderisi U, Cascino A, Giordano A (1999) Antisense oligo nucleotides as therapeutic agents. J. Cell. Physiol. 181, 251257. Gardner MJ, Shallom SJ, Carlton JM et al. (2002) Genome Sequense of the human malaria parasite Plasmodium falci parum. Nature 419, 498-511. Goncz KK, Colosimo A, Dallapiccola B et al. (2001) Expresion of F508 CFTR in normal mouse lung after site-specific modifi cation of CFTR sequences by SFH. Gene Ther. 8, 961-965. Gordon JW (1999) Genetic enhancement In humans. Science 283, 2023-2024. Hacein-Bey-Abina S, Le Deist F, Carlier F ei al. (2002) Sustained correction of X-linked severe combined immunodeficiency by ex vivo gene therapy. New Engl. J. Med. 346, 1185-1193.

Hoogenboom HR, De Bruine AP, Hutton SE, Hoet RM, Arends J-W, Roovers RC (1998) Antibody phage display technology and its application. Immunotechnology 4, 1-20. Hoppe-Seyler F, Butz K (2000) Peptide aptamers: powerful new tools for molecular medicine. J. Mol. Med. 78, 426-430. Huang L, Li S (1997) Liposomal gene delivery: a complex pack age. Nature Biotechnoi 15, 620-621. Hudson PJ (1999) Recombinat antibodi constructs in cancer ther apy. Curr. Opin. Immunol. 11, 548-557. Kafri T, Morgan D, Krahl T e ta l. (1998) Cellular Immune response to adenoviral vector infected cells does not require de novo viral gene expression: Implications for gene therapy. Proc. Natl Acad. Sci USA 95, 11377-11382. Kay MA, Glorioso JC, Naldini L (2001) Viral vectors for gene ther apy: the art of turning infectious agents into vehicles of thera peutics. Nature. Med. 7, 33-40. Lindstedt S, Holme E, Locke EA ef al. (1992) Treatment of hereditary tyrosinaemia type 1 by Inhibition of 4-hydroxphenyruvate dloxygenase, Lancet 340, 813-817. Marasco WA (1997) Intrabodies: turning the humoral immune system inside out for intracellular immunization. Gene Ther. 4, 11-15. Miyoshi H, Blomer U, Takahashi M, Gage FH, Verma IM (1998) Development of a self-inactivating lentivirus vector. J. Virol. 72, 8150-8157. Reyes-Sandoval A, Ertl HC (2001) DNA vaccines. Curr. Mol. Med. 1, 217-243. Russell CS, Clarke LA (1999) Recombinant proteins for genetic disease. Clin. Genet. 55, 389-394. Somia N, Verma IM (2000) Gene therapy: trials and tribulations. Nat. Rev. Genet. 1, 91-99. Stoger E.Vaquero C, Torres E et al. (2000) Cereal crops as viable production and storage systems for pharmaceutical scFv anti bodies. Plant Mol. Biol. 42, 583-590. Sullenger BA, Gilboa E (2002) Emerging clinical applications of RNA. Nature 418, 252-258. Thomson JA, Itskovitz-Eldor J, Shapiro SS et al. (1998) Embryonic stem cell lines derived from human blastocysts. Science 282, 1145-1147. Tse E, Rabbitts TH (2000) Intracellular antibody-caspase-medlated cell killing: an approach for application in cancer therapy. Proc. Natl Acad. Sci. USA 97, 12266-12271. Velander WH, Lubon H, Drohan WN (1997) Transgenic livestock as drug factories. Sci. American 276, 70-74.

G losario Nota: además de este glosario general, también hay cuatro glosarios especializados: ► Glosario de métodos de PCR, recuadro 5-1, pág. 124

► Glosario de genómica, recuadro 8-1, pág. 209

► Glosario de hibridación de ácido nucleico, recuadro 6-3, pág. 168

► Glosario de grupos filogenéticos metazoarios, recuadro 12-5, pág. 386

Siempre que es posible, se hace referencia a una figura, recuadro o sección del texto que ilustra o aclara el tema. Las palabras en itálicas se refieren a entradas adicionales en el glosario o referencias de figuras y recuadros. Acción Cis (de un factor regulador): control de la actividad del gen sólo cuando es parte de la misma molécula de DNA o del cromosoma como el factor regulador. Compárense factores regu ladores d e acción trans que pueden controlar sus secuencias blanco prescindiendo de su localización en el cromosoma. A cción trans: (de un factor regulador) afecta la expresión de todas las copias del gen blanco, prescindiendo de la localización cromosómica. Los factores reguladores de acción trans suelen ser proteínas que pueden difundirse a sus sitios blanco. Alelo nulo: alelo mutante que no produce productos. Alelos: formas alternativas del mismo gen. Amnios: una de las cuatro membranas extraembrionarias de mamíferos. Véase recuadro 3-8. Amplificación del genoma total: método de PCR que utiliza cebadores altamente degenerados que pueden amplificar un número muy grande de secuencias aleatorias diseminadas a través del genoma. Puede utilizarse para permitir pruebas repetidas de DNA de una célula, por ejemplo, en la tipificación de un espermatozoo aislado (sección 11.5.4). Análisis de par de hermanos: véase Análisis d e p a r d e hermanos afectados. Análisis de par de hermanos afectados (PHA): forma de análisis de enlace no param étrico basado en la medición de haplotipos que comparten hermanos que padecen la misma enfermedad. Véase figura 15-3. Análisis de segregación: metodología estadística para inferir mo dos de herencia. Aneuploidía: constitución cromosómica con uno o más cromoso mas extra o ausencia de un grupo euploide completo. Animal transgénico: un animal en el cual el DNA extraño (un transgén) introducido artificialmente se incorpora de manera estable dentro de la línea germinal. Véanse figuras 20-2, 20-3. Anneal: véase recuadro 6-3. Anticipación: tendencia al incremento de la gravedad de un padecimiento en generaciones sucesivas. Suele deberse a sesgo de valoración (véase sección 4.3.3), pero se ve realmente con m uta ciones dinám icas (sección 16.6.4). Anticodón: secuencia de tres bases en una molécula de tRNA que forma pares de bases con el codón de mRNA. Véanse figuras 17B y 1-20. Anticuerpo monoclonal (Acm): anticuerpos puros con especifici dad única, producidos mediante tecnología de hibridoma, a diferencia de los anticuerpos policlonales que se producen por inmunización. Véase recuadro 7-4. Antimorfo: alelo con un efecto negativo dominante.

Apoptosis: muerte célular programada. Aptitud (a): en poblaciones genéticas, una medida del éxito en la transmisión de genotipos a la generación siguiente. Llamada asimismo aptitud biológica o aptitud reproductiva, siempre se encuentra entre 0 y 1. Archaea: procariotas de célula única que se asemejan superficial mente a las bacterias, pero con características moleculares que indican un tercer reino de vida. Véase recuadro 12-4. ARMS (Sistema de amplificación de mutación resistente): PCR específica de alelo. Véanse figu ra 5-4 y 18-10. Asociación: tendencia de dos caracteres (enfermedades, alelos mar cadores, etc.) a ocurrir juntos en frecuencias no aleatorias. La Asociación es una observación estadística simple, no un fenó meno genético, pero en ocasiones puede ser causado por dese quilibrio de enlace. Véase sección 15.4. Asociación alélica: véase Desequilibrio d e enlace. Atrapamiento de exón: técnica para detectar secuencias dentro de un DNA genómico clonado que son capaces de empalmarse a exones dentro de un vector especializado. Véase figu ra 7-10. Autocigosidad: en una persona endogàmica, hom ocigosidad para alelos idénticos por descendencia. Autosoma: cualquier cromosoma aparte de los cromosomas del sexo, X y Y. BAC (cromosoma bacteriano artificial): plásmido recombinante en el que pueden propagarse insertos hasta de 300 kb de largo en células bacterianas. Véase sección 5.4.3. Biomètrica: estudio estadístico de caracteres cuantitativos. Bivalente: la estructura de cuatro filamentos que se observa en la profase I de la meiosis, que comprende dos cromosomas homólogos en sinapsis. Véase figu ra 2-11. BLAST: familia de programas que buscan bases de datos de secuencia para compatibilidades con una secuencia problema. Véase recuadro 7-3. Blastocisto: etapa muy temprana del desarrollo embrionario en la que el embrión consiste en una pelota hueca de células con un compartimiento interno lleno de líquido, el blastocele. Bloqueo de haplotipo: variante particular de un segmento polimorfico extendido de DNA cromosomico (típicamente 10100 kb) que se encuentra en muchos miembros de una población y se supone que representa una variante ancestral. Véanse recuadro 12-6 y sección 15.4.3. Bootstrapping: método estadístico diseñado para revisar la pre cisión de un árbol evolutivo construido a partir del análisis de secuencia comparativa. El método incluye numerosos ciclos de

636 1 GLOSARIO

reemplazo de algunos de los datos de secuencia original por submuestras aleatorias obtenidas de los datos originales y calcu lando nuevamente en cada ciclo la posibilidad de que el árbol original sea correcto. Véase figu ra 12-18. Buscador del genoma: programa que proporciona una interfaz gráfica para interrogar bases de datos del genoma. Véase sección 8.3.6. Calificación lod (z): medida de la posibilidad de enlace genético entre locus. El log (base 10) de las posibilidades de que se enla cen los locus (con la fracción recombinante 0) en lugar de que no estén enlazados. Para caracteres mendelianos una califi cación lod mayor de + 3 indica enlace; uno menor de -2 es una prueba contra enlace. Véanse recuadro 13-3, figu ra 13-7. Caminata de cromosoma: aislamiento de secuencias adyacentes a una clona en el cromosoma caracterizado mediante genotecas genómicas de selección para clonas que se superponen parcial mente. Cap: grupo químico especializado que añaden las células para blo quear el extremo 5’ del mRNA. Véase figu ra 1-17. Carácter dicotòmico: una característica como la polidactilia que tienen algunas personas y otras no -en comparación con una característica continua, por ejemplo, el peso, que tienen todas las personas, pero en diferente grado-. Característica continua: una característica, como el peso, que tienen todas las personas, pero en un grado diferente -en com paración con un carácter dicotòm ico como la polidactilia, que tienen algunas personas y otras no-. Cariotipo: estrictamente, significa un resumen de la constitución cromosomica de una célula o una persona, como 46, XY. Sin embargo, con frecuencia el término se utiliza laxamente para indicar una imagen que muestra los cromosomas de una célula seleccionados en orden y dispuestos en pares, como en la fig u ra 2-14. cDNA (DNA complementario): DNA sintetizado por la enzima transcriptasa inversa utilizando mRNA como una plantilla, sea experimentalmente (véanse figuras 4-8 y 6-5) o in vivo (véanse figuras 7-13 y 14-18). Cebador: oligonucleótido corto, con frecuencia de 15 a 25 bases de largo, con pares de bases específicamente para una secuencia blanco a fin de permitir que una polimerasa inicie la síntesis de un filamento complementario. Célula madre: célula que puede actuar como un precursor para diferenciar células, pero que retiene la capacidad de autorrenovarse. Véase sección 3.4.3. Célula somática: cualquier célula del cuerpo, excepto los gametos. Células germinales (o gametos): las células espermatozoo y óvulo. Células germinales primordiales: células en el embrión y el feto que dan lugar finalmente a las células de la línea germinal. Células madre embrionarias: véase Células ME. Células ME (madre embrionarias): células pluripotenciales indiferenciadas derivadas del embrión. Un instrumento clave para manipulación genética. Véanse Sección 3.4.5, figuras 211, 20-3. CentiMorgan (cM): unidad de distancia genética. Los locus sepa rados 1 cM tienen una probabilidad de recombinación del 1% durante la meiosis. Véase la figu ra 13-4 para la relación entre distancias genéticas y físicas. centiRay (cR): véase recuadro 8-1.

Centrómero: la constricción primaria de un cromosoma que sepa ra el brazo corto del brazo largo, y el punto en el que se unen fibras en huso para tirar de las cromátides a fin de separarlas durante la división celular. Véase sección 2.3.2. Chip de DNA: véase M icroordenación. Cigoto: óvulo fecundado. Citoesqueleto: andamiaje interno de filamentos de proteínas que existe dentro de las células, con funciones crucialmente impor tantes en la regulación de la forma celular, el movimiento de la célula y el transporte celular. Véase recuadro 3-2. Clona: véase recuadro 8-1. Clonación de sustracción: método de clonación de secuencias de DNA que se encuentran en una muestra de DNA y no existen en una segunda muestra, por lo general similar. Se utiliza para seleccionar cDNA específico de tejido mediante sustracción contra una genoteca de cDNA expresados ubicuamente, o para clonar un gen eliminado (deleción) en un paciente con una enfermedad mediante sustracción contra DNA normal. Clonación posicional: clonación de un gen del que sólo se conoce su localización cromosómica. Clonación terapéutica: método propuesto para el tratamiento de una enfermedad utilizando células desarrolladas mediante el trasplante de núcleos de células del paciente en células ME humanas. Véase figu ra 21-2. Codón: un tripleto nucleótido (estrictamente en el mRNA pero, por extensión, en el DNA genómico de codificación) que especifica un aminoácido o una señal de detención de traduc ción. Codón de terminación: codón UAG (ámbarj, UAA (ocre) o UGA (ópalo) en un mRNA (y por extensión, en un gen) que señala el extremo de un polipéptido. Coeficiente de selección: posibilidad de fracaso de la reproduc ción para un cierto genotipo en relación con el genotipo de mayor éxito. Véase sección 4.5.2. Compensación de dosis: cualquier sistema que iguala la cantidad de producto elaborado por genes que se encuentran en diferentes números. En mamíferos, describe el mecanismo de activación de X que asegura cantidades iguales de productos génicos codifica dos por X en células XX y XY. Véase figu ra 10-26. Complejidad: complejidad de un genoma es la longitud total o la proporción de secuencias únicas. En un genoma o una muestra se encuentran muchas veces secuencias de complejidad baja. Complementación: dos alelos se complementan si combinados restablecen el fenotipo de tipo silvestre (véase recuadro 4-2). Normalmente, los alelos sólo se complementan si se encuentran en locus diferentes, aunque ocurren algunos casos de com ple mentación interalélica. Complementariedad de bases: véase recuadro 6-3. Conservación de sintenia: cuando se comparan mapas genéticos de dos organismos, se conserva la sintenia si dos o más locus que están localizados en el mismo cromosoma en un organismo se encuentran juntos en un cromosoma en el otro. Constitucional: genotipo, anormalidad o mutación que se encon traba en el óvulo fecundado, y por consiguiente se encuentra en todas las células de una persona, distinto a un cambio somático. Contig: lista o diagrama que muestra una disposición ordenada de fragmentos clonados superpuestos que contienen en conjunto la secuencia de un filamento de DNA originalmente continuo. Conversión génica: intercambio genético sin reciprocidad que ocurre de manera natural, en el que se altera una secuencia de

GLOSARIO [ 637

un filamento del DNA de tal manera que se torna idéntico a la secuencia de otro filamento de DNA. Véase figu ra 11-10. Cordado: véase recuadro 12.5. Corion: una de las cuatro membranas extraembrionarias de los mamíferos. Véase recuadro 3-8. Cortador raro: nucleasa de restricción que corta DNA con poca frecuencia porque la secuencia que reconoce es grande, contiene uno o más CpGs, o ambos. Los ejemplos son NoA, SacII y BssHll. Véase cuadro 4-1. Cresta neural: grupo altamente versátil de células que dan lugar a parte del sistema nervioso periférico, los melanocitos, cierto hueso y músculo, la retina y otras estructuras. Las células de la cresta neural se forman durante la neurulación como una población específica de células que surgen a lo largo de los már genes laterales de los pliegues neurales y a continuación se desprenden de la placa neural y migran a muchos sitios especí ficos en todo el cuerpo. Véase figu ra 3-16A. Cromátide: desde el extremo de la fase S del ciclo celular (fig. 2-1) hasta la anafase de la división celular, los cromosomas consisten en dos cromátides hermanas. Cada una contiene una doble hélice completa y las dos son copias exactas una de la otra. Cromátide hermana: dos cromátides que se encuentran dentro de un cromosoma aislado y unidas por un centrómero. Las cromá tides que no son hermanas se encuentran en cromosomas dife rentes pero homólogos. Cromosoma marcador: cromosoma anormal extra sin origen identificado. Cruzamiento desigual (CDI): recombinación entre secuencias no alélicas en cromátides que no son hermanas de cromosomas homólogos. Véase Figura 11-7. Dedo de cinc: elemento polipéptido que se estabiliza por la unión de un átomo de cinc y confiere a las proteínas capacidad para unirse específicamente a secuencias de DNA. Se encuentra comúnmente en factores de transcripción. Véase figu ra 10-8. Descomposición de mRNA mediada sin sentido: mecanismo celular que degrada moléculas de mRNA que contienen un codón de terminación prematuro (> 50 nt corriente arriba de la última unión de empalme). Véase sección 11.4.4. Desequilibrio de enlace: asociación estadística entre alelos particu lares en locus separados pero enlazados, que resulta normal mente de un haplotipo ancestral particular común en la población estudiada. Un medio importante para mapeo de alta resolución. Véanse figuras 13-10, 15-6y recuadro 15-2. Deslizamiento de replicación: error en la replicación de una secuencia de DNA repetida en tándem que da por resultado que el filamento nuevo sintetizado tenga unidades repetidas extra o menos comparado con la plantilla. Véase figu ra 11-5. Desnaturalización: disociación de filamentos complementarios para proporcionar DNA, RNA, o ambos, de filamento único. Deuterostomas: véase recuadro 12-5. DGGE (electroforesis en gel de gradiente desnaturalizante): método para detectar mutaciones mediante electroforesis de productos de la PCR a través de geles que contienen un gradi ente de un desnaturalizante. Véase figu ra 18-3B. dHPLC (cromatografía líquida desnaturalizante de alta ejecu ción): método para detectar mutaciones basado en las propiedades de heterodúplex, capaz de alta sensibilidad y rendimiento. Véase figu ra 18-4.

Diferenciación: proceso por el cual las células se especializan v se comprometen a formar finalmente tipos específicos de células maduras. Digestión parcial: digestión, por lo general de DNA, mediante una enzima de restricción, que se detiene antes que se havan cortado todas las secuencias blanco. El objeto es producir frag mentos superpuestos. Véase figu ra 5-9. DILAM: desorción/ionización láser asistida por matriz. Método espectrométrico de masa que se utiliza comúnmente para iden tificar DNA o moléculas proteínicas. Véase recuadro 19-4. Dinucleótido CpG: la secuencia 5 'CG 3' dentro de una molécu la de DNA más larga. Los dinucleótidos CpG son blancos para un sistema específico de metilación d el DNA en mamíferos que es importante para controlar la expresión génica. Diploide: que tiene dos copias de cada tipo de cromosoma, la cons titución normal de la mayor parte de las células somáticas hu manas. Dirigido a genes: modificación dirigida de un gen en una célula o un organismo. Véanse figuras 20-7, 20-8, 20-10. Disomía uniparental: célula u organismo en el cual las dos copias de un par de cromosomas particular derivan de un padre. Según el cromosoma relacionado, puede ser patogénica o no. Véanse sección 2.5.4., recuadro 16-6. Distal (de cromosomas): colocados comparativamente distantes del centrómero. Distancia genética: distancia en un mapa genético, definida por fracciones de recombinación y la fu n ción de mapeo, y que se mide en centiMorgans. Véase sección 13.1. Distribución Hardy-Weinberg: la relación más simple entre fre cuencias génicas y frecuencias de genotipo que se encuentra en una población bajo ciertas condiciones. Véase sección 4.5. DNA codificante: DNA que codifica la secuencia de aminoácidos de un polipéptido (o en ocasiones un RNA maduro funcional que no especifica un polipéptido). DNA minisatélite: un ordenamiento de tamaño intermedio (típi camente 0.1-20 kb de largo) de secuencias de DNA cortas repetidas en forma de tándem. Véase recuadro 7-2. El DNA minisatélite hipervariable es la base de la huella digital d e DNA y muchos marcadores VNTR. DNA recombinante: híbrido de DNA construido artificialmente que contiene secuencias enlazadas de manera covalente con orí genes diferentes, por ejemplo, un vector con un inserto. DNA repetitivo: secuencia de DNA que se encuentra en muchas copias idénticas o similares en el genoma. Las copias pueden repetirse o dispersarse en tándem. DNA satélite: originalmente describía una fracción de DNA que forma bandas menores separadas en la centrifugación de gradi ente de densidad por su composición poco común de bases. El DNA está compuesto de ordenamientos muy largos de secuen cias de DNA repetidas en tándem. Véase sección. 9.4.1. Dominante: en genética humana, cualquier carácter que se expre sa en un heterocigoto. Véase asimismo semidominante. Duplicación segmentaria: existencia de bloques de secuencia de DNA muy altamente relacionados en diferentes cromosomas o en más de un sitio en un cromosoma. Véase figuras 12-12, 12-13Ectodermo: una de las tres capas germinativas del embrión. Se for ma durante la gastrulación en las células del epiblasto (véase fig. 3-15) y origina el sistema nervioso y los epitelios externos (véase recuadro 3-5).

638

GLOSARIO

Edición de RNA: proceso natural en el cual ocurren cambios específicos postranscripcionalmente en la secuencia de bases de una molécula de RNA. Rara vez se observa en genes humanos. Véasefigu ra 8-16. Efecto fundador: frecuencia alta de un alelo particular en una población porque esta última deriva de un número pequeño de fundadores, uno o más de los cuales llevaba ese alelo. Electroporación: método de transferencia de DNA a células in vitro, utilizando un pulso breve de alto voltaje. Elementos de respuesta: secuencia localizada por lo general a una distancia corta corriente arriba de promotores que hacen que la expresión génica responda a ciertas sustancias químicas en el ambiente celular. En el cuadro 10-4 se encuentra una lista de varios ejemplos. Elementos límite: secuencias que definen los límites de dominios de cromatina regulados coordenadamente en cromosomas. Véase recuadro 8-2. Empalme (sp licin gh normalmente em palme d e RNA en el cual se eliminan las secuencias de RNA transcritas de intrones de un transcrito primario y se empalman entre sí los transcritos de exones en el mismo orden lineal que los exones (véanse figuras 1-14, 1-16). Es importante una forma de em palme d e DNA para ensamblar inmunoglobulina productiva y genes receptores de células T en linfocitos B y T, respectivamente (véanse figuras 10-28, 10-29). Empalme (sp licin g) alternativo: uso natural de diferentes grupos de secuencias de unión de empalme para formar más de un producto a partir de un gen aislado. Véase sección 10.3.2, recuadro 10-4. Empalme de RNA: véase Empalme. Endodermo: una de las tres capas germinativas del embrión. Se forma durante la gastrulación a partir de células que migran fuera de la capa del epiblasto (fig. 3-15). Véase el recuadro 3-5 para derivados del endodermo embrionario. Endogamia: matrimonio con un familiar sanguíneo. El término es comparativo, ya que finalmente todas las personas están rela cionadas. El coeficiente de endogam ia es la proporción de genes de una persona que son idénticos p o r descendencia. ENEC (elemento nuclear entremezclado corto): clase de familias de secuencias de DNA moderada a altamente repetidas, de la cual la que se conoce mejor en humanos es la familia repetida Alu. Véanse cuadro 9-15 y figuras 9-7, 9-8. ENEL: demento nuclear entremezclado ¿irgo. Clase de secuencias de DNA repetidas que constituyen alrededor de 20% del geno ma humano (cuadro 9-15). Algunos son elementos transposables activos. Véanse figuras 9-17, 9-18. Enlace: tendencia de caracteres (fenotipos, alelos marcadores, etc.) a cosegregarse en una genealogía porque sus determinantes se encuentran juntos entre sí en un cromosoma particular. Epiblasto: capa de células del embrión en etapa previa a la gastru lación que dará lugar a las tres capas germinativas del embrión propiamente dicho, aunado al ectodermo y el mesodermo extraembrionarios. Compárese con hipoblasto. Epigenético: heredable (de la célula madre a la célula hija, o en ocasiones del padre al hijo), pero no producido por un cambio en la secuencia del DNA. La m etilación d el DNA es el mecanis mo epigenético mejor comprendido. Episoma: cualquier secuencia de DNA que puede existir en forma extracromosómica autónoma en la célula. Suele utilizarse para describir formas de DNA autorreplicantes y extracromosómicas.

Epitopo: parte de un antígeno con el cual reacciona un anticuerpo particular. Especificidad: en pruebas, una medida del desempeño de una prueba. Especificidad = (1 - tasa de positivas falsas), véase fig u ra 18-17. Espliceosoma: complejo ribonucleoproteínico que se utiliza en el em palme (splicing) de RNA. EST (marcado de secuencia expresada): véase recuadro 8-1. Estadísticas bayesianas: rama de la estadística que forma la base de estimación de mucho riesgo genético. Véase recuadro 18-4, figu ra 18-15. Estratificación: existencia de grupos diferenciados genéticamente dentro de una población que se supone es homogénea. Estructura secundaria: regiones de un ácido nucleico o una pro teína de filamento único/una molécula polipéptida en las que ocurre la unión química entre nucleótidos o aminoácidos espa ciados distantemente que da por resultado estructuras comple jas. Con frecuencia, la estructura secundaria se debe a la unión de hidrógeno intrafilamentaria (figuras 1-7, 1-24). Eucromatina: fracción del genoma nuclear que contiene DNA activo transcripcionalmente y que, a diferencia de la heterocromatina, adopta una conformación relativamente extendida. Eugénica: “mejoramiento” de una población mediante el apareamiento selectivo de los “mejores” tipos (eugénica positi va), o la prevención de tipos “indeseables” por apareamiento (eugénica negativa). Euploidía: estado de poseer uno o más grupos completos de cro mosomas con ninguno extra o faltante; el opuesto de aneuploidía. Exclusión alélica: mecanismo por el cual se expresa sólo uno de los dos alelos de la inmunoglobulina en linfocitos B, o alelos de receptor de célula T en linfocitos T. En forma más general, cualquier mecanismo que ocurre de manera natural que causa la expresión de un alelo solamente. Véase recuadro 10-4. Exhibición de fago: método de expresión de clonación en el que se insertan genes extraños en un vector fago y se expresan para dar polipéptidos que se exhiben en la superficie (cubierta proteínica) del fago. Exhibición diferencial: véase recuadro 5-1. Exón: segmento de un gen representado en el producto del DNA maduro. Los exones individuales pueden contener DNA de codificación, DNA no codificante (secuencias no traducidas), o ambos, véanse figuras 1-14, 1-19. Expresión constitutiva: estado en el cual un gen es activo en for ma permanente. Las mutaciones que dan por resultado una expresión constitutiva inapropiada suelen ser patógenas. Expresión monoalélica: expresión de sólo una de las dos copias de un gen en una célula, por inactivación de X, impresión u otro cambio epigenético, o debido al reordenamiento génico que se lleva a cabo con los genes de inmunoglobulina y del receptor de célula T. Véase recuadro 10-4, para ejemplo. Expresión variable: extensión o intensidad variable de signos fenotípicos en personas con un genotipo determinado. Véase, por ejemplo, la figu ra 4-5C. Extremo romo: fragmento de DNA que no tiene extensiones de filamento único. Extremos adherentes (terminales cohesivas): proyecciones cortas de filamento único de una molécula de DNA de doble filamen to que se forman típicamente por digestión de ciertas enzimas de restricción. Pueden asociarse moléculas Can con extremos

GLOSARIO

adherentes complementarios y a continuación unirse de manera covalente utilizando ligasa d e DNA para formar moléculas de DNA recombinante. Véanse figuras 4-3, 4-4. Familia multigénica: grupo de locus relacionados evolutivamente dentro de un genoma, cuando menos uno de los cuales puede codificar un producto funcional. Véase sección 9.3. Familias CEPH: grupo de familias reunido por el Centre d ’Etude du Polymorphisme Humain (Centro de estudio de polimorfismo humano) en París para ayudar en la producción de mapas estructurales marcador-marcador. Farmacogenética: estudio de la influencia de genes alelos indivi duales en el metabolismo o la función de fármacos. Farmacogenómica: uso de recursos del genoma (secuencias del genoma, perfiles de expresión, etc.) a fin de identificar blancos para nuevos fármacos. Fase (de marcadores enlazados): relación (acoplamiento o recha zo) entre alelos en dos locus enlazados. Si el alelo A l se encuen tra en el mismo cromosoma físico que el alelo B l, están en acoplamiento; si se encuentran en diferentes homólogos parentales, están en rechazo. Véase figu ra 13-6. Fase (del ciclo celular): las fases G l, S, G2, M y Go (véasefig . 2-1). Fase (de un intrón): término utilizado para clasificar intrones en secuencias de codificación según la posición en la que inte rrumpen el mensaje (véase recuadro 12-2). Fenotipo: características observables de una célula o un organismo, incluyendo el resultado de cualquier estudio que no sea una prueba directa del genotipo. Fibra de cromatina: arrollamiento de 30 mm de DNA e histonas que se piensa representa la conformación básica de la cromati na. Véast figu ra 2-3. Filamento antisentido (filamento plantilla): filamento de DNA de un gen que utiliza la polimerasa de RNA como una planti lla para la síntesis de mRNA, durante la transcripción. Véase figura 1-12. Filamento guía: en la replicación del DNA, el filamento que se sintetiza en forma continua {véase figu ra 1-9). Filamento plantilla: en la transcripción, el filamento de DNA que forma pares de bases con el transcrito de RNA naciente. Véase figu ra 1-12. Filamento retardado: en la replicación del DNA, el filamento que se sintetiza como fragmentos Okazaki (véase figu ra 1-9). Filamento de sentido: filamento de DNA de un gen cuya secuen cia es complementaria al filamento de la plantilla (antisentido) e idéntico a la secuencia de RNA transcrita (excepto que el DNA contiene T en tanto que el RNA contiene U). Las secuencias génicas mencionadas siempre son del filamento de sentido en la dirección 5'~* 3’. Véase figu ra 1-12. Filamentos complementarios: se dice que dos filamentos de áci do nucleico son complementarios en secuencia si pueden for mar suficientes pares de bases para generar una estructura de doble filamento estable. Filogenia: clasificación de organismos según la relación evolutiva percibida. Véanse figuras 12-22 a 12-24. Fracción de recombinación: para un par de locus determinado, la proporción de meiosis en que están separados por recombi nación. Suele indicarse como 0. Los valores 0 varían entre 0 y 0.5. Véase sección 13.1. Frecuencia génica: proporción de todos los alelos en un locus que son el alelo en cuestión. Véase la sección 4.5. Realmente sig

639

nifica frecuencia de alelos, pero en la actualidad está muy bien establecido el uso de frecuencia génica para poder cambiarse. Fusión céntrica: véase Fusión robertsoniana. Fusión robertsoniana: reordenamiento cromosómico que con vierte dos cromosomas acrocéntricos en uno metacéntrico o submetacéntrico. Véase figu ra 2-21. En ocasiones llamada fusión céntrica, aunque el punto de intercambio se encuentra en realidad en el brazo corto próxima! y no en el centrómero. Gastrulación: proceso altamente dinámico que comprende la con versión del embrión de dos capas anterior a la gastrulación (que consiste en epiblasto más hipoblasto) en otro que incluye las tres capas germinativas: ectodermo, mesodermo y endodermo. Gen candidato: en clonación posicional, un gen de localización cromosómica apropiada que se sospecha es el gen originario de una enfermedad. La sospecha se estudiaría buscando muta ciones en pacientes. Gen de fusión (híbrido): gen que contiene la secuencia de codifi cación de dos genes diferentes, por lo general creado mediante cruzamiento desigual (fig. 9-17) o translocaciones cromosómicas (fig. 18-7A). Gen modificador: gen cuya expresión puede influir un fenotipo y que resulta de la mutación en otro locus. Véase sección 16.6.3. Gen reportero: gen que se utiliza para estudiar la capacidad de una secuencia corriente arriba unida a él para causar su expresión. Las posibles secuencias reguladoras de acción cis pueden acoplarse a un gen reportero y transfectarse a células adecuadas para estudiar su función. Alternativamente, los animales transgénicos (y otros organismos) se preparan con frecuencia con un gen reportero no promotor integrado aleatoriamente en los cro mosomas, de tal manera que la expresión del reportero marca la presencia de un promotor eficiente. Véase recuadro 20-4. Gen supresor de tumor (GST): gen cuya función normal es inhibir o controlar la división celular. Típicamente, en tumores están inactivados los GST. Véase sección 17.4. Genes hox: subgrupo de genes homeobox que están organizados en racimos y tienen funciones importantes en la paternidad anterior y posterior. Véanse figuras 3-10 y 3-12. Genoma: grupo total de diferentes moléculas de DNA de un organelo, una célula o un organismo. El genoma humano con siste en 25 moléculas de DNA distintas, la molécula de DNA mitocondrial, aunada a 24 diferentes moléculas cromosómicas de DNA. Cf, transcriptoma, proteoma. Genómica funcional: análisis de la función génica a gran escala, llevando a cabo análisis paralelos de expresión/función génicas para grandes números de genes, incluso todos los de un genoma. Genoteca de DNA: véase recuadro 8-1. Genoteca de expresión: genoteca de cDNA clonados en un vector que les permite expresarse. Véase sección 5.6. Genotipo: constitución genética de un individuo, sea en su totali dad o en un locus específico. Grupo de células híbridas: conjunto de células híbridas somáticas o híbridas p o r radiación que se utiliza para mapeo físico. Haploide: describe una célula (típicamente un gameto) que sólo tiene una copia aislada de cada cromosoma (p. ej., los cromo somas 23 en espermatozoos y óvulos humanos). Haploinsuficiencia: un locus muestra haploinsuficiencia si la pro ducción de un fenotipo normal requiere más producto génico que la cantidad que produce una copia aislada. Véanse sección 16.4.2, cuadro 16-2.

640 | GLOSARIO

Haplotipo: serie de alelos que se encuentran en locus enlazados en un mismo cromosoma. Hemicigoto: que sólo tiene una copia de un gen o una secuencia de DNA en células diploides. Los varones son hemicigotos para la mayor parte de los genes en los cromosomas sexuales. Las deleciones que ocurren en un autosoma producen hemicigosidad en varones y mujeres. Herencia: proporción de la razón de una característica que se debe a causas genéticas. Véase recuadro 4-4. Herencia matrilineal: transmisión solamente por la madre, pero a los niños de cualquier sexo; patrón de herencia mitocondrial. Véase figu ra 4-4. Hermanos: hermanos o hermanas. Heterocigosidad media: de un marcador, la posibilidad de que una persona seleccionada aleatoriamente sea heterocigota. Una medida de la utilidad del marcador para análisis de enlace (véase sección 11.2.2). Heterocigoto: individuo que tiene dos alelos diferentes en un locus particular. Heterocigoto compuesto: personas con dos alelos mutantes dife rentes en un locus. Heterocromatina: región cromosómica que permanece altamente condensada durante todo el ciclo celular y no muestra pruebas, o muy pocas, de expresión génica activa. La heterocromatina constitutiva se encuentra en los centrómeros y algunas otras regiones (para lo cual véase fig. 2-15). Heterodúplex: DNA de doble filamento en el cual hay cierta desigualdad entre los dos filamentos. Importante en la detec ción de mutaciones -véase sección 18.3-. Heterogeneidad alélica: existencia de muchos alelos que causan diferentes enfermedades en un locus. La situación es la pre dominante en casos de enfermedades causadas por pérdida de función de un gen -véase, por ejem ^ o , figura 16-1-. Heterogeneidad de locus: determinación de la misma enfermedad o fenotipo por mutaciones en locus diferentes. Un problema común en mapeo de enfermedades genéticas. Véanse secciones 4.2.4, 16.7.2. Heteroplasmia: mosaicismo, por lo general dentro de una célula aislada, para variantes mitocondriales de DNA. Véanse sec ciones 4.2.5, 11.4.2. Hibridación de fluorescencia in situ (FISH): hibridación in situ utilizando una sonda de DNA o RNA marcada con fluorescen cia. Una técnica fundamental en genética molecular moderna -véanse figuras 2-17, 2-18-. Hibridación genómica comparativa (HGC): uso de hibridación de fluorescencia in situ competitiva para detectar regiones cromosómicas que están amplificadas o eliminadas, especialmente en tumores. Véase figu ra 17-3. Hibridación in situ : forma de hibridación molecular en la que el ácido nucleico blanco (DNA) está desnaturalizado dentro de las preparaciones cromosómicas (hibridación cromosómica in situ) o inmovilizado el RNA dentro de las células de cortes de tejidos en un portaobjetos para microscopio (hibridación tisular in situ -créase fig. 6-15) o dentro de la totalidad de los embriones (hi bridación in situ d e m ontaje total -véase fig. 7-15). Hibridación in situ de montaje total: véase Hibridación in situ. Híbrido de célula somática: célula construida artificialmente for mada por la fusión de dos tipos diferentes de células somáticas, en especial células de distintas especies. Los células híbridas humano-roedor han resultado medios valiosos para mapeo. Véase recuadro 8-4.

Híbrido por radiación: en mapeo físico humano, una célula de roedor que contiene múltiples fragmentos pequeños de cromo somas humanos. Producido mediante fusión con una célula humana radiada letalmente. Los grupos híbridos por radiación muestran un mapeo muy rápido de SSM. Véase figu ra 10-4). Hipermorfo: alelo que produce una cantidad o actividad mayor de producto. Hipoblasto: capa de células embrionarias antes de la gastrulación que da lugar al endodermo extraembrionario. Hipomorfo: alelo que produce una cantidad o actividad reducida de producto. Hipótesis de dos golpes: teoría de Knudson indicativa de que los cánceres hereditarios requieren dos mutaciones sucesivas para afectar una célula aislada. Véase figu ra 18-5. Hipótesis de un gen-una enzima: hipótesis planteada por Beadle y Tatum, en 1941, que indica que la principal acción de cada gen era especificar la estructura de una enzima. Muy impor tante históricamente, pero hoy en día sólo se considera como parte de la gama de funciones de los genes. Homocigoto: individuo que tiene dos alelos idénticos en un locus particular. Con propósitos clínicos, una persona suele describirse como homocigoto AA si tiene dos alelos que funcionan nor malmente, u homocigoto aa cuando presenta dos alelos patogéni cos en un locus, prescindiendo de que los alelos sean de hecho completamente idénticos a nivel de la secuencia de DNA. La homocigosidad para alelos idénticos p o r descendencia se denomi na autocigosidad. Homología de secuencia: medición de la similitud de las secuen cias de dos ácidos nucleicos o dos polipéptidos. Homólogos (cromosomas): las dos copias de un cromosoma en una célula diploide. A diferencia de las cromátides hermanas, los cromosomas homólogos no son copias entre sí; uno se heredó del padre y el otro de la madre. Homólogos (genes): dos genes o más cuyas secuencias están rela cionadas significativamente por una relación evolutiva cercana, sea entre especies (ortólogos) o dentro de una especia (parálogos). Homoplasmia: célula u organismo que tiene todas las copias del DNA mitocondrial idénticas. Cf. heteroplasmia. Huella digital de DNA: método actualmente obsoleto para iden tificar a una persona con propósitos legales o forenses basado en sondeos Southern blot con una sonda minisatélite hipervariable. Véase figu ra 18-19. Identidad por descendiente (IPD): alelos en un individuo o en dos personas que se sabe son idénticos porque ambos se heredaron de un ancestro común demostrable. Identidad por estado (IPE): alelos que parecen idénticos, pero pueden ser o no idénticos p o r descendiente porque no hay una fuente común demostrable. Véase figu ra 15-2. Impresión (impronta): determinación de la expresión de un gen por su origen parental. Véanse sección 10.5.4. y recuadro 16-6. Inactivación de X (lionización): inactivación de uno de los dos cromosomas X en las células de mamíferos hembra por una for ma especializada de impronta genética.. Véase Sección 10.5.6. Inestabilidad microsatélite: fenómeno característico de ciertas células tumorales en el cual, durante la replicación del DNA, el número de copias repetidas de microsatélites está sometido a cambios aleatorios. Se abrevia INM, IMS o ERR (error de repli cación). Véase figu ra 17-7. Intensificación genética: posible aplicación de tecnologías de genética molecular para modificar un fenotipo humano normal

GLOSARIO I 641

en cierta forma que se considere benéfica. Véase recuadro d e éti ca 3, en el capítulo 21. Intensificador: grupo de elementos de secuencia corta que estimu lan la transcripción de un gen y cuya función no depende críticamente de su posición u orientación precisa. Véase recuadro 10-2. Intensificador de empalme: secuencia (que puede ser exónica o intrónica) que incrementa la posibilidad de que un sitio poten cial de empalme cercano se utilice realmente. Véanse secciones 11.4.3 y 16.4.1. Intercambio de cromátide hermana (ICH): acontecimiento de recombinación que incluye cromátides hermanas. Debido a que estas últimas son duplicados una de la otra, estos intercambios no deben tener ningún efecto a menos que sean desiguales. Sin embargo, un incremento de la frecuencia de ICH indica daño del DNA. Intercambio desigual de cromátides hermanas (IDCH): recom binación entre secuencias no alélicas en cromátides hermanas de un cromosoma aislado. Véase Figura 11-7. Interfase: todo el tiempo del ciclo celular en el que no se está divi diendo una célula. Interferencia: en meiosis, tendencia de un cruzamiento a inhibir un cruzamiento adicional dentro de la misma región de los cro mosomas. Véase sección 13.1.3. Intrón: DNA no codificante que separa exones vecinos en un gen. Durante la expresión génica, se transcriben intrones al RNA, pero a continuación se eliminan las secuencias del intrón del pre-mRNA mediante empalme (splicing). Véase figu ra 1-14. Puede clasificarse según el mecanismo de empalme (véase recuadro 12-1) o, si se separan secuencias de codificación del DNA, por su localización precisa dentro de codones. (Véase recuadro 12-2). Inversión paracéntrica: inversión de un segmento cromosomico que no incluye el centròmero. Véase figu ra 2-20. Inversión pericéntrica: inversión de un segmento cromosomico que incluye el centròmero. Véase figu ra 2-20. Isla CpG: tira corta de DNA, con frecuencia < 1 kb, que contiene dinucleótidos CpG n o mediados frecuentes. Las islas CpG tienden a marcar los extremos 5’ de los genes. Véase recuadro 9-3. Isocromosoma: cromosoma simétricamente anormal, que consiste en dos brazos idénticos, que normalmente son el brazo corto o el brazo largo de un cromosoma normal. Isoformas/isozimas: formas alternas de una proteína o una enzima. Isogénico: dos o más organismos o células que tienen genotipos idén ticos. Por ejemplo, diferentes ratones que pertenecen a una cepa endogàmica particular, por ejemplo, C57B10/J, son isogénicos. Knock-down: inhibición dirigida de la expresión de un gen medi ante, por ejemplo, el uso de RNA antisentido o si RNA para unirse a transcritos de RNA. Knock-out condicional: mutante por ingeniería que causa pérdi da de la función de un gen bajo ciertas circunstancias (p. ej., aumento de la temperatura), o en algunas células, pero no en otras. Véase sección 20.2.6. Lectura de pruebas: mecanismo enzimàtico por el cual se identi fican y corrigen los errores de replicación del DNA. Ligadura: formación de un enlace 3'- 5' fosfodiéster entre nucleótidos en los extremos de dos moléculas (ligadura intermolecular) o los dos extremos de la misma molécula (ligadura intramolecu lar, ciclización).

Linaje: serie de células que se origina de una célula progenitora. Línea germinal: las células germinales y las células que les dan lugar; otras células del cuerpo constituyen el soma. Liposoma: vesícula lípida sintética que se utiliza para transportar una molécula de interés al interior de una célula. Véase figu ra 21-8. Locus: localización cromosómica única que define la posición de un gen individual o la secuencia de DNA. Locus de carácter cuantitativo (LCC): locus importante para determinar el fenotipo de un carácter continuo. En la sección 15.6.8 se comenta la investigación sobre el LCC subyacente a la obesidad humana. Manifestación de heterocigoto: portador femenino de un padeci miento recesivo enlazado a X que muestra algunos síntomas clínicos, posiblemente por inactivación de X sesgada. Véase sec ción 4.2.2. Mapa genético: véase recuadro 8-1. Mapeo de autocigosidad: para trastornos autosómicos recesivos incluye la búsqueda de grandes genealogías endogámicas para locus en los que todos los individuos afectados son autocigotos para el mismo alelo. Véase figu ra 13-8. Mapeo de exclusión: mapeo genético con resultados negativos, demostrativo de que el locus en cuestión no se mapea en una localización particular. Especialmente útil para excluir un posi ble gen candidato sin la labor de selección de mutación. Mapeo de (unción: ecuación matemática que describe la relación entre la fracción de recombinación y la distancia genética. El mapeo de función depende de la extensión a la cual la interferencia impide recombinantes dobles cercanos. Véase sección 13.1.3. MAPH: hibridización multiplex con sonda amplificable: método para detectar deleciones o duplicaciones de exones. Véase recuadro 18-1. Marcador (cromosoma): cromosoma extra de origen no identifi cado. Marcador (genético): cualquier carácter m endeliano polimórfico que puede utilizarse para seguir un segmento cromosómico a través de una genealogía. Los marcadores genéticos suelen ser polimorfismos de DNA. Véase recuadro 13-1. Marcador de DNA: véase M arcador (genético). Marcadores polimórficos: véase recuadro 8-1. Marco de lectura: durante la traducción, la forma en que se lee la secuencia continua del mRNA como una serie de codones tripletos. Para cualquier mRNA hay tres posibles marcos de lectura y el marco de lectura correcto se establece por el reconocimiento correcto del codón de inicio AUG. Marco de lectura abierto (MLA): secuencia de DNA significati vamente larga en la que no hay codones de terminación, cuan do menos en uno de los posibles marcos de lectura. Son factibles seis marcos de lectura para un DNA dúplex porque cada filamento puede tener tres marcos de lectura. Masa celular interna: grupo de células localizado dentro del blastocisto que dará lugar al embrión propiamente dicho. Véase figura 3-13. Matriz extracelular: sustancia parecida a un retículo que se encuentra dentro del espacio extracelular y se asocia con la membrana basal de la superficie celular. Proporciona un andamiaje al cual se adhieren las células y sirve para promover la proliferación celular. Meiosis informativa: en análisis de enlace, una meiosis es infor mativa si los genotipos en la genealogía permiten decidir si es

642

GLOSARIO

recombinante o no (para un par de locus determinado). Véase recuadro 13-2. Mendeliano: de un patrón de genealogía, que se ajusta a uno de los patrones arquetípicos que se muestran en la figu ra 4-2. Un carácter dará un patrón de genealogía mendeliana si está deter minado en la localización de un cromosoma, prescindiendo de que el determinante sea o no un gen en el sentido de los genetis tas moleculares. Mesodermo: una de las tres capas germinativas del embrión. Se forma durante la gastrulación por células que migran fuera del epiblasto. Véanse figu ra 3-15 y recuadro 3-5 para derivados del mesodermo embrionario. Metafase: etapa de la división celular (mitosis o meiosis) en la que los cromosomas están contraídos al máximo y alineados en el plano ecuatorial (placa de metafase) de una célula. Véanse fig u ras 2-10, 2-11, 2-15. Metazoarios: animales multicelulares en oposición a protozoarios unicelulares. Mediación de DNA: en el contexto del DNA humano, casi siem pre significa conversión de citosina (por lo general en un dinucleótido CpG) en una 5-metilcitosina. Microdeleción: deleción cromosomica muy pequeña para obser varse al microscopio (típicamente < 3 Mb). Microordenación: una ordenación miniatura de diferentes secuen cias de DNA u oligonucleótidos en una superficie de vidrio que se pretende utilizar en una valoración de hibridación. La secuen cia pueden ser moléculas de DNA preformadas que se deposi taron utilizando automatización o secuencias de oligonucleótidos que se sintetiza in situ para hacer un chip de DNA. Micro-RNA (miRNA): moléculas cortas (22 nt) de RNA codifi cadas dentro de genomas normales que tienen un sitio en la regu lación de la expresión génica y también pueden ser de estructura cromatínica. En ocasiones, se denominan RNA tem poral pequeño (stRNA, del inglés, tem poral pequeño, RNA). Véanse figuras 9-6, 20-12. Microsatélite: tramo pequeño (por lo general menos de 0.1 kb) de repeticiones tándem de una secuencia de DNA muy simple, por lo general 1.4 bp, por ejemplo (CA)n. Con frecuencia polimor fica, proporcionó el medio principal para el mapeo genético durante la década de 1990. En ocasiones también se describe como polimorfismo RTS (repetición tándem simple) o RSS (repetición de secuencia simple). Véanse figuras 7-7, 7-8. Microtúbulos: cilindros huecos largos constituidos por polímeros de tubulina que forman parte del citoesqueleto (véase recuadro 3-2). Minisecuenciación: método para detectar variantes de secuencia en una posición predefinida mediante la secuenciación de tan sólo uno o dos nucleótidos corriente abajo de un cebador. Se utiliza con frecuencia en un formato de microordenamiento. Veassfigu ra 18-9B. Molécula reportera: molécula cuya presencia se detecta fácilmente (p. ej., una molécula fluorescente) que está unida a una secuencia de DNA que se desea vigilar. Véase, por ejemplo, la figura 6-7. Mosaico: individuo que tiene dos o más líneas de células genética mente diferentes derivadas de un solo cigoto. Las diferencias pueden ser mutaciones de punto, cambios cromosómicos, etc. Véast figu ra 4-10. Mosaico germinal (gonadal o gonosómico): individuo con un subgrupo de células de la línea germinal que llevan una mutación que no se encuentra en otras células de dicha línea. Véase figu ra 4-9.

Multifactorial: una característica determinada por alguna combi nación no especificada de factores genéticos y ambientales. Cf, poligénica. Mutación de cambio de estructura: mutación que altera el mar co de lectura traduccional normal de un mRNA añadiendo o eliminando varias bases que no son múltiplos de tres. Mutación dinámica: repetición expandida inestable que cambia de tamaño entre el padre y el hijo. Véase sección 16.6.4. Mutación knock-in: mutación dirigida que reemplaza la actividad de un gen por la de un gen introducido (por lo general un ale lo). Véase figu ra 20-14. Mutación knock-out: inactivación dirigida de un gen dentro de una célula intacta. Mutación de punto: mutación que causa una alteración pequeña en la secuencia de DNA en un locus. El significado es un poco impreciso: cuando se compara con las mutaciones cromosómicas, el término mutación de punto podría utilizarse para incluir cambios muy grandes (pero submicroscópicos) dentro de un gen aislado, en tanto que cuando se discuten mutaciones en un locus aislado, normalmente las mutaciones de punto sig nifican sustitución, inserción o deleción sólo de un nucleótido aislado. Mutación de sentido erróneo: sustitución de un nucleótido que da por resultado el cambio de un aminoácido. Véase recuadro 11-3. Mutación sin sentido: mutación que ocurre dentro de un codón y que lo cambia a un codón de detención. Véase recuadro 11-3. Mutación silenciosa (sinónimo): mutación que cambia un codón pero no altera el aminoácido codificado. Véase recuadro 11-3. Estas mutaciones pueden tener aún efectos en el empalme o la estabilidad del mRNA. Mutagénesis dirigida por sitio: producción de un cambio especí fico predeterminado en una secuencia de DNA. Puede hacerse in vitro en DNA clonado (secciones 5.5.2 y 5.5.3) o in vivo mediante recombinación homologa (sección 20.2.6). Mutagénesis insercional: mutación (por lo general abolición de la función) de un gen por inserción dentro del mismo de una secuencia de DNA no relacionada. Negativo dominante (antimorfo): gen mutante cuyo producto puede inhibir la función del producto del gen tipo silvestre en heterocigotos. Véase, por ejemplo, figu ra 16-4. Neomorfo: alelo con actividad o producto nuevo. No disyunción: falta de separación (desunión) de cromosomas (cromátides hermanas en la mitosis o la meiosis II; homólogos en par en la meiosis I) en la anafase. La principal causa de anor malidades cromosómicas numéricas. Véase sección 2.5.2. No paramétrico: en análisis de enlace, un método que no depende de un modelo genético específico, como el análisis de pares de hermanos afectados. No penetrancia: situación en la que una persona que lleva un ale lo que normalmente causa un fenotipo dominante no muestra ese fenotipo. Un efecto de otros locus genéticos o del ambiente. Un error en la asesoría genética. La figu ra 4-5B muestra un ejemplo. Northern blot: moléculas de membrana que llevan RNA que se fraccionaron de tamaño mediante electroforesis en gel y se uti lizan como blanco para la valoración de hibridación. Se utiliza para detectar los tamaños de transcritos de un gen de interés en un conjunto de tejidos adultos o fetales. Véase figura 5-13.

¡ 643

Notocordio: estructura flexible parecida a un bastón que forma el eje de apoyo del cuerpo en cordados y vertebrados simples y en embriones de vertebrados más complejos. Nucleosoma: unidad estructural de cromatina. "Véase figu ra 2-3. Número MIM: número en el catálogo de un gen o carácter mendeliano, en la lista de la base de datos OMIM. Oligogénico: carácter determinado por un número pequeño de genes que actúan juntos. Oligonucleótido enlazador (adaptador): oligonucleótido de doble filamento que puede ligarse a una molécula de DNA de interés, diseñado para contener alguna característica deseable, por ejemplo, un sitio de restricción favorable. Oligonucleótido específico de alelo (OEA): oligonucleótido sin tético, típicamente ca. 20 nt de largo, cuya hibridación a su secuencia blanco puede alterarse por una incompatibilidad de un par de bases aislado bajo condiciones adecuadas. Los OEA se utilizan como sondas de hibridación específicas de alelo (véase fig. 6-11), o como cebadores específicos de alelo en la reacción en cadena de la polimerasa (PCR). Véase ARMS. Oligonucleótidos degenerados: serie de oligonucleótidos sinteti zados en paralelo que proporcionan la flexibilidad del nucleótido en ciertas posiciones de éste. Cuando se utilizan como sondas de hibridación o fragmentos precursores de PCR pueden hibridar a una familia de secuencias o amplificarla. OMIM: (del inglés, Qn-line Afendelian /nheritance in Afán). Herencia mendeliana en el hombre en línea, la base de datos central de genes humanos y caracteres mendelianos (http: //www3.ncbi.nlm.nih.gov/omim/. Los números M IM son los números índice para entradas en OMIM. Oncogen: gen relacionado con el control de la proliferación celu lar que cuando se activa en exceso puede ayudar a transformar una célula normal en otra tumoral. Véase cuadro 17-1. Originalmente, se utilizó la palabra sólo para las formas acti vadas del gen y el gen celular normal se denominó protooncogen, pero esta distinción no se reconoce ampliamente en la actualidad. Ortólogo: uno de un grupo de genes homólogos en diferentes especies (p. ej., PAX3 en humanos y Pax3 en ratones). Véase recuadro 12-3. Palíndrome: una secuencia de DNA como ATCGAT que es igual cuando se lee en la dirección 5,—* 3' en cada filamento. Por ejemplo, el reconocimiento DNA-proteína mediante enzimas de restricción se basa con frecuencia en secuencias palindrómicas. Par erróneo de filamento deslizado: véase Deslizamiento de replicación. Paradoja de valor C: falta de una relación directa entre el con tenido de DNA en las células de un organismo (el valor C) y la complejidad del mismo. Parálogo: uno de un grupo de genes homólogos dentro de una misma especie. Véase recuadro 12-3. Parámetrico: en análisis de enlace, un método como un análisis de calificación lod estándar, que requiere un modelo genético estrechamente especificado. Pareo: matrimonio entre personas de fenotipo o genotipo similar (p. ej., las personas altas tienden a casarse con personas altas, los individuos sordos tienden a casarse con individuos sordos; algunas personas prefieren casarse con familiares). El pareo puede producir una distribución que no se corresponde con la de Hardy-Weinberg de genotipos en una población.

PCR de tiempo real: véase recuadro 5-1. PCR-Alu: véase recuadro 5-1. PCR-TI (PCR de transcriptasa inversa): véase recuadro 5-1. Penetrancia: frecuencia con la cual se manifiesta un genotipo en sí mismo en un fenotipo determinado. Pérdida de heterocigosidad (PeH]: homocigosidad o hemicigosidad en un tumor u otra célula somática cuando el genotipo cons titu cion al es heterocigoto. Prueba del cambio genético somático. Véase figu ra 17-6, 17-7. Perfil de DNA: uso de genotipos en una serie de locus polimórficos para reconocer a una persona, por lo general con propósitos legales o forenses. Véase sección 18.7. Perfil de expresión: obtención de un cuadro amplio del genoma de niveles de mRNA, normalmente mediante análisis de microordenación del cDNA celular total (fig. 17-18, 19-8). Véase asimismo SAGE. Pintado cromosómico: marcado de un cromosoma completo con fluorescencia mediante un procedimiento de PISH en el que la sonda es una combinación de muchas secuencias diferentes de DNA de un cromosoma aislado. Plasticidad: véase Transdiferenciación. Pliegues: módulos de estructuras proteínicas tridimensionales. Casi todas las estructuras proteínicas están formadas por un repertorio limitado de pliegues que se comparten entre muchas proteínas. Véase sección 19.4.4. Pluripotente: estrictamente, significa la capacidad para dar lugar a muchos tipos de células diferentes, pero no a todos los que puede originar el cigoto. Se dice que el cigoto y las células inmediatas que origina son totipotenciales, pero la diferen ciación por la etapa de blastocisto significa que las células de la masa celular interna son pluripotenciales en lugar de totipoten ciales. PNU (polimorfismo de nucleótido único): cualquier variación polimórfica en un nucleótido aislado. Los PNU incluyen RFLP, pero también otros polimorfismos que no alteran ningún sitio de restricción. Aunque menos informativos que los microsatélites, los PNU son más factibles de calificación automa tizada a gran escala. Poliadenilación: adición de residuos típicamente 200 A al extremo 3’ de un mRNA. La cola poli (A) es importante para estabilizar mRNA. Véase figu ra 1-18. Poligénico: carácter determinado por la acción combinada de va rios locus genéticos. La teoría poligénica matemática (véase sec ción 4.4) asume que hay demasiados locus, cada uno con un efecto pequeño. Polimorfismo: estrictamente, existencia de dos o más variantes (alelos, fenotipos, variantes de secuencia, variantes de estructura cromosómica) a frecuencias importantes en la población. Los usos más laxos entre genetistas moleculares incluyen 1) cualquier variante de secuencia que se encuentra a una frecuen cia > 1% en una población, 2) cualquier variante de secuencia no patogénica, prescindiendo de la frecuencia. Polimorfismo de longitud de fragmentos de restricción (RFLP): marcador genético que consiste en tamaños variables de fragmentos de restricción alélica que resultan de un polimor fismo de secuencia de DNA. Véase recuadro 7-2. Los RFLP se valoraron originalmente mediante Southern blotting (fig. 7-5A), pero en la actualidad por lo general con PCR (fig. 7-6). Polimorfismo de repetición tándem de número variable (VNTR): microsatélites, minisatélites y DNA satélite son orde-

namientos de secuencias repetidas en tándem que con frecuen cia varían entre las personas en el número de unidades repeti das. Véase recuadro 7-2. El término VNTR se utiliza con frecuencia para indicar específicamente minisatélites. Polimorfismo repetido de secuencia simple: véase Microsatélite. Polimorfismo TCR (polimorfismo tándem corto repetido): véase Microsatélite. Poliploide: que tiene múltiples grupos de cromosomas como resul tado de un acontecimiento genético anormal (p. ej., triploidía constitucional o en mosaico, tetraploidía, etc.) o programado (como algunas plantas y ciertas células del cuerpo humano son naturalmente poliploides). Promotor: combinación de elementos de secuencia corta, normal mente justo corriente arriba de un gen, a la que se une la polimerasa de RNA a fin de iniciar la transcripción del gen. "Véase figu ra 1-13. Promotor inducible: un prom otor cuya actividad puede cambiar para que actúe o se suprima por un agente externo. Véase fig u ra 20-5A. Prosecuenciación: método de patente para revisar secuencias muy cercanas a un punto de inicio definido previamente. Véase recuadro 18-2. Proteína de fusión: producto del gen de fusión natural o por inge niería: una cadena polipéptida aislada que contiene secuencias de aminoácidos que normalmente son parte de dos o más polipéptidos separados. Véase recuadro 20-2. Proteoma: grupo total de diferentes proteínas en una célula, tejido u organismo. Cf, genom a, transcriptoma. Protooncogen: véase Oncogen. Protostomas: véase recuadro 12-5. Proximal (de cromosomas): colocado comparativamente cerca del centròmero. Prueba de desequilibrio de transmisión (PDT): prueba estadís tica de asociación alélica. Véase Recuadro 15-3. Prueba de truncación de proteínas (PTP): método de selección para mutaciones de cadena terminal expresando artificialmente un alelo mutante en un sistema acoplado de transcripción-tra ducción. Véase figu ra 17-9, figu ra 18-5. Punto caliente: secuencia asociada con una frecuencia anormal mente alta de recombinación o mutación. Quiasma: manifestación física de recombinación meiótica como se observa al microscopio. Véase figu ra 13-3. Quimera: organismo derivado de más de un cigoto. Véase figura 4-10. RACE-AREC: véase recuadro 5-1. Rastreo gènico: predicción de genotipos dentro de genealogías uti lizando marcadores de enlace a fin de rastrear un segmento cro mosomico. En ocasiones se denomina Prueba indirecta. Véase recuadro 18-3. Recesivo: un carácter es recesivo si sólo se manifiesta en homocigotos. Recombinación no homologa: recombinación entre secuencias que no tienen homología o con homología local limitada. Una causa mayor de inserciones y deleciones a nivel genético o cro mosomico. Véanse, por ejemplo, figuras 11-7, 16-2. Recombinante (análisis de enlace): persona que hereda de un padre una combinación de alelos que resulta de un cruzamien to durante la meiosis. Véase figu ra 13-1.

Redundancia genética: ejecución de la misma función en parale lo por genes en más de un locus, de tal manera que la pérdida de mutaciones funcionales en un locus no causa una pérdida total de la función. Región de control de locus (RCL): extensión de DNA que con tiene elementos reguladores que controlan la expresión gènica en un grupo de genes que puede estar localizado decenas de kilobases lejos. Véase figura 10-23. Región nucleolar organizadora (RNO): los tallos satélite de los cromosomas humanos 13, 14, 15, 21 y 22. Las RNO contienen ordenamientos de genes de DNA ribosómico y pueden teñirse selectivamente con plata. Cada RNO forma un nucleolo en la telofase de la división celular; los nucléolos se fusionan en la interfase. Regiones no traducidas (RNT 5’, RNT 3’) : regiones en el extre mo 5' del mRNA antes del codón de inicio de traducción de AUG, o en el extremo 3' después del codón de detención UAG, UAA o UGA. Véase figu ra 1-19. Regiones seudoautosómicas: regiones en cada punta de los cro mosomas X y Y que contienen genes homólogos X-Y. Debido a la recombinación X-Y, los alelos en estas regiones muestran un modo de herencia aparentemente autosómico. Véase figura 1215. Relación de segregación: proporción de la descendencia que here da un gen o carácter determinado de un padre. Remplazo genico: terapéutica gènica que consiste en reemplazar un gen endógeno defectuoso con una versión que funciona de manera correcta. Véase figu ra 21-4. Reparación incompatible: proceso enzimàtico natural que reem plaza un nucleótido de par erróneo en un dúplex de DNA (más probablemente se encuentra por un error en la replicación del DNA) a fin de obtener un par de bases de Watson-Crick per fecto. Repetición Alu: secuencia de DNA no codificante altamente repetitiva que se encuentra en genomas de primates. Replicón: cualquier ácido nucleico que es capaz de autorreplicarse. Muchos vectores de clonación utilizan replicones extracromosómicos (como en el caso de plásmidos). Oros emplean replicones cromosómicos, sea de manera directa (p. ej., en los vectores cromosómicos de levadura artificial), o indirecta, per mitiendo la integración en el DNA cromosomico. Rescate de trisomía: sobrevivencia de un embrión inicialmente trisómico porque una falta de disyunción mitótica al azar pro duce una célula disómica que se constituye en el progenitor de la totalidad del feto. Puede dar por resultado disomia uniparental. Retrotransposón (retroposón): un elemento de DNA transposable que se transpone mediante un intermedio de RNA. Los retroposones codifican una transcriptasa inversa que actúa en el transcrito de RNA para hacer una copia de cDNA, que a con tinuación se integra en el DNA cromosomico en un sitio dife rente. Véase recuadro 7-4, figuras 7-17, 7-18. Retrovirus: virus RNA con función de transcriptasa inversa, que permite copiar el genoma de RNA del cDNA antes de inte grarse en los cromosomas de una célula huésped. RFLP: véase Polimorfismo de longitud d e fragm entos de restricción. Ribozima: molécula RNA catálitica natural o sintética. Véase fig u ra 21-10. Riesgos empíricos: riesgos calculados a partir de datos de encues tas y no de la teoría genética. La asesoría genética en la mayor

645

parte de los padecimientos no mendelianos se basa en riesgos empíricos. Véase sección 4.4.4. RNA antisentido: transcrito complementario de un mRNA nor mal, formado utilizando el filamento que no es modelo (planti lla) de un gen. Los RNA antisentido que ocurren naturalmente son reguladores importantes de la expresión génica. RNAi (RNA de interferencia): uso de siRNA para knock down (pero rara vez abolir completamente) la expresión de genes específicos. Un medio potente para estudiar la función de los genes. siRNA (RNA de interferencia pequeño); RNA de doble filamen to de 21 a 23 nt que suprime específicamente la función de su mRNA homólogo. Véanse sección 20.2.7 y figu ra 20-2. tRNA supresor: molécula de RNA de transferencia mutante con sustitución de un nucleótido en el anticodón. Muestra una especificidad de codificación alterada y es capaz de trasladar un codón sin sentido (o de sentido erróneo). Véase recuadro 5-3. SAGE (análisis seriado de expresión génica): método de p erfil de expresión basado en secuenciación. Véase figu ra 19-5■ Satélite (en el cromosoma): proyección pedunculada que se encuentra variablemente en los brazos cortos de cromosomas acrocéntricos humanos (13,14,15,21,22). Secuencia de señal (secuencia guía): secuencia de unos 20 aminoácidos en la terminal N de un polipéptido que controla su destino dentro o fuera de la célula. Véase sección 1.5.4. Secuenciación de bisulfito: método para detectar patrones de metilación de DNA. Véase sección 18.3.6. Secuenciación en escopetazo: secuenciación de fragmentos de DNA que se han generado aleatoriamente de una clona grande o un genoma completo. Véase figu ra 8-3. Segmentación química de incompatibilidades (CCM): método de exploración de fragmentos de DNA de tamaño kilobase para mutaciones. Véase cuadro 18-2, figu ra 18-4B. Selección de cDNA: método basado en hibridación para recupe rar clonas genómicas que tienen contrapartes en una genoteca de cDNA. Véase figu ra 7-11. Semidominante: un alelo que, en el heterocigoto, produce un fenotipo intermedio (pero no necesariamente a la mitad) entre el tipo silvestre y el homocigoto. Un término que se utiliza ampliamente en genética de ratones pero que es mejor evitar, cuando menos en genética humanan, ya que dominancia es una propiedad de un carácter y no de un alelo. Sensibilidad de dosis: propiedad de un gen en la que un cambio en el número de copias produce un fenotipo anormal. Sesgo de valoración: proporciones deformadas de fenotipos en un grupo de datos causado por la forma en que se reúnen los casos. Véase sección 15.2.1. Seudogen: secuencia de DNA que muestra un grado alto de homología de secuencia con un gen funcional no alélico pero que no es funcional en sí mismo. Silenciador: combinación de elementos de secuencia de DNA cortos que suprimen la transcripción de un gen. Véase recuadro 10- 2 .

Sincitio: célula que contiene múltiples núcleos como resultado de ciclos de replicación del DNA sin división celular o por fusión de múltiples células (como en el caso de las células de fibra muscular). Síndrome de aneuploidía (o aneusomía) segmentaria: véase Síndrome de gen contiguo.

Síndrome de gen contiguo (aneuploidía segmentaria): síndrome causado por deleción de un grupo contiguo de genes, varios de los cuales, o la totalidad de ellos, contribuyen al fenotipo. Véase sección 16.8.1. Sintenia: presencia de locus en el mismo cromosoma (sinténicos). Los locus sinténicos no necesariamente están enlazados: locus suficientemente separados en el cromosoma se seleccionan alea toriamente, con 50% de recombinantes. Sistema Cre-lox: técnica para generar deleciones cromosómicas predefinidas. Cre es un gen bacteriófago P1 cuyo producto facilita la recombinación entre secuencias loxP. Se denomina así porque crea ^combinación. Véanse figuras 20-10, 20-11. Sistema de dos híbridos: véase Sistema de levadura de dos híbridos. Sistema de levadura de dos híbridos: un sistema importante para identificar y purificar proteínas que se unen a una proteína de interés. Véase figu ra 19-18. Sitio aceptor de empalme (splice)-. la unión entre el extremo 3’ de un intrón y el inicio del exón siguiente. Secuencia de consenso ynnyagR (y = pirimidina, R = purina; caso de arriba = exón). Véase figu ra 1-15. Sitio donador de empalme: unión entre el extremo de un exón y el inicio (extremo 5’) del intrón corriente abajo. Secuencia de consenso (C/A)ACgíragt (r = purina; caso de arriba = exón). Véase figu ra 1-15. Sitio de empalme (splice) críptico: secuencia en el pre-mRNA con cierta hemología a un sitio de empalme. Los sitios de empalme crípticos pueden utilizarse como sitios de empalme cuando está alterado éste o después de una mutación de susti tución de bases que aumenta la semejanza con un sitio de empalme normal. Véanse figuras 11-12, 11-13. Sitio de rama: en el procesamiento del mRNA, una secuencia bas tante mal definida (consenso CTRAY; R = purina, Y = pirimi dina) localizada 10 a 50 bases corriente arriba del aceptor de empalme que contiene la adenosina en la cual se forma el inter mediario de empalme lazo. Véase figu ra 1-15. Sitio de secuencia /«arcado (SSM): cualquier pieza única de DNA para la cual se ha diseñado una valoración de PCR específica, de tal manera que es posible estudiar fácilmente la presencia o ausencia de cualquier muestra de DNA. Véase recuadro 10-3. Sitios de hipersensibilidad de DNAsa I: regiones de la cromatina que son digeridos rápidamente por la DNAsa I. Se piensa que son secuencias de control de largo alcance importantes. Véase sección 10.5.2. Sobredominante: fenotipos que muestran ventaja de heterocigoto. Un término que se utiliza en genética de población. Somitas: bloques discretos de mesodermo segmentario que estable cerán la organización segmentaria del cuerpo originando la mayor parte del esqueleto axil (incluyendo la columna verte bral), los músculos voluntarios y parte de la dermis de la piel. Sonda: fragmento de DNA o RNA conocido (o un conjunto de diferentes fragmentos conocidos) que se utiliza en una valo ración de hibridación a fin de identificar secuencias de DNA o RNA relacionadas muy de cerca dentro de una mezcla comple ja de ácidos nucleicos, que se comprende muy poco. En las valo raciones de hibridación estándar se marca la sonda, pero en las valoraciones de hibridación inversa se marca el blanco (véase recuadro 6-4). Southern blot: transferencia de fragmentos de DNA de un gel electroforético a una membrana de nylon o nitrocelulosa (fil tro), en preparación para una valoración de hibridación. Véase figu ra 5-12.

SSCP o SSCA: polimorfismo o análisis de conformación de fila mento único, un método que se utiliza comúnmente para la selección de mutaciones de punto. Véase figu ra 18-3 A. STS: vcase recuadro 8-1. Suplementación génica (o aumento): terapéutica génica en la que se introduce un gen funcional en las células del paciente sin manipular ninguno de los genes endógenos. Adecuado para corregir la pérdida de fenotipos funcionales. Véase figura 21-4. Sustitución conservadora: mutación que causa el reemplazo de un codón por otro codón que especifica un aminoácido dife rente, pero que está relacionado en las propiedades químicas con el aminoácido original. Sustitución sinónima (silenciosa): sustitución que reemplaza un codón por otro que codifica el mismo aminoácido. Véase Recuadro 9-2.

Translocación: transferencia de regiones cromosómicas entre cro mosomas que no son homólogos. Véase figura 2-21. Transposición duplicativa (o copia o replicativa): transposición de la copia de una secuencia de DNA, en tanto permanece en su sitio la original. Transposón: elemento genético móvil —véase figu ra 9-17—. Transversión: sustitución de un nucleótido de purina por pirimidina o viceversa. Triploidía: de una célula, tener tres copias del genoma; de un organismo, estar constituido por células triploides. Trisomía: presencia de tres copias de un cromosoma particular, por ejemplo, trisomía 21. Trofoblasto (= trofoectodermo): capa externa de células polari zadas en el blastocisto (véase fig. 3-13) que evolucionará para formar el corion, el componente embrionario de la placenta.

Telómero: estructura especializada en las puntas de los cromoso mas. Consiste en una ordenamiento de repeticiones tándem cortas (TTAGGG)n en humanos, que forman un asa cerrada y protegen el extremo del cromosoma. Temperatura de fusión (Tf): véase recuadro 6-3. Tiempo de coalescencia: en genética de población, el número de generaciones anteriores al ancestro común más reciente. Véase recuadro 12-6. Trampa génica: método para seleccionar las inserciones transgénicas que han ocurrido en un gen. Trampa intensificadora: técnica para identificar genes que se expresan con fuerza en un organismo. Transcriptasa inversa: enzima que puede formar un filamento de DNA utilizando una plantilla de RNA. Se utiliza para hacer genotecas de cDNA (fig. 4-8) y para PCR-TI (sección 20.2.4). La transcripción inversa es una parte esencial del ciclo de vida retroviral (fig. 18-2) pero, hasta donde se sabe, no del metabo lismo celular normal. Transcriptoma: grupo total de transcritos de RNA diferentes en una célula o tejido. Cf. genom a, proteoma. Transdiferenciación: (o plasticidad): posible capacidad de las células que parecen estar comprometidas a un tipo particular de diferenciación para derivarse hacia otra vía de diferenciación. Transducción: transferencia génica mediada por virus. Véanse Recuadro 19-1 y Recuadro d e ética 1 en el capítulo 21. Transfección: captación de DNA por células eucariotas (el equiva lente de transformación en bacterias, pero esta palabra tiene un significado diferente para células eucariotas. Véase asimismo captación de DNA de plásmido por células bacterianas. Véase Recuadro 19-1. Transformación (de una célula): 1, captación por una célula bac teriana com petente de DNA de peso molecular alto desnudo del ambiente; 2, alteración de las propiedades de crecimiento de una célula eucariota normal como un paso hacia la evolución a una célula tumoral. Transgén: gen exógeno transfectado al interior de una célula de un animal o una planta. Puede presentarse en algunos tejidos (como en las terapéuticas génicas en el hombre) o en todos los tejidos (p. ej., en ingeniería de línea germinal, como en el ratón). Los transgenes introducidos pueden ser episómicos y expresarse en forma pasajera, o integrarse en los cromosomas de la célula huésped. Transición: sustitución nucleótida G o c

SegLoO a Dase

Leu

CCU CCC CCA CCG

Pro

UAU 1 _ UAC/ T 'r UAASTO P UAG STO P

CAU CAC CAA CAG

UGU1 Cis UGC J QS UGA STOP U G G Trp

CGU CGC CGA CGG

His G in

Arg

AUU AUC AUA AUG ACU ACC ACA ACG AAU AAC AAA AAG AGU AGC AGA AGG

G

lie M et

T re

Asn Lis

S er Arg

GUU GUC GUA GUG

Val

GCU GCC GCA GCG

A la

GAU GAC GAA GAG GGU GGC GGA GGG

Asp Gli

Gli

Códigos de una letra para aminoácidos A G M S X

alanina glicina metionina serina codón de detención

C H N T

cisterna histidina asparagina treonina

D I P V

ácido aspártico isoleucina prolina valina

E ácido glutámico K lisina Q glutamina W triptófano

F L R Y

Información complementaria En las páginas indicadas puede encontrarse información sobre los temas siguientes. Bases de datos electrónicas y recursos de URL (véase asimismo Uso inteligente de internet, pág. xxix) Proyectos del genoma Pág. 236 Centros de secuencia del genoma Cuadro 8-4, pág. 235 Organismos modelos Pág. 236 Base de datos sobre mutación Pág. 348 Secuencias de nucleótidos y proteínas Cuadro 8-2, pág. 222 Otros proyectos del genoma de metazoarios Cuadro 8-4, pág. 235 Genes humanos y estadísticas sobre gcnomas

Recuadro 9-5, pág. 255

Nomenclatura en seres humanos Cromosomas Anormalidades cromosómicas Genes y secuencias de DNA Mutaciones Símbolos de genealogía

Recuadro 2-3, pág. 49 Recuadro 2-4, pág. 53 Recuadro 8-2, pág. 212 Recuadro 16-2, pág. 463 Figura 4-1, pág. 102

Filogenias Fiiogenia^ticariota : .jogen; de metazoarios Filos; :iia de vertebrados

Figura 12-22, pág. 380 Figura 12-24, pág. 382 Figura 12-23, pág. 381

m jo k s

de tejidos de capas germinativas

Recuadro 3-5, pág. 75

fenilalanina leucina arginina tirosina

r\

13.3 13.2 13.1

112r

13.1 13.2 13.3

11.2 1

11.3 11.23

\W

11:1

11.2

12 13

23.1 23.2 23.3

22.1

31.1 31.2 31.3

22.3 23.1

22.2

32 33.1 33.2 33.3 34 35.1 35.2 35.3

15.5 15.4 15.3 15.2 15.1

13.3 13.2 12.3 12.2 12.1

11:1

11.2

H

21.1 21.2 21.3 22.1

21.1 21.2 21.3

22.1

22.2 22.3

22.2

22.3 23.1 23.2

25.1 25.2 25.3 26.1 26.2 26.3

23 24.1 24.2 24.31 , 24.32 \ 24.33

10

11

ii.i ii.i 11.2

26.1 26.2 26.3

12

15

11.3

11.2

11:1 11.21 11.22 11.23

16

Patrones de bandeo de cromosomas humanos

C lave: ^ C entróm ero - rD N A E3 H etero crom atina no centrom érica

a genética molecular humana se revisó y actualizó a la luz de los descubrimientos consecutivos del Proyecto del Genoma Humano. A medida que entramos en la era posgenoma, este libro proporciona un enlace entre los textos elementales y la bibliografía sobre investigación, de tal manera que las personas sin demasiadas bases sobre el tema pueden apreciar y leer las últimas investigaciones.

L

• La primera sección incluye material básico sobre la estructura y función del DNA, cromosomas, células y desarrollo, análisis de genealogía y técnicas básicas utilizadas en un laboratorio. • La segunda com enta los diversos proyectos de secuenciación del genoma y las informaciones que proporcionan sobre la organización, expresión, variación y evolución del genoma humano. • La tercera se enfoca en el mapeo, identificación y diagnóstico de causas genéticas de enfermedades mendelianas, complejas y oncológicas. • En la cuarta parte se analizan los horizontes más amplios de la genómica funcional, proteómica, bioinformàtica, modelos animales y terapéutica. • Se incluye un glosario extenso. Se organizaron por completo las secciones sobre enfermedades complejas y el capítulo de proyectos del genoma. Destaca también una nueva sección sobre filogenètica molecular y la introducción de recuadros de ética para comentar algunas de las implicaciones del nuevo conocimiento. El presente libro permite explicar los principios y no proporcionar gran número de hechos. Es fácil consultar los acontecimientos relevantes, sobre todo a través de internet, y se proporcionan referencias necesarias. Las bibliografías al final de cada capítulo tienen un propósito más didáctico; con frecuencia se citan revisiones en lugar del primer artículo sobre un tema y se han elegido referencias de revistas de fácil acceso. Antes que todo, la obra refleja la sensación de una investigación de rápido movimiento que lleva a continuar la travesía del descubrimiento hacia nuestro genoma.

Me McGraw-Hill H¡ifw Interamericana

The M c G ra w -H ill Companies

V isite nuestra página WEB

www.mcgraw-hill-educacion.coni

Tom Stracham. Genetica Humana 3ra Ed - . VISION MEDICA

Short Description

Description

Comments

We need your help!