Biología molecular avanzada I

20
Evolución del concepto de gen El término gen (gene en inglés) se lo debemos a Wihlhem Johannsen, que así acortó lo que Mendel llamó «la partícula más pequeña que representa una característica hereditaria», lo que Darwin llamó gémulas, o lo que de Vries denominó pangenes. En términos genéticos clásicos, el gen se definía como: La unidad elemental de la herencia La región del cromosoma que gobierna una característica hereditaria concreta El portador de información genética de una generación a la siguiente Ninguna de estas definiciones se ajusta al concepto molecular de gen. La primera definición molecular, un gen, una enzima, se la debemos a Beadle y Tatum, pero como no todas las proteínas son enzimas, se modificó por un gen, una proteína. Cuando se comprobó que las proteínas pueden estar compuestas por varias subunidades, se definió un gen, un polipéptido. Pero pronto se juntaron pruebas de que el gen como unidad de función no era indivisible, puesto que existían en él sitios de mutación específicos que podían separarse entre sí por medio de la recombinación génica. Benzer llamó «cistrón» a la unidad de función genética, «recón» a la unidad indivisible de recombinación y «mutón» a la menor unidad de mutación, con lo que propone un nuevo concepto de gen como cistrón, y la hipótesis de «un cistrón, un polipéptido» (más tarde redefinida como «un gen o cistrón, un mRNA, un polipéptido») . El avance de la biología molecular ha puesto de manifiesto lo siguientes fenómenos que no cuadran con las anteriores definiciones de gen: el descubrimiento de zonas codificantes que no se traducen (intrones) la traducción de zonas no codificantes (el líder de trpL) el solapamiento de varios promotores (genes de rRNA y promotores PR y PRM de λ) la yuxtaposición de terminadores (t1 y t2 en el operón trp) y la antiterminación la aparición de genes que no se traducen (codifican tRNA, rRNA, etc). la existencia del gen UHG, cuyo producto funcional es el intrón, ya que los exones se degradan. lo que ha obligado a dar una definición molecular como un gen, un producto funcional. Sin embargo, existen genes para los que se necesita forzar las definiciones establecidas para que tengan cabida. En estos casos debemos acudir a una interpretación más funcional del concepto de gen en lugar de perdernos en los detalles de la definición. Por ejemplo: Dos genes pueden ser solapantes, compartiendo una región de DNA, bien sobre la misma cadena, bien sobre cadenas distintas. Recordemos los promotores PR y PRM del fago λ que comparten el operador OR. Algunos genes pueden codificar varios productos distintos: los pre-rRNA da varios rRNA funcionales distintos, los genes que inician la transcripción en distintos sitios, los ayustes alternativos del mRNA, etc. El caso más excepcional es el de la inmunoglobulinas en la que un fragmento de DNA sufre reorganizaciones internas antes de ser transcrito, de forma que mediante la pérdida de material genético se originan una gran variedad de transcritos y genes (los anticuerpos). En cualquier caso, no debe confundirse el término gen con el de unidad de transcripción, que incluye la secuencia del DNA que se ha de transcribir más las dos secuencias consenso que la flanquean lo que se denimina promotor y terminador. Es «impropio» (que no incorrecto) definir la unidad de transcripción como región del DNA que se extiende entre el promotor y el terminador. En los eucariotas, el concepto de gen y unidad de transcripción coinciden, mientras que en los procariotas se reserva el término operón para la unidad de transcripción ya que éste y el gen no coinciden. Nomenclatura de genes y proteínas Los genes tienen un nombre de tres letras que se escriben en cursiva o bien subrayados, mientras que la proteína que determinan se escribe en letra normal con todo o sólo la primera letraen mayúsculas. A veces, para evitar confusiones, se añade la letra «p» al final del nombre de la proteína.

description

Notes of advanced molecular biology from the University of Málaga, provided by the Doctor González Claros

Transcript of Biología molecular avanzada I

Page 1: Biología molecular avanzada I

Evolución del concepto de gen

El término gen (gene en inglés) se lo debemos a Wihlhem Johannsen, que así acortó lo que Mendel llamó

«la partícula más pequeña que representa una característica hereditaria», lo que Darwin llamó gémulas, o lo que de Vries denominó pangenes. En términos genéticos clásicos, el gen se definía como:

La unidad elemental de la herencia

La región del cromosoma que gobierna una característica hereditaria concreta

El portador de información genética de una generación a la siguiente

Ninguna de estas definiciones se ajusta al concepto molecular de gen. La primera definición molecular, un gen, una enzima, se la debemos a Beadle y Tatum, pero como no todas las proteínas son enzimas, se modificó por un gen, una proteína. Cuando se comprobó que las proteínas pueden estar compuestas por varias subunidades, se definió un gen, un polipéptido. Pero pronto se juntaron pruebas de que el gen

como unidad de función no era indivisible, puesto que existían en él sitios de mutación específicos que podían separarse entre sí por medio de la recombinación génica. Benzer llamó «cistrón» a la unidad de función genética, «recón» a la unidad indivisible de recombinación y «mutón» a la menor unidad de mutación, con lo que propone un nuevo concepto de gen como cistrón, y la hipótesis de «un cistrón, un polipéptido» (más tarde redefinida como «un gen o cistrón, un mRNA, un polipéptido») .

El avance de la biología molecular ha puesto de manifiesto lo siguientes fenómenos que no cuadran con las anteriores definiciones de gen:

el descubrimiento de zonas codificantes que no se traducen (intrones)

la traducción de zonas no codificantes (el líder de trpL)

el solapamiento de varios promotores (genes de rRNA y promotores PR y PRM de λ)

la yuxtaposición de terminadores (t1 y t2 en el operón trp) y la antiterminación

la aparición de genes que no se traducen (codifican tRNA, rRNA, etc).

la existencia del gen UHG, cuyo producto funcional es el intrón, ya que los exones se degradan.

lo que ha obligado a dar una definición molecular como un gen, un producto funcional. Sin embargo,

existen genes para los que se necesita forzar las definiciones establecidas para que tengan cabida. En estos casos debemos acudir a una interpretación más funcional del concepto de gen en lugar de perdernos en los detalles de la definición. Por ejemplo:

Dos genes pueden ser solapantes, compartiendo una región de DNA, bien sobre la misma cadena, bien sobre cadenas distintas. Recordemos los promotores PR y PRM del fago λ que

comparten el operador OR.

Algunos genes pueden codificar varios productos distintos: los pre-rRNA da varios rRNA funcionales distintos, los genes que inician la transcripción en distintos sitios, los ayustes alternativos del mRNA, etc.

El caso más excepcional es el de la inmunoglobulinas en la que un fragmento de DNA

sufre reorganizaciones internas antes de ser transcrito, de forma que mediante la pérdida de material genético se originan una gran variedad de transcritos y genes (los anticuerpos).

En cualquier caso, no debe confundirse el término gen con el de unidad de transcripción, que incluye la

secuencia del DNA que se ha de transcribir más las dos secuencias consenso que la flanquean —lo que se denimina promotor y terminador—. Es «impropio» (que no incorrecto) definir la unidad de transcripción como región del DNA que se extiende entre el promotor y el terminador. En los eucariotas, el concepto de gen y unidad de transcripción coinciden, mientras que en los procariotas se reserva el término operón para la unidad de transcripción ya que éste y el gen no coinciden.

Nomenclatura de genes y proteínas

Los genes tienen un nombre de tres letras que se escriben en cursiva o bien subrayados, mientras que la proteína que determinan se escribe en letra normal con todo —o sólo la primera letra— en mayúsculas. A veces, para evitar confusiones, se añade la letra «p» al final del nombre de la proteína.

Page 2: Biología molecular avanzada I

el gen ABC determina la proteína Abc, ABC o Abcp.

Los genes se escriben en minúsculas cuando son mutantes, mientras que se escriben las tres letras

en mayúsculas en el caso de genes silvestres eucariotas, o con sólo la primera en mayúsculas si es un gen silvestre procariota.

En levaduras URA3 es el gen silvestre y ura3-52 es la mutación que impide sintetizar

uracilo.

En E. coli, LacZ es el gen silvestre lacZ es un mutante.

Cuando hay varios genes que tienen el mismo nombre, se suele completar con una letra mayúscula en procariotas o con números en eucariotas. Los proyectos de secuenciación de genomas necesitan

nombrar genes de función desconocida, con lo que siguen otros criterios para generar esos nombres que se encuentran también normalizados como el de los genes de humanos (http://www.gene.ucl.ac.uk/nomenclature/guidelines.html) y ratones (http://www.informatics.jax.org/mgihome/nomen/).

En levaduras están los genes GAL1, GAL4 y GAL80 que intervienen en la regulación de la

asimilación de la galactosa.

En el caso del estudio de genética del desarrollo en Drosophila y Arabidopsis, es corriente

encontrarse genes que tienen más de tres letras y corresponden con un concepto en inglés, ya que es más fácil recordar así la función de dicho gen. Por ejemplo, el gen APETALA genera flores sin pétalos cuando se muta.

RNA eucarióticos

Buena parte de las peculiaridades de la transcripción eucariótica se debe a que estas células producen más tipos de RNA que los procariotas, lo que lleva a una clara distinción entre los que es un transcrito primario(o RNA precursor) y un transcrito maduro que será el RNA funcional. En los

eucariotas, todos los transcritos primarios sufren algún tipo de maduración o procesamiento.

Localización intracelular

La localización intracelular también va a ser específica: en una célula eucariota, por ejemplo un fibroblasto, encontramos aproximadamente 6 pg de DNA que corresponde a su material genético. En cambio, encontramos 25 pg de RNA, de los que 3-4 pg están localizados en el núcleo y el resto en el

citoplasma. Todos los transcritos primarios y algunos de los maduros (por ejemplo los snRNA, véase más adelante) se encuentran en el núcleo, mientras que en el citoplasma sólo se encontrarán formas

maduras de la mayoría de los transcritos. De los que se encuentran en el núcleo, los pre-rRNA se encuentran en el nucléolo y los demás en el nucleoplasma.

Tipos de RNA

Además de los típicos y abundantes mRNA, rRNA y tRNA cuya función y definición es la misma que la de procariotas, los eucariotas poseen:

hnRNA: es el precursor del mRNA. Su tamaño es muy heterogéneo (de 0,2 a 30 kb, aunque la mayoría

entre 5 y 8 kb) y la vida media muy breve. En cuanto se sintetiza, se le unen proteínas, formando el hnRNP. Más del 70% del hnRNA se degrada en el núcleo sin conseguir madurar correctamente.

pre-rRNA: es el precursor de los rRNA (el más abundante en las células) y se localiza en el núcleo. La

mitad del que se sintetiza se degrada en el núcleo sin llegar a formar un rRNA maduro.

pre-tRNA: es el precursor de los tRNA (12 al 15% del RNA celular). Es muy poco abundante.

Page 3: Biología molecular avanzada I

snRNA: se trata de RNA nucleares pequeños y monocatenarios que miden de 50 a 300 nt. Tienen sus

propios promotores. Uno de ellos (el snRNA 7SL) se ha descubierto que se encuentra finalmente en el retículo endoplásmico para el transporte de proteínas, por lo que se le denomina frecuentemente scRNA.

snoRNA: RNA nucleolares pequeños y monocatenarios que se obtienen por el ayuste de los intrones, aunque algunos tienen sus propios promotores. Actúan asociados a proteínas, formando las snoRNP.

Éstas sirven para ayudar a procesar el pre-rRNA 45S, guiar sus modificaciones covalentes (por ejemplo, metilación de la ribosa en los rRNA o la formación de seudouridinas), y madurar los tRNA. También se suele considerar que este tipo de RNA es el que hace de plantilla para los telómeros.

Muchos de los snRNA y snoRNA se están encontrando en lo que antes se denominaba DNA chatarra o basura (junk DNA). Por ejemplo, el gen UHG de mamíferos que codifica los snoRNA U22 y U25 a U31 en sus intrones, mientras que su mRNA maduro no codifica nada, degradándose rápidamente en la célula.

miRNA: es el microRNA, pequeñas moléculas de RNA monocatenario que regulan la transcripción de

determinados mRNA mediante ribointerferencia, o se unen al 3'UTR de un mRNA y bloquean su traducción. Se transcriben a partir de su propio promotor. Forman parte de este tipo de RNA los stRNA (small temporal RNA) y su precursor, el shRNA (small hairpin RNA).

siRNA: son los RNA interferentes pequeños que se obtienen por la degradación de dsRNA en fragmentos

de 21 a 25 nt y que permiten degradar los mRNA complementarios a ellos. Estos siRNA surgen del corte endonucleolítico de los RNA aberrantes celulares.

Diferencias entre la transcripción procariótica y eucariótica

La cromatina a transcribir está mucho más condensada en los eucariotas: en la

metafase (máxima condensación) la transcripción está detenida.

La mayor parte del DNA eucariota (como mínimo la mitad) no se transcribe nunca, mientras que en los procariotas se transcribe práticamente todo.

Los eucariotas producen más tipos de transcritos distintos.

Más del 1,5% del RNA transcrito corresponde a RNA no codificantes (ncRNA); la

mayoría son miRNA y snoRNA. Existen además otros largos que parecen mRNA, pero que están regulados e intervienen en numerosos procesos básicos y del desarrollo.Entre ellos también están los transcritos de función desconocida, que son cada vez más y se están descubriendo gracias a las técnicas de secuenciación masiva.

Todos los transcritos eucariotas han de madurarse en el núcleo, aunque algunas etapas

pueden ocurrir en el citosol.

En los eucariotas, la transcripción y la traducción no están acopladas, y se producen en

compartimentos diferentes. Esto implica una regulación distinta para cada proceso.

Las secuencias 5’ y 3’ no traducidas de los mRNA son mucho más largas que las que se encuentran en los procariotas.

Los genes eucariotas son monocistrónicos.

En los eucariotas hay 3 polimerasas nucleares distintas, y también una característica de

mitocondrias y una quinta para los cloroplastos.

Las polimerasas eucariotas necesitan muchos factores de transcripción para funcionar. La mayoría son activadores.

Gracias a los estudios de genómica y transcriptómica, cada vez se están encontrando más transcritos de función desconocida (TUF: transcripts of unknown function).

Se puede conseguir silenciar completamente un gen en un eucariota.

La transcripción eucariótica es muy específica y regulada, lo que les confiere una

expresión muy controlada, compleja y precisa. La pérdida de esta regulación provoca enfermedades como el cáncer: se ha visto que suelen contener transcritos específicos, la mayoría procedentes de fusiones génicas o de ayustes aberrantes, además de las archiconocidas deleciones génicas.

Page 4: Biología molecular avanzada I

RNA-polimerasas eucarióticas

Las tres RNA-polimerasas eucarióticas codificadas en el núcleo se numeran I, II y III en función del orden en el que eluyen cuando se cromatografía un extracto nuclear en columna de intercambio iónico al ir aumentando la fuerza iónica del tampón de elución. Las tres se transcriben desde distintos genes, se localizan en diferentes compartimentos, son susceptibles a distintos inhibidores, tienen un tamaño en torno a 600 kDa y están compuestas por dos subunidades grandes no idénticas que se denominan, como en procariotas, núcleo polimerasa o polimerasa central.

La subunidad mayor (Rpb1) pesa entre 180 y 210 kDa. Su secuencia es homóloga a la subunidad ß’ de E. coli. Es la que interacciona directamente con el DNA. Es la que interacciona directamente con el DNA y contiene el dominio CTD de la RNA-pol II.

La subunidad menor (Rpb2) pesa entre 130 y 150 kDa y es homóloga a la subunidad ß de

la de E. coli. En ella reside la actividad catalítica del complejo.

El heterodímero Rpb3/Rpb11 es homóloga a la subunidad α de la bacteriana.

El núcleo enzimático va acompañado de 10 a 14 subunidades más pequeñas (10 a 50 kDa), de las que sólo 5 son comunes a las tres polimerasas (Rpb5, Rpb6, Rpb8, Rpb10 y Rpb12) y son absolutamente esenciales. Las RNA-polimerasas son incapaces de reconocer los promotores, por lo que existe un aparato básico de transcripción, cuyo funcionamiento debe ser dirigido por los factores de transcripción. Los factores de transcripción son incapaces de reconocer sus secuencias diana si están unidas a nucleosomas. Cada RNA-polimerasa una reconoce distintos promotores para iniciar la transcripción.

El tamaño final de la holoenzima (600 kDa) es mayor que el del nucleosoma (260 kDa). La velocidad total de polimerización es unas 20 veces mayor que la de las DNA-polimerasas puesto que las tres RNA-polimerasas están funcionando simultáneamente. La siguiente tabla resume las principales características de las RNA-polimerasas eucarióticas.

La RNA-polimerasa I se localiza en el nucléolo por ser donde se transcriben activamente los rRNA. Es

muy abundante y es la más activa. La cromatina que transcribe está totalmente desprovista de nucleosomas para permitir la transcripción rápida y continua de estos genes.

La RNA-polimerasa II transcribe todos los genes que se traducen y los snRNA de tipo U (menos el U6

que lo hace la RNA-polimerasa III), por lo que se considera la más representativa y es a la que se suele aludir cuando no se especifica el tipo de polimerasa. Es menos activa que la RNA-polimerasa I porque debe eliminar los nucleosomas a su paso.

Puede estar fosforilada en su subunidad mayor, donde presenta un dominio C-terminal con múltiples repeticiones (50 en mamíferos) de la secuencia Tyr-Ser-Pro-Thr-Ser-Pro-Thr llamado CTD (C-terminal domain) que es clave para la iniciación y la enlongación. Seis de las subunidades adicionales de la RNA-pol II de humanos son capaces de sustituir sus homólogas en levaduras, ya que la mayoría de los polipéptidos que componen esta holoenzimas están muy conservados a lo largo de las especies. A diferencia de sus equivalentes bacterianas, las RNA-pol I y II tienen que ser muy procesivas porque los genes transcritos a veces son muy grandes (13 kb la I y hasta 1000 kb la II).

Page 5: Biología molecular avanzada I

En la imagen de la derecha puedes analizar en más detalle la estructura de la RNA-polimerasa II de levaduras. El centro activo lo puedes localizar en el centro de la proteína gracias a la presencia del átomo de Mg. Cada subunidad está representada de un color diferente. En torno al Mg contactan las dos subunidades mayores (Rbp1 y Rbp2). Las subuniddes Rpb1, Rpb5 y Rpb9 forman un par de mandíbulas que sujetan el DNA, mientras que Rbp1, Prb2 y Pbp6 forman una pinza que sujeta el DNA cerca del sitio catalítico. Esta doble sujección del DNA es lo que le da su gran procesividad.

La RNA-polimerasa III es la más compleja y menos abundante, y trancribe todo tipo de RNA pequeños

Las RNA-polimerasas de los orgánulos son un único

polipéptido codificado por un gen nuclear. Tienen clara homología con las polimerasas fágicas (la de mitocondria) o de cianobacterias (la cloroplastídica). Como estos genomas son más pequeños, se dedican a transcribir pocos genes y el control de la transcripción es mucho más simple, cuando existe.

El el caso de la mitocondria de los humanos, la RNA-polimerasa mitocondrial necesita la presencia del factor de transcripción mtTFA para iniciar la transcripción. La transcripción de la hebra pesada (H) se inicia en dos promotores distintos (PH1 y PH2) muy cercanos uno del otro sobre la región no codificante del cromosoma mitocondrial humano. En la misma región se localiza el promotor que transcribe la cadena ligera (PL) del genoma mitocondrial.

A partir de PH1 se transcribe un RNA corto que

codifica los tRNAPhe, rRNA 12S, tRNAVal y rRNA 16S. La transcripción se para entonces gracias al factor mtTERF. Este transcrito se corta a continuación para dar los 4 RNA.

Page 6: Biología molecular avanzada I

Cuando la transcripción se inicia en PH2, el inicio de transcripción se localiza justo detrás

del tRNAPhe, pero la polimerasa consigue copiar completamente el cromosoma mitocondrial. El doble inicio en PH1 y PH2 permite sintetizar más cantidad de rRNA que del resto de los productos génicos (60 veces más). La decisión del promotor a utilizar viene gobernada por las hormonas tiroideas.

El transcrito generado por PL, aunque copia todo el cromosoma, solo contiene 8 tRNA y un

mRNA útiles, además de general el RNA cebador que ayudará a la replicación de la cadena H.

Etapas de la transcripción

Al igual que en procariotas, las etapas básicas son la iniciación, la elongación y la terminación. Los

procesos enzimológicos también son los mismos, por lo que vamos a ver cuáles son las diferencias esenciales que caracterizan al proceso eucariótico.

Hasta no hace mucho, los promotores se analizaban por deleciones seriadas desde el extremo 5' del gen, por lo que se consideraba que el promotor empezaba a partir del nucleótido más distal cuya deleción provocaba la pérdida de la capacidad transcriptora. Siguiendo este criterio, quedaban excluidos del promotor muchos elementos reguladores que no influían decisivamente sobre la transcripción del gen.

Para la transcripción se necesitan una serie de factores de transcripción que se nombran empezando por la abreviatura TF, le sigue el número de la polimerasa que reconoce, y termina por una letra que sirve para distinguirlos unos de otros. Por razones históricas, existen muchas excepciones a esta regla.

Page 7: Biología molecular avanzada I

Iniciación

Principios generales

Durante la iniciación es cuando se produce el reconocimiento del promotor y asociación de la polimerasa. Es la parte más compleja de la transcripción y sobre la que se ejercerán la mayoría de las actividades reguladoras. Debido al gran tamaño del genoma, los factores de transcripción y la polimerasa tienen muy difícil reconocer sus sitios específicos. Para conseguir especificidad se requieren mecanismos más intrincados como el superenrollamiento —condensar las regiones de DNA que no se tienen que expresar— con el objeto de disminuir la cantidad de DNA a rastrear. Como se verá, la presencia de los nucleosomas entorpece la transcripción de los genes.

La función del promotor esencialmente consiste en facilitar la unión de la RNA-polimerasa al DNA y asegurar que el inicio de la transcripción se realice con mucha eficacia y en un nucleótido determinado. El complejo de iniciación produce en la región de inicio de transcripción el desenrollamiento y separación de las dos cadenas del DNA (complejo abierto) que es donde va a tener lugar la síntesis de la cadena de RNA. Esta estructura se desplazará por el DNA a medida que avanza la elongación (burbuja de transcripción). Es necesario que se en torno a la RNA-polimerasa forme el complejo holoenzimático polimerasa para que se pueda empezar a transcribir. El modelo más aceptado propone que en la región

promotora se van asociando los factores de transcripción y subunidades de la holoenzima de manera ordenada y constante, hasta que se une la polimerasa central. También se requiere la presencia de una DNA-helicasa y la establización de la región desapareada con proteínas específicas. El proceso

enzimático por el que se añaden los ribonucleótidos uno a uno a partir del primer nucleótido trifosfato es igual que el procariota.

Más adelante se verá que cada RNA-polimerasa reconoce un promotor específico y forma un complejo holoenzimático polimerasa diferente y característico. La determinación de los elementos que hay en un promotor se realiza mediante mutaciones, deleciones seriadas y huellas genéticas de protección.

Decondensación del DNA para la transcripción

Para poder iniciar una transcripción, la maquinaria transcriptora ha de poder acceder a la hebra de DNA, lo que implica la descondensación previa de la región implicada del cromosoma. Este fenómeno se reconoció por primera vez al estudiar citoquímicamente los cromosomas politénicos de las glándulas salivares deDrosophila. En los cromosomas politénicos se distinguen una serie de bandas muy características y constantes. Cada banda contiene unos pocos genes (menos de 10) y desaparece

cuando uno de estos genes se transcribe activamente, ya que se desempaqueta el DNA.

Para que la maquinaria transcripcional pueda acceder al promotor, éste ha de encontrarse descondensado (como máximo, debe estar en forma de fibra de 10 nm) y desprovisto de nucleosomas (se detectan como regiones hipersensibles a las nucleasas). En cambio, en esta región abundan las proteínas no histónicas como HMG14 y HMG17. La eliminación de los nucleosomas se debe al ensamblaje y desensamblaje de los mismos controlado por la acetilación de las histonas. La acetilación de los

aminoácidos Lys y Arg (que aportan las cargas positivas) produce grupos amida que no se protonan a pH fisiológico, por lo que estas proteínas pierden su carga; tradicionalmente se pensaba que con ello se disminuye su afinidad por el DNA, pero parece más probable que la acetilación no influya en la interacción con el DNA sino entre las propias histonas del nucleosoma. Las actividades histona-acetil-transferasa (HAT) e histona-desacetilasa (HDAC) se encargan de realizar este proceso. Cada vez es más evidente

que los factores de transcripción tienen actividad acetil-transferasa para facilitar la liberación de los nucleosomas en torno a la secuencia que reconocen. Cuando la cromatina está en forma inactiva (condensada), las histonas se encuentran metiladas en lugar de acetiladas. A su vez, este DNA inactivo también está metilada la 5mC de los dobletes CpG.

Page 8: Biología molecular avanzada I

También se ha observado la ubicuitinación de H2A y H2B en las zonas de cromatina transcripcionalmente competente es una señal de desensamblaje. La fosforilación también es clave, pero los resultados de su acción son aparentemente contradictorios.

Durante la elongación de la transcripción, la RNA-polimerasa es capaz de desplazar los nucleosomas en la zona codificante: cuando la RNA-polimerasa se encuentra con uno, lo empuja sin esfuerzo los primeros 30 nt y luego se enlentece hasta el nt 80 —con paradas cada 10 nt—, momento en el que el nucleosoma es desplazado gracias a la energía potencial topológica que se acumula en las superhélices por la tensión del DNA y a la intervención de factores de remodelación del nucleosoma: primero se desprende el dímero H2A-H2B y luego el H3-H4. Inmediatamente se vuelve a formar por detrás.

Page 9: Biología molecular avanzada I

Inicio de la RNA-polimerasa I

Esta polimerasa, a diferencia de las otras dos, va a sintetizar un único tipo de transcrito, el pre-rRNA grande de 13,7 kb en los mamíferos (45S). El promotor de cada unidad de transcripción (que está repetida miles de veces en la mayoría de los genomas) abarca unas 200 pb delante del inicio de transcripción y comprende dos regiones:

1. El promotor basal, que va de la posición –45 hasta la +20, por lo que incluye el inicio de transcripción (+1). Esta región es rica en G y C

(salvo la parte del Inr alrededor de la posición +1, que es rica en A y T) y se necesita para iniciar correctamente la transcripción, siendo capaz depromover la transcripción por sí misma. No existe ninguna secuencia conservada entre especies —ya que sólo hay un promotor de estos por especie— que pueda servir de señal de reconocimiento.

2. La secuencia reguladora distal (UCE: upstream control element o URS, upstream regulatory sequence) se sitúa en la parte 5’ del gen, entre las posiciones –107 y –180. Su eliminación hace que la transcripción descienda hasta 100 veces. Su secuencia es un 85% homóloga a la del promotor basal y también rica en GC.

La falta de homologías en las secuencias promotoras de este tipo de genes hace que sean promotores muy específicos de especie y no sean reconocidos por la maquinaria de transcripción de especies heterólogas.

Page 10: Biología molecular avanzada I

Los factores que reconocen este promotor para facilitar la entrada de la RNA-polimerasa I son:

UBF (upstream binding factor): es un homodímero que reconoce la UCE y provoca un giro

de 360° que acerca esta región al promotor basal, con lo que mejora la eficacia de la transcripción al interaccionar con el otro factor de transcripción (SL1). Otros autores proponen que UBF reconoce a la vez el promotor basal y el UCE, y por eso induce el giro en el DNA.

SL1 (selective factor, también denominado TIF-IB o Rib1 en otras especies): es un

heterotetrámero formado por la TBP (TATA binding protein) y tres TAFI (TBP associated factors). La unión del SL1 reconoce el promotor como funcional y permite que se una la RNA-polimerasa I para comenzar la transcripción; por eso, la función del SL1 recuerda la del factor σ de la RNA polimerasa bacteriana.

La TBP se aisló inicialmente de los promotores de la RNA-

polimerasa II como la proteína que reconocía específicamente la caja TATA en estos promotores.

Los TAFI sí suelen ser específicos de los promotores. El subíndice

indica el tipo de promotor al que se unen. Las distintas moléculas de TAF del mismo factor de transcripción suelen ser distintas. Algunos TAF se ha visto que también forman parte de otros complejos proteicos que están directa o indirectamente relacionados con la regulación de la transcripción —como las histona-acetil-transferasas—. Los TAF se asocian entre sí mediante el dominio HFD (histone fold domain) de la misma forma que se asocian las histonas.

Por tanto, se deduce que el SL1 se une al promotor de forma similar a como lo hacen el DNA y los nucleosomas.

Inicio de la RNA-polimerasa III

Ninguno de los genes que transcribe esta polimerasa produce una proteína, sino RNA funcionales, y son pequeños (menores de 300 nt): pre-rRNA 5S; los tRNA; algunos RNA pequeños que intervienen en el ayuste —snRNA U6, 7SK, 7SL, 4,5S y M— y los microRNA. Todos comienzan con una G y se localizan sobre la zona codificante (no delante como todos los demás) en lo que se denomina la región interna de control (ICR:internal control region). Cadena arriba hay una secuencia necesaria para la especificidad y eficacia del sitio de inicio: la secuencia reguladora proximal (URS: upstream regulatory sequence).

Inicio de la RNA-polimerasa III

Ninguno de los genes que transcribe esta polimerasa produce una proteína, sino RNA funcionales, y son pequeños (menores de 300 nt): pre-rRNA 5S; los tRNA; algunos RNA pequeños que intervienen en el ayuste —snRNA U6, 7SK, 7SL, 4,5S y M— y los microRNA. Todos comienzan con una G y se localizan sobre la zona codificante (no delante como todos los demás) en lo que se denomina la región interna de control (ICR:internal control region). Cadena arriba hay una secuencia necesaria para la especificidad y eficacia del sitio de inicio: la secuencia reguladora proximal (URS: upstream regulatory sequence).

Page 11: Biología molecular avanzada I

Según se coloquen la ICR y la URS, se distinguen tres tipos de promotores:

De tipo «a» (como el de la figura) El del rRNA 5S. La ICR incluye dos cajas (A y C), de unos 20 pb cada una, entre las regiones +55 y +80, que son reconocidas inicialmente por el factor TFIIIA. La presencia

del TFIIIA provoca una curvatura en el DNA y a continuación atrae al factor TFIIIC. Con el consumo de ATP, se une el factor TFIIIB que también necesita la existencia de la caja A, pero no de la C. Con la entrada del TFIIIB en presencia de TFIIIA y TFIIIC se ha formado el complejo de preiniciación con lo que puede incorporarse la polimerasa. El complejo de preiniciación indica que el gen está listo para ser transcrito, es un complejo estable y puede mantenerse a lo largo de varios ciclos de replicación; in vitro, el promotor funciona con tal de que el TFIIIB ya estuviera unido.

De tipo «b» El de los tRNA, snRNA y posiblemente los microRNA. No tienen caja C, pero tienen una caja B en posiciones variables y una caja A más cercana al inicio de transcripción, y no necesitan el TFIIIA. La interacción del TFIIIB sólo depende de la presencia de la caja A.

De tipo «c» El del gen del snRNA U6 y 7SK. No son intragénicos —no presentan IRC— sino que se encuentran en la región 5' del gen, contienen una caja TATA a –25, que es lo que reconoce el TFIIIB, y la URS está en –60. Necesitan que el factor de transcripción SNAPc se una al TFIIIB para que luego se una la polimerasa. Durante muchos años se dudó de que fuera la pol-III y no la pol-II la que los transcribía.

El TFIIIA es una proteína de 37 kDa con 9 dedos de zinc como dominio de unión al DNA en su región N-

terminal, que ocupa casi toda la proteína.

El TFIIIC es un complejo proteínico de más de 500 kDa con al menos 5 subunidades diferentes.

El TFIIIB es equivalente al SL1, pues se trata de un heterotetrámero formado por la TBP y

tres TAFIII diferentes entre sí y a los vistos para el SL1. TFIIIB sitúa la RNA-polimerasa III correctamente en el inicio de transcripción sobre la URS.

Los promotores de la RNA-polimerasa II

Los genes transcritos por la RNA-polimerasa II son todos los mRNA y muchos snRNA implicados en su ayuste, por lo que son los responsables de las proteínas de la célula. Los promotores se localizan siempre en la zona 5' no codificante previa al sitio del inicio de la transcripción.

Page 12: Biología molecular avanzada I

Aunque la estructura de estos promotores es bastante dispar, se pueden definir los tres elementos esenciales de este tipo de promotores:

1. Promotor basal o mínimo: es el que determina el sitio de inicio de transcripción. En esta parte se encuentran varios elementos comunes a todos los promotores. Éstos son la caja TATA para verificar que es un promotor, la secuencia iniciadora Inr para determinar el inicio de transcripción, y el emento de respuesta al TFIIB (BRE) para orientar el promotor.

2. Los elementos proximales: se encarga de determinar la frecuencia con la que se debe iniciar la transcripción. Los elementos proximales más importantes son la caja CAAT, las cajas GC y las secuencias distales específicas (SDE).

3. Los elementos distales: se encuentran a más de 1 kpb del inicio de transcripción, tanto hacia 5' como hacia 3', y funcionan independientemente de su orientación. Los hay potenciadores y silenciadores.

Muchos autores prefieren definir los promotores sólo como los elementos basales y proximales, dejando a los terceros exclusivamente como secuencias reguladoras.

El promotor basal

Además de lo anteriormente mencionado, en esta región se se ensamblará el complejo de preiniciación. Abarca desde la posición +40 a –40 aproximadamente y contiene varios elementos:

La caja TATA (caja de Hogness; no se debe confundir con la caja TATA (Pribnow) de

procariotas que está a –10) se sitúa entre la posición –15 y –25, aunque en levaduras varía mucho más (desde –40 a –120). La secuencia consenso es TATANAA, y la mutación de uno de sus nucleótidos siempre estropea la actividad promotora. Su función es marcar el fragmento del cromosoma en el que puede comenzar la transcripción, así como el sitio preciso en el que iniciará la transcripción, pero no determina el sentido de la transcripción debido a la simetría de su secuencia. Solo aparece en al 10-15% de los genes conocidos de los humanos

La secuencia iniciadora Inr se sitúa entre las posiciones –3 y +5, su secuencia consenso es NYYAN(TA)YY o (Y)2CA(Y)5, donde la A es el primer nucleótido que se transcribe

La orientación de la transcripción la proporciona la secuencia BRE (elemento de

respuesta al TFIIB). Suele aparecer en algunos de los promotores con caja TATA, con lo que la contienen tan solo el 12% de los promotores. Se localiza entre las posiciones –32 y –37, muy cerca de la caja TATA. A veces se puede encontrar detrás de la caja TATA.

la secuencia DPE (downstream core promoter element) se encuentra ya en la zona

codificante entre las posiciones +28 to +32. Suele aparecer sobre todo en los promotores que carecen de caja TATA. Cuando hay DPE, actúa sinérgicamente con Inr. Por ejemplo, es la caja que promueve la transcripción de los LINE.

el motivo MTE (motif ten element) funciona en sinergia y dependencia de la secuencia Inr, y aparece en los promotores sin caja TATA.

Los distintos tipos de promotores basales combinan distintas posibilidades, siendo la más frecuente que la ausencia de caja TATA implique presencia de Inr, DPE y MTE

Page 13: Biología molecular avanzada I

Los elementos proximales

Estos elementos no especifican la posición del inicio, sino la frecuencia con la que se produce el inicio por ser reconocidas por diversos factores de transcripción que favorecen la interacción de la RNA-polimerasa II con el punto de inicio. Su presencia y secuencia es aún mas variable que las de los elementos basales.

La caja CAAT se localiza entre –50 y –100. Su consenso es CC(CT)ACCTCT. Fue uno de los primeros

módulos descritos como importantes para el promotor. Se puede encontrar en muchas posiciones y su papel es más importante que el de la caja TATA en proporcionar eficacia al promotor, pero, curiosamente, no siempre está presente.

La caja GC suele aparecer varias veces (hasta 6 copias). Su secuencia suele ser de tipo GGGCGG, con

la C sin metilar. Pueden encontrarse tanto delante como detrás de la caja CAAT (pero siempre delante del promotor mínimo) y son más frecuentes en promotores sin TATA, como la mayoría de los genes de mantenimiento (housekeeping). Su función es permitir una expresión constante, pero baja.

Las secuencias distales específicas (SDE) son las más alejadas de todas (–100 a –200) y suelen

constar de 6 a 10 nt. Son reconocidas específicamente por determinadas proteínas. Funcionalmente no se distinguen de los elementos distales, pero se diferencian de éstos en que se localizan en la zona proximal. Un ejemplo son las secuencias Oct1 y Oct2 reconocidas por los homeodominios que se verán en el tema siguiente.

Cuando los promotores carecen de estos elementos proximales se dice que son genes constitutivos o de mantenimiento. Da igual que los genes constitutivos se expresen de forma muy abundante, como que se transcriban a baja velocidad, puesto que lo importante es que lo hagan de manera continua y no regulada.

Elementos distales

Aparecen en los genes inducibles. se encuentran muy alejados de los elementos anteriores —entre 1 y 5 kpb—, se pueden encontrar tanto en la región 5’ como 3’ del gen, y funcionan independientemente de su orientación. Su naturaleza es modular —con secuencias repetidas en tándem—, lo que le permite compensar las mutaciones que se introduzcan en alguno de sus módulos. Con frecuencia no se les considera parte del gen. Aunque están lejos, se acercan al promotor basal debido a curvaturas en el DNA y a que tampoco están tan lejos, ya que unas 2 kpb contienen de 10 a 12 nucleosomas, con lo que el potenciador no estará a mas de 20 nm del promotor basal —recuerda que la RNA-polimerasa II mide 16 nm—.

Se pueden establecer 3 categorías:

1. Silenciadores o inhibidores: Impiden que se transcriba el gen sin cambiar el grado de empaquetamiento de la cromatina. Se describieron inicialmente en las levaduras, y

ya se han encontrado unos pocos en otros organismos. No confundir con el silenciamiento por condensación de la cromatina.

2. Potenciadores (intensificadores o estimuladores: enhancers): aumentan mucho la velocidad de inicio de transcripción de los pomotores mínimos que se colocan en su misma cadena de DNA. En las levaduras hay elementos análogos a los potenciadores: las UAS (upstream activating sequences), pero se diferencian de los potenciadores en que sólo funcionan si se localizan en 5’ del promotor, nunca detrás.

3. Aisladores (insulator): se trata de secuencias cortas (alrededor de 50 nt) que impiden que los potenciadores y los silenciadores actúen más allá de ellas. Así, un gen rodeado por aisladores está protegido frente a la propagación de efectos de inactivación de las regiones cercanas, así como de la regulación por potenciadores inadecuados.

Page 14: Biología molecular avanzada I

A todos los aisladores se les une la proteína CTCF (CCCTC binding factor por ser ésta la

secuencia presente en todos los aisladores encontrados en vertebrados) que presenta 11 dedos de Zn. No son meras barreras físicas sino que intervienen directamente en la regulación.

Parece que su acción se ejerce al formar «lazos» aislados en la cromatina que definen el dominio sobre el

que se puede ejercer su regulación. Estos dominios se establecen por interacción entre aisladores, entre

el aislador y la membrana, o entre el aislador y las proteínas que se unen a un potenciador. No solo son

capaces así de evitar el efecto de potenciadores indebidos, sino incluso de evitar el efecto silenciador del

DNA superenrollado cercano.

Page 15: Biología molecular avanzada I

Los silenciadores y los potenciadores pueden encontrarse muy próximos entre sí. En otras ocasiones

pueden incluso funcionar como potenciador y como silenciador, como en el caso del elemento de

respuesta a estrógenos, que es potenciador si a él se une el receptor de las hormonas esteroideas, pero

es silenciador si se le une el receptor de las hormonas tiroideas (se verá en otro capítulo). Los

potenciadores víricos son los más potentes y de más amplio espectro: el primer potenciador se describió

en el virus SV40 en 1981, que sirve para activar los genes tempranos del virus durante la infección. En el

caso de las inmunoglobulinas se ha detectado un elemento distal «dentro» del propio transcrito del gen,

aunque sólo funciona como tal en los linfocitos B.

Inicio de los promotores de la RNA-pol II

La RNA-polimerasa II interacciona simultáneamente con gran variedad de factores de transcripción. Según se unan a cada uno de los elementos descritos anteriormente, se puede hablar de factores de transcripcióngenerales (reconocen los elementos basales), proximales (reconocen los elementos proximales) e inducibles (reconocen los elementos distales y los SDE). La forma y el orden en que se unen determina el inicio de la transcripción.

Factores de transcripción generales y cómo se unen

Los factores generales, al reconocer las secuencias más conservadas, son a su vez, los más conservados. Promueven la formación del complejo de inicio, mediando la fijación de la polimerasa y el correcto punto de comienzo de transcripción. Véase un esquema general del proceso.

Page 16: Biología molecular avanzada I

La secuencia de unión de estos factores comienza con la unión del TFIID al surco menor del DNA (libre

de histonas) a través de la caja TATA (o del MTE/DPA) a través de la TBP, protegiendo unos 35 pb. Esta

etapa es la crítica en el proceso. El TFIID está muy conservado y parece ser el único que reconoce

específicamente una secuencia de DNA, la caja TATA, aunque también se une a promotores que no la

tienen, uniéndose, en tal caso, al elemento Inr. Su tamaño es de unos 800 kDa. Uno de sus componentes

es la TBP que aquí sí reconoce específicamente la caja TATA. La TBP tiene un dominio de unión a DNA

un poco especial que se conoce como «silla de montar». In vitro basta la TBP para iniciar una

transcripción. Los otros componentes del TFIID son varias moléculas de TAFII (de 9 a 12 distintas) que

varían enormemente de unos promotores a otros. Una buena parte de las TAF son proteínas reguladoras

y factores específicos de tejido u órgano y otras median entre el complejo basal de la RNA-polimerasa y

algunos reguladores. Por tanto, las TAFIIson necesarias para responder a la regulación de los

promotores.

Si quieres conocer mejor su estructura y modo de acción de la TBP, consulta una estupenda

guía elaborada por Jordi Oliver y Pilar Roca (UIB).

A continuación se unen el TFIIA y el TFIIB para definir el punto de inicio o abortar el proceso si no se ha

encontrado un verdadero punto de inicio. El DNA está protegido desde –80 hasta +10. La estructura asimétrica del complejo define el sentido de la transcripción. El TFIIA es un complejo de 3 subunidades que sirve para estabilizar la interacción entre el TFIID y el DNA. No es esencial pero muchos reguladores interaccionan con él. El TFIIB es le que orienta el sentido de la transcripción del promotor. En su región N-terminal hay motivos de dedo de Zn para unirse al DNA y presenta un canal de salida del RNA, de forma análoga a la que presenta la subunidad σ procariótica.

A continuación se unen la RNA-polimerasa II y el TFIIF, lo que lleva la protección del DNA hasta +20. La

subunidad mayor del TFIIF tiene actividad helicasa y la otra se parece mucho a la subunidad σ de la RNA-polimerasa bacteriana. Su principal función es la de deshacer interacciones inespecíficas entre la RNA-polimerasa y el DNA, estabilizar las interacciones correctas, definir el sitio de iniciación y aumentar la velocidad de polimerización de los primeros nucleótidos.

Sobre este complejo entra el TFIIE, llevando la protección hasta +30. Se trata del momento de máxima protección y se le denomina complejo promotor cerrado.

La entrada del TFIIH/TFIIK, que está compuesto por al menos 9 subunidades que le proporcionan

actividad helicasa y cinasa, separa las dos cadenas del DNA en torno a la caja TATA en unos 12 pb. La subunidad con actividad cinasa es la TFIIK, puesto que no aparece en el TFIIH que interviene en la REN.

La TFIIK, que se une y separa reversiblemente del complejo, fosforila el dominio CTD de la RNA-polimerasa una vez formado elcomplejo promotor abierto.

En los promotores con elemento Inr, también intervienen las IBP (Inr binding proteins), que son un conjunto de factores entre los que se encuentran TAF150, TFII-I e YY1.

La fosforilación del CTD marca el fin de la inicación. Al comenzar la polimerización, se separan la mayoría de los TFII y se pasa a la elongación. El promotor basal y los factores generales de transcripción bastan para transcribir un gen, pero con muy poca intensidad. La fuerza del promotor va a depender de la unión de factores a los elementos proximales y distales del promotor.

Factores de transcripción proximales

Son los que contribuyen a aumentar la eficacia de la formación del complejo de inicio, o bien

favorecen la actividad de la propia polimerasa. Cada promotor necesita un conjunto preciso de estos factores para su funcionamiento óptimo. A modo de ejemplos:

CTF (también conocido como NF1): interacciona con la caja CAAT y hace aumentar la

eficacia del promotor. El dominio que hace de activador es del tipo rico en Pro (20%) de la secuencia.

CBP, ACF, CP1 y CP2 también interaccionan con la caja CAAT en distintos tipos celulares, por lo que se sugiere que debe existir una familia de de proteínas capaces de discriminar las distintas cajas CAAT.

Page 17: Biología molecular avanzada I

SP1 (monómero de 105 kDa): se une a las cajas GC, pero no a todas, por lo que las

secuencias adyacentes han de influir de alguna manera en esta interacción, ya que su unión protege unos 20 nt, cuando el motivo GC es sólo de 6-8 nt. Contacta con TFIID, activando la transcripción. El motivo de unión a DNA de SP1 son 3 dedos de Zn en la zona C-terminal. El dominio activador tiene un 25% de Gln.

Factores de transcripción inducibles o distales

Los factores que reconocen los elementos distales facilitan (o impiden) la formación del complejo de inicio de transcripción. A diferencia de los anteriores, sólo están presentes en momentos específicos o en células que lo requieren. O sea, son reguladores y se verán ejemplos característicos en el tema de la

regulación eucariótica.

Lo habitual es que el contacto no sea directo entre el factor distal y la polimerasa, sino que esté mediado por un coactivador que interacciona simultáneamente con la polimerasa y con el factor distal. Un

coactivador se define como «aquellos factores que se necesitan para ejercer el efecto de los activadores que se unen al DNA, pero que no son necesarios para la transcripción basal per se, ni muestran una unión específica de sitio por sí mismos».

Los coactivadores suelen estar formados por muchas subunidades proteicas. Puesto que el mismo coactivador puede recibir señales de distintos potenciadores, son distintas subunidades de éste las que van a interaccionar con los elementos distales. Uno de los coactivadores holoproteicos más conocidos en humanos recibe el nombre de Mediador. Se trata de un complejo de más de 20 subunidades (más

grande que la propia RNA-polimerasa) tan conservado que es capaz de reconocer señales que provienen de activadores de distintas especies. Se ha visto que se organiza en módulos que se pueden disociar del conjunto (coincidiendo con los colores de los dibujos anteriores y con la recogida y envío de las señales).

En la figura de la derecha se esquematiza la estructura del complejo mediador y a la derecha cómo interacciona con la RNA-polimerasa y con el DNA.

Page 18: Biología molecular avanzada I

Elongación

La holoenzima ha permanecido inmóvil mientras se polimerizan los primeros nucleótidos, hasta que el TFIIK fosforila el CTD, activado por el TFIIE. Se ha visto que este dominio fosforilado se ubica muy próximo al canal por el que sale el RNA que se está sintetizando, por lo que se piensa que interviene en la transferencia de factores proteicos al mRNA naciente.

Tras la fosforilación, la polimerasa se libera de todos los factores de iniciación excepto la helicasa del TFIIF y comienza su avance por el DNA. En torno al elemento Inr pueden quedarse los TFII A, B y D así como otros activadores de la transcripción, listos para reiniciar otro ciclo de transcripción —esta vez más abreviado puesto que las primeras estapas no han de repetirse—.

Una actividad helicasa sigue abriendo el DNA por delante, lo que genera importantes tensiones en la molécula que se compensan por la acción de las topoisomerasas. Por detrás de la polimerasa el RNA recién sintetizado se va desapareando del DNA molde y quedando en forma de cadena sencilla de RNA. Las dos cadenas de DNA se vuelven a aparear y gracias a la asistencia de otra topoisomerasa, se rebobina de nuevo el DNA.En esta etapa intervienen al menos 16 factores de elongación cuyo mecanismo exacto se desconoce. Su función siempre aparece relacionada con 3 fenómenos principales:

La eliminación de las pausas o paradas de la polimerasa. Los mejor identificados

son TFIIS (antes llamado SII) que sirve para evitar que la RNA-polimerasa se detenga prematuramente (limita las pausa de la RNA polimerasa. La presencia de este factor también se necesita para que se estimule la actividad editora.) y por los factores que alteran la Km y la Vmax de la enzima para incrementar su capacidad catalítica: ELL, CSB y SIII (elonguina).

Para que la polimerasa funcione, tiene que estar fosforilado hSPT5. Gracias a este factor

se recluten las enzimas necesarias para la adición de la caperuza: también sirve para se se incorpore TAT-SF1 que es necesario para que se reclute en los sitios adecuados la maquinaria del ayuste. También se incorporan las proteínas que intervienen en la remodelación de los nucleosomas durante la elongación (SWI/SNF, FACT, HMG14, elongator...), ya que sigue siendo necesario despejar el camino.

El mantenimiento del estado fosforilado del CTD (PTEFb y otros), ya que su

desfosforilación inhibe la elongación. Este factor también mantiene fosforilado el hSPT5. También sirve para reclutar otros factores como TAT-SF1.

Está claro que la elongación, la terminación y la maduración del mRNA están íntimamente interconectados y necesitan estar coordinados con precisión.

Page 19: Biología molecular avanzada I

Terminación

Las secuencias terminadoras propiamente dichas están aún poco caracterizadas, pero se ha visto que provocan dos efectos:

detención o pausa en el avance de la polimerasa al pasar por ellas

desestabilización del híbrido RNA—DNA.

El resultado final es la separación de los componentes del complejo de transcripción (incluida la desfosforilación del CTD de la RNA-polimerasa II) y desensamblaje de la holoenzima para ser reciclada en otro complejo de iniciación. El extremo 3’ de los RNA eucarióticos transcritos no coincide con el extremo 3’ de los RNA maduros ya que es habitual que los extremos de los transcritos primarios se corten durante la maduración (excepto los de la RNA-polimerasa III). También se comprende la dificultad del estudio de las secuencias y mecanismos de terminación, ya que los transcritos primarios (hnRNA y otros pre-RNA) son de corta vida y difícil purificación.

Terminación de la RNA-polimerasa I

Los rRNA se expresan mucho debido al confinamiento de estos genes en el nucléolo, la ausencia de nucleosomas en su región codificante y el estar repetidos en tándem. Por otra parte, el acoplamiento entre el fin de la transcripción de un pre-rRNA con el comienzo del siguiente (posición en tándem) acelera aún más esta transcripción: cuando la terminación de la transcripción de un gen acaba cerca del promotor del siguiente, se activa la transcripción del segundo gen ya que resulta más rentable polimerizar secuencia inútil que soltar el DNA y volver a iniciar otra transcripción.

La señal de terminación de los rRNA es una secuencia de 18 pb duplicada que se encuentra triplicada, de la que hay dos copias cerca del extremo 3’ del gen 28S (T1 y T2) y la tercera a 200 pb del inicio de transcripción del gen siguiente (T3).

En una secuencia indeterminada se une una proteína terminadora (Reb1p en las levaduras o TTF-I en los

mamíferos) que detiene el avance de la RNA-polimerasa. Una vez detenida, una región rica en T en la

cadena codificante facilita la separación del RNA. No se ha observado que se formen horquillas.

Page 20: Biología molecular avanzada I

Terminación de la RNA-polimerasa II

Esta enzima tiene un mecanismo equivalente al de la terminación dependiente de ρ de procariotas. Se ha observado que la enzima se detiene en la región de terminación debido bien a secuencias específicas en el DNA, o bien a proteínas que favorecen la pausa que aún no se han identificado. Una proteína similar a ρ se une al RNA e induce la separación del complejo holoenzimático. De hecho se ha comprobado que la propia ρ de E. coli es capaz de inducir esta terminación. Está directamente relacionada con la poliadenilación del mRNA.

Terminación de la RNA-polimerasa III

Esta enzima tiene un mecanismo equivalente al de la terminación intrínseca en procariotas. La detención de la RNA-polimerasa se produce en alguna de las T que hay al final del gen. Se producen diferencias en la terminación dependiendo del tipo de promotor que se ha utilizado en la iniciación:

Si es un promotor de tipo «a», el TFIIIA atrae los factores de terminación específicos que

van a reconocer las T si van precedidas de un palíndromo de GC.

Si es un promotor de tipo «b» es TFIIIC el que atrae los factores de terminación.

Si es un promotor de tipo «c», SNAPc es la que va a reclutar los factores de terminación

que van a reconocer las T dentro de una zona rica en A puesto que se ha visto que la presencia de G inhibe la terminación en este caso.

A diferencia de la terminación de las otras dos polimerasas, estos transcritos no van a sufrir ninguna modificación en su extremo 3’, por lo que todos acaban en varias UUU.