Información

¿Los codones de inicio alternativos codifican la metionina después de la transcripción?

¿Los codones de inicio alternativos codifican la metionina después de la transcripción?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Existe alguna bibliografía que muestra que todos los codones de inicio codifican la metionina. Sin embargo, en el código genético estándar, los codones de inicio alternativos codifican claramente la leucina. ¿Significa eso que estos codones codificarán la leucina cuando se encuentren durante la traducción (después de que el codón de inicio se haya inicializado y traducido)?


Comenté que esto era un duplicado, pero al leer la pregunta con más atención, parece estar preguntando algo ligeramente diferente.

En el contexto de un "inicio", estos codones serán reconocidos por fMet-tRNA y se insertará una formil-metionina como primer aminoácido. Las apariciones posteriores del mismo codón dentro del marco de lectura abierto se traducirán normalmente (por ejemplo, GUG> valina).

El uso de GTG como codón de iniciación en el E. coli lacI gene

en este papel

Frottini y col. (2006) La proteómica de la escisión de metionina N-terminal. Molec. & Celda. Proteómica 5: 2336-2349

los autores informan ensayos de E. coli metionina aminopeptidasa con péptidos modelo que muestran que cuando Lys es el segundo residuo, la eliminación de Met es muy ineficaz. También muestran que cuando Pro es el tercer residuo, la eliminación de Met es muy ineficiente.

Esto explica el hecho de que cuando se secuenció la proteína represora lacI:

Beyreuther y col. (1973) La secuencia de aminoácidos del represor lac. PNAS 70: 3576-3580

se encontró que tenía un residuo Met en su extremo N (secuencia Met-Lys-Pro-).

Sin embargo, cuando el lacI el gen fue secuenciado:

Farabaugh (1978) Secuencia de la lacI gene. Naturaleza 274: 765-769

la secuencia de ADN correspondiente fue GTG AAA CCA, lo que demuestra que el residuo N-terminal está codificado por un codón GTG (Val). El residuo LacI Val23 está codificado por un codón GTG, lo que demuestra el uso normal de ese codón en el cuerpo del ARNm.


42 El código genético

Para resumir lo que sabemos hasta este punto, el proceso celular de transcripción genera ARN mensajero (ARNm), una copia molecular móvil de uno o más genes con un alfabeto de A, C, G y uracilo (U). La traducción de la plantilla de ARNm convierte la información genética basada en nucleótidos en un producto proteico. Las secuencias de proteínas constan de 20 aminoácidos comunes, por lo tanto, se puede decir que el alfabeto proteico consta de 20 letras. Cada aminoácido está definido por una secuencia de tres nucleótidos llamada triplete. codón. La relación entre un codón de nucleótido y su correspondiente aminoácido se llama codigo genetico.

Dados los diferentes números de "letras" en los "alfabetos" de ARNm y proteínas, las combinaciones de nucleótidos correspondían a aminoácidos individuales. El uso de un código de tres nucleótidos significa que hay un total de 64 (4 × 4 × 4) combinaciones posibles, por lo tanto, un aminoácido dado está codificado por más de un triplete de nucleótidos (Figura 8).

Figura 8: Esta figura muestra el código genético para traducir cada triplete de nucleótidos, o codón, en el ARNm en un aminoácido o una señal de terminación en una proteína naciente. (crédito: modificación del trabajo por NIH)

Tres de los 64 codones terminan la síntesis de proteínas y liberan el polipéptido de la maquinaria de traducción. Estos trillizos se llaman codones de parada. Otro codón, AUG, también tiene una función especial. Además de especificar el aminoácido metionina, también sirve como codón de inicio para iniciar la traducción. El marco de lectura para la traducción lo establece el codón de inicio AUG cerca del extremo 5 'del ARNm. El código genético es universal. Con unas pocas excepciones, prácticamente todas las especies utilizan el mismo código genético para la síntesis de proteínas, lo que es una prueba poderosa de que toda la vida en la Tierra comparte un origen común.


Características y excepciones del código genético y ¡ndash discutidas!

Existe una conexión íntima entre los genes y la síntesis de polipéptidos o enzimas. Los genes están formados por nucleótidos dispuestos de una manera específica. En la terminología moderna, un gen se refiere a un cistrón de ADN. Un cistrón está compuesto por una gran cantidad de nucleótidos.

La disposición de los nucleótidos o sus bases nitrogenadas está relacionada con la síntesis de proteínas al influir en la incorporación de aminoácidos en ellas. La relación entre la secuencia de aminoácidos en un polipéptido y la secuencia de nucleótidos de ADN o ARNm se llama código genético.

El ADN contiene solo cuatro tipos de bases nitrogenadas o nucleótidos, mientras que el número de aminoácidos es 20. Por lo tanto, se planteó la hipótesis de que el código triplete (que consta de tres bases adyacentes para un aminoácido) es operativo. Las diferentes investigaciones que ayudaron a descifrar el código genético del triplete son las siguientes.

1. Crick et al (1961) observaron que la deleción o adición de uno o dos pares de bases en el ADN de T4 el bacteriófago alteró el funcionamiento normal del ADN. Sin embargo, cuando se agregaron o eliminaron tres pares de bases, la perturbación fue mínima.

2. Nirenberg y Mathaei (1961) argumentaron que un solo código (un aminoácido especificado por una base de nitrógeno) puede especificar solo 4 ácidos (4 1), un código doble solo 16 (4 2) mientras que un código triplete puede especificar hasta 64 aminoácidos (4 3). Como hay 20 aminoácidos, puede ser operativo un código triplete (tres bases nitrogenadas por un aminoácido).

3. Nirenberg (1961) preparó polímeros de los cuatro nucleótidos UUUUUU & # 8230 (ácido poliuridílico) ,× & # 8230 (ácido policitidílico), AAAAAAA & # 8230 (ácido poliadenílico) y GGGGGGG & # 8230 (ácido poliguanílico). Observó que poli-U estimuló la formación de polifenilalanina, poli-C de poliprolina, mientras que poli-A ayudó a formar polilisina. Sin embargo, el poli-G no funcionó (formó una estructura de triple cadena que no funciona en la traducción). Más tarde, se descubrió que GGG codificaba el aminoácido glicina.

Mesa. Asignación de codones de ARNm a aminoácidos.

4. Khorana (1964) sintetizó copolímeros de nucleótidos como UGUGUGUGUG y observó que estimulaban la formación de polipéptidos que tenían aminoácidos alternativamente similares a cisteína-valina-cisteína. Esto es posible solo si tres nucleótidos adyacentes especifican un aminoácido (por ejemplo, UGU) y otros tres el segundo aminoácido (por ejemplo, GUG).

5. Los codones del triplete se confirmaron mediante la asignación de codones in vivo a través de (i) estudios de desplazamiento y desplazamiento de aminoácidos (ii) mutaciones de cambio de marco.

6. Lentamente se elaboraron todos los codones, algunos aminoácidos están especificados por más de un codón. Los lenguajes de código de ADN y ARNm son complementarios. Por tanto, los dos codones para fenila y timilanina son UUU y UUC en el caso de ARNm, mientras que son AAA y A AG para ADN.

Caracteristicas:

1. Código de triplete:

Tres bases de nitrógeno adyacentes constituyen un codón que especifica la ubicación de un aminoácido en un polipéptido.

2. Señal de inicio:

La síntesis de polipéptidos se indica mediante dos codones de iniciación: el codón AUG o metionina y el codón GUG o valina.

3. Señal de parada:

La terminación de la cadena polipeptídica se indica mediante tres codones de terminación UAA (ocre), UAG (ámbar) y UGA (ópalo). No especifican ningún aminoácido y, por lo tanto, también se denominan codones sin sentido.

4. Código universal:

El código genético es aplicable universalmente, es decir, un codón especifica el mismo aminoácido de un virus a un árbol o un ser humano. Por lo tanto, el ARNm del oviducto de pollo introducido en Escherichia coli produce un ovalbumen en la bacteria exactamente similar al formado en el pollo.

5. Codones no ambiguos:

Un codón especifica solo un aminoácido y ningún otro.

6. Codones relacionados:

Los aminoácidos con propiedades similares tienen codones relacionados, p. Ej. aminoácidos aromáticos triptófano (UGG), fenilalanina (UUC, UUU), tirosina (UAC, UAU).

7. Sin coma:

El código genético es continuo y no posee pausas después de los trillizos. Si se elimina o se agrega un nucleótido, todo el código genético se leerá de manera diferente. Por tanto, un polipéptido que tiene 50 aminoácidos se especificará mediante una secuencia lineal de 150 nucleótidos. Si se agrega o elimina un nucleótido en el medio de esta secuencia, los primeros 25 aminoácidos del polipéptido serán los mismos, pero los siguientes 25 aminoácidos serán bastante diferentes.

8. Código no superpuesto:

Una base de nitrógeno es un componente de un solo codón.

9. Degeneración del código:

Dado que hay 64 tripletes de codones y solo 20 aminoácidos, la incorporación de algunos aminoácidos debe estar influenciada por más de un codón. Solo el triptófano (UGG) y la metionina (AUG) se especifican mediante codones individuales.

Todos los demás aminoácidos están especificados por 2-6 codones. Estos últimos se denominan codones degenerados. En los codones degenerados, las dos primeras bases nitrogenadas son similares mientras que la tercera es diferente. Como la tercera base de nitrógeno no tiene ningún efecto sobre la codificación, la misma se denomina posición de oscilación.

10. Colinealidad:

Tanto el polipéptido como el ADN o ARNm tienen una disposición lineal de sus componentes. Además, la secuencia de bases de triplete nucleótidos en el ADN o ARNm corresponde a la secuencia de aminoácidos en el polipéptido fabricado bajo la guía del primero. El cambio en la secuencia de codones también produce un cambio similar en la secuencia de aminoácidos del polipéptido.

11. Paridad cistrón-polipéptido:

La porción de ADN llamada cistrón (= gen) especifica la formación de un polipéptido particular. Significa que el sistema genético debe tener tantos cistrones (= genes) como tipos de polipéptidos que se encuentran en los organismos.

Excepciones:

1. Diferentes codones:

En Paramecium y algunos otros codones de terminación ciliados, UAA y UGA codifican glutamina.

2. Genes superpuestos:

ф xl74 tiene 5375 nucleótidos que codifican 10 proteínas que requieren más de 6000 bases. Tres de sus genes E, B y K se superponen con otros genes. La secuencia de nucleótidos al comienzo del gen E está contenida dentro del gen D. Del mismo modo, el gen K se solapa con los genes A y C. Se encuentra una condición similar en SV-40.

3. Genes mitocondriales:

AGG y AGA codifican la arginina, pero funcionan como señales de parada en la mitocondria humana. UGA, un codón de terminación, corresponde al triptófano, mientras que AUA (codón de isoleucina) denota metionina en las mitocondrias humanas.


Transcripción en células eucariotas

La transcripción es más compleja en las células eucariotas que en las procariotas. Las proteínas activadoras se unen a genes conocidos como potenciadores que ayudan a determinar qué genes están activados y aceleran la transcripción. Las proteínas represoras se unen a genes llamados silenciadores que interfieren con las proteínas activadoras y ralentizan la transcripción. Los coactivadores, moléculas adaptadoras que coordinan las señales de las proteínas activadoras y represoras, transmiten esta información a factores basales que luego colocan la ARN polimerasa al comienzo de la región codificante del gen para comenzar la transcripción.

Una vez que comienza la transcripción real, los ribonucleótidos que contienen 3 grupos fosfato forman enlaces de hidrógeno a través del proceso de emparejamiento de bases complementarias con los desoxirribonucleótidos expuestos en la hebra desenrollada que se va a transcribir. A continuación, los ribonucleótidos se unen covalentemente mediante enlaces fosfodiéster, y la energía se suministra mediante la escisión de dos grupos fosfato del ribonucleótido trifosfato (Figura ( PageIndex <16> ). 8B.5). (El enlace fosfodiéster se refiere al fosfato en el 5'C del nucleótido recién insertado que se une covalentemente al 3'C del último ribonucleótido en la cadena de ARNm).

Figura ( PageIndex <18> ). 6B.5: Transcripción de ARNm complementario al ADN. El ARN se sintetiza mediante el apareamiento de bases complementarias de ribonucleótidos libres con los desoxirribonucleótidos de un gen. Los ribonucleótidos se unen covalentemente mediante enlaces fosfodiéster, y la energía se suministra mediante la escisión de dos grupos fosfato del ribonucleótido trifosfato. La enzima responsable de la transcripción es la ARN polimerasa (no se muestra aquí)

A diferencia de los procariotas, la mayoría de los genes de las células eucariotas superiores contienen grandes cantidades (hasta un 98% en el genoma humano) de regiones llamadas intrones que no forman parte del código de la proteína final. Estos se intercalan entre las regiones codificantes o exones que realmente codifican la proteína final.

La ARN polimerasa copia tanto los exones como los intrones para formar lo que se llama ARNm precursor o pre-ARNm. Al principio de la transcripción, se agrega una tapa en forma de un nucleótido inusual, el 7-metilguanilato, al extremo 5 'del pre-ARNm. Esta tapa ayuda a que los ribosomas se adhieran para la traducción. A medida que la transcripción está casi completa, se agrega una serie de 100-250 ribonucleótidos de adenina denominada cola poli-A al extremo 3 'del pre-ARNm. Se cree que esta cola de poli-A ayuda a transportar el ARNm fuera del núcleo y puede estabilizar el ARNm contra la degradación en el citoplasma. Después de la transcripción del ARNm precursor, las regiones codificantes no proteicas (intrones) se escinden y las regiones codificantes (exones) se unen mediante complejos de ribonucleoproteínas llamados espliceosomas para producir lo que se denomina ARNm maduro, como se muestra en la Figura ( PageIndex <9> ). Este proceso se llama procesamiento de ARN.

El ARNm maduro pasa luego a través de los poros de la membrana nuclear para ser traducido en proteína por el ARNt en los ribosomas eucariotas 80S (compuestos por subunidades 60S y 40S) de una manera similar a los procariotas.

La molécula de ARNm se divide en codones. Un codón es una serie de tres bases de ARNm consecutivas que codifican un aminoácido específico. Los diversos codones y los aminoácidos que codifican se muestran en la Figura ( PageIndex <8> ). Hay 64 codones. Un codón, AUG, también sirve como codón de inicio para iniciar la traducción, y tres codones, UAG, UAA y UGA, funcionan como codones de parada o sin sentido para terminar la traducción. (Los codones de inicio alternativos son diferentes del codón AUG estándar y se encuentran ocasionalmente tanto en procariotas como en eucariotas).

Además de los genes que se transcriben en ARNm para traducirlos en polipéptidos y proteínas, también existen genes específicos en el ADN a partir de los cuales se transcriben cada uno de los diferentes ARN de transferencia (ARNt) y ARN ribosómico (ARNr).

Una vez transcrito, el ARNm se puede traducir en proteína.

Como se mencionó anteriormente, los intrones constituyen la mayor parte del ADN en las células eucariotas superiores y durante décadas se consideró que era "ADN basura" acumulado durante millones de años de evolución. Sin embargo, en los últimos años, se ha descubierto que gran parte de este ADN intergénico, aunque no codifica la síntesis de proteínas, se transcribe en moléculas funcionales de ARN con nombres como ARN antisentido microARN y ARN riboswitch que desempeñan papeles importantes en si o en realidad, no se produce una proteína.

El ARN antisentido es ARN transcrito de la hebra de ADN complementaria a la que se transcribe en ARNm. En otras palabras, es una molécula de ARN complementaria a un ARNm y, como tal, puede formar pares de bases complementarias con el ARNm y evitar que se traduzca en proteína.

El microARN, a menudo transcrito a partir del intrón del ADN, se pliega sobre sí mismo para parecerse al ARN bicatenario, una forma de ARN producida por muchos virus durante su ciclo de vida. El ARN de doble hebra viral activa un mecanismo de defensa del huésped que degrada ese ARN viral. El microARN se une con frecuencia al ARNm y engaña a este mecanismo de defensa para degradar ese ARNm para que no pueda traducirse en proteína.

El ARN de riboswitch, a menudo transcrito a partir de intrones, existe en forma inactiva hasta que se une una sustancia química diana específica. La unión de la sustancia química objetivo convierte el ARN riboswitch en una forma activa que puede traducirse en una proteína específica.


¿Qué hace un codón de inicio y finalización?

Todo tiene que ver con cómo el ADN almacena la información para formar proteínas. Una descripción general rápida:

El ADN son moléculas largas, tienes de 2 a 3 metros en una célula. Solo se transcribe una pequeña parte de este ADN cuando se debe producir una proteína. Entonces, las enzimas que hacen esto tienen que saber dónde comienza y termina un gen, ahí es donde entran los codones de inicio y parada.

Cada aminoácido tiene sus propios codones específicos = 3 bases de ADN / ARNm. los codón de inicio siempre tiene el código AUG en el ARNm y codifica el aminoácido metionina. Esta es la señal donde las enzimas comienzan la transcripción.

Hay varios codones de parada (UAA, UAG y UGA) estos no codifican un aminoácido, sino que solo actúan como una señal para que la enzima detenga la transcripción.

Entonces, entre el codón de inicio y finalización está el región de codificación de un gen que se traduce en una proteína


La importancia del ARN ribosómico

El ribosoma en sí está compuesto por proteínas ribosómicas y ARNr (ARN ribosómico). En una perspectiva de 2000 titulada & quot; El ribosoma es una ribozima & quot; (https://science.sciencemag.org/content/289/5481/878) Thomas Cech describe cómo la estructura cristalina del ribosoma avanzó nuestra comprensión de las funciones de la Componentes proteicos y de ARNr de este complejo crítico. La estructura cristalina de la gran subunidad ribosomal del arqueo Haloarcula marismortui en alta resolución se publicó en 2000 (https://science.sciencemag.org/content/289/5481/905 Ban et al.). Venkatraman Ramakrishnan, Thomas A. Steitz y Ada E. Yonath luego compartieron el Premio Nobel de Química 2009 por sus contribuciones a nuestra comprensión de esta estructura. Esta estructura reveló que el sitio activo, donde se forma el enlace peptídico entre los aminoácidos en los sitios P ​​y A, no son en gran medida proteínas, que son la mayoría de los catalizadores celulares, sino ARN ribosómico. Una ribozima es el término para un ARN que puede catalizar una reacción enzimática. Por tanto, el ribosoma es una ribozima.

Estructura del ensamblaje de la subunidad ribosómica 50S (estado intermedio 1) de E. coli K-12 (https://www.rcsb.org/structure/6GC7) con ARN ribosómico en naranja y proteínas en otros colores.


Marcos de lectura

Fig. 15 Diagrama detallado de la organización del comienzo de un gen (los descriptores de dirección de cadena siguen la convención del NCBI). Nótese que las designaciones de cadena positiva y negativa son relativas al brazo p del cromosoma, mientras que la designación de cadena de sentido es relativa a la orientación de un gen particular.

Una hebra particular de ADN podría dividirse en codones de tres formas diferentes dependiendo de la posición de partida desde la que se demarcan las tripletas de nucleótidos. Dado que los genes pueden codificarse en cualquiera de las hebras complementarias, una pieza de ADN de doble hebra puede tener un total de seis marcos de referencia diferentes para demarcar codones. Cada uno de estos seis se llama marco de lectura.

Todas las secuencias de ADN que codifican proteínas comienzan con el mismo codón, ATG, que codifica el aminoácido metionina. Este codón también se conoce como el codón de inicio. En la Fig. 15, la secuencia ATG en la hebra negativa delimita el comienzo de una secuencia codificante. (Dado que el gen en el ejemplo está codificado en la hebra negativa, para ese gen la hebra negativa es la hebra con sentido). El marco de lectura que contiene esa metionina es, por lo tanto, el único marco de lectura correcto (de los seis posibles), que codifica para la proteína. Los otros cinco marcos de lectura son básicamente un galimatías al azar. La metionina aparecerá al principio de todos los genes, ya que es el único codón utilizado para señalar el inicio de la codificación de proteínas, pero no todas las metioninas en una secuencia son codones de inicio. Además de su papel en el inicio de la traducción, la metionina también es simplemente un aminoácido equivalente a los otros 19 aminoácidos.

Debido a su naturaleza aleatoria, los otros cinco posibles marcos de lectura derivados de una secuencia de ADN a menudo contendrán codones de parada que se generan por casualidad. Si esos marcos de lectura realmente codificaran proteínas, los codones de terminación indicarían a los ribosomas que deberían dejar de agregar aminoácidos al polipéptido. Dado que biológicamente no tendría sentido que la traducción se detuviera después de un tiempo tan corto, la presencia de muchos codones de parada puede servir como una indicación de que un marco de lectura particular no codifica legítimamente una secuencia de proteína. En una secuencia de ADN compuesta por una serie aleatoria de nucleótidos, los codones de terminación deben ocurrir al azar en promedio cada 21 codones (43 combinaciones posibles de tres nucleótidos divididos por los tres codones de terminación posibles). Por lo tanto, es poco probable que cualquier marco de lectura continúe por una distancia de mucho más de 21 codones sin ser interrumpido por un codón de terminación a menos que realmente codifique una proteína. Un segmento de ADN que contiene un marco de lectura en el que una secuencia larga no es interrumpida por ningún codón de terminación se denomina marco de lectura abierto (ORF). Por lo tanto, el primer paso en la búsqueda de una nueva secuencia genómica de genes codificadores de proteínas desconocidos suele ser identificar los ORF. Nota: Para que un segmento de ADN se considere un ORF, el tramo de ADN que carece de un codón de terminación debe ser mucho más largo de lo que podría ocurrir por casualidad en una secuencia aleatoria de nucleótidos (es decir, muchos más de 21 codones = cientos de nucleótidos).

Debe tener en cuenta que hay genes que no codifican proteínas. En particular, estos son genes que codifican ARN no mensajeros (es decir, ARN de transferencia = ARNt y ARN ribosómico = ARNr). En el caso de genes que codifican ARN, la transcripción de ARN es el producto estructural final y no se traduce posteriormente. Por tanto, los genes de ARNt y ARNr no contienen codones, ni el término marco de lectura tiene ninguna relevancia para ellos.


Rompiendo el código genético

Después de que James Watson, Francis Crick y Rosalind Franklin descifraran la estructura del ADN, se iniciaron serios esfuerzos para comprender la naturaleza de la codificación de las proteínas. George Gamov postuló que se debe emplear un código de tres letras para codificar los 20 aminoácidos diferentes utilizados por las células vivas para codificar proteínas. La primera elucidación de un codón fue realizada por Marshall Nirenberg y Heinrich J. Matthaei en 1961 en los Institutos Nacionales de Salud. Utilizaron un sistema libre de células para traducir una secuencia de ARN de poli-uracilo (o UUUUU. En términos bioquímicos) y descubrieron que el polipéptido que habían sintetizado consistía únicamente en el aminoácido fenilalanina. De este modo dedujeron de esta polifenilalanina que el codón UUU especificaba el aminoácido fenilalanina. Ampliando este trabajo, Nirenberg y sus compañeros de trabajo pudieron determinar la composición de nucleótidos de cada codón. Para determinar el orden de la secuencia, los trinucleótidos se unieron a los ribosomas y se utilizó aminoacil-tRNA marcado con radiactividad para determinar qué aminoácido correspondía al codón. El grupo de Nirenberg pudo determinar las secuencias de 54 de 64 codones. El trabajo posterior de Har Gobind Khorana identificó el resto del código y, poco después, Robert W. Holley determinó la estructura de transferencia del ARN, la molécula adaptadora que facilita la traducción. En 1968, Khorana, Holley y Nirenberg compartieron el Premio Nobel de Fisiología o Medicina por su trabajo.


¿Por qué son importantes los codones de inicio y parada?

Los codones de inicio y parada son importantes porque le dicen a la maquinaria celular dónde comenzar y finalizar la traducción, el proceso de producción de una proteína. El codón de inicio también establece el marco de lectura de la cadena de ADN, lo que indica que cada triplete después de ese punto codifica un aminoácido específico.

Los codones de inicio y parada se encuentran tanto en la cadena de ADN original en el núcleo de la célula como en la cadena de ARN mensajero que sirve como plantilla de proteína. El ARNm que corresponde a un gen específico en la cadena de ADN se sintetiza en el núcleo utilizando la cadena antisentido de ADN como guía para el orden de los codones. Esta cadena de ARNm luego viaja a un ribosoma en el núcleo celular, donde tiene lugar el ensamblaje de proteínas.

En la mayoría de los organismos, el único codón de inicio es ATG, un triplete formado por las bases de ADN adenina, guanina y timina. ATG también codifica el aminoácido metionina cuando se encuentra en el medio de un gen. En la plantilla de ARNm, ATG se reemplaza por AUG porque la base uracilo siempre aparece en lugar de timina en el ARN.

Los codones de parada vienen en tres formas diferentes: TGA, TAG y TAA. En el ARN, estos tres codones aparecen como UGA, UAG y UAA. A diferencia del codón de inicio, ninguno de los codones de terminación codifica un aminoácido.


Discusión

Estos resultados apoyan la idea de que las características de las UTR 5 ′ en la mayoría de los eucariotas multicelulares, y probablemente en una amplia gama de unicelulares, están dictadas en gran medida por la deriva genética aleatoria y los procesos mutacionales que causan un recambio estocástico en los sitios de inicio de la transcripción y codones de inicio prematuros. Bajo el modelo más simple que presentamos, la selección natural solo influye indirectamente en las longitudes de las UTR a través del origen mutacional de los codones de iniciación prematura dentro de la UTR. Si esta hipótesis es correcta, no es necesario invocar la selección de características reguladoras específicas de genes para explicar el rango de 1000 veces de longitudes de 5'-UTR entre genes dentro de las especies. Se espera que la amplia distribución de longitudes de UTR con una cola larga a la derecha (fig. 1) surja solo a través de procesos mutacionales, y los CV observados dentro de las especies en longitudes de UTR también son consistentes con la sólida predicción teórica de 1.2-1.3.

Una característica atractiva de la teoría propuesta es la insensibilidad de las predicciones de los modelos a la longitud real de los TIS, que puede variar entre especies. Más notablemente, una vez norte excede de 5, hay una casi invariancia en la distribución de estado estable de las longitudes de 5′-UTR predichas por el modelo, a pesar del hecho de que la distancia promedio entre los TIS aleatorios es una función creciente de norte. Este comportamiento asintótico es el resultado de la fuerte barrera al movimiento aguas arriba de los TIS impuesta por la acumulación neutra de PSC aguas arriba potencialmente dañinas, así como por la vulnerabilidad de las UTR demasiado largas a la eliminación mutacional por la aparición de las PSC dentro de sus límites.

La única incompatibilidad entre los datos y la distribución de longitud 5′-UTR predicha es el desplazamiento de las distribuciones observadas hacia la derecha en ∼30–50 nt, lo que sugiere que las clases de tamaño más cortas pueden ser seleccionadas por fuerzas distintas de las PSC. Como se discutió anteriormente, se espera que parte de dicha selección resulte de la variación estocástica en los puntos de inicio de la transcripción que operan a nivel celular, lo que tendría consecuencias perjudiciales para los genes con TIS lo suficientemente cerca del codón de inicio de la traducción como para iniciar ocasionalmente la transcripción más allá de la traducción. sitio de inicio.

Una segunda complicación potencial no incorporada en el modelo se refiere a la presencia de intrones (externos) en la UTR 5 ', que pueden inhibir la producción mutacional de alelos viables con UTR cortas. Como se señaló anteriormente, la acumulación de PSC puede hacer que dichos intrones sean excepcionalmente estables. En el caso de que un evento mutacional produzca un TIS dentro de un intrón 5′-UTR que no contenga una PSC descendente dañina, se producirá un nuevo alelo exitoso, con la porción ascendente de la UTR 5 ′ del gen ancestral siendo eliminada y se incorpora la parte aguas abajo del intrón que adquiere el nuevo TIS. Dados los tamaños medios de las UTR 5 ′ eucariotas (este artículo) y los tamaños medios de los intrones (Lynch y Conery 2003), el efecto neto de estos cambios potenciales será a menudo un aumento general de la longitud de la UTR. La mera presencia de intrones también puede inhibir la evolución de las UTR 5 'cortas por razones puramente estructurales, ya que parece haber un tamaño de exón mínimo esencial para un corte y empalme eficiente (Sterner, Carlo y Berget 1996).

Debido a que los TIS cortos aumentan las posibilidades de que el aparato transcripcional sea subvertido a un sitio inapropiado (falso positivo), parece que se requieren TIS de al menos una complejidad moderada para una transcripción eficiente. Tanto para los genomas eubacterianos como para los arqueales, la eficiencia de la selección natural es suficiente para mantener el número de promotores centrales espurios a niveles por debajo de las expectativas aleatorias (Hahn, Stajich y Wray 2003). El hecho de que aproximadamente el 25% de los ADNc humanos no contienen un marco de lectura abierto obvio y se derivan en gran medida de regiones genómicas ricas en AT que probablemente alberguen secuencias TATA falsas sugiere que la utilización inapropiada de TIS aleatorios ocurre en eucariotas (Ota et al.2004 ). Se transcribe casi 10 veces más ADN genómico de lo que pueden explicar los exones conocidos (Kapranov et al.2002), y se han realizado observaciones similares en Giardia (Elmendorf, Singer y Nash 2001). Muchos de estos ARN no codificantes provienen de la hebra antisentido, se superponen con los exones del ADN codificante (Cawley et al. 2004) y podrían tener una función, pero eso está por determinar.

Dicho esto, norte no es necesario que sea muy grande para minimizar las posibilidades de falsos positivos. Bajo el supuesto de frecuencias de nucleótidos iguales, la distancia esperada entre secuencias aleatorias de norte nucleótidos es 4 norte pb, por lo que un genoma de 108 pb de longitud (por ejemplo, un invertebrado promedio) contendría ∼24,400 TIS de longitud norte = 6, ∼1,530 de longitud norte = 8, y solo ∼95 de longitud norte = 10. Por tanto, debido a que el número de genes por genoma eucariota normalmente excede 10 4, la longitud de un TIS no necesita ser mucho mayor de ocho para asegurar que casi todas estas secuencias se mantengan activamente por selección en la vecindad de genes funcionales. Cualquier aumento adicional en norte impondría una tasa de mutación más alta a los alelos defectuosos sin proporcionar ningún beneficio obvio en términos de eficiencia transcripcional. Con μ siendo ∼10 8 por generación (Denver et al.2004), y ∼15,000 genes en un genoma eucariota típico, los resultados anteriores sugieren que solo ∼0.2% de los gametos portarían un nuevo alelo nulo asociado con 5′-UTR en algunos locus si norte = 8. Este nivel de mutación nula se adapta fácilmente a las estimaciones existentes de la tasa de mutación letal gamética de ~ 1,0% (Lynch y Walsh 1998 Fry et al. 1999).

Aunque la variación entre los grupos filogenéticos en las longitudes promedio de las longitudes de 5′-UTR es excepcionalmente pequeña en relación con otros atributos genómicos, pueden existir algunas diferencias significativas específicas de linaje (debe tenerse en cuenta que los errores estándar en la tabla 1 no se corrigen para no independencia filogenética). Varios efectos de segundo orden podrían ser responsables de tales diferencias. Primero, al derivar las expectativas teóricas, se asumió que los 4 nt son igualmente probables, mientras que la mayoría de los genomas eucariotas se desvían algo de estas condiciones. Sin embargo, aunque se puede esperar que las longitudes promedio de 5 ′ UTR escalen negativamente con las frecuencias esperadas aleatorias de secuencias TATA y ATG dentro de las regiones UTR, no existe tal relación en los datos observados (r 2 = 0.08 y 0.01, respectivamente). En segundo lugar, por las razones discutidas anteriormente, la variación específica de linaje en la frecuencia y / o el número de intrones externos podría imponer diferentes restricciones a las presiones selectivas indirectas hacia UTR más cortas. En tercer lugar, el modelo desarrollado anteriormente considera solo mutaciones de sustitución de nucleótidos, mientras que pueden existir diferencias interespecíficas significativas en las tasas de deleción y / o inserción (Petrov et al. 2000).

En resumen, nuestros resultados empíricos y teóricos apoyan la idea de que la reducción de nortemi que acompañó la evolución de eucariotas, particularmente especies multicelulares, produjo un ambiente genético poblacional propicio para el movimiento de TISs a posiciones aleatorias, sujeto sólo a la restricción impuesta por la producción mutacional estocástica de codones de inicio prematuros. Algunos eucariotas microbianos pueden tener poblaciones efectivas suficientemente grandes para mantener selectivamente longitudes promedio de 5′-UTR por debajo de las expectativas bajo neutralidad efectiva (Ghosh et al. 1994 Singh et al. 1997 Liston y Johnson 1999 Yee et al. 2000 Adam 2001), virtualmente todas estas especies exhiben otros sellos genómicos de grandes nortemi, incluidos tamaños y números pequeños de intrones y una baja incidencia de elementos genéticos móviles (Lynch y Conery 2003). Sin embargo, esencialmente todas las especies multicelulares pueden tener un nortemi insuficientemente grande para prevenir la expansión física de las 5 ′ UTR por mecanismos no adaptativos. Si esta hipótesis es correcta, no es necesario invocar la selección de características reguladoras específicas de genes para explicar la expansión de las UTR 5 'eucariotas en relación con la situación en procariotas. Sin embargo, una vez establecidas permanentemente, las UTR 5 'expandidas pueden haber proporcionado un sustrato novedoso para la evolución de los mecanismos de regulación postranscripcional de la expresión génica eucariota, proporcionando otro ejemplo más de cómo una reducción en nortemi puede promover pasivamente la evolución de formas novedosas de arquitectura genética que, en última instancia, facilitan la evolución de la complejidad del organismo (Lynch et al. 2001 Lynch 2002 Lynch y Conery 2003).

Incluso aquí hay margen para la precaución. Although many structural features of 5′ UTRs (including their lengths) are known to influence the rate of protein synthesis by modifying the efficiency of translation, prior to accepting natural selection as the underlying explanation for such features, further consideration of semineutral processes may prove worthwhile. For example, upstream open-reading frames (uORFs) can slow the rate of translation by causing the ribosome to terminate and/or reinitiate, and secondary UTR structure and/or internal ribosome entry sites may have similar indirect roles. A number of authors have suggested that uORFs serve an adaptive function ( Morris and Geballe 2000 Meijer and Thomas 2002 Vilela and McCarthy 2003). However, uORFs are generally on the order of 20 codons in length, approximately what is expected by chance, and transcripts from some uORF-containing genes are subject to degradation by the nonsense-mediated decay pathway ( Ruiz-Echevarria and Peltz 2000). In principle, a number of uORFs may simply exist because their stop codons have neutralized the effects of a PSC, enabling their carrier alleles to perform at normal levels.


Ver el vídeo: Traducción (Mayo 2022).