Información

2.6: Transcripción - Biología

2.6: Transcripción - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

El flujo de información genética

La función principal del ADN es almacenar información heredable que codifica las instrucciones para crear un organismo. En la última década hemos llegado a ser muy buenos en la secuenciación del ADN, pero todavía no sabemos cómo decodificar de forma fiable TODA la información y todavía no entendemos TODOS los mecanismos por los que se expresa.

Sin embargo, existen algunos principios y mecanismos básicos asociados con la lectura y expresión del código genético cuyos pasos básicos se comprenden y que deben ser parte del conjunto de herramientas conceptuales para todos los biólogos. Dos de estos procesos son transcripción y traducción; la copia de partes del código genético escrito en el ADN en moléculas del polímero ARN relacionado, seguido de la lectura y decodificación de la secuencia de ARN (de nucleótidos) en la secuencia de proteínas (de aminoácidos).

En BIS2A nos enfocamos principalmente en desarrollar una comprensión de los

proceso

de la transcripción (recordemos que una historia energética es simplemente una forma de describir un proceso) y su papel en la expresión de la información genética. Motivamos nuestra discusión sobre la transcripción enfocándonos en problemas funcionales (incorporando partes de nuestro desafío de diseño / resolución de problemas) que deben resolverse para que se lleve a cabo el proceso. Luego pasamos a describir cómo la naturaleza utiliza el proceso para crear una variedad de moléculas de ARN funcionales (que pueden tener varias funciones estructurales, catalíticas o reguladoras), incluidas las moléculas de ARN mensajero (ARNm) que transportan la información necesaria para sintetizar proteínas. Asimismo, nos enfocamos en los desafíos y preguntas asociados con el proceso de traducción, el proceso por el cual los ribosomas sintetizan proteínas.

El flujo básico de información genética en los sistemas biológicos se describe a menudo en un esquema conocido como "el dogma central" (ver figura siguiente). Este esquema establece que la información codificada en el ADN fluye hacia el ARN a través de la transcripción y finalmente a las proteínas a través de la traducción. Procesos como la transcripción inversa (la creación de ADN a partir de una plantilla de ARN) y la replicación también representan mecanismos para propagar información en diferentes formas. Este esquema, sin embargo, no dice nada sobre cómo se codifica la información o sobre los mecanismos por los cuales las señales reguladoras se mueven entre las diversas capas de tipos de moléculas representadas en el modelo. Por lo tanto, si bien el esquema a continuación es una parte casi necesaria del léxico de cualquier biólogo, quizás un remanente de la vieja tradición, los estudiantes también deben ser conscientes de que los mecanismos de flujo de información son más complejos (aprenderemos sobre algunos a medida que avanzamos, y que "el dogma central" solo representa algunas vías centrales.

El flujo de información genética.
Atribución: Marc T. Facciotti (obra original)

Genotipo a fenotipo

Un concepto importante en las siguientes secciones es la relación entre la información genética, la genotipo, y el resultado de expresarlo, el fenotipo. Estos dos términos y los mecanismos que los vinculan se discutirán repetidamente durante las próximas semanas; comience a dominar el uso de este vocabulario.

La información almacenada en el ADN está en la secuencia de los nucleótidos individuales cuando se lee en la dirección 5 'a 3'. La conversión de la información del ADN en ARN (un proceso llamado transcripción) produce la segunda forma que toma la información en la célula. El ARNm se utiliza como molde para la creación de la secuencia de aminoácidos de las proteínas (en traducción). Aquí se muestran dos conjuntos diferentes de información. La secuencia de ADN es ligeramente diferente, lo que resulta en la producción de dos ARNm diferentes, seguidos de dos proteínas diferentes y, en última instancia, dos colores de pelaje diferentes para los ratones.

Genotipo se refiere a la información almacenada en el ADN del organismo, la secuencia de los nucleótidos, la recopilación de sus genes. Fenotipo se refiere a cualquier característica física que se pueda medir, como la altura, el peso, la cantidad de ATP producido, la capacidad de metabolizar la lactosa, la respuesta a los estímulos ambientales, etc. Las diferencias en el genotipo, incluso leves, pueden dar lugar a diferentes fenotipos que están sujetos a selección. La figura de arriba muestra esta idea. Tenga en cuenta también que, si bien las discusiones clásicas sobre las relaciones de genotipo y fenotipo se tratan en el contexto de los organismos multicelulares, esta nomenclatura y los conceptos subyacentes se aplican a todos los organismos, incluso a los organismos unicelulares como las bacterias y las arqueas.

Discusión sugerida

¿Se puede considerar un fenotipo algo que no se puede ver "a simple vista"?

Discusión sugerida

¿Pueden los organismos unicelulares tener múltiples fenotipos simultáneos? Si es así, ¿puede proponer un ejemplo? Si no es así, ¿por qué?

Genes

¿Qué es un gen? A gene es un segmento de ADN en el genoma de un organismo que codifica un ARN funcional (como ARNr o ARNt, etc.) o un producto proteico (enzimas, tubulina, etc.). Un gen genérico contiene elementos que codifican regiones reguladoras (que a menudo no se transcriben) y una región que codifica una unidad transcrita.

Los genes pueden adquirir mutaciones - definido como cambios en la composición o secuencia de los nucleótidos, ya sea en las regiones codificantes o reguladoras. Estas mutaciones pueden conducir a varios resultados posibles: (1) como resultado, no ocurre nada mensurable; (2) el gen ya no se expresa; o (3) la expresión o el comportamiento de los productos génicos son diferentes. En una población de organismos que comparten el mismo gen, las diferentes variantes del gen se conocen como alelos. Los diferentes alelos pueden dar lugar a diferencias en los fenotipos de los individuos y contribuir a la diversidad de la biología que se encuentra bajo presión selectiva.

Empiece a aprender estos términos de vocabulario y conceptos asociados. Entonces se familiarizará un poco con ellos cuando comencemos a profundizar en ellos con más detalle en las próximas conferencias.

Un gen consta de una región codificante para un ARN o un producto proteico acompañado de sus regiones reguladoras. La región codificante se transcribe en ARN que luego se traduce en proteína. Tenga en cuenta que la mayoría de las transcripciones no comienzan con un codón de inicio y terminan con un codón de terminación (a diferencia de este ejemplo), por lo general hay regiones sin traducir aguas arriba y aguas abajo.

Resumen de la sección

Todos los seres vivos deben transcribir genes de sus genomas. Si bien la ubicación celular puede ser diferente (los eucariotas realizan la transcripción en el núcleo; las bacterias y las arqueas, que carecen de núcleo, realizan la transcripción en el citoplasma), los mecanismos por los cuales los organismos de cada uno de estos clados llevan a cabo este proceso son fundamentalmente los mismos y pueden caracterizarse por tres etapas: iniciación, alargamiento y terminación.

Transcripción: de ADN a ARN

A breve descripción de la transcripción

La transcripción es el proceso de crear una copia de ARN de un segmento de ADN. Dado que este es un proceso, queremos aplicar Energy Story para desarrollar una comprensión funcional de la transcripción. ¿Cómo se ve el sistema de moléculas antes del inicio de la transcripción? ¿Qué aspecto tiene al final? ¿Qué transformaciones de materia y transferencias de energía ocurren durante la transcripción y qué cataliza el proceso, si es que hay algo? También queremos pensar en el proceso desde el punto de vista de Design Challenge. Si la tarea biológica es crear una copia del ADN en el lenguaje químico del ARN, ¿qué desafíos podemos plantear razonablemente como hipótesis, o anticipar, dado nuestro conocimiento sobre otros procesos de polímeros de nucleótidos, deben superarse? ¿Existe evidencia de que la naturaleza resolvió estos problemas de diferentes maneras? ¿Cuáles parecen ser los criterios para el éxito de la transcripción? Entiendes la idea.

Enumerar algunos de los requisitos básicos para la transcripción.

En primer lugar, consideremos las tareas a mano utilizando algunos de nuestros conocimientos fundamentales e imaginando lo que podría tener que suceder durante el proceso de transcripción si el objetivo es hacer una copia de ARN de un fragmento de una hebra de una molécula de ADN de doble hebra. Veremos que usar algo de lógica básica nos permite inferir muchas de las preguntas importantes y cosas que necesitamos saber para describir adecuadamente el proceso.

Imaginemos que queremos diseñar una nanomáquina / nanobot que realice la transcripción. Podemos usar algo de pensamiento de Desafío de Diseño para identificar problemas y subproblemas que nuestro pequeño robot debe resolver.

• Lo primero que queremos que sepa nuestra máquina es por dónde empezar. Entre los millones y los miles de millones de pares de bases, ¿a dónde debería dirigirse la máquina?
• Asimismo, necesitamos saber dónde parar.
• Si tenemos sitios de inicio y detención, necesitaremos formas de codificar esa información para que nuestra (s) máquina (s) puedan leer esta información. ¿Cómo se logrará eso?
• ¿Cuántas copias de ARN del ADN necesitaremos hacer?
• ¿Qué tan rápido deben hacerse las copias de ARN?
• ¿Con qué precisión deben realizarse las copias?
• ¿Cuánta energía tomará el proceso y de dónde vendrá la energía?

Estas son, por supuesto, solo algunas de las preguntas centrales. Uno puede profundizar más si lo desea. Sin embargo, ya son lo suficientemente buenos para que comencemos a tener una buena idea de este proceso. Observe también que muchas de estas preguntas son notablemente similares a las que inferimos que podrían ser necesarias para comprender la replicación del ADN.

Los componentes básicos de la transcripción

Los bloques de construcción del ARN

Recuerde de nuestra discusión sobre la estructura de los nucleótidos que los componentes básicos del ARN son muy similares a los del ADN. En el ARN, los componentes básicos consisten en nucleótidos trifosfatos que están compuestos por un azúcar ribosa, una base nitrogenada y tres grupos fosfato. Las diferencias clave entre los componentes básicos del ADN y los del ARN es que las moléculas de ARN están compuestas de nucleótidos con azúcares ribosa (a diferencia de los azúcares desoxirribosa) y que en lugar de utilizar timidina (el nucleótido que contiene timina), el ARN utiliza uridina (un uracilo que contiene nucleótido). Tenga en cuenta a continuación que el uracilo y la timina son estructuralmente muy similares: al uracilo simplemente le falta un metilo (CH3) grupo funcional en comparación con la timina.

Los componentes químicos básicos de los nucleótidos.
Atribución: Marc T. Facciotti (obra original)

Inicio de la transcripción

Promotores

Las proteínas responsables de crear una copia de ARN de un fragmento específico de ADN (transcripción) primero deben poder reconocer el comienzo del elemento que se va a copiar. A promotor es una secuencia de ADN en la que varias proteínas, conocidas colectivamente como la maquinaria de transcripción, se unen e inician la transcripción. En la mayoría de los casos, los promotores existen corriente arriba (5 'de la región codificante) de los genes que regulan. La secuencia específica de un promotor es muy importante porque determina si la porción codificante correspondiente del gen se transcribe todo el tiempo, algunas veces o con poca frecuencia.

En la bacteria E. coli, en las regiones -10 y -35 corriente arriba del sitio de inicio (el sitio del primer nucleótido de la transcripción), hay dos promotores consenso secuencias o regiones que son similares en muchos promotores y en varias especies relacionadas. Algunos promotores tendrán una secuencia muy similar a la secuencia consenso (la secuencia que contiene los elementos de secuencia más comunes) y otros se verán muy diferentes. Estas variaciones de secuencia afectan la fuerza a la que la maquinaria transcripcional puede unirse al promotor para iniciar la transcripción. Esto ayuda a controlar la cantidad de transcripciones que se realizan y la frecuencia con la que se hacen.

(a) Un diagrama general de un gen. El gen incluye la secuencia promotora, una región de no traducción (UTR) y la secuencia codificante. (b) Una lista de varias secuencias promotoras fuertes de E. coli. La caja -35 y la caja -10 son secuencias muy conservadas en toda la lista de promotores fuertes. Los promotores más débiles tendrán más diferencias de pares de bases en comparación con estas secuencias. Fuente: http: //www.discoveryandinnovation.co...lecture12.html

Discusión sugerida

¿Qué tipos de interacciones se modifican entre la maquinaria de transcripción y el ADN cuando cambia la secuencia de nucleótidos del promotor? ¿Por qué algunas secuencias crearían un promotor "fuerte" y por qué otras crearían un promotor "débil"?

Promotores bacterianos vs eucariotas

En las células bacterianas, la región -10 es rica en AT, a menudo en TATAAT. Las secuencias justo aguas arriba de la región -10, s así como la región -35 (TTGACA), son reconocidas y unidas por la proteína. σ ("factor sigma"), que es un componente de la holoenzima de la ARN polimerasa. Una vez que se realiza esta interacción proteína-ADN, el factor sigma facilita el desenrollamiento de la región -10 y carga la polimerasa en la hebra molde. Por tanto, el factor sigma ayuda a la polimerasa a reconocer las secuencias promotoras y a cargar la polimerasa en el lugar correcto, apuntando en la dirección correcta. Curiosamente, E. coli produce varios factores sigma diferentes. En diferentes situaciones, por ejemplo, bajo un estrés particular, la activación de un factor sigma diferente cambiará los tipos de genes transcritos con mayor frecuencia por la ARN polimerasa. Algunos bacteriófagos se han aprovechado de este aspecto de la transcripción bacteriana, produciendo sus factores sigma específicos del gen del fago que secuestran la ARN polimerasa del huésped y la redirigen al genoma del fago.

Los promotores eucariotas son mucho más grandes y más complejos que los promotores procariotas, pero ambos tienen una región rica en AT; en eucariotas se le suele llamar "caja TATA". Por ejemplo, en el gen de la timidina quinasa de ratón, la caja TATA se encuentra aproximadamente en -30. Para este gen, la secuencia exacta de la caja TATA es TATAAAA, como se lee en la dirección 5 'a 3' en la hebra sin plantilla. Esta secuencia no es idéntica a la E. coli -10, pero ambos comparten la cualidad de ser elementos ricos en A – T.

En lugar de una sola polimerasa bacteriana, los genomas de la mayoría de los eucariotas codifican tres ARN polimerasas diferentes, cada una compuesta por 10 subunidades de proteínas o más. Cada polimerasa eucariota también requiere un conjunto distinto de proteínas conocidas como factores de transcripción para reclutarlo a un promotor. Desafortunadamente, la terminología para los factores de transcripción es bastante inconsistente. Baste decir que hay muchas proteínas que siempre deben actuar simultáneamente para cargar, por ejemplo, cualquier ARN polimerasa II (la polimerasa que transcribe los ARNm). Estos se denominan factores de transcripción "basales" (o "generales"). Además, un ejército de proteínas puede afectar la frecuencia de atracción de estos factores basales a los promotores, la frecuencia de carga de ARN pol II e incluso el "escape" del complejo pol II de los promotores eucariotas (de modo que pueda realmente realizar la transcripción). Potenciadores y silenciadores, ambos Secuencias de ADN, no proteínas- son reconocidos por estos factores de transcripción reguladores. Los factores de transcripción basales son cruciales en la formación de un complejo de preiniciación en la plantilla de ADN que posteriormente recluta ARN polimerasa para el inicio de la transcripción.

imagen de Kelvinsong

Independientemente de los detalles de la localización y orientación de la polimerasa bacteriana frente a eucariota, el inicio de la transcripción comienza con la unión de la ARN polimerasa a la promotor. La transcripción requiere que la doble hélice de ADN se desenrolle parcialmente de modo que una hebra pueda usarse como plantilla para la síntesis de ARN. Tenga en cuenta que el desenrollamiento se produce dentro de la polimerasa; La ARN polimerasa, a diferencia de la ADN polimerasa, tiene una actividad helicasa intrínseca. El ADN bicatenario es absorbido por la enzima (al igual que los NTP) y emerge el ADN bicatenario más el ARN. La región de desenrollado se llama burbuja de transcripción.

Durante el alargamiento, la ARN polimerasa rastrea a lo largo de la plantilla de ADN, sintetiza ARNm en la dirección 5 'a 3' y se desenrolla y luego rebobina el ADN a medida que se lee. La cadena "sin plantilla" que se ilustra aquí a menudo se denomina "soporte de codificación", simplemente porque su secuencia coincidirá con la secuencia de la transcripción.

Alargamiento

La transcripción siempre procede de una de las dos cadenas de ADN, que se denomina hebra de plantilla. El producto de ARN es complementario a la hebra molde y es casi idéntico a la hebra sin plantilla, llamada hebra de codificación, con la excepción de que el ARN contiene un uracilo (U) en lugar de la timina (T) que se encuentra en el ADN. Durante el alargamiento, una enzima llamada Polimerasa de ARN avanza a lo largo de la plantilla de ADN añadiendo nucleótidos mediante el apareamiento de bases con la plantilla de ADN de una manera similar a la replicación del ADN, con la diferencia de que se sintetiza una hebra de ARN que no permanece unida a la plantilla de ADN. A medida que avanza el alargamiento, el ADN se desenrolla continuamente por delante de la enzima central y se rebobina detrás de ella. Tenga en cuenta que la dirección de síntesis es idéntica a la de la síntesis en el ADN - 5 'a 3'.

Durante el alargamiento, la ARN polimerasa rastrea a lo largo de la plantilla de ADN, sintetiza ARNm en la dirección 5 'a 3' y se desenrolla y luego rebobina el ADN a medida que se lee.

A) La adición de nucleótidos durante el proceso de transcripción es muy similar a la adición de nucleótidos en la replicación del ADN. El ARN se polimeriza de 5 'a 3' y con cada adición de un nucleótido, la enzima hidroliza un enlace fosfoanhídrido, lo que da como resultado un polímero más largo y la liberación de dos fosfatos inorgánicos.
Fuente: http://utminers.utep.edu/rwebb/html/...longation.html

Discusión sugerida

Compare y contraste la historia de la energía para la adición de un nucleótido en la replicación del ADN con la adición de un nucleótido en la transcripción.

Elongación bacteriana vs eucariota

En las bacterias, el alargamiento comienza con la liberación del σ subunidad de la holoenzima ARN polimerasa. La disociación de σ permite que la enzima central avance a lo largo de la plantilla de ADN, sintetizando ARNm en la dirección 5 'a 3' a una velocidad de aproximadamente 40 nucleótidos por segundo. El emparejamiento de bases entre el ADN y el ARN no es lo suficientemente estable como para mantener la estabilidad de los componentes de síntesis del ARNm. En cambio, la ARN polimerasa actúa como un enlazador estable entre la plantilla de ADN y las cadenas de ARN nacientes para garantizar que el alargamiento no se interrumpa prematuramente.

En eucariotas, después de la formación del complejo de preiniciación, la polimerasa se libera de los otros factores de transcripción y se permite que el alargamiento proceda como lo hace en procariotas con la polimerasa sintetizando pre-ARNm en la dirección 5 'a 3'. Como se discutió anteriormente, la ARN polimerasa II transcribe la mayor parte de los genes eucariotas, por lo que esta sección se centrará en cómo esta polimerasa logra la elongación y la terminación.

Terminación

En bacterias

Una vez que se transcribe un gen, es necesario instruir a la polimerasa bacteriana para que se disocie de la plantilla de ADN y libere el ARNm recién creado. Dependiendo del gen que se transcribe, existen dos tipos de señales de terminación. Uno está basado en proteínas y el otro está basado en ARN. Terminación dependiente de Rho está controlada por la proteína rho, que sigue detrás de la polimerasa en la cadena de ARNm en crecimiento. Cerca del final del gen, la polimerasa encuentra una serie de nucleótidos G en la plantilla de ADN y se detiene. Como resultado, la proteína rho choca con la polimerasa. La interacción con rho libera el ARNm de la burbuja de transcripción.

Terminación independiente de Rho está controlado por secuencias específicas en la hebra de la plantilla de ADN. A medida que la polimerasa se acerca al final del gen que se transcribe, encuentra una región rica en nucleótidos C – G. El ARNm se pliega sobre sí mismo y los nucleótidos C-G complementarios se unen. El resultado es un estable horquilla que hace que la polimerasa se detenga tan pronto como comienza a transcribir una región rica en nucleótidos A – T. La región U-A complementaria del transcrito de ARNm forma solo una interacción débil con el ADN molde. Esto, junto con la polimerasa estancada, induce suficiente inestabilidad para que la enzima central se separe y libere la nueva transcripción de ARNm.

En eucariotas

La terminación de la transcripción es diferente para las diferentes polimerasas. A diferencia de los procariotas, el alargamiento por la ARN polimerasa II en eucariotas tiene lugar entre 1000 y 2000 nucleótidos más allá del final del gen que se transcribe. Esta cola de pre-ARNm se elimina posteriormente mediante escisión durante el procesamiento del ARNm. Por otro lado, las ARN polimerasas I y III requieren señales de terminación. Los genes transcritos por la ARN polimerasa I contienen una secuencia específica de 18 nucleótidos que es reconocida por una proteína de terminación. El proceso de terminación en la ARN polimerasa III implica una horquilla de ARNm similar a la terminación de la transcripción independiente de rho en procariotas.

En Archaea

La terminación de la transcripción en las arqueas está mucho menos estudiada que en los otros dos dominios de la vida y todavía no se comprende bien. Si bien es probable que los detalles funcionales se parezcan a los mecanismos que se han visto en los otros dominios de la vida, los detalles están más allá del alcance de este curso.

Ubicación celular

En bacterias y arqueas

En bacterias y arqueas, la transcripción ocurre en el citoplasma, donde se encuentra el ADN. Debido a que la ubicación del ADN, y por lo tanto el proceso de transcripción, no está físicamente segregado del resto de la célula, la traducción a menudo comienza antes de que finalice la transcripción. Esto significa que el ARNm en bacterias y arqueas se usa como molde para una proteína antes de que se produzca el ARNm completo. La falta de segregación espacial también significa que hay muy poca segregación temporal para estos procesos. La siguiente imagen muestra los procesos de transcripción y traducción que ocurren simultáneamente.

Aquí, los círculos azul pálido representan ARN polimerasas que avanzan a lo largo de una plantilla de ADN (de izquierda a derecha). Tenga en cuenta que múltiples polimerasas pueden cargar secuencialmente en un solo gen. Debido a que se trata de un procariota, los ribosomas pueden comenzar a usar una transcripción para sintetizar proteínas antes de que se complete la transcripción. Tenga en cuenta también que múltiples ribosomas se pueden cargar secuencialmente en una sola transcripción.
Fuente: Marc T. Facciotti (trabajo propio)

En eucariotas ...

En eucariotas, el proceso de transcripción se segrega físicamente del resto de la célula, secuestrado dentro del núcleo. Esto da como resultado dos cosas: el ARNm se completa antes de que pueda comenzar la traducción, y hay tiempo para "ajustar" o "editar" el ARNm antes de que comience la traducción. La separación física de estos procesos les da a los eucariotas la oportunidad de alterar el ARNm de tal manera que: extienda la vida útil del ARNm o incluso altere el producto proteico que se producirá a partir del ARNm.

Procesamiento de ARNm

5 'G-Cap y 3' Poly-A tail

Cuando se transcribe un gen eucariota, la transcripción primaria se procesa en el núcleo de varias formas. Los ARNm eucariotas se modifican en el extremo 3 'mediante la adición de una cola poli-A. Esta serie de residuos A se agrega mediante una enzima que no utiliza ADN genómico como plantilla. Además, los ARNm tienen una modificación química del extremo 5 ', denominada tapa 5'. Los datos sugieren que estas modificaciones ayudan tanto a aumentar la vida útil del ARNm (previenen su degradación prematura en el citoplasma) como a ayudar al ARNm a iniciar la traducción.

Figura: Un ejemplo de una transcripción casi completamente eucariota y las señales requeridas para la adición de la cola poliA (¡aún no agregada!). Esta señal se escindirá de la transcripción tras la adición de la cola.

Figura: la tapa 5 'de transcripciones eucariotas. A menudo, los primeros 2 nucleótidos (aquí de color púrpura) del ARNm también se modifican. Tenga en cuenta el enlace impar de 5 'a 5'.

Empalme

"Empalme" de ARNm eucariotas se refiere a la eliminación de secuencias no codificantes (denominadas intrones) incrustadas dentro de la región codificante de la transcripción (los exones) (véase más adelante). La sección del Dr. Britt no discutirá el empalme en profundidad, excepto para referirse a él como un proceso que debe ocurrir antes de que el ARNm esté completamente maduro y pueda enviarse al citoplasma para su traducción.


2.6: Transcripción - Biología

1. Habilidad: Dibujar diagramas simples de la estructura de un solo nucleótido de ADN. y ARN, utilizando círculos, pentágonos y rectángulos para representar fosfatos, pentosas y bases.

2. El ADN se diferencia del ARN en el número de hebras presentes, la base composición y tipo de pentosa.

3. Los ácidos nucleicos ADN y ARN son polímeros de nucleótidos. unidos por enlaces covalentes en una sola hebra

  • columna vertebral: azúcar - fosfato - azúcar - fosfato
  • base nitrogenada unida al azúcar pentosa de 5 carbonos (desoxirribosa en el ADN, ribosa en el ARN)

4. El ADN es una doble hélice formada por dos hebras antiparalelas de nucleótidos unidas por enlaces de hidrógeno entre pares de bases complementarios.

pelado de base complementario:

  • A = T: la adenina forma dos enlaces de hidrógeno con su base complementaria, la timina
  • G = C: la guanina forma tres enlaces de hidrógeno con su base complementaria, la citosina
  • la combinación de enlaces de hidrógeno entre A = T y G = C mantener juntas las dos hebras de ADN
  • cada hebra forma una hélice, las dos hebras juntas forman una doble hélice

Aplicaciones y habilidades:

• Aplicación: elucidación de Crick y Watson de la estructura del ADN mediante la creación de modelos.

• En los diagramas de la estructura del ADN, no es necesario mostrar la forma helicoidal, pero las dos hebras deben mostrarse en forma antiparalela. La adenina debe mostrarse emparejada con timina y guanina con citosina, pero no es necesario recordar las longitudes relativas de las bases de purina y pirimidina, ni el número de enlaces de hidrógeno entre los pares de bases.


Fondo

La secuenciación de sitios hipersensibles a la DNasa-I (DNasa-seq [1–4]) y los Ensayos para la secuenciación de la cromatina accesible a la transposasa (ATAC-seq [5, 6]) son dos protocolos ampliamente utilizados para la identificación de cromatina abierta en todo el genoma. DNasa-seq y ATAC-seq se basan en el uso de enzimas de escisión (DNasa-I y Tn5, respectivamente), que reconocen y escinden el ADN en regiones de cromatina abiertas. La secuenciación y la alineación de lecturas de estos fragmentos permite la detección de cromatina abierta mediante la identificación de intervalos genómicos con muchas lecturas [1, 2]. Sin embargo, la presencia de factores de transcripción (TF) unidos al ADN evita que la enzima se escinda en una región que de otro modo estaría libre de nucleosomas. Esto deja pequeñas regiones, denominadas huellas, donde la cobertura de lectura cae repentinamente dentro de las regiones pico de alta cobertura.

Se ha demostrado que los métodos computacionales que escanean perfiles de cromatina abiertos para encontrar huellas predicen los sitios de unión del factor de transcripción (TFBS) con alta precisión en los datos de la secuencia de ADNasa [7, 8]. Entre otros, la huella computacional se ha utilizado para detectar el léxico regulador de varios tipos de células [9, 10], para medir los efectos de las variantes genéticas en la unión del TF [11] y para evaluar los cambios en la actividad de los TF, por ejemplo, durante la inflamación. respuestas [12] o condiciones de ayuno [13]. La huella computacional, que solo requiere un único experimento de cromatina abierto por celda de interés, es una herramienta poderosa para estudiar los procesos regulatorios.

ATAC-seq tiene varias ventajas experimentales sobre DNase-seq: requiere menos células (50.000 a células individuales) y es menos laborioso [5, 6]. No es sorprendente que el número de estudios basados ​​en ATAC-seq depositados en Gene Expression Omnibus sea doce veces mayor que el número de estudios basados ​​en DNasa-seq en el último año (366 ATAC-seq frente a 29 DNasa-seq) Nota al pie 1. También hay dos veces más muestras de ATAC-seq que de ADNasa-seq por estudio, lo que confirma que su simplicidad experimental lo convierte en una buena opción para estudios con un tamaño de muestra grande, por ejemplo, en entornos clínicos [14]. Sin embargo, la huella computacional todavía está poco explorada en los datos de ATAC-seq. El único estudio que contrasta ATAC-seq y DNase-seq muestra que las huellas de ATAC-seq tienen una precisión inferior a la de las huellas de DNase-seq [15]. También se informó que los perfiles de huella promedio de ATAC-seq no están tan bien definidos como los perfiles de huella promedio de DNase-seq [11]. Sin embargo, todo el trabajo con footprinting en ATAC-seq hasta ahora [5, 15, 16] utilizó métodos computacionales adaptados a los datos de DNase-seq e ignoraron características intrínsecas al protocolo ATAC-seq.

Una posible razón para el menor rendimiento de la huella de ATAC-seq podría ser la propia enzima de escisión Tn5, que tiene un “motivo Tn5” grande (17 pb) [5, 17] y un mecanismo de escisión complejo que requiere un dímero Tn5 para su acción. El gran tamaño del dímero Tn5 hace que los eventos de escisión dependan de las características estructurales de las proteínas vecinas (TF o histonas) y del tamaño del ADN accesible [18]. Los eventos de escisión en el ADN enlazador pequeño entre nucleosomas son posibles, pero menos probables que la escisión de fragmentos de regiones reguladoras activas [5]. Es importante destacar que las preferencias de unión al ADN de las enzimas provocan un sesgo de escisión específico de secuencia. Por lo tanto, la corrección del sesgo computacional es un aspecto importante del análisis de datos de DNasa-seq [19, 20] y ATAC-seq [21]. Algunos trabajos utilizan matrices de peso de posición (PWM), que asumen independencia entre posiciones, para modelar el sesgo de DNase-seq [22]. Sin embargo, la mayoría de los métodos de corrección de sesgo infieren estimaciones de sesgo utilizando k-mer secuencias alrededor del inicio de lecturas alineadas, estimando la probabilidad de encontrar un k-mer en sitios de inicio de lectura frente a ocurrencias en el genoma [19]. Para DNase-seq, un k igual a 6 se utilizó con frecuencia [8, 11, 19, 20, 23]. Este método requiere la estimación de una distribución multinomial y es probable que sufra un sobreajuste para grandes k-mers [24]. Alternativamente, los modelos de dependencia de posición (PDM) permiten flexibilidad en el tipo de dependencias que se modelan [25, 26]. Se ha demostrado que superan el problema del sobreajuste en el modelado de preferencias de unión proteína-ADN. No conocemos los métodos que exploran los efectos de la estructura de la cromatina local en ATAC-seq o el uso de PDM para modelar el sesgo de las enzimas de escisión.

Aquí, proponemos HINT-ATAC, que es el primer método de huella que se ocupa de las características del protocolo ATAC-seq. Primero, proponemos el uso de un PDM probabilístico basado en modelos de mezclas no homogéneas locales dispersas (SLIM) para la corrección del sesgo de escisión [26] y lo evaluamos para los protocolos ATAC-seq y DNase-seq. En segundo lugar, modelamos una observación novedosa de que los eventos de escisión de ATAC-seq muestran un sesgo de hebra, que está asociado al número de nucleosomas en los fragmentos de ATAC-seq. HINT-ATAC, que se basa en modelos ocultos de Markov, utiliza señales específicas de hebra, descompuestas del tamaño del nucleosoma y con corrección de sesgo para identificar huellas. Demostramos que HINT-ATAC mejora significativamente la recuperación de huellas con el apoyo de datos TF ChIP-seq [8, 27] de líneas celulares ENCODE [9]. Además, las huellas de HINT-ATAC tienen una precisión predictiva similar utilizando los protocolos ATAC-seq o DNase-seq. Finalmente, como un ejemplo de aplicación práctica del análisis de huellas, usamos HINT-ATAC para detectar TFs asociados con la especificación de células dendríticas inmunes (DC).


Resultados y discusión

Para investigar el procesamiento de CD19 exón 2, tratamos la línea celular NALM-6 B-ALL con thapsigargin, que induce la respuesta de la proteína desplegada y la actividad IRE1 [10], y perfilamos las transcripciones seleccionadas mediante RT-PCR. Como se anticipó, los niveles del empalme XBP1 isoforma aumentaron, pero no detectamos cambios en el informe CD19 Producto Δex2part (archivo adicional 1: Fig. S1a). Esto puso en duda el papel de IRE1 en el procesamiento del exón 2. Por lo tanto, decidimos investigar el empalme aberrante de CD19 ARNm en B-ALL con más detalle. Con este fin, realizamos dRNA-seq y cDNA-seq en la misma muestra de ARN de un xenoinjerto derivado del paciente resistente a la terapia [17] utilizando secuenciación ONT de lectura larga. Ambos conjuntos de datos documentaron la aparición de varias enfermedades patológicas informadas anteriormente. CD19 isoformas, incluida la omisión del exón 2 [2] y la retención del intrón 2 [4]. Sorprendentemente, no pudimos detectar el producto Δex2part en dRNA-seq, aunque se observó claramente en cDNA-seq (Fig. 1a). Esto sugirió que puede ser un artefacto del protocolo basado en la amplificación de la transcripción inversa (RT) / PCR. Un examen minucioso de la CD19 La secuencia del exón 2 reveló que el supuesto exitron podría plegarse en una horquilla estable flanqueada por dos repeticiones directas de 8 nt (Fig. 1b), insinuando un posible deslizamiento de RT o PCR en la base de la horquilla y el consiguiente truncamiento del producto.

El exitron reportado en el CD19 el exón 2 es un artefacto de transcripción inversa. a Genome browser view showing cDNA-seq and dRNA-seq data for RNA from a patient-derived xenograft (PDX). Junction reads supporting the reported Δex2part product can be observed in cDNA-seq but are absent in the dRNA-seq. B Schematic of the predicted secondary structure and the direct repeats of the putative intron in CD19 exon 2. C Schematic of the eGFP/mCherry-based reporter to detect splicing of the reported CD19 exitron. D RT-PCR assay characterizing the CD19 transcript isoforms for the wild type version and the variants of the reporter shown in panel c. They include two different point mutants predicted to stabilize the putative hairpin (mut+) or disrupt one of the direct repeats (mut−), as well as the control construct wherein the reported exitron has been deleted at the DNA level (exon2part-del). mi Flow cytometry-based assay to characterize splicing of the reported exitron in HEK293T cells. F Genome browser view showing the region of CD19 exon 2. cDNA-seq, dcDNA-seq, and dRNA-seq were performed on the same RNA sample from HEK293T cells expressing the mut+ reporter shown in panel c. Several hundred junction reads supporting exitron excision at the direct repeats in the cDNA-seq and dcDNA-seq data are detected, while none are found in the dRNA-seq

To test this hypothesis, we engineered a dual-fluorescence GFP/RFP reporter (Fig. 1c) that would allow detection of CD19 exitron excision by standard RT-PCR, and the corresponding protein product - via restoring the RFP open reading frame detectable by flow cytometry. Consistent with the CD19 exitron excision being an RT-PCR artifact, we readily observed the corresponding RT-PCR product, but no RFP/GFP double-positive cells upon transfection into HEK293T cells (Fig. 1d, e). In addition, we introduced point mutations that were predicted to either increase the stability of the secondary structure (mut+ ΔΔG = − 5.1 kcal/mol) or disrupt one of the direct repeats (mut− Fig. 1b). Consistent with our hairpin hypothesis, these reporter variants altered the levels of the Δex2part product in the RT-PCR-based assay. Namely, they were 82% higher in the case of mut+ or completely abolished in the case of mut− (Fig. 1d). Again, neither of them, not even mut+, yielded GFP/RFP double-positive cells (Fig. 1e). As a positive control, we removed the reported exitron from the reporter at the DNA level (exon2part-del) and readily observed both truncated RT-PCR product (Fig. 1d, e Additional File 1: Fig. S1b, c) and robust expression of RFP (Fig. 1e).

To differentiate between RT and PCR artifacts, we performed dRNA-seq, direct cDNA (dcDNA)-seq omitting PCR amplification, and regular PCR-aided cDNA-seq on the reporter-transfected cells. To rule out the sensitivity issue, we used the mut+ reporter variant, which yields the highest levels of the Δex2part product in RT-PCR (Fig. 1e). Strikingly, in the long-read ONT data, the Δex2part product accounted for > 25% of dcDNA-seq and almost 30% of cDNA-seq reads, but was undetectable using dRNA-seq (Fig. 1f). This direct comparison of sequencing protocols indicated that excision of the reported CD19 exitron occurs not in live cells, but in the test tube during the RT step, possibly due to the two direct repeats brought together at the base of the predicted hairpin structure. A similar phenomenon has been previously observed in the human LIP1 y FOXL2 genes [18, 19].

Our results indicate that RT-based sequencing protocols can lead to the widespread mis-identification of exitrons. De hecho, el CD19 exitron was recently reported to yield a new isoform in the long-read full-length cDNA-seq dataset obtained using the Rolling Circle Amplification to Concatemeric Consensus (R2C2) method serving to increase detection accuracy [7, 8]. To determine whether other transcripts are prone to such RT artifacts, we performed a targeted search in publicly available ONT sequencing datasets. Specifically, we screened for transcript isoforms that are present only in cDNA-seq but not in the matching dRNA-seq. This was achieved using several filtering steps, such as adjusting for read coverage and excluding the presence of canonical splice sites (Fig. 2a, Additional File 1: Fig. S2a, also see Methods). We first applied this comparison to cDNA-seq and dRNA-seq data for the B-lymphoblastoid cell line GM12878 from the Nanopore RNA Consortium [20]. We readily rediscovered the CD19 exitron along with 19 other questionable exitrons, which we dubbed “falsitrons” (Fig. 2b, c, Additional File 1: Fig. S2b, Additional File 2: Data 1, Additional File 3: Table S1), supporting the common nature of such artifacts. We then extended our search to ONT sequencing data for five commonly used cell lines from the Singapore Nanopore Expression Project (SG-NEx) [21]: A549, HCT116, HepG2, K562, and MCF-7. In total, we discovered 100 candidate events corresponding to 57 unique falsitrons in 43 genes, for which “spliced” reads were present in the cDNA-seq (up to 70% of reads) but completely absent in the matched dRNA-seq (Fig. 2c, Additional File 2: Data 1, Additional File 3: Table S1). Many of these falsitrons were short (median length 353 nt Fig. 2d), with the “spliced” regions flanked by direct repeats (35 out of 57 Fig. 2c, e). This discovery strengthens our hypothesis that falsitrons in many instances arise from RT slippage. These artifacts are not restricted to ONT data, but occur in other long-read sequencing protocols such as Iso-Seq (Isoform Sequencing, PacBio) as well [13]. We detected 33 out of 57 falsitrons in the reconstructed isoforms from publicly available Iso-Seq data for several human RNA samples (Alzheimer brain, lymphoblastoid cell line COLO829BL, melanoma cell line COLO829T and Human Universal Reference RNA—see the “Methods” section and Additional File 1: Fig. S2c).

The detection of questionable exitrons is common in cDNA-seq and dcDNA-seq. a Schematic representation of the workflow to identify falsitrons in public ONT sequencing datasets. B Genome browser view showing the falsitron in TAX1BP3 in ONT sequencing data for GM12878. C Violin plots indicating the detection of falsitrons in cDNA-seq and dcDNA-seq of different human cell lines. D Stacked bar plots showing the fraction of falsitrons of different lengths. mi Bar graph depicting the length of falsitron-flanking direct repeats. F Violin plots show relative abundance of falsitron products in DNAJC22 y GAS2L3 for three TCGA cancer cohorts. ESCA, esophageal carcinoma. OV, ovarian serous cystadenocarcinoma. STAD, stomach adenocarcinoma. gramo Plot showing cumulative percentage with direct repeats of at least a given length. Dashed lines indicate the total fraction of introns with direct repeats (≥ 4 nt). h Sequence logos indicating nucleotide composition at 5′ and 3′ splice sites. Positions of splice site dinucleotide motifs are highlighted

Conceptually, such RT artifacts would not be restricted to long-read cDNA-seq data either and should also be found in conventional short-read RNA-seq protocols. To test this hypothesis, we screened the Cancer Genome Atlas (TCGA) database [22] and immediately found six of the falsitrons in several cancer types. Overall, the abundance of the corresponding isoforms was low (< 5%), but could rise up to > 90% for certain samples and tumor types (Fig. 2f). This is potentially important, because a recent paper reported more than 100,000 exitrons in the TCGA database and suggested that the corresponding isoforms are novel cancer drivers and neoepitopes [23]. To learn whether such analyses might be affected by RT artifacts, we overlaid the falsitrons from our ONT data comparison onto these reported exitrons. We found that five falsitrons, including the CD19 one, overlapped with reported exitrons. To our surprise, we further detected direct repeats (≥ 4 nt) overlapping the putative splice sites in almost 75% of the reported exitrons (91,852 out of 123,337 median length 5 nt), i.e. even more than in our falsitron list (with the shorter median length of 4 nt Fig. 2g). In contrast, only

25% of all annotated introns harbored such direct repeats at their splice sites (median length < 4 nt). Moreover, even though exitrons had been selected for canonical splice site dinucleotides (GU/GC-AG), they lacked other characteristics of 5′ and 3′ splice sites such as U1 complementarity and the polypyrimidine tract (Fig. 2h). This finding indicates that a significant fraction of the reported exitrons could also be RT artifacts. Although this observation awaits experimental validation, it suggests that caution is required when interpreting RNA-seq mapping data. We envision that as more dRNA-seq data become available, the unequivocal classification of cryptic introns as exitrons or falsitrons will be possible.


2.6 – Enzymes

2.6 – Enzymes
2.6.1 – Define enzyme and active site
Enzima – A biological catalyst made of globular protein
Enzymes speed up the reactions by influencing the stability of bonds in the reactants. Que puede also provide an alternative reaction pathway, and reduce the energy needed for the reaction.
Sitio activo – The region of an enzyme molecule surface where the substrate molecule binds and catalysis occurs
The substrate is drawn in to the active site. It has both binding and catalytic regions. The molecules are positioned to promote the reaction.

2.6.2 – Explain enzyme-substrate specificity
A substrate is the starting substance, which is converted to the product.
Enzymes are very specific, and will only catalyse one type of reaction or a very small group of similar reactions. They recognize the substrate as the active site had a precise shape and
distinctive chemical properties. Hence, only particular substrate molecules will be attracted to the active site and fit there. Others cannot fit and will not bind.
Enzymes can have high specificity (when it will only bind to a single type of substrate) or low specificity (when it will bind to a range of related substances). When they bind, the enzyme substrate complex is formed. En el lock and key model, it is suggested that the enzyme and substrate possess specific, complementary shapes that fit exactly into each other.

2.6.3 – Explain the effects of temperature, pH and substrate concentration on enzyme
actividad
Temperatura -Each enzyme has an optimal temperature for function. When at this temperature, the enzyme will work at its peak, speeding up the reaction. After the temperature reaches its optimum level, the reaction rate abruptly declines. Many enzymes are adversely affected by high temperatures, at which point denaturation occurs. Many enzymes only have a narrow range of conditions under which they operate properly. This is usually at low temperatures for plant and animal enzymes.

pH -Enzymes also have an optimal pH. At this point, it works best and the reaction occurs the fastest, as the enzyme is the most active. There is lower activity above and below the optimum pH (see graph). Extremes in pH will usually result in a complete loss of activity for most enzymes as it leads to a change in shape of the active site. The H+ ions interfere with hydrogen and ionic bonds within the protein structure, which means that the substrate cannot bind. The optimum pH for each enzyme varies greatly. For example, pepsin has an optimum pH of 1.5, but lipase has an optimum pH of 8.0.

Substrate Concentration – If the amount of the enzyme is kept constant and the substrate concentration is increased, the reaction velocity will increase until it hits its maximum. After that, the velocity plateaus. At this point, all of the enzymes have formed complexes with the substrates.

Enzyme Concentration – The rate of reaction, so long as there is excess substrate, will continue to increase as the concentration of the enzyme increases

2.6.4 – Define denaturation
Denaturation is a structural change in a protein that alters its shape and results in a loss of biological properties. This can be caused by pH or temperature. This is when the protein loses its three-dimensional structure, usually along with function. It is often permanent. The bonds in the secondary and tertiary structure are altered, although the sequence is unchanged.
This can result from strong acids and alkalis, which disrupt ionic bonds, resulting in coagulation. Long exposure will eventually break down the primary structure. Metales pesados also disrupt ionic bonds, and form bonds with the carboxyl groups of the R group, reducing the charge of the protein. This generally causes the protein to precipitate. Calor y radiación (such as UV rays) disrupt the bonds because of the increased energy provided to the atoms. Detergents and solvents form bonds with the non-polar groups in the protein, which disrupts hydrogen bonding.

2.6.5 – Explain the use of lactase in the production of lactose-free milk
The production of lactose-free milk is an example of industrial use of biotechnology, which is of huge and increasing economic importance. People who cannot digest lactose are lactose intolerant y do not produce lactase. They must instead drink lactose-free milk, which is made by using lactase from bacteria.
This used to be done through whole-cell preparations. This is not efficient, however, and inappropriate for a food like liquid milk. Cell-free preparation is also used, although the enzymes cannot be re-used, and removal can be expensive.
En lugar de, immobilized enzymes son usados. The advantages of this method are:

  • The enzyme preparation can be re-used
  • The product received is enzyme-free
  • The enzyme may be more stable and long lasting due to protection by the inert matrix

Today, lactose free milk is produced by passing milk over lactase enzyme, bound to an inert carrier. The enzyme is obtained from bacteria, purified, and enclosed in capsules. Once the molecule is cleaved, there are no lactose ill-effects. Alternatively, a harmless bacterium may be added (such as L. Acidophilus), which affects the lactose in milk and yoghurt.


Structural basis for backtracking by the SARS-CoV-2 replication-transcription complex

Backtracking, the reverse motion of the transcriptase enzyme on the nucleic acid template, is a universal regulatory feature of transcription in cellular organisms but its role in viruses is not established. Here we present evidence that backtracking extends into the viral realm, where backtracking by the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) RNA-dependent RNA polymerase (RdRp) may aid viral transcription and replication. Structures of SARS-CoV-2 RdRp bound to the essential nsp13 helicase and RNA suggested the helicase facilitates backtracking. We use cryo-electron microscopy, RNA-protein cross-linking, and unbiased molecular dynamics simulations to characterize SARS-CoV-2 RdRp backtracking. The results establish that the single-stranded 3' segment of the product RNA generated by backtracking extrudes through the RdRp nucleoside triphosphate (NTP) entry tunnel, that a mismatched nucleotide at the product RNA 3' end frays and enters the NTP entry tunnel to initiate backtracking, and that nsp13 stimulates RdRp backtracking. Backtracking may aid proofreading, a crucial process for SARS-CoV-2 resistance against antivirals.

Palabras clave: RNA-dependent RNA polymerase backtracking coronavirus cryo-electron microscopy molecular dynamics.


Ver el vídeo: TRANSCRIPCIÓN: de ADN a ARN. Hacks para aprenderlo rápido! (Mayo 2022).