Información

¿Qué tan grande es el cambio en las proteínas debido al empalme alternativo?

¿Qué tan grande es el cambio en las proteínas debido al empalme alternativo?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

¿Cuán diferentes pueden ser las proteínas que están codificadas a partir de la misma secuencia de ADN pero que se someten a un empalme alternativo?

Lo que estoy tratando de entender es por qué estamos tan obsesionados con las secuencias de ADN y lo que están codificando, si el resultado puede diferir mucho debido al empalme alternativo.


Para su primera pregunta, pueden variar drásticamente.

Originalmente no publiqué como una respuesta formal porque mi declaración a continuación es difícil de citar una fuente y, por lo tanto, sería algo subjetiva, aunque tengo bastante confianza en la afirmación. Se basa en mi propia experiencia en lectura de literatura tanto de GWAS como de EWAS. Mi investigación se refiere a métodos para el análisis de tales datos.

Para responder a su segunda pregunta, el enfoque principal se ha desplazado de la variación genética (aunque todavía se hace) a la variación de expresión y la variación epigenética. La investigación de expresión se centra exactamente en el tipo de problema que está discutiendo con el empalme alternativo, y esto es en gran parte posible debido a la disminución del costo de RNAseq. Ya no estamos tan obsesionados con la secuencia; El advenimiento de GWAS, que alguna vez se pensó que era una panacea para la explicación de la susceptibilidad a las enfermedades, solo ha terminado por explicar una fracción de las estimaciones de heredabilidad genética. Por no decir que no está enfocado, solo en el contexto de otros tipos de variaciones y exposiciones ambientales.


Splicing alternativo

Abstracto

El empalme alternativo es el proceso de seleccionar diferentes combinaciones de sitios de empalme dentro de un precursor de ARN mensajero (pre-ARNm) para producir ARNm con empalme variable. Estos múltiples ARNm pueden codificar proteínas que varían en su secuencia y actividad y, sin embargo, surgen de un solo gen. El corte y empalme alternativo es un mecanismo importante en el desarrollo y el control específico del tipo celular de la expresión génica, y como un mecanismo para aumentar la diversidad del proteoma. Se encuentra en casi todos los organismos eucariotas que llevan a cabo un empalme de pre-ARNm nuclear estándar, incluidos animales, plantas y, en algunos casos, hongos. El empalme alternativo está modulado por muchas proteínas que interactúan con una gran variedad de secuencias potenciadoras y supresoras del empalme.


Fondo

Las inserciones / deleciones de secuencias (indeles) ocurren durante la evolución y el proceso de empalme alternativo (AS) en eucariotas. La generación de diversas isoformas de proteínas a través del empalme alternativo se ha considerado como uno de los principales mecanismos evolutivos para aumentar el tamaño del proteoma y la diversidad funcional [1, 2]. Un análisis reciente de alto rendimiento basado en datos de ARNm-SEQ de diversos tejidos humanos y líneas celulares sugirió que el empalme alternativo es casi universal (hasta un 94%) en los genes de múltiples exones humanos [3]. Si bien hay varios tipos de eventos de empalme que dan como resultado diferentes isoformas de empalme en comparación con las secuencias primarias, como truncamiento, sustitución, inserción y deleción, los casos de inserción / deleción interna son la forma dominante de variantes de empalme alternativas y son de gran interés debido a su impacto potencial sobre el plegado y la estabilidad de las estructuras isoformas [3, 4]. Además, los genes que contienen exones "en forma de interruptor" tienen más probabilidades de tener isoformas con indeles [3]. Es fundamental para nuestra comprensión de la función de las isoformas de proteínas empalmadas alternativamente si sabemos cómo los cambios de secuencia, especialmente las inserciones y deleciones de secuencia, afectan la estructura de las variantes de empalme, ya que las estructuras contienen información clave para la función de las proteínas.

Nuestro conocimiento actual sobre cómo el empalme alternativo afecta las estructuras de las proteínas es muy limitado. Si bien hay alrededor de 28,000 isoformas de proteínas anotadas de la reciente liberación de UniProt 15.11 (24 de noviembre de 2009) [5] y más de 60,000 estructuras de proteínas depositadas en Protein Data Bank (PDB) [6], menos de 10 pares de isoformas empalmadas alternativamente tienen estructuras documentadas [7]. La predicción de estructuras de isoformas generalmente entra en la categoría de modelado de homología. Sin embargo, el modelado de homología de proteínas con indeles no es una tarea trivial. La clave del éxito en el modelado de homología con indeles es la precisión de la alineación, especialmente el posicionamiento de las secuencias de inserción o deleción. Por ejemplo, varios grupos en CASP8 (el octavo experimento comunitario sobre la evaluación crítica de técnicas para la predicción de la estructura de proteínas) utilizaron la misma proteína 2G39 como plantilla para modelar la proteína diana T0438, pero solo tres de los nueve modelos colocaron la secuencia de inserción (12 aminoácidos) en el lugar correcto [8]. Otro ejemplo infame / famoso en el posicionamiento indel es el modelado de la isoforma AS larga de Piccolo C2Un dominio que tiene una inserción de nueve residuos en un bucle. En lugar de plegarse como parte del bucle, el inserto de nueve residuos desplaza una hebra β que es empujada hacia la región de unión al calcio a través de un reordenamiento local, lo que lleva a un cambio dramático en la afinidad de unión al calcio [9].

Si bien en general se cree que las inserciones y deleciones se toleran bien en los bucles [10, 11], las inserciones y deleciones dentro de las estructuras secundarias (hélices α y láminas β) pueden tener un efecto dramático en la estructura general y se consideran perjudiciales y desfavorables. durante la evolución [4, 12]. Trenza et al. argumentó que la isoforma AS es probablemente una ruta poco probable para aumentar la diversidad funcional debido al gran impacto estructural inducido por indeles [4]. Sin embargo, en una serie de estudios con inserciones y deleciones modificadas genéticamente en lisozima T4, el grupo de Matthews demostró que la proteína tiene plasticidad estructural para tolerar indeles dentro de estructuras secundarias [13-15]. Tres análisis recientes a gran escala también ofrecieron una visión similar de que las estructuras proteicas tienen cierto grado de "plasticidad" para tolerar inserciones y deleciones manteniendo el mismo pliegue estructural [16-18].

El objetivo principal de este artículo es investigar el impacto de los indeles internos cortos (menos de 40 aminoácidos) en las estructuras de las proteínas, especialmente para los indeles dentro de las estructuras secundarias. Los indeles grandes pueden plegarse como un dominio individual o los pares de proteínas pueden adoptar pliegues diferentes debido a las grandes diferencias entre dos secuencias [8]. Los indeles terminales no se consideran en este estudio, ya que los fragmentos terminales son relativamente flexibles y la deleción / truncamiento terminal se han convertido en un protocolo estándar en la expresión y cristalización de proteínas recombinantes [19-21]. Además, los vectores de clonación ampliamente utilizados con His-tags introducen artefactos de secuencia que se incluyen en los registros de PDB SEQRES y la determinación de las secuencias de etiquetas exactas es problemático [22, 23]. Aunque hay varias encuestas similares sobre estadísticas de indel desde 1992 [10, 24-27], nuestro enfoque es diferente ya que nuestro objetivo es estudiar el impacto de los indeles en la estructura de las proteínas y proporcionar una guía para la predicción de la estructura de isoformas. Por lo tanto, es fundamental que las ubicaciones de los indeles sean únicas e inequívocas. De lo contrario, los cambios estructurales estarían menos definidos. Por ejemplo, no es raro que dos proteínas con una alta identidad de secuencia global tengan una baja similitud de secuencia local [28]. Para abordar este problema, tenemos en cuenta la similitud de secuencia local y solo consideramos los pares de proteínas con una similitud de secuencia tanto global como local (secuencias que flanquean los indeles) (& gt75%) para garantizar la unicidad de las secuencias y posiciones de indel. Además, incluimos la "conformación desordenada" en nuestro análisis estructural. Se ha demostrado que las regiones intrínsecamente desordenadas o no estructuradas son responsables de muchas funciones celulares importantes y recientemente se ha informado de un vínculo entre el empalme alternativo y el trastorno intrínseco de proteínas [17, 29, 30].

En este artículo, presentamos un análisis sistemático de un gran conjunto de datos indel no redundante con pares de proteínas altamente homólogas. Anteriormente, encontramos que la familia de inmunoglobulinas (Ig), rica en ciertos aminoácidos como tirosina, glicina y serina en la tercera región determinante de complementariedad de la cadena pesada de Ig (CDR-H3), estaba sobrerrepresentada en un conjunto de datos de indel [28, 31, 32]. Por lo tanto, esas secuencias indel relacionadas con Ig no se consideran en nuestro análisis actual. Nuestros resultados muestran que los indeles internos tienden a tener estructuras secundarias menos regulares (hélices α y hebras β), pero son ricas en "conformación desordenada", lo cual está en línea con el trabajo de Romero. et al [17]. Nuestros datos también muestran que las proteínas con indeles cortos, incluidas las que se encuentran dentro de las estructuras secundarias regulares, generalmente conservan el pliegue estructural con algún reordenamiento y replegamiento de la estructura local, presumiblemente para la estabilidad estructural y la funcionalidad. Se describe la fuente del indel, ya sea de origen natural o de ingeniería experimental, y se discute la importancia estadística de las características del indel natural. Se desarrolló un servidor web SCINDEL http://bioinfozen.uncc.edu/scindel para una visualización conveniente de los cambios estructurales inducidos por indel.


Resultados

Creación de perfiles de AS en GBM mediante recurrencia

Se perfilaron 37 muestras humanas de GBM de 23 pacientes, 19 casos primarios no tratados y 18 casos recurrentes tratados con terapia estándar (radiación, temozolomida y resección quirúrgica) 34 muestras fueron muestras longitudinales emparejadas con el paciente (Fig.1a Archivo adicional 1: Tabla S1). Realizamos RNA-seq en cada una de estas muestras, generando más de 277 millones de lecturas por muestra. Además, obtuvimos 15 conjuntos de datos públicos de RNA-seq de muestras longitudinales de GBM y 29 conjuntos de datos públicos de RNA-seq de tejidos cerebrales fetales y adultos no malignos (sección “Materiales y métodos”).

a Descripción general conceptual del diseño del estudio y las muestras utilizadas. B Integración de vecino estocástico distribuido en T (tSNE) de AS PSI en muestras de cerebro no malignas de GBM primario, GBM recurrente y GTEx. C Como en B, pero PCA. D Análisis de ontología genética del cáncer de Wikipathway de genes dentro del 20% superior de las cargas del componente principal positivo y negativo uno de C. mi Las distribuciones de los tipos de EA en eventos de EA específicos de tumores, comparando GBM primarios y recurrentes

Construimos un modelo integrado de EA entre el cerebro no maligno, las condiciones de GBM primario y recurrente a través de MAJIQ [4] (Fig. 1b, sección “Materiales y métodos”). Descubrimos que las muestras de cerebro no malignas formaban un grupo distinto, que se separaba de las muestras de GBM primarias y recurrentes, cuando se veían en un análisis de componentes principales (PCA) de índices seleccionados porcentuales marginales (PSI) (Fig.1c Archivo adicional 2: Tabla S2). Los valores de PSI se calcularon mediante el modelo bayesiano de MAJIQ y estiman las frecuencias con las que se seleccionan las uniones de empalme en los eventos de AS. Un análisis de ontología genética de los eventos de AS cuyos PSI cargados de forma variable con el componente principal uno reveló la señalización del factor de crecimiento (p. Ej., PDGFRB, PIK3R1, FOS, MAPK9), factor de crecimiento tumoral (p. ej., TGFB1, SMAD2, SMAD4) y proinflamatorio (p. ej., NFKB1, RELA, STAT1, STAT3) señalización (Fig. 1d, archivo adicional 3: Fig. S1). Las proporciones relativas de los tipos de eventos de EA se mantuvieron estables al comparar la enfermedad primaria y recurrente (Fig. 1e).

Identificación de dianas para la terapia con células T autólogas

Comenzamos por el cribado de objetivos específicos de GBM en neouniones específicas de cáncer que se habían identificado previamente en un análisis de pan-cáncer [2]. Identificamos eventos de neounión putativos de 2011 en proteínas de la superficie celular expresadas en GBM. De estos, el 37,8% cayeron en dominios extracelulares y, por lo tanto, serían adecuados como dianas de células CAR T (Fig. 2a). Luego comparamos los datos de scRNA-seq de GBM humano (sección “Materiales y métodos”), para validar las secuencias de neounión como expresadas en células neoplásicas, pero no expresadas en glía no malignas o células inmunes (Fig. 2b). Encontramos una variedad de neouniones expresadas específicamente por células neoplásicas GBM (Archivo adicional 4: Tabla S3). Estos incluyeron receptores de matriz extracelular que se han estudiado durante mucho tiempo como mediadores de la invasión de GBM (p. Ej., PTPRZ1 Fig. 2c) [5], así como el marcador de células madre de glioma del subtipo mesenquimal de Verhaak, CD44. Encontramos varias secuencias diana expresadas en el 10-35% de las células neoplásicas dentro de los tumores individuales y en el 5-10% de los casos de GBM (Fig. 2d, archivo adicional 3: Fig. S2A).

a Las frecuencias de neouniones identificadas por Kahles et al. [2] a través de los dominios de las proteínas de la superficie celular. B Las frecuencias de las neouniones en los dominios extracelulares de las proteínas de la superficie celular y en las células neoplásicas frente a las células gliales, inmunes y endoteliales no malignas. C Las frecuencias de expresión de secuencias de neounión en células neoplásicas GBM humanas en datos de scRNA-seq de Smart-seq2. D Las frecuencias de neouniones en las poblaciones de GBM y pan-cáncer, según lo evaluado a partir de los datos de secuencia de ARN del Atlas del genoma del cáncer (TCGA)

Luego interrogamos nuestros nuevos datos de secuencia de ARN en busca de eventos de AS específicos de tumores. Identificamos genes empalmados diferencialmente entre todas las muestras de GBM frente a muestras de cerebro no malignas (sección "Materiales y métodos" Archivo adicional 5: Tabla S4). Luego, estos eventos se filtraron para retener solo aquellos que estaban completamente ausentes en el cerebro no maligno. Con ese fin, solo consideramos los eventos de EA con PSI = 0 en todas las muestras de cerebro no malignas y el PSI absoluto esperado & gt 10% a un nivel de confianza del 95% en las muestras tumorales. Encontramos muchos menos eventos específicos de tumores que en nuestro análisis de corte y empalme diferencial anterior (Fig. 3a). No obstante, identificamos 221 eventos AS específicos del tumor (Fig. 3b), y la mayoría ocurre solo en GBM recurrente (Archivo adicional 3: Fig. S2B). Cuando comparamos nuestros datos de scRNA-seq de GBM, encontramos que había 21 y 18 supuestos eventos de neounión en proteínas de superficie celular que se expresaban específicamente en células neoplásicas y estaban presentes en dominios extracelulares (Fig.3c, d Archivo adicional 6: Tabla S5 ). Siguiendo el enfoque de Kahles et al. [2], derivamos secuencias polipeptídicas que abarcan neouniones y las comparamos con la base de datos del Clinical Proteomic Tumor Analysis Consortium (CPTAC) [6]. Encontramos que más del 75% de nuestras muestras expresaron al menos una neounión confirmada por CPTAC (Fig. 3e), con tres a cuatro neouniones confirmadas por muestra en promedio (Fig. 3f). Consideramos que esto es una subestimación conservadora, ya que los polipéptidos alternativos derivados del empalme que abarcan la unión están pobremente representados en los datos de espectrometría de masas como CPTAC debido a las propiedades de escisión de la tripsina [7]. Por lo tanto, todos nuestros candidatos a nivel de ARN serían adecuados para una mayor validación y desarrollo como objetivos de células T con CAR.

a La distribución del tipo de evento de EA en eventos de EA específicos de tumor, comparando GBM primarios y recurrentes. B Las fracciones de eventos AS específicos del tumor en las proteínas de la superficie celular, comparadas entre GBM primario y recurrente. C Los porcentajes de neouniones específicas de tumores encontrados en diferentes dominios proteicos. D Las frecuencias de neouniones específicas de tumores en células neoplásicas GBM de Smart-seq2 scRNA-seq. mi Las fracciones de casos con al menos una neounión confirmada por CPTAC. F El número medio de neouniones confirmadas por CPTAC por caso

Aunque nuestro enfoque principal fue la identificación de dianas para las células T con CAR, también analizamos posibles dianas para las terapias de células T transducidas por el receptor de células T (TCR). Las células TCR T son menos flexibles que las células CAR T, ya que requieren procesamiento y presentación diana en antígeno leucocitario humano (HLA) de clase I. Por otro lado, las células CAR T pueden dirigirse a cualquier proteína de la superficie celular independientemente de la presentación de HLA y el procesamiento de péptidos no es un requisito previo. Por lo tanto, para identificar posibles dianas para la terapia con células T de TCR, primero necesitábamos determinar el serotipo de HLA de clase I para cada paciente a partir de los datos de secuencia de ARN asociados (Fig. 4a, sección “Materiales y métodos” Archivo adicional 7: Tabla S6) . Luego extrajimos secuencias de la referencia en una ventana de 50 pares de bases alrededor de cada una de nuestras supuestas neouniones y usamos NetMHCpan para predecir péptidos escindidos del producto proteico asociado. NetMHCpan se utilizó además para predecir la unión de HLA de péptidos generados, dado el serotipo del paciente. Identificamos 704 neoantígenos putativos derivados de neouniones (Fig. 4b). Tenga en cuenta que una sola neounión puede dar lugar a múltiples neoantígenos putativos. Observamos un aumento tanto en el número de neoantígenos inferidos como en la afinidad de unión prevista de esos antígenos en GBM recurrentes (Fig. 4c, d).

a Una descripción general del proceso de descubrimiento de neoantígenos. B El número de neoantígenos derivados de neouniones putativos enriquecidos en tumores primarios, enriquecidos en tumores recurrentes y compartidos. C Las frecuencias de neoantígenos derivados de neouniones en GBM primario frente a recurrente. D El HLA-I predijo las afinidades de unión de los neoantígenos derivados de la neounión en la GBM primaria frente a la recurrente

AS eventos enriquecidos en GBM recurrente

A continuación, realizamos una prueba de PSI diferencial a través de MAJIQ, comparando muestras primarias y recurrentes. Identificamos 172 eventos AS en 107 genes (100 ARN codificantes y 7 largos no codificantes) con un PSI diferencial esperado mayor al 10%, al nivel de confianza del 95% (sección “Materiales y métodos” Archivo adicional 8: Tabla S7). Muchos de estos eventos ocurrieron en genes que son críticos para la progresión maligna. Por ejemplo, varias proteína quinasas activadas por mitógenos (MAP4K4, MAPK9, MAPK10), receptores de factores de crecimiento (FGFR1, FGFR2, EGFR) y proteínas matricelulares (TNC, FN1) mostró diferencias significativas en PSI entre MBG primario y recurrente (Fig. 5a, archivo adicional 3: Fig. S3A). Encontramos que estos y otros AS que se enriquecieron en GBM recurrentes en nuestros datos también se enriquecieron en casos recurrentes en GBM RNA-seq disponible públicamente [8] (Fig. 5b).

a Ejemplos de eventos de AS con empalme diferencial significativo entre GBM primarios y recurrentes. B Los porcentajes de superposición entre eventos AS específicos recurrentes en nuestros datos, en comparación con la expresión específica recurrente en los datos TCGA y INCB

Los GBM recurrentes expresan preferentemente isoformas que mejoran la invasión

Las secuencias de genes empalmados diferencialmente se escanearon en busca de motivos de proteínas de unión a ARN y sitios de unión putativos. La mayoría de los sitios de unión se encontraron en las regiones codificantes, menos en las regiones intrónicas y no traducidas (Fig. 6a). Entre los motivos observados con más frecuencia se encuentran los reconocidos por los trans-mediadores de AS descritos anteriormente. En particular, se identificaron varias proteínas de unión al ARN del factor de corte y empalme rico en serina y arginina (SRSF) (Fig. 6b). Los factores de corte y empalme de SRSF se han implicado previamente en la progresión del cáncer por su capacidad para unirse a exones variables e inhibir o promover la omisión de exones (p. Ej., [9]).

a La distribución de los sitios de reconocimiento de proteínas de unión a ARN a través de genes empalmados diferencialmente entre GBM primario y recurrente. B Las frecuencias de apariciones de motivos de proteínas de unión a ARN en genes empalmados diferencialmente entre GBM primario y recurrente. C Inclusión de exón alternativo en MAP4K4. D Sitios de unión inferidos para proteínas SRSF en MAP4K4. mi Valores de PSI para las uniones que apoyan la inclusión del exón 19 y otros, comparados entre la RNA-seq de GBM primaria y recurrente, utilizando los datos internos. F Como en mi, pero utilizando datos públicos de TCGA y INCB. gramo Las frecuencias de expresión del exón-19 que apoyan las secuencias de neounión en GBM primario versus recurrente, comparadas entre nuestros datos internos, TCGA y datos de la JIFE. h Las frecuencias de ocurrencia de MAP4K4 uniones de exón que apoyan la inclusión del exón-19 en células GBM neoplásicas similares a tallo y no similares a tallo. I Los resultados de un ensayo de invasión de matriz extracelular que compara SRSF5 OE en células U87 con controles, con y sin tratamiento TMZ en el IC50 durante 48 h

Algunos sitios de unión de SRSF predichos se produjeron en exones que se retuvieron específicamente en GBM recurrente. Por ejemplo, MAP4K4 interactúa selectivamente con MAPK8 para promover la migración y la invasión en el cáncer, dependiendo de la inclusión del exón 19 [10, 11]. Una pantalla de pérdida de función reciente identificada MAP4K4 como esencial para la invasión de GBM y la transición epitelial a mesenquimal [12]. Encontramos el exón 19 de MAP4K4 para ser retenido preferentemente en GBM recurrente en nuestros datos, pero preferentemente empalmado en GBM primario (Fig. 6c). Además, los motivos SRSF5 y SRSF9 (dos de los más sobrerrepresentados en nuestro análisis) se enriquecieron en el exón 19 (Fig. 6d). Este enriquecimiento para la inclusión del exón 19 en la recurrencia fue pronunciado en nuestros datos (Fig. 6e) y validado en datos longitudinales públicos de GBM RNA-seq [8], tanto a través del modelado MAJIQ (Fig. 6f) como en términos del número de primarios vs. Casos recurrentes que expresan la neounión asociada (Fig. 6g).

Para determinar la especificidad del tipo celular de MAP4K4 expresión de isoformas, examinamos los datos publicados de scRNA-seq que se obtuvieron a través de las plataformas Smart-seq2 y 10X Genomics [13, 14]. Encontramos un aumento de más del doble en las secuencias de unión que apoyan el exón 19 en las células madre en comparación con las células con un fenotipo más diferenciado (Fig. 6h, archivo adicional 3: Fig. S3B, sección “Materiales y métodos”). Además, esta isoforma se encontró predominantemente en células madre del subtipo mesenquimal de Verhaak. De acuerdo con el papel de esta isoforma en la estimulación de MAPK8, encontramos un aumento significativo MAPK8 expresión en GBM recurrente (adj. pag = 0.045 Archivo adicional 9: Tabla S8).

Para determinar el efecto de SRSF5 sobreexpresión (OE), transfectamos la línea celular de glioma derivada del paciente U87 con plásmidos que expresan SRSF5 o controles de vector vacío (sección “Materiales y métodos”). Las células transfectadas se seleccionaron mediante citometría de flujo usando un marcador fluorescente expresado por el vector. Se tomaron alícuotas de 500.000 células por condición (por duplicado) para un ensayo de invasión de matriz extracelular basado en cámara de Boyden. Se consideraron dos brazos, con y sin tratamiento de 48 h con temozolomida (TMZ) de terapia estándar de GBM a la mitad de la concentración inhibitoria máxima (IC50), que habíamos determinado a partir de estudios previos para esta línea celular [14]. Encontramos eso SRSF5 La OE aumentó la invasividad y este efecto se vio exacerbado por el tratamiento con TMZ (Fig. 6i).


Discusión

Se reconstruyó un atlas completo de transcriptoma FL de maní a partir de tejidos de raíces, hojas, puntas de brotes, flores y tejidos de clavijas mediante PacBio Iso-seq. Usando datos de Iso-seq, detectamos múltiples eventos de AS asociados con tejido de clavija y transcripciones de FL específicas de la etapa de desarrollo. Identificamos 1448, 1102, 832 y 902 transcripciones empalmadas alternativamente en maní S1, S2, S3 y S4, respectivamente, incluidas 184 transcripciones empalmadas alternativamente relacionadas con la respuesta mecánica y de luz, estimulación de la gravedad, vías de señalización mediadas por hormonas y dependientes del calcio proteínas, que se consideraban que desempeñaban un papel importante en el desarrollo de las clavijas de maní, como el alargamiento de las clavijas y la formación temprana de las vainas.

Las clavijas S1 representaban las clavijas aéreas fertilizadas que detectaban la gravedad y se doblaban hacia abajo. En esta etapa, identificamos múltiples transcripciones expresadas específicamente relacionadas con los estímulos mecánicos y de luz, la estimulación de la gravedad, los factores de respuesta hormonal y las proteínas quinasas dependientes del calcio y los receptores de detección (Tabla S5). Entre estas transcripciones, encontramos 21 transcripciones relacionadas con la luz y el estímulo mecánico, incluida la proteína asociada a la clasificación de proteínas vacuolares (9 transcripciones), las proteínas relacionadas con la peroxidasa (6 transcripciones), la subunidad de protón ATPasa de tipo V (4 transcripciones) y el catión vacuolar. / intercambiador de protones 5 (2 transcripciones), que se informó que desempeñan un papel clave en el alargamiento de la clavija de maní y el desarrollo de la vaina [4, 7, 9, 24]. Estudios anteriores demostraron que los transportadores ABC, los microtúbulos, las proteínas asociadas a los microtúbulos y las proteínas de choque térmico desempeñan un papel importante en la respuesta a la estimulación de la gravedad de las plantas [25, 26, 27]. En este estudio, identificamos 20 transcripciones expresadas específicamente relacionadas con la estimulación de la gravedad, incluidas 8 transcripciones del transportador ABC, 5 transcripciones de alfa-tubulina, 3 transcripciones de proteínas asociadas a microtúbulos, dos transcripciones TANGLED de proteína de unión a microtúbulos y dos transcripciones de proteínas de choque térmico pequeñas. En particular, dos genes gravitrópicos, RESPUESTA ALTERADA A LA GRAVEDAD (ARG1) y GRAVITROPISMO DEFECTUOSO 2 (GRV2), que estaban bien caracterizados para afectar el crecimiento de las plantas en respuesta a la gravedad [28,29,30], se detectaron cada 2 isoformas transcritas alternativamente y expresadas de forma única sólo en clavijas S1. Se informó que la percepción de la gravedad podría dar lugar a una redistribución asimétrica de auxinas y hacer que los órganos de la planta se inclinen o crezcan hacia el vector de gravedad [31, 32]. Identificamos 15 transcripciones relacionadas con factores de respuesta hormonal, incluidos 7 factores de respuesta a auxina, 2 proteína IAA26 sensible a auxina, 2 proteína de sobreproducción de etileno 1, 2 factor de transcripción sensible al etileno RAP2-12 y 2 IAA-aminoácido hidrolasa tipo ILR1 6, que se expresaron específicamente en clavijas S1. La respuesta de estimulación por gravedad podría aumentar el nivel de Ca 2+ del citoplasma y promover aún más la extensibilidad de la pared celular, lo que cambió el transporte polar de auxina [33, 34]. Encontramos 6 transcripciones expresadas específicamente relacionadas con proteínas quinasas dependientes de calcio y receptores de detección, incluido el receptor de detección de calcio (3 transcripciones) y la proteína quinasa dependiente de calcio (3 transcripciones). Por ejemplo, identificamos 14 transcripciones relacionadas con la estructura de la pared celular, incluidas 10 villinas, 2 poligalacturonasas y 2 expansinas. Los villinos participaron en la regulación de la dinámica de la actina de las plantas, como el crecimiento de los tubos polínicos y los pelos radiculares [35, 36]. Las expansinas desempeñan funciones vitales en múltiples procesos morfogenéticos, como el alargamiento y extensión de la pared celular vegetal, el crecimiento de los tubos polínicos y los pelos radiculares, la regulación de la acción de las auxinas [37, 38]. Nuestros resultados mostraron que las villinas y las expansinas pueden contribuir al alargamiento de las clavijas S1. Otro gen, GDSL esterasa / lipasa, que se informó tiene funciones en la regulación de los componentes de señalización del etileno para modular la inmunidad sistémica en Arabidopsis [39, 40], se identificó para transcribir alternativamente 2 isoformas y solo se expresó en clavijas S1.

S2 representó las clavijas subterráneas que penetraron en el suelo durante 24 h, las cuales exhibieron diferentes características morfológicas y fisiológicas en comparación con las clavijas S1. Identificamos múltiples transcripciones empalmadas alternativamente que se expresaron específicamente en clavijas S2 (Tabla S5), de las cuales se relacionaron principalmente con estímulos mecánicos, estimulación por gravedad, transportador de auxina y proteínas sensibles, transportadores y proteína quinasas. Veintidós transcripciones empalmadas alternativamente relacionadas con la estimulación de la gravedad (10 transcripciones) y el estímulo mecánico (12 transcripciones) se expresaron específicamente en clavijas S2, lo que sugiere que las transcripciones contribuyeron al alargamiento de la clavija de maní después de la penetración en el suelo dentro de las 24 h. Un gen gravitrópico DISPARAR GRAVITROPISMO 6 (SGR6), que se informó que está involucrado en la regulación de cambios en las estructuras de las membranas morfológicas y vacuolares en las células endodérmicas sensibles a la gravedad en Arabidopsis [41], fueron identificados por tener 3 isoformas por un evento AA y expresados ​​específicamente solo en clavijas S2. Un análisis adicional identificó 5 transcripciones que probablemente sean transportadoras de auxina y sensibles, incluidas 2 involucradas en la proteína 4 de tipo transportador de auxina y 3 en la proteína IAA30 sensible a auxina. Identificamos múltiples transcripciones transportadoras expresadas específicamente en clavijas S2, incluido el transportador GABA 1 (2 transcripciones), el transportador de magnesio NIPA6 (4 transcripciones), el transportador de sulfato 4.2 (4 transcripciones), la proteína de transporte de proteínas At3g07100 similar a Sec24 (3 transcripciones), el transportador de azúcar ERD6-like 6 (2 transcripciones), transportador de dicarboxilato de tonoplasto (3 transcripciones) y transportador de dicarboxilato de tonoplasto (2 transcripciones), de los cuales estaban en concordancia con un estudio de transcriptoma previo en maní [4]. Se identificó que un gran número de transcripciones que codifican las proteínas serina / treonina proteína quinasa están involucradas en el estrés por frío, sal y en la regulación del crecimiento y desarrollo de las plantas a través de la autofosforilación [42, 43].

Las clavijas S3, a diferencia de S2, representaron la reorientación de las clavijas subterráneas contra la gravedad después de la penetración en el suelo durante tres días. Identificamos muchas transcripciones empalmadas alternativamente relacionadas con estímulos mecánicos, como peroxidasas, receptores de clasificación vacuolar y ATPasas de protones de tipo V y muchas proteínas de respuesta hormonal, es decir, proteínas que responden a auxinas y proteínas de sobreproducción de etileno, lo que sugiere que estas transcripciones desempeñan funciones en el subsuelo. desarrollo de clavijas. Al igual que con las clavijas S2, encontramos múltiples transcripciones relacionadas con las proteínas serina / treonina proteína quinasa, especialmente para la serina / treonina-proteína quinasa similar al receptor LRR (10 transcripciones) que estaban involucradas en la señalización temprana del ácido abscísico y actuaban como un regulador esencial en Arabidopsis formación de patrones embrionarios y generación de primordios de cotiledones [44,45,46]. En particular, detectamos muchas transcripciones de AS que estaban involucradas en la regulación del proceso de desarrollo en las clavijas S3. Un gen, EMBRIÓN DEFECTUOSO 1674 (EMB1674), tenía dos isoformas debido a un evento de AA, que estaba involucrado en la regulación del desarrollo embrionario normal en Arabidopsis [47]. El gen PENTACYSTEÍNA BÁSICA 4 (BPC4), que tiene dos isoformas como un evento de EA, funcionó como un regulador transcripcional positivo que participó en los procesos de desarrollo en Arabidopsis [48]. Un gen Proteína 4 de formación de raíces aberrantes (ALF4), que codifica una proteína localizada en el núcleo, tenía dos isoformas debido a un evento de IR, que desempeñan un papel esencial en Arabidopsis formación de raíces laterales [49]. Mientras tanto, detectamos algunos genes que intervienen en la regulación del desarrollo mediante la luz, por ejemplo, SECUENCIA 5 RELACIONADA CON FAR1 (FRS5), tenía tres isoformas debido a eventos AD, AA y ES, que funcionaban como un activador de la transcripción involucrado en la regulación del control de la luz del desarrollo en Arabidopsis [50] CRONÓMETRO CIRCADIANO XAP5 (XCT) tenía dos isoformas a través de un evento de AA que estaba involucrado en la coordinación de señales de luz para la fotomorfogénesis y el reloj circadiano en Arabidopsis [51].

S4 representa la vaina subterránea que sufre hinchazón y alargamiento después de la penetración del suelo. Identificamos 902 transcripciones empalmadas alternativamente en vainas S4. Entre estas transcripciones, detectamos múltiples transcripciones relacionadas con estímulos mecánicos, proteínas de respuesta a auxinas, proteínas transportadoras / transportadoras de calcio, transportes, proteínas ciclina y reguladores del proceso de desarrollo. Se identificaron diecisiete transcripciones relacionadas con estímulos mecánicos (8 transcripciones) y proteínas de unión / transporte de calcio (7 transcripciones) expresadas específicamente en vainas de hinchazón temprana. Ocho transcripciones que codifican el factor de respuesta a auxina 3/4 y la proteína IAA9 sensible a auxina se expresaron específicamente en vainas S4, que participaron en la regulación de la expresión de genes de respuesta a auxina [52]. Múltiples iones inorgánicos y pequeñas transcripciones transportadoras de sustancias orgánicas exhibidas expresadas de forma única en las vainas S4. Un gen proteína de transporte de auxina GRANDE (BIG), que codifica una proteína similar a la calosina, tenía dos isoformas debido a un evento de EA, que estaba involucrado en el transporte de auxinas polares durante los estímulos mediados por la luz [53]. Se identificaron muchas transcripciones de AS que codifican proteínas de ciclina expresadas específicamente en vainas de hinchamiento temprano. De estas proteínas ciclina, Ciclina-D4–1 (CYCD4–1) actuó como activador de Arabidopsis división del ápice de la raíz y promoción de la germinación de la semilla [54]. Además, identificamos múltiples transcripciones expresadas específicamente relacionadas con los reguladores del proceso de desarrollo en las cápsulas S4. Seven transcripts from gene TOPLESS (TPL) encoding transcriptional corepressor were identified uniquely expressed in early swelling pods, which were functioned as an essential factor in ovule development [55]. Notably, five transcripts from gene ROOT HAIR DEFECTIVE 3 (RHD3) encoding GTP-binding protein were identified in swelling pods, which was involved in root or root hair cells enlargement [56,57,58].


4. Alternative splicing and nonsense-mediated decay

NMD is an extensive and complicated mechanism, ranging from yeast to human, exploited to achieve another level of robustness in post-transcriptional gene expression control. Studies have revealed that up to one-third of human alternative splicing events contain premature termination codons (PTC), which are recognized and lead to the degradation of transcripts containing NMD cis-elements in their 3′ UTRs (56, 57). In vertebrates, it has been proposed that the coupling of the exon junction complex (EJC) to mRNA transcripts, followed by binding of 3′UTRs to EJCs, triggers vertebrate specific NMD (58). The sensitivity of mRNA transcripts to NMD is modulated by alternative splicing events in the 5′ or 3′UTRs and aids with the wide range of protein biosynthesis (59). Furthermore, analysis of quantitative alternative splicing microarray profiling has demonstrated that individual knockdown of NMD factors [Up-Frameshift (UPF)] strongly affects PTC-introducing alternative splicing events, indicating a role for different UPF factor requirements in alternative splicing regulation (60). In a second example, regulation of intron retention by alternative splicing-NMD in a specific differentiation event has been recently observed (61).


Control de la estabilidad del ARN

Before the mRNA leaves the nucleus, it is given two protective “caps” that prevent the ends of the strand from degrading during its journey. 5′ and 3′ exonucleases can degrade unprotected RNAs. los 5′ cap , which is placed on the 5′ end of the mRNA, is usually composed of a methylated guanosine triphosphate molecule (GTP). The GTP is placed “backward” on the 5′ end of the mRNA, so that the 5′ carbons of the GTP and the terminal nucleotide are linked through three phosphates. los cola poli-A , which is attached to the 3′ end, is usually composed of a long chain of adenine nucleotides. Estos cambios protegen los dos extremos del ARN del ataque de exonucleasas.

Una vez que el ARN se transporta al citoplasma, se puede controlar el tiempo que el ARN reside allí. Cada molécula de ARN tiene una vida útil definida y se desintegra a un ritmo específico. Esta tasa de descomposición puede influir en la cantidad de proteína que hay en la célula. Si la tasa de desintegración aumenta, el ARN no existirá en el citoplasma por tanto tiempo, acortando el tiempo disponible para que se produzca la traducción del ARNm. Por el contrario, si la tasa de descomposición disminuye, la molécula de ARNm residirá en el citoplasma durante más tiempo y se podrá traducir más proteína. Esta tasa de descomposición se conoce como estabilidad del ARN. Si el ARN es estable, se detectará durante períodos de tiempo más prolongados en el citoplasma.

La unión de proteínas al ARN también puede influir en su estabilidad. Proteins called RNA-binding proteins , or RBPs, can bind to the regions of the mRNA just upstream or downstream of the protein-coding region. These regions in the RNA that are not translated into protein are called the untranslated regions , or UTRs. No son intrones (se han eliminado en el núcleo). Más bien, se trata de regiones que regulan la localización, la estabilidad y la traducción de proteínas del ARNm. The region just before the protein-coding region is called the 5′ UTR , whereas the region after the coding region is called the 3′ UTR (Figure 3). La unión de las RBP a estas regiones puede aumentar o disminuir la estabilidad de una molécula de ARN, dependiendo de la RBP específica que se una.

Figure 3. The protein-coding region of mRNA is flanked by 5′ and 3′ untranslated regions (UTRs). The presence of RNA-binding proteins at the 5′ or 3′ UTR influences the stability of the RNA molecule.


Opciones de acceso

Obtenga acceso completo a la revista durante 1 año

Todos los precios son precios NETOS.
El IVA se agregará más adelante en el proceso de pago.
El cálculo de impuestos se finalizará durante el pago.

Obtenga acceso completo o por tiempo limitado al artículo en ReadCube.

Todos los precios son precios NETOS.


Download and print this article for your personal scholarly, research, and educational use.

Buy a single issue of Ciencias for just $15 USD.

Ciencias

Vol 351, Issue 6280
25 March 2016

Article Tools

Please log in to add an alert for this article.

Ciencias 25 Mar 2016 : 1390-1392

3D snapshots reveal dynamics of the spliceosome on the mRNA splicing pathway [Also see Research Article by Agafonov et al.]


Evolution: Alternative splicing of RNA rewires signaling in different tissues, may contribute to species differences

MIT biologists have found that alternative splicing of messenger RNA accounts for much of the differences seen between species. Credit: Wikimedia Commons

When genes were first discovered, the canonical view was that each gene encodes a unique protein. However, biologists later found that segments of genes can be combined in different ways, giving rise to many different proteins.

This phenomenon, known as alternative RNA splicing, often alters the outputs of signaling networks in different tissues and may contribute disproportionately to differences between species, according to a new study from MIT biologists.

After analyzing vast amounts of genetic data, the researchers found that the same genes are expressed in the same tissue types, such as liver or heart, across mammalian species. However, alternative splicing patterns—which determine the segments of those genes included or excluded—vary from species to species.

"The core things that make a heart a heart are mostly determined by a heart-specific gene expression signature. But the core things that make a mouse a mouse may disproportionately derive from splicing patterns that differ from those of rats or other mammals" says Chris Burge, an MIT professor of biology and biological engineering, and senior author of a paper on the findings in the Dec. 20 online edition of Ciencias.

Lead author of the paper is MIT biology graduate student Jason Merkin. Other authors are Caitlin Russell, a former technician in Burge's lab, and Ping Chen, a visiting grad student at MIT.

A variety of proteins

Alternative RNA splicing (a discovery for which MIT Institute Professor Phillip Sharp shared the 1993 Nobel Prize in medicine or physiology), controls the composition of proteins encoded by a gene. In mammals, genes—made of DNA stored in the cell nucleus—consist of many short segments known as exons and introns. After the DNA is copied into an RNA transcript, all introns and frequently some exons are excised before the messenger RNA (mRNA) leaves the nucleus, carrying instructions to make a specific protein.

This process allows cells to create a much wider variety of proteins than would be possible if each gene encoded only one protein. Some proteins, including Dscam in fruit flies and neurexin in humans, have thousands of alternate forms. These variant proteins can have vastly different functions, Burge says. For example, the full version of a protein may bind to DNA at one end and activate DNA transcription at the other end. If an alternatively spliced form is missing the activation section, it will compete for binding to the same DNA regions as the full-length protein, preventing activation of transcription.

In 2008, Burge and colleagues analyzed mRNA from 10 different human tissues, publishing their results in Naturaleza, and found that nearly every gene is alternatively spliced. Furthermore, most alternative splicing was found to differ among tissues.

In the new study, the researchers compared tissues from several different mammalian species—the rhesus monkey, rat, mouse and cow—as well as one species of bird, the chicken. For each species, the researchers analyzed nine types of tissue (brain, colon, heart, kidney, liver, lung, muscle, spleen and testes) from three individuals, sequencing more than a trillion bases of mRNA.

Using new high-speed sequencing technology, the researchers analyzed both gene expression and alternative splicing patterns in each tissue sample. They found that gene expression patterns were extremely similar across tissues, no matter what species the tissue came from. That is, the genes active in kidney tissue from rats were nearly identical to those turned on in cows' kidney tissue.

"That was not a big surprise," Burge says. "It's consistent with the idea that the gene expression pattern actually determines the identify of the tissue. You need to express certain structural and motor proteins if you're a muscle cell, and if you're a neuron you have to express certain synaptic proteins."

The results from the alternative splicing pattern comparison were very different. Instead of clustering by tissue, the patterns clustered mostly by species. "Different tissues from the cow look more like the other cow tissues, in terms of splicing, than they do like the corresponding tissue in mouse or rat or rhesus," Burge says.

Because splicing patterns are more specific to each species, it appears that splicing may contribute preferentially to differences between those species, Burge says. "Splicing seems to be more malleable over shorter evolutionary timescales, and may contribute to making species different from one another and helping them adapt in various ways," he says.

The new study is the first large-scale effort to look at the role of alternative splicing in evolution, says Brenton Graveley, a professor of genetics and developmental biology at the University of Connecticut Health Center. "It provides a lot of new insight into the potential role of alternative splicing in driving differences between species," says Graveley, who was not involved in this study.

The researchers also found that a major function of alternative splicing is the addition and deletion of short protein segments that contain one or more phosphorylation sites. Phosphorylation (addition of a phosphate molecule) is a very common way for cells to activate or deactivate proteins.

When a variant form of a protein lacks a key phosphorylation site, it may lose the function of the original form. Phosphorylation can also direct proteins to different locations within the cell, which may alter their function.

Changes in splicing patterns also help to modify the signaling networks that regulate most cellular activity. These networks are often controlled by phosphorylation of proteins involved in the network, many of which can be alternatively spliced. "You can think about it as rewiring signaling networks so they control different outputs. Splicing can add a new output or delete it in a tissue-specific way," Burge says.

The researchers also identified several thousand new alternative exons in each species, and are now studying how these exons evolved and exploring their potential functions.

ABSTRACT
Most mammalian genes produce multiple distinct messenger RNAs through alternative splicing, but the extent of splicing conservation is not clear. To assess tissue-specific transcriptome variation across mammals, we sequenced complementary DNA from nine tissues from four mammals and one bird in biological triplicate, at unprecedented depth. We find that while tissue-specific gene expression programs are largely conserved, alternative splicing is well conserved in only a subset of tissues and is frequently lineage-specific. Thousands of previously unknown, lineage-specific, and conserved alternative exons were identified widely conserved alternative exons had signatures of binding by MBNL, PTB, RBFOX, STAR, and TIA family splicing factors, implicating them as ancestral mammalian splicing regulators. Our data also indicate that alternative splicing often alters protein phosphorylatability, delimiting the scope of kinase signaling.


Ver el vídeo: mRNA Splicing (Agosto 2022).