Información

¿Las transcripciones antisentido tienen nombres diferentes a sus transcripciones de cadenas sensoriales?

¿Las transcripciones antisentido tienen nombres diferentes a sus transcripciones de cadenas sensoriales?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Quiero encontrar qué genes en el genoma humano pueden ser potencialmente complementarios a una transcripción que podría actuar como inhibición de la transcripción antisentido. ¿Los cis-NAT (transcripciones antisentido que ocurren naturalmente) se consideran transcripciones diferentes y se nombran de manera diferente o tienen el mismo nombre que la transcripción sentido?


Si la transcripción antisentido está correctamente anotada y en las bases de datos (un si muy, muy grande), entonces tendrá un nombre diferente. Por ejemplo, la transcripción antisentido de ratón Msx1 tiene el acceso RefSeq NR_027920 mientras que la transcripción con sentido del mismo gen es NM_010835.

En general, cada transcripción que se transcribe de un locus dado tiene una accesión diferente. Lo mismo es cierto para las transcripciones empalmadas alternativamente. Si un gen determinado tiene 4 transcripciones AS, cada una de estas transcripciones tendrá una accesión única y diferente. El gen del receptor de insulina humana, por ejemplo, tiene dos transcripciones que codifican proteínas, cada una con su propia accesión: NM_000208 y NM_001079817.

Quizás le interese un análisis reciente de cis-NAT en 10 especies[1] y también en NATsDB: Base de datos de transcripciones antisentido natural[2].

  1. Osato N, Suzuki Y, Ikeo K, Gojobori T. 2007. Interferencias transcripcionales en cis Transcripciones antisentido naturales de humanos y ratones. Genética, 176 (2): 1299-1306, doi: 10.1534 / genetics.106.069484.
  2. Li JT, Zhang Y, Kong L, Liu QR, Wei L. 2008. Trans-transcritos antisentido naturales que incluyen ARN no codificantes en 10 especies: implicaciones para la regulación de la expresión. Investigación de ácidos nucleicos, 36 (15): 4833-44, doi: 10.1093 / nar / gkn470.

Expresión conservada de transcripciones antisentido naturales en mamíferos

Estudios recientes han encontrado miles de transcripciones antisentido naturales que se originan a partir de los mismos loci genómicos de genes que codifican proteínas, pero de la hebra opuesta. No está claro si la mayoría de las transcripciones antisentido son funcionales o simplemente un ruido transcripcional.

Resultados

Utilizando la matriz Affymetrix Exon con un protocolo de síntesis de ADNc modificado que permite la detección de transcripción antisentido en todo el genoma, realizamos análisis de expresión a gran escala de transcripciones antisentido en nueve tejidos correspondientes de humanos, ratones y ratas. Detectamos miles de transcripciones antisentido, algunas de las cuales muestran una expresión específica de tejido que podría someterse a estudios adicionales para determinar su función potencial en los tejidos / órganos correspondientes. Los patrones de expresión de muchas transcripciones antisentido se conservan en todas las especies, lo que sugiere una presión selectiva sobre estas transcripciones. En comparación con los genes que codifican proteínas, las transcripciones antisentido muestran un menor grado de conservación de la expresión. También encontramos una correlación positiva entre la expresión sentido y antisentido en los tejidos.

Conclusión

Nuestros resultados sugieren que las transcripciones antisentido naturales están sujetas a una presión selectiva pero en menor grado en comparación con las transcripciones sentido en los mamíferos.


Funciones reguladoras de las transcripciones antisentido naturales

Aunque la clasificación y la nomenclatura se encuentran todavía en sus primeras etapas, el número de lncRNA anotados funcionalmente continúa expandiéndose rápidamente. De hecho, ya se han caracterizado ampliamente varias subclases que incluyen NAT [8], ncRNA intergénico grande (lincRNA) [9] y transcripciones no codificantes total y parcialmente intrónicas (TIN y PIN) [10]. Aunque los lincRNA también han cobrado importancia en los últimos años, en particular debido a su asociación con varios tipos de cáncer (tabla 1), una descripción completa de los campos en expansión de estos y otros tipos de lncRNA está más allá del alcance de esta breve revisión. En su lugar, nos centraremos en el potencial terapéutico de los NAT, posiblemente el mejor caracterizado de los lncRNA. Además de la información presentada aquí, animamos al lector a consultar los siguientes excelentes artículos, que describen con más detalle diferentes temas dentro del diverso mundo de lncRNAs [11-14].

Tablas 1

Ejemplos recientes de lncRNA reguladores con funciones potenciales en la enfermedad

Gene Enfermedad Referencia
NATMALAT1Cáncer[61]
ATXN80SAtaxia espinocerebelosa[62]
ASFMR1Síndrome frágil & # x000d7[63]
NAT-RAD18Enfermedad de Alzheimer[42]
ROSA1-ASEnfermedad de Parkinson, diabetes[34]
ANRILCáncer, enfermedad cardiovascular, diabetes[39]
BACE1-ASEnfermedad de Alzheimer[18]
NPPA-ASEnfermedad cardiovascular[35]
HTTASenfermedad de Huntington[33]
p15ASCáncer[41]
LincRNAAIRE CALIENTECáncer[64]
LincRNA-p21Cáncer[65]
LincRNA-EPSAnemia[66]
LSINCT5Cáncer[67]
CUDRCáncer[68]

Los NAT son lncRNA que se transcriben desde la cadena de ADN opuesta a transcripciones con sentido (codificación de proteínas) y se superponen en parte con el ARN con sentido, el promotor con sentido u otras regiones reguladoras [2]. Pueden originarse a partir de ADN codificante o no codificante, incluidas secuencias génicas, intergénicas o intrónicas, y muestran una serie de similitudes con el ARNm, como el taponamiento 5 & # x02032, la poliadenilación 3 & # x02032 y el empalme alternativo [8]. La forma más común de regulación observada para los NAT es el emparejamiento de uno de estos ARN antisentido no codificantes con una transcripción de sentido asociado [2]. Los resultados del proyecto FANTOM3 revelaron al menos 1000 pares de transcripciones sentido-antisentido que estaban bien conservados entre el ratón y el ser humano, así como muchos miles considerados no conservados [15]. En 2010, Faghihi y sus colegas examinaron la eliminación dirigida de 797 NAT conservadas evolutivamente y encontraron evidencia de funciones reguladoras para una serie de pares sentido-antisentido [16]. De hecho, ahora se han identificado NAT para una amplia gama de genes de mamíferos implicados en varios procesos diversos, como el crecimiento y la diferenciación celular, el desarrollo, el metabolismo, la función cardiovascular y la plasticidad sináptica (tablas 1 y & # x200B y2). 2). A pesar de ser procesados ​​de la misma manera que los ARNm, no todos los NAT muestran las mismas características. Por ejemplo, pueden poliadenilarse sobre no poliadenilarse o localizarse dentro del núcleo o el citoplasma. Si bien en general se ha demostrado que son menos abundantes que las transcripciones con sentido [17], el nivel de expresión de una transcripción antisentido determinada también puede variar según el tipo de célula [18, 19]. Utilizando una matriz de ncRNA personalizada, Clark y sus colegas demostraron muy recientemente que las vidas medias de las transcripciones antisentido que actúan en cis pueden oscilar entre tres y diez horas, aunque la mayoría de los examinados se agruparon en aproximadamente cinco a seis horas [20]. La estabilidad de los NAT también parece estar influenciada por su localización celular, y las transcripciones nucleares se muestran más inestables [20].

Tabla 2

Validación funcional de la regulación antisentido natural in vitro.

Sentido Antisentido designado Especies Referencia
Regulación concordanteROSA1ROSA1-ASRatón, humano[34]
BACE1BACE1-ASRatón, humano[18]
iNOSiNOS-ASRata[28]
p53Envolver53Humano[57]
HAS2HAS2-ASHumano[69]
WDR83DHPSHumano[70]
Regulación discordanteMsx-1Msx-1 comoRatón[71]
HIF1-aaHIF1Humano[31]
CrxCrxOSRatón[72]
D5DD5D inversoHumano[73]
Rad18Nat-Rad18Rata[42]
p15p15ASHumano[41]
BOKBOK-ASHumano[74]
NPPANPPA-ASHumano[35]
SLC39A5ANKRD52Humano[16]
CCPG1CCPG1-ASHumano[16]
RAPGEF3RAPGEF3-ASHumano[16]
Empate-1tiene-2Humano[75]
BDNFBDNF-ASRatón, humano[19]
GDNFGDNF-ASHumano[19]
EPHB2EPHB2-ASHumano[19]
Tbca13Tbca16Humano[76]
TspoTspo-NatRatón[77]

Hasta ahora, las funciones reguladoras de varias formas de lncRNA se han demostrado generalmente a través de pantallas moleculares a gran escala, en las que sus actividades se han interrumpido utilizando tecnología de interferencia de ARN. Estos estudios han demostrado que los lncRNA endógenos pueden actuar reprimiendo o promoviendo la expresión de sus genes diana. Se ha visto que esta regulación ocurre o bien cis-, por lo que el lncRNA se origina dentro del mismo locus genético en el que se dirige a la transcripción del sentido, o trans-, por lo que el lncRNA se deriva en una ubicación cromosómica distante del gen sobre el que actúa [16, 21]. Aunque demuestran un alto grado de especificidad de la diana, se cree que la forma en que los NAT regulan sus correspondientes transcripciones de sentido apareado es bastante diversa, e implica varios mecanismos transcripcionales y postranscripcionales sugeridos (para una revisión, ver [8]). Por ejemplo, ahora se ha demostrado que varios de ellos interactúan con las regiones promotoras de su correspondiente hebra sentido en cis-, e influyen en la metilación del ADN, o actúan como andamios para el reclutamiento dirigido de complejos modificadores de histonas que dictan su estado de cromatina [22]. De hecho, la presencia de motivos de unión al ARN en muchas enzimas modificadoras de la cromatina sugiere que algunos NAT que se encuentran en baja abundancia dentro del núcleo pueden actuar localmente para orquestar modificaciones de histonas y, por lo tanto, mediar el silenciamiento génico [23]. Hasta ahora, el ejemplo mejor caracterizado de esto es el reclutamiento del complejo recesivo polycomb silenciador de genes 2 (PRC2), que se sabe que induce la trimetilación del residuo de lisina 27 en la histona H3 (H3K27me3), una marca de cromatina transcripcionalmente silenciosa. . La inmunoprecipitación de ARN (RIP) combinada con la secuenciación direccional de ARN reveló que el complejo PRC2 se asocia con más de 9000 ARN en células madre embrionarias de ratón, y que casi 3000 de estos ARN son NAT. De hecho, el reclutamiento de PRC2 por uno de esos NAT, la transcripción específica de X (inactiva) (Xist), puede conducir a la inactivación de todo el cromosoma X en humanos a través de la heterocromatinización [24], que también puede tener implicaciones importantes para varios X -enfermedades relacionadas [25].

Alternativamente, la complementariedad de secuencia de los NAT que actúan en cis significa que también pueden regular la expresión de sus ARN de sentido apareados mediante la formación de dúplex de ARN, tanto en el núcleo como en el citoplasma. La formación de dúplex de ARN-ARN entre NAT y su transcripción de sentido de pareja en el núcleo puede conducir a un empalme diferencial de ARN o una disponibilidad celular reducida del ARN sentido a través de la retención nuclear [26, 27]. Además, se ha demostrado que la formación de dúplex de ARN en el citoplasma influye en la estabilidad del transcrito sentido a través de alteraciones en la estructura secundaria o enmascarando otros sitios de unión reguladores [18, 28]. También se ha demostrado que los dúplex de ARN dentro del citoplasma inhiben la traducción del ARN sentido entre las etapas de iniciación y elongación [29].

Dado este nivel complejo de regulación, es probable que la expresión de NAT celular alterada también pueda contribuir a una serie de estados patológicos. Esto está respaldado por observaciones de que algunas transcripciones antisentido, como BACE1-AS, HSR y HIF1-AS, pueden verse influenciadas por varios factores estresantes celulares [18, 30-32]. Además, se han identificado NAT para genes implicados en diversas afecciones neurológicas, como la enfermedad de Alzheimer [18], la enfermedad de Huntington [33] y la enfermedad de Parkinson [34], así como trastornos cardiovasculares [35] y metabólicos [34]. Aunque actualmente queda por ver si algunas de estas transcripciones se expresan realmente de manera diferencial en las poblaciones de pacientes, como veremos más adelante, la validación funcional de estos y otros NAT similares puede conducir a la identificación de nuevos objetivos farmacológicos para combatir la progresión de la enfermedad (tabla 1). ).

Si bien se han informado varias mutaciones en varios loci de ncRNA [3, 36, 37], hasta ahora hay pruebas muy limitadas de estudios genéticos humanos que demuestren que las mutaciones o los polimorfismos de un solo nucleótido (SNP) dentro de los genes que codifican NAT pueden afectar su expresión. niveles o dar lugar a fenotipos de enfermedades. Sin embargo, los estudios de asociación de todo el genoma han demostrado que la región intergénica que codifica ANRIL, una gran transcripción antisentido que media la regulación transcripcional de los genes supresores de tumores INK4b / ARF / INK4a en el locus INK4a [38], se asocia con una mayor susceptibilidad al cáncer. , diabetes tipo 2 y enfermedad coronaria [39]. De hecho, los SNP dentro de la región que codifica ANRIL que están vinculados con una mayor susceptibilidad a la aterosclerosis, están asociados con niveles reducidos de expresión de ANRIL en células T & # x02013 de sangre periférica purificada. Por otro lado, se ve que ANRIL se sobreexpresa en las células de cáncer de próstata, lo que induce el silenciamiento de los genes supresores de tumores INK4b / ARF / INK4a, a través del reclutamiento de PRC1 [38]. Otro informe ha demostrado que ANRIL también es necesario para el silenciamiento mediado por PRC2 del gen supresor de tumores P15 / INK4B, y que interrumpir su interacción con el complejo PRC2 puede inhibir la proliferación celular [40]. También se observó un aumento de la expresión de un NAT para otro gen supresor de tumores p15 (p15AS) en pacientes con leucemia, que se correlacionó con una disminución marcada en los niveles de sentido de p15 [41]. Aquí, los investigadores demostraron que la expresión de p15AS indujo la dimetilación de la histona 3 lisina 4 (H3K4) y redujo la dimetilación de la histona 3 lisina 9 (H3K9) en el promotor p15, lo que resultó en un silenciamiento transcripcional persistente. Si bien se desconoce la causa de esta regulación positiva de p15AS, este es un claro ejemplo de cómo un NAT expresado diferencialmente podría funcionar como un marcador molecular potencial para la enfermedad, así como como una nueva diana terapéutica.


Resultados

Predicción de Arabidopsis trans-NAT pares

Identificar trans-NATs en Arabidopsis, primero recopilamos secuencias de todos Arabidopsis genes anotados y transcripciones de ADNc de longitud completa, y las agrupa en grupos de acuerdo con sus ubicaciones genómicas. Aquí, un grupo de transcripciones representaba un grupo de todas las transcripciones derivadas del mismo gen o locus genómico. A todo el genoma transEl cribado -NAT se llevó a cabo mediante la búsqueda de pares de grupos de transcripciones que compartieran la complementariedad de secuencias entre sí utilizando el programa NCBI BLAST. Dos transcripciones fueron consideradas como trans-NAT par si: tienen regiones complementarias de secuencia parcial o perfecta que podrían formar dúplex de ARN-ARN la longitud total de todas las supuestas regiones dúplex de las dos transcripciones es mayor que el 50% de la longitud de la transcripción más corta del par (alto- categoría de cobertura) o la longitud de la región dúplex putativa más larga de las dos transcripciones es superior a 100 nucleótidos (categoría nt 100 nt). Después de eliminar previamente informado cis-NAT y pares formados por transcripciones derivadas de transposones y pseudogenes anotados, un total de 1320 trans-Se identificaron pares NAT dentro del Arabidopsis genoma (archivo de datos adicional 1). Entre ellos, 368 trans-Los pares NAT pertenecían a la categoría de 'alta cobertura', mientras que los 952 pares restantes pertenecían a la clase '100 nt' (Tabla 1). La longitud promedio de la región de emparejamiento de doble hebra de la clase de 'alta cobertura' trans-NAT pares es de 571 nt, con un rango entre 75 y 2.628 nt. Para la clase '100-nt' trans-Pares NAT, la longitud media de emparejamiento es de 258 nt, con un rango entre 100 y 1.621 nt.

Se sabe que las moléculas de ARN asumen varias estructuras tridimensionales para ejecutar sus funciones biológicas o para interactuar con otras moléculas. Para investigar si dos transcripciones de un putativo trans-NAT par de hecho podría formar un dúplex de ARN de doble cadena, utilizamos un programa híbrido [23, 24] para inspeccionar la estructura de fusión de cada trans-NAT par en silico. Los resultados muestran que las dos transcripciones de todas las predicciones trans-Los pares NAT en la categoría de alta cobertura y alrededor del 90% de los pares en la categoría de 100 nt podrían hibridar entre sí y tener regiones dúplex extendidas en sus formas de fusión de energía más baja, al menos en base a la en silico Modelo de hibridación de ARN (ver Materiales y métodos). Algunos transLos pares -NAT incluso tenían una región de emparejamiento bicatenario que se extendía más allá del área predicha según los resultados de BLAST (Figura 1).

Estructura recocida de un trans-Par NAT (At4g19270 :: At1g56530). El programa híbrido predijo la estructura recocida de dos transcripciones. La transcripción At4g19270 se muestra como la hebra superior de 5 'a 3', mientras que la transcripción At1g56530 se muestra como la hebra inferior de 3 'a 5'. La región emparejada obtenida por el resultado de la búsqueda de explosión se muestra en rojo.

Análisis de expresión de trans-NATs

Entre los 1.320 trans-NAT pares, 658 pares se formaron mediante dos grupos de transcripciones, ambos con ADNc de longitud completa coincidentes, 444 pares tenían soporte de ADNc de longitud completa para una transcripción y los 218 pares restantes se identificaron únicamente mediante la comparación de secuencias de genes anotadas (Tabla 1 ).

Para que una molécula de ARN funcione como trans-NAT, tiene que coexistir con su transcrito sentido en la misma célula para formar un dúplex de ARN bicatenario. Para comprobar la posibilidad de coexpresión del putativo trans-NAT pares, usamos el Arabidopsis base de datos pública de MPSS para examinar los perfiles de expresión de las transcripciones en diferentes tejidos o en diferentes condiciones de crecimiento. los Arabidopsis La base de datos pública MPSS contiene etiquetas de secuencia expresadas de 17 nt y 20 nt de largo Arabidopsis transcripciones de 17 tejidos o plantas diferentes cultivadas en diferentes condiciones. En este estudio, primero asignamos todas las etiquetas MPSS de 17 nt y 20 nt al Arabidopsis genoma, y ​​se seleccionaron para un análisis posterior solo aquellas etiquetas que podrían mapearse de forma única para las transcripciones que forman trans-Parejas NAT. Aproximadamente el 16% de trans-NAT se empareja en la categoría de 'alta cobertura' y el 28% de trans-Los pares NAT en la categoría '100 nt' tenían etiquetas MPSS correspondientes para ambas transcripciones, y otro 32% y 45% trans-Los pares NAT en las categorías de 'alta cobertura' y '100 nt', respectivamente, tenían etiquetas MPSS para una transcripción (Tabla 2). Para esos trans-Pares NAT en los que ambas transcripciones tenían datos de MPSS coincidentes, más del 85% se coexpresaron en al menos un tejido (Tabla 2), lo que sugiere que las dos transcripciones de estos trans-Los pares NAT tuvieron la oportunidad de formar dúplex de ARN bicatenario en vivo. Los patrones de expresión de dos trans-Los pares de NAT derivados de los datos de MPSS se muestran en la Tabla 3 como ejemplos. Observamos que, en la mayoría de los casos, las transcripciones de sentido y antisentido de un transEl par -NAT tenía niveles de expresión comparables cuando se expresaba en el mismo tejido. No se observó un sesgo tisular significativo en la expresión de trans-NAT se empareja al comparar datos MPSS de las 17 bibliotecas diferentes.

Para investigar más a fondo el potencial de putativo trans-NAT pares para formar dúplex de ARN bicatenario a nivel de una sola célula, inspeccionamos el patrón de expresión de cada uno trans-NAT par en Arabidopsis células de la raíz que utilizan disponibles públicamente en el lugar datos de hibridación (base de datos AREX) [25]. Dado que la base de datos AREX contiene información solo para anotaciones Arabidopsis genes, solo 658 putativos trans-Pares NAT para los que ambas transcripciones derivadas de genes anotados podrían compararse mediante este análisis. Entre los 355 trans-NAT se empareja con en el lugar datos de hibridación para ambas transcripciones, se encontraron ARNm de ambas transcripciones de 237 pares (67%) en la misma célula con niveles de expresión comparables (Tabla 4), lo que sugiere que las transcripciones sentido y antisentido de estos pares tienen la oportunidad de interactuar entre sí en Arabidopsis células de la raíz. Si las transcripciones sentido y antisentido en la misma célula podrían estar presentes en diferentes compartimentos celulares, espera futuras investigaciones experimentales. Una lista completa de los 355 trans-NAT se empareja con disponible en el lugar Los datos de hibridación se proporcionan en el archivo de datos adicional 2.

Funciones de trans-NAT pares

Usamos el Arabidopsis Asignación de funciones del consorcio Gene Ontology (GO) para analizar las funciones biológicas de trans-NATs y observaron un modesto sesgo de categoría funcional. Las transcripciones de las clases de funciones con actividad catalítica, actividad del transductor de señal y actividad del transportador estaban ligeramente sobrerrepresentadas (Figura 2). Los resultados de la prueba de chi-cuadrado mostraron que la diferencia entre las transcripciones de trans-Los pares de NAT frente a los de todo el genoma tenían un valor de p & lt 0,01 en todas las categorías anteriores, lo que indica que la diferencia era estadísticamente significativa. Un análisis detallado de la función génica utilizando FuncAssociate [26] reveló que las transcripciones de varias familias de genes o grupos funcionales estaban sobrerrepresentadas en transPares -NAT, que incluyen transcripciones de genes de UDP-glicosiltransferasa y transcripciones de genes involucrados en la biosíntesis de la pared celular, ubiquitinación de proteínas y respuestas al estímulo de auxina (Tabla 5). Por el contrario, no se encontró ningún enriquecimiento en ninguna familia de genes específica entre las transcripciones de cis-Parejas NAT (datos no mostrados).

Análisis funcional de trans-NATs usando GO. El porcentaje de Arabidopsis genes anotados y genes implicados en trans-Se muestran los pares de NAT en cada categoría funcional.

Conservación evolutiva de trans-NAT pares

Estudiar la posible conservación filogenética de trans-NATs en plantas superiores, realizamos un en silico buscar trans-NAT pares en chopo y arroz y los comparamos con los de Arabidopsis. Aproximadamente el 60% de Arabidopsis trans-Pares NAT, homólogos de al menos una transcripción involucrada en el par también tienen trans-NAT asociados en álamo o arroz (Cuadro 6). Para la mayoría de estos Arabidopsis trans-NAT pares, solo una transcripción retuvo un trans-Relación NAT en chopo o arroz, pero con nuevos socios. Incluso para la pequeña proporción de Arabidopsis trans-NAT pares en los que se conservaron ambas transcripciones. trans-Relaciones NAT en álamo o arroz, las transcripciones sentido y antisentido de la misma trans-El par NAT tendía a tener nuevos socios de emparejamiento solo uno trans-El par NAT se mantuvo igual en álamo y arroz que en Arabidopsis.

Redes formadas por cis- y trans-NAT pares

diferente a cis-Pares NAT, de los cuales una transcripción de sentido generalmente tiene solo un socio antisentido, las relaciones de uno a muchos se ven comúnmente en trans-NATs. También hubo casos en los que una transcripción formó diferentes dúplex de ARN bicatenario con diferentes transcripciones derivadas del mismo gen como resultado de un empalme alternativo. Entre todos los grupos de transcripciones involucradas en trans-Pares NAT, 425 tanto de la categoría de alta cobertura como de la categoría de 100 nt pueden formar múltiples trans-NAT se empareja con otras transcripciones (Figura 3).

Relación de emparejamiento de grupos de transcripciones en trans-Parejas NAT.

Comparación con lo informado anteriormente Arabidopsis cis-Los datos NAT revelaron que 430 transcripciones en el trans-La lista NAT también tenía cis-NAT [7], lo que indica que las transcripciones antisentido pueden formar redes reguladoras complejas en Arabidopsis. Las proteínas de la familia de la UDP-glucosil transferasa son enzimas importantes que catalizan el transporte de azúcares [27]. los Arabidopsis El genoma contiene aproximadamente 115 genes que codifican proteínas de la familia de UDP-glucosil transferasa. Las transcripciones de 44 genes de UDP-glucosil transferasa tienen uno o más emparejamientos trans-NAT, entre los cuales 5 también tienen supuestos cis-NATs. Otras 13 transcripciones de miembros del gen UDP glucosil transferasa tienen apareamiento cis-NAT solamente. Analizamos pares NAT formados por transcripciones de miembros de la familia de genes UDP-glucosil transferasa en detalle utilizando el software yEd [28] para descubrir posibles redes reguladoras formadas por transcripciones antisentido (Figura 4). Nuestros resultados mostraron que las transcripciones antisentido podrían potencialmente regular las transcripciones de la familia de UDP-glucosil transferasa de varias maneras. Algunas transcripciones podrían formar pares antisentido con transcripciones de miembros de la familia de UDP-glucosil transferasa tanto en un cis- y trans-conducta. El análisis filogenético de las transcripciones de miembros del gen UDP-glucosil transferasa indicó que las transcripciones estrechamente relacionadas (del mismo clado del árbol filogenético) tendían a estar reguladas por el mismo trans-transcripción antisentido (Figura 4, archivo de datos adicional 3). También se observó una red de emparejamiento tan compleja entre las transcripciones de varias otras familias de genes (datos no mostrados).

Redes de cis- y trans-NAT pares formados por transcripciones que codifican proteínas de la familia de UDP-glucosil transferasa en A. thaliana. Las elipses verdes representan las transcripciones de UDP-glucosil transferasa involucradas en trans-Los pares de NAT solo las elipses rojas representan las transcripciones de UDP-glucosil transferasa involucradas en cis-Los pares de NAT solo las elipses amarillas representan los trascriptos de UDP-glucosil transferasa involucrados en ambos cis- y trans-Parejas NAT. Las transcripciones de otras familias de proteínas se muestran como elipses azules. Las líneas dirigidas presentan la relación de apareamiento de dos transcripciones, con flechas que apuntan a las transcripciones de UDP-glucosil transferasa.

Posibles roles de trans-NAT en la inducción del silenciamiento génico

Se ha demostrado que Dicer puede digerir los dúplex de ARN bicatenario para producir pequeños ARN interferentes (revisado en [29]). Ya que trans-Los pares de NAT también tienen regiones de doble hebra extendidas durante mucho tiempo, preguntamos si algunos de ellos, si no todos, podrían regular la expresión de cada uno a través de la vía de interferencia del ARN. Para probar esta hipótesis, primero mapeamos todos los Arabidopsis pequeños ARN del público Arabidopsis Base de datos MPSS a la Arabidopsis genoma [30], y buscó aquellos ARNip que presumiblemente podrían ser generados por trans-Parejas NAT. Pudimos identificar un total de 148 ARNip que supuestamente se derivaron de la región dúplex ARN-ARN de 171 trans-Pares NAT (Tabla 7). Entre ellos, 110 ARNip podrían ser generados por más de una trans-NAT par. Comparación de la densidad de ARNip (número de ARNip emparejado versus longitud de secuencia) entre las regiones de apareamiento y no apareamiento de 171 transLos pares -NAT revelaron que la densidad de ARNip en las regiones dúplex es 1,75 veces mayor que en las regiones de una sola hebra (14 ARNip por 1000 nt frente a 8 ARNip por 1000 nt). SiRNA generados a partir de la región dúplex de un transEl par -NAT podría aparearse con el transcrito antisentido y cebar la síntesis de ARN de doble hebra a través de la ARN polimerasa dependiente de ARN (RDRP), generando así más ARNip de las secuencias 5 'a la región dúplex original. Por esta razón, solo las secuencias desde el extremo 3 'de la región dúplex hasta el extremo 3' del transcrito que no podían producir ARNip generados por RDRP se consideraron en el análisis de densidad de ARNip.

Comparación del perfil de expresión del trans-RNAs específicos de NAT entre los Arabidopsis ARN polimerasa 2 de tipo salvaje y dependiente de ARN (rdr2) mutante con pérdida de función [31] mostró que, de los 148 ARNip, solo 1 se encontró en el rdr2 mutante. Este resultado sugiere que al menos algunos ARNip generados por trans-Las NAT dependen de RDR2.

Debido a que una gran proporción de los 171 ARNip relacionados trans-Los pares NAT se formaron mediante supuestas transcripciones de genes anotados como codificadores de proteínas hipotéticas, preguntamos si algunos de estos genes son elementos transponibles no caracterizados. Para abordar esta cuestión, extrajimos las regiones genómicas correspondientes de los genes implicados en el 171 trans-NAT pares, y utilizó RepeatMasker para examinar la homología de estas secuencias con elementos transponibles conocidos. Los resultados mostraron que 101 transLos pares -NAT tenían al menos una transcripción cuya región genómica correspondiente mostraba una alta homología con los elementos transponibles enumerados en Repbase, lo que indica que estos genes podrían derivar de transposones.

Trans-NATs y empalmes alternativos

Otra función reportada de trans-NAT es alterar el patrón de empalme de sus correspondientes transcripciones de sentido mediante el emparejamiento de bases, enmascarando así ciertos sitios de empalme [10, 11]. Para explorar los roles potenciales de Arabidopsis trans-NAT en la regulación del empalme alternativo, comparamos la proporción de genes con el empalme alternativo en nuestra predicción trans-NAT se empareja con el de todos los genes del Arabidopsis genoma. Un estudio anterior que utilizó ADNc de longitud completa mostró que aproximadamente el 11,59% de Arabidopsis las unidades de transcripción tenían eventos de empalme alternativo [32]. Para el 658 predicho trans-Los pares NAT que tenían genes anotados correspondientes para ambas transcripciones, 127 pares tenían una transcripción con productos génicos empalmados alternativamente conocidos, y otros 3 pares tenían formas empalmadas alternativamente para ambas transcripciones (Tabla 8). Estos datos muestran que Arabidopsis trans-Los pares NAT tienen una proporción mucho mayor de eventos de empalme alternativo (19,76%) en comparación con todas las unidades de transcripción en el genoma (11,59%), lo que sugiere que algunos trans-Las NAT podrían funcionar regulando empalmes alternativos en Arabidopsis. Además, entre estos 130 trans-NAT pares, alrededor del 60% tenían regiones de emparejamiento antisentido superpuestas con exones empalmados alternativamente, lo que sugiere que la unión de transcripciones antisentido al pre-ARNm de sus compañeros de sentido podría causar la exclusión de la región de emparejamiento de los ARNm de sentido maduro resultantes.


(ESTÁN). Una región en una transcripción de ARN con nucleótidos A y U frecuentes, como AUUUA, que apunta al ARN para su degradación.

Endonucleasa de la familia de ARNasa III que procesa ARNdc y pre-miARN en ARNip y miARN, respectivamente.

(ENCyclopedia Of DNA Elements). Un proyecto financiado con fondos públicos que tiene como objetivo encontrar elementos funcionales en el genoma humano.

(miARN). SsRNA pequeño (20-25 nucleótidos) que se cree que regula la expresión de otros genes, ya sea inhibiendo la traducción de proteínas o degradando una transcripción de ARNm diana, mediante un proceso similar al ARNi.

Especie de ARN pequeña (25-35 nucleótidos) que se procesa a partir del ARN ss precursor, independientemente de Dicer, y forma un complejo con la proteína Piwi. Los piRNA probablemente estén implicados en el silenciamiento de transposones y en la función de las células madre.

(Complejo silenciador inducido por ARN). Un complejo de múltiples proteínas que incorpora una hebra de ARNip y lo usa para reconocer el ARNm diana complementario para su degradación.

(Complejo de silenciamiento transcripcional inducido por ARN). Un complejo de múltiples proteínas, por ejemplo, en la levadura de fisión, que incorpora moléculas de ARN cortas, como siARN, y desencadena la regulación a la baja de la transcripción de un gen o región genómica en particular. Esto generalmente se logra mediante la modificación de las colas de histonas, que se dirigen a la región genómica para la formación de heterocromatina.

(ARNip). Molécula de ARN corta (21-23 nucleótidos) que se procesa a partir de un ARNdc largo. Los ARNip son componentes funcionales del RISC y normalmente se dirigen a los ARNm uniendo secuencias perfectamente complementarias en el ARNm y provocando su degradación.

Un grupo de etiquetas de secuencia expresadas o ARNm, generalmente con patrones de corte y empalme alternativos, que comparten un solapamiento exónico de al menos 1 nucleótido y están en la misma orientación cromosómica.


RESULTADOS

Los promotores sujetos a transcripción antisentido muestran niveles aumentados de enzimas remodeladoras de cromatina y chaperonas de histonas.

Para abordar cómo la transcripción antisentido impacta en las características canónicas alrededor del promotor de sentido, definimos todos los genes en función del nivel de naciente transcripción antisentido en una ventana de 300 pb inmediatamente aguas abajo del promotor sentido, excluyendo cualquier gen convergente superpuesto (Figura 1A). Esto nos permitió examinar cómo los promotores de sentido sujetos a altos niveles de transcripción antisentido difieren de aquellos con niveles más bajos.

Dividimos 5183 S. cerevisiae genes en cinco clases según el número de lecturas de NET-seq en la ventana de 300 pb. Esto nos dio una clase de 1024 genes (20%) con altos niveles de transcripción antisentido (≥28 lecturas, mediana 70 lecturas), una clase de 1240 genes (24%) con poca o ninguna transcripción antisentido (0 o 1 lectura), y tres clases intermedias (Figura 1A). Luego evaluamos si los genes de la clase con la transcripción antisentido más alta estaban enriquecidos para factores específicos en comparación con los de la clase más baja, utilizando un análisis extenso en el que se determinaron los niveles de 202 factores promotores en todo el genoma (10). Sorprendentemente, encontramos que los promotores de genes sujetos a altos niveles de transcripción antisentido se enriquecieron significativamente en factores implicados en la modulación del entorno de la cromatina (Tabla 1 Tabla complementaria S1). Para evaluar si estos factores enriquecidos eran una característica única de genes sujetos a transcripción antisentido, o simplemente genes transcritos en general, comparamos el grupo con la transcripción antisentido más alta (mediana de 70 lecturas antisentido, 578 lecturas con sentido, norte = 1024) con otro grupo que no tenía o tenía niveles bajos de transcripción antisentido (0 o 1 lectura) pero niveles más altos de transcripción sentido (mediana 948 lecturas, norte = 1240) dentro de la misma ventana de 300 pb (Tabla complementaria S2). Los componentes de los complejos de remodelación ISW1, ISW2 e INO80 y la histona chaperona FACT (28) se enriquecieron específicamente en los promotores de sentido de genes sujetos a una alta transcripción antisentido en comparación con los promotores de genes con altos niveles de transcripción de sentido (Tabla 1). Por tanto, es probable que la transcripción antisentido esté asociada con enzimas remodeladoras de cromatina específicas y cambios en la estructura de la cromatina promotora.

Los genes transcritos antisentido están enriquecidos para distintas proteínas relacionadas con la transcripción unidas al promotor

Factor enriquecido. Complejo. Función. PAG-valor a.
Isw1 Isw1a, Isw1b Enzima remodeladora de cromatina 4.2 × 10 −9
Ino80 INO80 Enzima remodeladora de cromatina 4.9 × 10 −9
Pob3 HECHO Chaperona de histona 2.5 × 10 −7
Rsc9 RSC1, RSC2, RSCa Enzima remodeladora de cromatina 3.2 × 10 −7
Swi3 SWI-SNF Enzima remodeladora de cromatina 4.9 × 10 −7
Rpd3 RPD3 Histona chaperona y lisina desacetilasa 2.9 × 10 −6
Rpb7 Pol II Reclutamiento de factores de procesamiento del extremo 3 ' 3.8 × 10 −6
Itc1 Isw2 Componente del complejo remodelador de cromatina 1.2 × 10 −5
Spt3 SAGA, SLIK Subunidad de acción negativa de los complejos reguladores transcripcionales SAGA y similares a SAGA 1.9 × 10 −5
Ctk1 CTK Fosforilación de CTD, regula el procesamiento del extremo 3 'del ARNm 2.1 × 10 −5
Spn1 (Iws1) Interactor SPT6 Interactúa con RNAP II, TBP y factores de remodelación de cromatina. 2.2 × 10 −5
Spt6 SPT6 Chaperona de histona 2.9 × 10 −5
Rpo21 Pol II Subunidad Pol II más grande 3.8 ×10 −5
Htb2 nucleosoma Histona del núcleo 6.7 × 10 −5
Rpb2 Pol II Segunda subunidad Pol II más grande 8.8 × 10 −5
Factor enriquecido. Complejo. Función. PAG-valor a.
Isw1 Isw1a, Isw1b Enzima remodeladora de cromatina 4.2 × 10 −9
Ino80 INO80 Enzima remodeladora de cromatina 4.9 × 10 −9
Pob3 HECHO Chaperona de histona 2.5 × 10 −7
Rsc9 RSC1, RSC2, RSCa Enzima remodeladora de cromatina 3.2 × 10 −7
Swi3 SWI-SNF Enzima remodeladora de cromatina 4.9 × 10 −7
Rpd3 RPD3 Histona chaperona y lisina desacetilasa 2.9 × 10 −6
Rpb7 Pol II Reclutamiento de factores de procesamiento del extremo 3 ' 3.8 × 10 −6
Itc1 Isw2 Componente del complejo remodelador de cromatina 1.2 × 10 −5
Spt3 SAGA, SLIK Subunidad de acción negativa de los complejos reguladores transcripcionales SAGA y similares a SAGA 1.9 × 10 −5
Ctk1 CTK Fosforilación de CTD, regula el procesamiento del extremo 3 'del ARNm 2.1 × 10 −5
Spn1 (Iws1) Interactor SPT6 Interactúa con RNAP II, TBP y factores de remodelación de cromatina. 2.2 × 10 −5
Spt6 SPT6 Chaperona de histona 2.9 × 10 −5
Rpo21 Pol II Subunidad Pol II más grande 3.8 ×10 −5
Htb2 nucleosoma Histona del núcleo 6.7 × 10 −5
Rpb2 Pol II Segunda subunidad Pol II más grande 8.8 × 10 −5

a Los factores se clasifican en orden de PAG-valores determinados utilizando la prueba de suma de rangos de Wilcoxon, y se consideraron enriquecidos si sus niveles eran más altos en aquellos genes con alto antisentido en comparación con bajo antisentido y si tenían un PAG-valor inferior a 0,0001. Los factores en azul se enriquecieron significativamente en genes con transcripción antisentido en comparación con aquellos con transcripción sentido pero sin transcripción antisentido (ver Tabla complementaria S2).

Factor enriquecido. Complejo. Función. PAG-valor a.
Isw1 Isw1a, Isw1b Enzima remodeladora de cromatina 4.2 × 10 −9
Ino80 INO80 Enzima remodeladora de cromatina 4.9 × 10 −9
Pob3 HECHO Chaperona de histona 2.5 × 10 −7
Rsc9 RSC1, RSC2, RSCa Enzima remodeladora de cromatina 3.2 × 10 −7
Swi3 SWI-SNF Enzima remodeladora de cromatina 4.9 × 10 −7
Rpd3 RPD3 Histona chaperona y lisina desacetilasa 2.9 × 10 −6
Rpb7 Pol II Reclutamiento de factores de procesamiento del extremo 3 ' 3.8 × 10 −6
Itc1 Isw2 Componente del complejo remodelador de cromatina 1.2 × 10 −5
Spt3 SAGA, SLIK Subunidad de acción negativa de los complejos reguladores transcripcionales SAGA y similares a SAGA 1.9 × 10 −5
Ctk1 CTK Fosforilación de CTD, regula el procesamiento del extremo 3 'del ARNm 2.1 × 10 −5
Spn1 (Iws1) Interactor SPT6 Interactúa con RNAP II, TBP y factores de remodelación de cromatina. 2.2 × 10 −5
Spt6 SPT6 Chaperona de histona 2.9 × 10 −5
Rpo21 Pol II Subunidad Pol II más grande 3.8 ×10 −5
Htb2 nucleosoma Histona central 6.7 × 10 −5
Rpb2 Pol II Segunda subunidad Pol II más grande 8.8 × 10 −5
Factor enriquecido. Complejo. Función. PAG-valor a.
Isw1 Isw1a, Isw1b Enzima remodeladora de cromatina 4.2 × 10 −9
Ino80 INO80 Enzima remodeladora de cromatina 4.9 × 10 −9
Pob3 HECHO Chaperona de histona 2.5 × 10 −7
Rsc9 RSC1, RSC2, RSCa Enzima remodeladora de cromatina 3.2 × 10 −7
Swi3 SWI-SNF Enzima remodeladora de cromatina 4.9 × 10 −7
Rpd3 RPD3 Histona chaperona y lisina desacetilasa 2.9 × 10 −6
Rpb7 Pol II Reclutamiento de factores de procesamiento del extremo 3 ' 3.8 × 10 −6
Itc1 Isw2 Componente del complejo remodelador de cromatina 1.2 × 10 −5
Spt3 SAGA, SLIK Subunidad de acción negativa de los complejos reguladores transcripcionales SAGA y similares a SAGA 1.9 × 10 −5
Ctk1 CTK Fosforilación de CTD, regula el procesamiento del extremo 3 'del ARNm 2.1 × 10 −5
Spn1 (Iws1) Interactor SPT6 Interactúa con RNAP II, TBP y factores de remodelación de cromatina. 2.2 × 10 −5
Spt6 SPT6 Chaperona de histona 2.9 × 10 −5
Rpo21 Pol II Subunidad Pol II más grande 3.8 ×10 −5
Htb2 nucleosoma Histona central 6.7 × 10 −5
Rpb2 Pol II Segunda subunidad Pol II más grande 8.8 × 10 −5

a Los factores se clasifican en orden de PAG-valores determinados utilizando la prueba de suma de rangos de Wilcoxon, y se consideraron enriquecidos si sus niveles eran más altos en aquellos genes con alto antisentido en comparación con bajo antisentido y si tenían un PAG-valor inferior a 0,0001. Los factores en azul se enriquecieron significativamente en genes con transcripción antisentido en comparación con aquellos con transcripción sentido pero sin transcripción antisentido (ver Tabla complementaria S2).

La transcripción antisentido se asocia con un cambio en la arquitectura de la cromatina en el promotor de sentido

Preguntamos cómo los genes podrían diferir en el posicionamiento, la dinámica y la ocupación de sus nucleosomas unidos al promotor. Utilizando un mapa de ocupación de nucleosomas de todo el genoma (29), encontramos que los genes sujetos a altos niveles de transcripción antisentido mostraban una ocupación de nucleosomas elevada a través de sus promotores (pag = 2,3 × 10 −27 Figura 1B). El NDR entre los nucleosomas -1 y +1 también fue más corto en genes con transcripción antisentido alta (Figura 1B una longitud mediana de 75 pb frente a 114 pb para las clases más alta y más baja, respectivamente, pag = 1 × 10 −16). El aumento en la ocupación de nucleosomas se produjo de forma escalonada entre las cinco clases de genes, lo que sugiere que la transcripción antisentido puede ejercer cambios en la cromatina incluso a niveles bajos y en aproximadamente el 75% de los genes. Críticamente, encontramos que solo hay una correlación muy débil entre la transcripción sentido y antisentido dentro de la ventana de 300 pb (Figura 1C, coeficiente de correlación de Spearman = -0.07). Además, los cambios en la transcripción sentido no se correlacionaron inversamente con los cambios en la transcripción antisentido en todo el genoma usando experimentos NET-seq llevados a cabo en células cambiadas de un medio que contiene glucosa a un medio que contiene galactosa, a pesar de haber un cambio de & gt3 veces en la transcripción sentido. para 1078 genes (20% del genoma) (8) (Figura 1D, rs = +0,06). Por lo tanto, es probable que el aumento en la ocupación de nucleosomas asociado con el aumento de la transcripción antisentido sea independiente de la transcripción de los sentidos.

La transcripción sentido y antisentido se asocia con distintos patrones de ocupación de nucleosomas en el promotor sentido

A continuación, evaluamos cómo la transcripción sentido naciente en la misma ventana de 300 pb influye en la ocupación del nucleosoma y el tamaño de NDR en el promotor sentido en presencia de niveles variables de transcripción antisentido (Figura 2A-D). Primero, preguntamos cómo los niveles de transcripción sentido o antisentido en la ventana de 300 pb se correlacionaban con la ocupación de nucleosomas en diferentes posiciones en relación con el TSS (Figura 2A). Encontramos que la transcripción sentido se correlacionó negativamente con la ocupación del nucleosoma inmediatamente aguas arriba del TSS, y se correlacionó positivamente inmediatamente aguas abajo, en la región correspondiente al nucleosoma +1, apoyando un modelo en el que la transcripción sentido posiciona el nucleosoma +1 (30). En contraste, la transcripción antisentido se correlacionó positivamente con la ocupación del nucleosoma sobre el promotor, directamente corriente arriba del TSS, y en el primer kb de la región transcrita. Los genes con transcripción sentido pero sin transcripción antisentido tendían a una estructura de cromatina promotora abierta, con baja ocupación de nucleosomas y un NDR grande (126 pb), mientras que los genes con alta transcripción antisentido y transcripción de sentido bajo tenían una estructura de cromatina promotora cerrada con alta ocupación de nucleosomas a través de el promotor y un pequeño NDR (39 pb) (Figura 2B y C). Confirmamos que el aumento de la ocupación de nucleosomas asociada con la transcripción antisentido es independiente de la transcripción de sentido comparando genes con niveles similares de transcripción de sentido pero diferentes niveles de transcripción de antisentido, y encontramos que la ocupación de nucleosomas aún difiere notablemente (Figura 2B y C). Esto sugiere tres arquitecturas de cromatina promotoras distintas, definidas por genes enriquecidos principalmente para la transcripción sentido (panel izquierdo de la Figura 2D), principalmente para la transcripción antisentido (panel central), o genes con niveles variables de transcripción tanto sentido como antisentido (panel derecho). Estas arquitecturas recuerdan mucho a las distintas clases de configuraciones de cromatina promotoras específicas de la condición asociadas con diferentes grados de ruido de expresión génica (26). Por tanto, la transcripción sentido y antisentido se asocia con distintas propiedades de la organización de la cromatina que rodea al TSS sentido. Aunque la transcripción sentido y antisentido están inversamente asociados con la ocupación del nucleosoma, la correlación muy débil entre la transcripción sentido y antisentido en todo el genoma sugiere que son procesos en gran medida independientes, donde uno no regula los niveles del otro.

(A) Correlación entre la ocupación de nucleosomas y los dos tipos de transcripción. Se muestra el coeficiente de correlación de Spearman calculado para la transcripción sentido (rojo) y, por separado, la transcripción antisentido (azul) en la ventana de 300 pb con ocupación de nucleosomas en diferentes posiciones alrededor del TSS. Los rectángulos grises representan las posiciones aproximadas de los nucleosomas -1 (izquierda) y +1 (derecha). (B) Número medio de lecturas con sentido y antisentido en los grupos de genes que se muestran en el panel (C), junto con su tamaño medio de NDR. (C) Ocupación promedio de nucleosomas en genes con números medios variables de lecturas con sentido y antisentido en la misma ventana, con colores que se refieren a los grupos de genes descritos en el panel (B). (D) Se puede considerar que los promotores pertenecen a una de tres clases diferentes bajo un conjunto dado de condiciones, cada una con características de cromatina distintas. Los triángulos representan factores de transcripción, enzimas remodeladoras de cromatina ovaladas. Consulte las Figuras complementarias S1 y S2.

(A) Correlación entre la ocupación de nucleosomas y los dos tipos de transcripción. Se muestra el coeficiente de correlación de Spearman calculado para la transcripción sentido (rojo) y, por separado, la transcripción antisentido (azul) en la ventana de 300 pb con ocupación de nucleosomas en diferentes posiciones alrededor del TSS. Los rectángulos grises representan las posiciones aproximadas de los nucleosomas -1 (izquierda) y +1 (derecha). (B) Número medio de lecturas con sentido y antisentido en los grupos de genes que se muestran en el panel (C), junto con su tamaño medio de NDR. (C) Ocupación promedio de nucleosomas en genes con números medios variables de lecturas con sentido y antisentido en la misma ventana, con colores que se refieren a los grupos de genes descritos en el panel (B). (D) Se puede considerar que los promotores pertenecen a una de tres clases diferentes bajo un conjunto dado de condiciones, cada una con características de cromatina distintas. Los triángulos representan factores de transcripción, enzimas remodeladoras de cromatina ovaladas. Consulte las Figuras complementarias S1 y S2.

La transcripción de sentido naciente y antisentido están asociados con distintos patrones de modificación de histonas

Examinamos los patrones de modificaciones de histonas en genes con diferentes niveles de transcripción antisentido en la ventana de 300 pb, e identificamos numerosas modificaciones que mostraban diferencias sustanciales en genes sujetos a transcripción antisentido alta en comparación con aquellos con niveles bajos (Figura 3A). Estas modificaciones podrían clasificarse ampliamente en tres grupos: las que estaban más altas en el cuerpo del gen con una transcripción antisentido alta, las que eran más bajas y las que estaban distribuidas de manera más uniforme. También evaluamos cómo las correlaciones entre las modificaciones de cromatina y la transcripción antisentido en comparación con las correlaciones entre las modificaciones y la transcripción de sentido (Figura 3B y C). Las asociaciones de todo el genoma permanecieron iguales cuando la clase de genes con la transcripción antisentido más alta se dividió en tres subgrupos (Figura complementaria S1) o cuando los genes regulados que contienen cajas TATA (25) se excluyeron del análisis (Figura complementaria S2), lo que indica un continuo de los efectos sobre todos los tipos de genes, asociados con el nivel de transcripción antisentido. Aunque este análisis se basa en la transcripción sentido y antisentido en la ventana de 300 pb, mostramos que la falta de correlación entre la transcripción sentido y antisentido se extiende bien en el cuerpo del gen (Figura 3D). La pequeña correlación negativa hacia la región 3 'sugiere que el inicio de la transcripción antisentido podría conducir a la terminación prematura de la transcripción sentido, afectando así los niveles de transcripción en estado estacionario.

La transcripción sentido y antisentido tiene asociaciones distintas con una variedad de modificaciones de histonas. (A) Los niveles promedio de siete modificaciones de histonas diferentes alrededor del TSS (0) en las cinco clases de genes descritas en la Figura 1A, sujeto a transcripción antisentido variable. (B) El coeficiente de correlación entre los niveles de siete modificaciones de histonas diferentes en ventanas de 10 pb alrededor del TSS (0) y, por separado, el número de lecturas de NET-seq sentido y antisentido en la ventana de 300 pb descrita en la Figura 1A. (C) Los niveles promedio de siete modificaciones de histonas diferentes alrededor del TSS (0) en las cinco clases de genes descritas en la Figura 1A, sujetas a transcripción antisentido alta (azul) y transcripción de sentido alto (rojo) en la ventana de 300 pb. (D) Coeficiente de correlación de Spearman entre la transcripción sentido y antisentido a través de genes. (mi) Los niveles medios de TBP, TFIIB, H2A.Z y RNAPII de transcripción de sentido. TBP y TFIIB no se propagan al cuerpo del gen con una transcripción antisentido creciente como lo hace H2A.Z. (F) Coeficiente de correlación entre el nivel de RNAPII CTD Ser2ph y la transcripción sentido y antisentido. Donde se muestra, PAG-Los valores se determinaron utilizando la prueba de suma de rangos de Wilcoxon, comparando los genes en la clase más alta con la clase más baja cerca del TSS. Consulte la figura complementaria S3.

La transcripción sentido y antisentido tiene asociaciones distintas con una variedad de modificaciones de histonas. (A) Los niveles promedio de siete modificaciones de histonas diferentes alrededor del TSS (0) en las cinco clases de genes descritas en la Figura 1A, sujeto a transcripción antisentido variable. (B) El coeficiente de correlación entre los niveles de siete modificaciones de histonas diferentes en ventanas de 10 pb alrededor del TSS (0) y, por separado, el número de lecturas de NET-seq sentido y antisentido en la ventana de 300 pb descrita en la Figura 1A. (C) Los niveles promedio de siete modificaciones de histonas diferentes alrededor del TSS (0) en las cinco clases de genes descritas en la Figura 1A, sujetas a transcripción antisentido alta (azul) y transcripción de sentido alto (rojo) en la ventana de 300 pb. (D) Coeficiente de correlación de Spearman entre la transcripción sentido y antisentido a través de genes. (mi) Los niveles medios de TBP, TFIIB, H2A.Z y RNAPII de transcripción de sentido. TBP y TFIIB no se propagan al cuerpo del gen con una transcripción antisentido creciente como lo hace H2A.Z. (F) Coeficiente de correlación entre el nivel de RNAPII CTD Ser2ph y la transcripción sentido y antisentido. Donde se muestra, PAG-Los valores se determinaron usando la prueba de suma de rangos de Wilcoxon, comparando los genes en la clase más alta con la clase más baja cerca del TSS. Consulte la figura complementaria S3.

La acetilación en la histona H3 se elevó en genes sujetos a transcripción antisentido alta (Figura 3A-C Figura complementaria S3A-C). Aunque la acetilación de H3 también fue mayor en genes con transcripción en sentido alto, estas diferencias se produjeron principalmente en el promotor, mientras que los cambios asociados a la transcripción antisentido se produjeron tanto en el promotor como en todo el cuerpo del gen.

Los niveles de H3K4me3 disminuyeron significativamente en el promotor y en la región transcrita temprana de genes sujetos a transcripción antisentido (Figura 3A-C), pero aumentaron más hacia abajo, lo que sugiere que la marca se redistribuye por transcripción antisentido (31) (Figura complementaria S3D). Los niveles de la variante de histona Htz1 (H2A.Z) mostraron una redistribución similar desde el promotor al cuerpo de genes sujetos a una alta transcripción antisentido (Figura 3E), es decir, se distribuyeron de manera más uniforme. Sin embargo, TFIIB y TBP permanecen asociados en el promotor, lo que demuestra que la redistribución que observamos no es el resultado de promotores crípticos en la región transcrita (Figura 3E).

H2BK123ub, H3K36me3 y H3K79me3 son más bajos en genes sujetos a alta transcripción antisentido en todo el genoma, principalmente en todo el cuerpo del gen (Figura 3A-C Figura complementaria S3E y F). Esto es contrario a lo que cabría esperar de genes que poseen dos unidades de transcripción convergentes superpuestas, dado que H3K36me3 se encuentra principalmente en el extremo 3 'de los genes (16, 19), lo que implica que la transcripción antisentido puede ser inherentemente diferente de la transcripción sentido. De hecho, observamos poca correlación entre la transcripción antisentido y la fosforilación de serina 2 de RNAPII CTD (32) (Figura 3F), requerida para la deposición de H3K36me3 por Set2, lo que sugiere que los complejos de RNAPII de transcripción antisentido y sentido pueden diferir. Curiosamente, H2BK123ub, H3K36me3 y H3K79me3 están asociados con la estabilización de las estructuras de los nucleosomas (16, 20-21, 33-34). Además, a pesar de que H3K36me3 no muestra una relación causal con el recambio de histonas (13), las modificaciones de las histonas más fuertemente asociadas con la transcripción antisentido también fueron las más fuertemente correlacionadas con el recambio de histonas H3 en todo el genoma, a saber, H3K79me3 y H3K36me3 (correlacionados negativamente con ambos) y H3K4ac. , H3K56ac y H3K79me2 (correlacionados positivamente con ambos) (Figura 4A), lo que nos lleva a preguntarnos si la transcripción antisentido se correlaciona con el recambio de histonas.

La transcripción antisentido se asocia con un aumento del recambio de histonas. (A) Los coeficientes de correlación de Spearman obtenidos al correlacionar el recambio de histonas o la transcripción antisentido en todo el genoma con los niveles de trece modificaciones de histonas diferentes dentro de las mismas regiones con sonda. (B y C) Diagramas de caja que muestran las distribuciones de las tasas de renovación de histonas en los nucleosomas -1 a +4 de genes con (B) niveles variables de transcripción antisentido, coloreados como en la Figura 1A, con las tres clases intermedias combinadas en un solo grupo, o (C) transcripción de sentido en la ventana de 300 pb. Los niveles medios de transcripción sentido y antisentido en cada grupo se dan en rojo y azul respectivamente. La parte superior e inferior del cuadro gris indican el valor medio de todas las sondas que se superponen a un nucleosoma -1 o un recambio de histonas en todo el genoma, respectivamente. (D) Datos de renovación de histonas para regiones seleccionadas en células detenidas G1 de (12) y datos de NET-seq (8) que muestran la transcripción específica de cadena para TUB2 (B) y HMS2 (C). El verde representa regiones con bajo recambio de histonas y el rojo indica regiones con alto recambio de histonas. TUB2 y HMS2 están sujetos a niveles similares de transcripción sentido pero muestran niveles muy diferentes de transcripción antisentido. Consulte la figura complementaria S4.

La transcripción antisentido se asocia con un aumento del recambio de histonas. (A) Los coeficientes de correlación de Spearman obtenidos al correlacionar el recambio de histonas o la transcripción antisentido en todo el genoma con los niveles de trece modificaciones de histonas diferentes dentro de las mismas regiones con sonda. (B y C) Diagramas de caja que muestran las distribuciones de las tasas de renovación de histonas en los nucleosomas -1 a +4 de genes con (B) niveles variables de transcripción antisentido, coloreados como en la Figura 1A, con las tres clases intermedias combinadas en un solo grupo, o (C) transcripción de sentido en la ventana de 300 pb. Los niveles medios de transcripción sentido y antisentido en cada grupo se dan en rojo y azul respectivamente. La parte superior e inferior del cuadro gris indican el valor medio de todas las sondas que se superponen a un nucleosoma -1 o un recambio de histonas en todo el genoma, respectivamente. (D) Datos de renovación de histonas para regiones seleccionadas en células detenidas G1 de (12) y datos de NET-seq (8) que muestran la transcripción específica de cadena para TUB2 (B) y HMS2 (C). El verde representa regiones con bajo recambio de histonas y el rojo indica regiones con alto recambio de histonas. TUB2 y HMS2 están sujetos a niveles similares de transcripción sentido pero muestran niveles muy diferentes de transcripción antisentido. Consulte la figura complementaria S4.

Los promotores y los cuerpos de genes sujetos a transcripción antisentido exhiben mayores tasas de renovación de histonas

Para evaluar las tasas de renovación de histonas, utilizamos un mapa de todo el genoma en el que se midió la tasa de desplazamiento de H3 etiquetada con Myc por H3 etiquetada con Flag después de la inducción de la expresión de Flag-H3 (12). El recambio de histonas fue significativamente mayor entre los nucleosomas -1 y +4 de genes con transcripción antisentido alta en la ventana de 300 pb en comparación con aquellos con transcripción antisentido baja o nula en la ventana de 300 pb (Figura 4B pag = 9,6 × 10 −7, 1,7 × 10 −22, 1,9 × 10 −24, 5,4 × 10 −21 y 4,9 × 10 −25 respectivamente). Estas tendencias se mantuvieron cuando la metiltransferasa H3K36 SET2 se eliminó (16) (Figura complementaria S4), lo que coincide con la ausencia de un papel causal importante para la metilación de H3K36 en la asociación entre la transcripción antisentido y el recambio de histonas.

Para confirmar que el aumento de la renovación de histonas es una característica de la transcripción antisentido, y no la transcripción de manera más general, evaluamos cómo difería la renovación de histonas para genes con diferentes niveles de transcripción de sentido (Figura 4C). A pesar de los grandes cambios en la transcripción de sentido entre los grupos, el recambio de histonas no varió sustancialmente en el promotor, aunque las tasas de recambio fueron altas. Esta falta de asociación entre los niveles de transcripción de sentido y el recambio de histonas en el promotor concuerda con hallazgos previos (12). La transcripción sensorial, sin embargo, mostró la relación esperada en los nucleosomas +3 y +4, con una mayor rotación asociada con niveles más altos de transcripción.

La dramática influencia de la transcripción antisentido en el recambio de histonas se puede ver en HMS2 y TUB2, genes con niveles similares de transcripción sentido pero muy diferente transcripción antisentido (Figura 4D). Tomados en conjunto, nuestros resultados sugieren que aunque el recambio de histonas es una característica del promotor eucariota canónico, no se correlaciona con el nivel de transcripción sentido, sino más bien con el nivel de transcripción antisentido. Este aumento del recambio podría ser una consecuencia del aumento de los niveles de histonas chaperonas y / o enzimas remodeladoras de la cromatina, que también se ha demostrado que dirigen el recambio (35, 36).

Disminución de la transcripción antisentido GAL1 aumenta los niveles de acetilación de H3 y H3 pero reduce los niveles de H3K36me3

Presumimos que la transcripción antisentido podría ser en sí misma responsable de cambiar los niveles de histonas y las modificaciones en el promotor del sentido y en todo el cuerpo del gen, y buscamos validar esto experimentalmente en el GAL1 gene. Tanto en glucosa como en galactosa, GAL1 tiene sentido y antisentidoCUT445) transcripciones, aunque en glucosa la transcripción de sentido (SUT013) proviene de un promotor en GAL10 (22) (Figura 5 y Figura complementaria S5). Anteriormente, mostramos que al insertar la secuencia del terminador de ADH1 (ADH1T) en el ORF de GAL1 resultó en un redefinición de la unidad de transcripción el GAL1 transcripciones sensorialesGAL1 y SUT013) terminado en ADH1T mientras que la transcripción antisentido se inició a partir de ella (9) (Figura 5A y B). El acortamiento de las transcripciones antisentido durante la inducción de galactosa resulta de la producción de distintas isoformas de transcripción (Figura 5B) (8, 37). El mapeo de estas transcripciones en glucosa reveló que un sitio final de la transcripción antisentido principal estaba 128 pb corriente arriba del TSS sentido, bien en el GAL1–10 promotor, lo que sugiere que podría modular la estructura del promotor sentido (Figura 5C). El mapeo de las transcripciones nacientes usando NET-seq confirmó la presencia de transcripción antisentido que se extiende por todo el GAL1–10 promotor al inicio de la inducción (60 min en galactosa) y cuando la transcripción sentido es altamente inducida (180 min en galactosa) (Figura 5D).

Transcripción antisentido que varía experimentalmente en GAL1 altera las modificaciones de la cromatina (A) Esquemas que muestran las transcripciones en el locus GAL nativo en medio de glucosa (arriba) o después de la inserción del ADH1 terminador (T) +757 pb en GAL1 en glucosa (medio) o galactosa (abajo). (B) Sonda de transferencia Northern para GAL1 transcripciones de sentido y antisentido durante un curso de tiempo de inducción (tiempos en min). El ARNr en el gel teñido con bromuro de etidio se muestra como control de carga. El control es GAL1: ADH1T y el mutante TATA tiene 4 pb de una secuencia similar a TATA codificada (ver panel C). Transcripción antisentido al GAL1 El promotor del inserto puede romperse por la mutación de una secuencia similar a TATA dentro ADH1T. (C) GAL1: ADH1 mapeo de ARN sentido / antisentido por RL-PCR (con decaptación y desfosforilación) en la región 3 'de la construcción con ADH1T insertado en GAL1. También se muestra la posición de la secuencia similar a TATA, así como su secuencia después de la mutación (cambios marcados en rojo). Se confirmaron 3 "sitios finales mediante 3" RACE. Secuencia de imprimaciones disponibles bajo pedido. (D) NET-seq que muestran transcripciones nacientes en la cadena de ADN Watson (W) y Crick (C) en un GAL1: ADH1T colar después de 60 o 180 min en medio de galactosa. (mi y F) Experimentos con chip que muestran los niveles de histona H3 o varias modificaciones de histonas en GAL1 en el GAL1-ADH1T cepa, con y sin mutación de la secuencia similar a TATA. La cromatina se preparó a partir de cepas cultivadas en glucosa como se describió anteriormente (27). (E) En la cepa con la secuencia de tipo TATA intacta, se observa un pico de H3K4me3 que corresponde aproximadamente al sitio desde el que se inicia la transcripción antisentido. Después de la mutación de la secuencia similar a TATA, este pico se pierde, de acuerdo con la anulación observada de la transcripción antisentido, norte = 2, las barras de error son SEM. (F) Niveles de H3, acetilación de lisina de histona para H3K9, K14, K18 y K23 y trimetilación de lisina de histona H3 para K36 normalizados a niveles de H3.

Transcripción antisentido que varía experimentalmente en GAL1 altera las modificaciones de la cromatina (A) Esquemas que muestran las transcripciones en el locus GAL nativo en medio de glucosa (arriba) o después de la inserción del ADH1 terminador (T) +757 pb en GAL1 en glucosa (medio) o galactosa (abajo). (B) Sonda de transferencia Northern para GAL1 transcripciones de sentido y antisentido durante un curso de tiempo de inducción (tiempos en min). El ARNr en el gel teñido con bromuro de etidio se muestra como control de carga. El control es GAL1: ADH1T y el mutante TATA tiene 4 pb de una secuencia similar a TATA codificada (ver panel C). Transcripción antisentido al GAL1 El promotor del inserto puede romperse por la mutación de una secuencia similar a TATA dentro ADH1T. (C) GAL1: ADH1 mapeo de ARN sentido / antisentido por RL-PCR (con decaptación y desfosforilación) en la región 3 'de la construcción con ADH1T insertado en GAL1. También se muestra la posición de la secuencia similar a TATA, así como su secuencia después de la mutación (cambios marcados en rojo). Se confirmaron 3 "sitios finales mediante 3" RACE. Secuencia de imprimaciones disponibles bajo pedido. (D) NET-seq que muestran transcripciones nacientes en la cadena de ADN Watson (W) y Crick (C) en un GAL1: ADH1T colar después de 60 o 180 min en medio de galactosa. (mi y F) Experimentos con chip que muestran los niveles de histona H3 o varias modificaciones de histonas en GAL1 en el GAL1-ADH1T cepa, con y sin mutación de la secuencia similar a TATA. La cromatina se preparó a partir de cepas cultivadas en glucosa como se describió anteriormente (27). (E) En la cepa con la secuencia de tipo TATA intacta, se observa un pico de H3K4me3 que corresponde aproximadamente al sitio desde el que se inicia la transcripción antisentido. Después de la mutación de la secuencia similar a TATA, este pico se pierde, de acuerdo con la anulación observada de la transcripción antisentido, norte = 2, las barras de error son SEM. (F) Niveles de H3, acetilación de lisina de histona para H3K9, K14, K18 y K23 y trimetilación de lisina de histona H3 para K36 normalizados a niveles de H3.

Identificamos una secuencia dentro ADH1T parecido a una caja TATA (TATAAAAA) (Figura 5C), y planteó la hipótesis de que podría ser necesario para el inicio de la transcripción antisentido. Sorprendentemente, aunque aguas abajo del TSS antisentido, la mutación de la caja TATA (AAATAAAT) redujo los niveles de la transcripción antisentido mientras que los niveles de la transcripción sentido no se vieron afectados (Figura 5B), de acuerdo con la falta de correlación entre la transcripción sentido y antisentido (Figura 1C ). Usamos inmunoprecipitación de cromatina (ChIP) para mostrar niveles reducidos de H3K4me3 alrededor del TSS para la transcripción antisentido en la cepa mutante TATA-box (Figura 5E), lo que confirma el uso reducido de la unidad de transcripción. La capacidad de reducir la transcripción antisentido en GAL1 proporcionó un sistema experimental en el que se podían observar los efectos de la transcripción antisentido sobre la cromatina.

Los niveles de histonas y modificaciones de histonas se midieron usando ChIP en medio que contiene glucosa, específicamente H3, una serie de marcas de acetilación H3 (K9,14,18,23ac) y H3K36me3 en ambos GAL1 constructos (Figura 5F). Los experimentos de ChIP se realizaron en presencia de SUT013, que en la glucosa se transcribe a niveles similares a los GAL1 transcripción antisentido (Figura 5D). Sobre la base del análisis de todo el genoma, se predijo que los niveles de acetilación de H3 y H3 caerían después de la ablación de la transcripción antisentido y que H3K36me3 aumentaría. De acuerdo con nuestras predicciones, los niveles de acetilación de H3 y H3 (normalizados a los niveles de H3) disminuyeron, mientras que los niveles de H3K36me3 normalizados con H3 aumentaron, tras la mutación de la secuencia similar a TATA y la pérdida de la transcripción antisentido (Figura 5F). Estos cambios son consistentes con una reducción / depósito de histonas en ausencia de transcripción antisentido, y sugieren que la transcripción antisentido está asociada con amplios cambios en la cromatina.

Cambios en la transcripción antisentido después de la eliminación de SET2, RCO1, EAF3 o SERIE 1 están asociados con un cambio correspondiente en la ocupación de nucleosomas y modificaciones de histonas

Hasta ahora, hemos mostrado asociaciones entre la transcripción antisentido y las características de la cromatina a través de diferentes genes en un fondo de tipo salvaje. Planteamos la hipótesis de que se observarían asociaciones similares al comparar la mismo genes entre diferente cepas de levadura. es decir, investigando cómo cambia la transcripción antisentido tras la mutación, y si estos cambios se reflejan en los cambios en las características de la cromatina discutidas anteriormente.

Con este fin, utilizamos los datos de NET-seq disponibles obtenidos en mutantes de levadura que se sabe que tienen niveles alterados de transcripción antisentido, a saber SET2, RCO1, EAF3 y SERIE 1 cepas de deleción (7) y genes agrupados sobre la base de si la transcripción antisentido durante la ventana de 300 pb aumentó, disminuyó o no cambió. De los 5183 genes que componían las cinco clases presentadas en la Figura 1A, seleccionamos tres nuevos grupos de genes en función de cómo cambiaron la clasificación en la cepa mutante en comparación con la de tipo salvaje. Se seleccionó un grupo de genes "aumentado" en el que los genes aumentaron en al menos dos clases (por ejemplo, de la clase dos a la clase cuatro, en la Figura 1A). Se seleccionó un segundo grupo en el que los genes se redujeron en al menos dos clases (el grupo "disminuido"). El tercer grupo contenía genes que no cambiaron de clasificación (el grupo "sin cambios"). Los números de genes en cada grupo para cada cepa mutante se muestran en los paneles de la izquierda en la Figura 6. Tenga en cuenta especialmente que los tres grupos son diferentes en cada uno de los cuatro mutantes (ver norte valores de los paneles de la izquierda), ya que la transcripción antisentido se alteró diferencialmente entre ellos, es decir. un gen clasificado como "aumentado" en un mutante bien podría clasificarse como "disminuido" o "sin cambios" en otro. Los niveles de expresión sensorial en todo el genoma fueron generalmente similares entre los cuatro mutantes y el tipo salvaje, salvo por eaf3Δ, en el que el nivel medio de transcripción de sentido en un gen era tres cuartas partes del de tipo salvaje. Fundamentalmente, y en apoyo de nuestros análisis anteriores, la correlación entre el cambio en la transcripción sentido y antisentido en la ventana de 300 pb en los mutantes de deleción en relación con el tipo salvaje fue igualmente pequeña para las cuatro cepas (Figura 6), es decir. los cambios en la transcripción antisentido no se asociaron con un aumento o disminución de la transcripción en el sentido.

Los cambios en los niveles de transcripción antisentido después de la mutación son concomitantes con los cambios esperados en la ocupación del nucleosoma y la modificación de la cromatina. (AD) El cambio promedio en los niveles de ocupación de nucleosomas, H3K14ac, H3K36me3 y H4ac en (A) set2Δ (B) rco1Δ (C) eaf3Δ y (D) set1Δ, en comparación con el tipo salvaje. Se analizaron tres grupos de genes, que diferían en términos de cómo cambió el nivel de transcripción antisentido en la ventana de 300 pb después de la mutación. Un valor positivo indica que el nivel particular ha aumentado en la cepa mutante en relación con el tipo salvaje. Las líneas verticales negras indican PAG-valores entre grupos de genes en los puntos indicados, determinados mediante la prueba de suma de rangos de Wilcoxon (* indica PAG & lt 0.05, **PAG & lt 0.01, ***PAG & lt 0,001). El cuadro vertical gris representa la región típicamente ocupada por el nucleosoma +1. Los niveles de H3K14ac y H3K36me3 se normalizaron a los niveles de ocupación de nucleosomas como se describe en Materiales y métodos. Los paneles del extremo derecho muestran diagramas de dispersión que comparan los cambios en la transcripción sentido en la ventana de 300 pb con los cambios en la transcripción antisentido para cada uno de los cuatro mutantes en relación con el tipo salvaje. Se incluyen los 5183 genes que se describen en el texto. Se muestran los coeficientes de correlación de rango de Spearman (r). Los datos de NET-seq se obtuvieron de (7), la ocupación de nucleosomas, los datos de H3K14ac y H3K36me3 fueron de (38) y los datos de H4ac fueron de (39).

Los cambios en los niveles de transcripción antisentido después de la mutación son concomitantes con los cambios esperados en la ocupación del nucleosoma y la modificación de la cromatina. (AD) El cambio promedio en los niveles de ocupación de nucleosomas, H3K14ac, H3K36me3 y H4ac en (A) set2Δ (B) rco1Δ (C) eaf3Δ y (D) set1Δ, en comparación con el tipo salvaje. Se analizaron tres grupos de genes, que diferían en términos de cómo cambiaba el nivel de transcripción antisentido en la ventana de 300 pb después de la mutación. Un valor positivo indica que el nivel particular ha aumentado en la cepa mutante en relación con el tipo salvaje. Las líneas verticales negras indican PAG-valores entre grupos de genes en los puntos indicados, determinados mediante la prueba de suma de rangos de Wilcoxon (* indica PAG & lt 0.05, **PAG & lt 0.01, ***PAG & lt 0,001). El cuadro vertical gris representa la región típicamente ocupada por el nucleosoma +1. Los niveles de H3K14ac y H3K36me3 se normalizaron a los niveles de ocupación de nucleosomas como se describe en Materiales y métodos. Los paneles del extremo derecho muestran diagramas de dispersión que comparan los cambios en la transcripción sentido en la ventana de 300 pb con los cambios en la transcripción antisentido para cada uno de los cuatro mutantes en relación con el tipo salvaje. Se incluyen los 5183 genes que se describen en el texto. Se muestran los coeficientes de correlación de rango de Spearman (r). Los datos de NET-seq se obtuvieron de (7), la ocupación de nucleosomas, los datos de H3K14ac y H3K36me3 fueron de (38) y los datos de H4ac fueron de (39).

Consideramos cómo se comparan los niveles de ocupación de nucleosomas y modificaciones de histonas entre estos tres grupos distintos. Obtuvimos los niveles de ocupación de nucleosomas, H3K14ac y H3K36me3 de los datos de ChIP-seq (H3K36me3 no se muestra para set2Δ que carece de esta modificación, o rco1Δ) (38). Los niveles de H4ac procedían de los datos del chip ChIP (disponible para set2Δ y rco1Δ cepas solamente) (39). Predijimos que los genes cuya transcripción antisentido aumentaron después de la mutación tenderían a un mayor aumento en la ocupación de nucleosomas y H3K14ac en comparación con aquellos genes en los que disminuyó la transcripción antisentido, mientras que H3K36me3 tenderían a una disminución mayor. Los cambios en el mutante en comparación con las cepas de tipo salvaje se muestran como gráficos de diferencias (Figura 6A-D). Superpuestas a las gráficas de diferencia para el grupo de genes sin cambios están las gráficas de diferencia para los grupos de genes con transcripción antisentido aumentada o disminuida. Sorprendentemente, los cambios observados coincidieron con nuestro análisis anterior (Figuras 1-4). Por ejemplo en el set2Δ cepa, un aumento o disminución en la transcripción antisentido cambió la ocupación del nucleosoma en el promotor y en el cuerpo del gen como se predijo. Se encontró generalmente que los cambios en los niveles de transcripción antisentido tenían efectos recíprocos sobre la acetilación y H3K36me3 en las cepas mutantes (Figura 6D). Sin embargo, observamos que los cambios en la cromatina se encuentran en diferentes regiones de genes en las diferentes cepas mutantes. Para el serie 1 cepa de deleción, por ejemplo, observamos cambios en la ocupación de nucleosomas y H3K36me3 en el promotor, pero no en el cuerpo del gen. Por el contrario, se observaron cambios en la ocupación de nucleosomas tanto en el promotor de sentido y el cuerpo genético en set2Δ, rco1Δ y eaf3Δ, mientras que H3K36me3 cambió en ambas regiones en eaf3Δ. Esto sugiere que Set1 podría ser necesario para mediar algunos de los cambios asociados a la transcripción antisentido que se observan en el cuerpo del gen en las otras cepas mutantes. Este análisis apoya nuestra hipótesis de que la transcripción antisentido está asociada con un entorno de cromatina único en comparación con la transcripción sentido. Tomados junto con la bioinformática anterior y la validación experimental, nuestros datos respaldan un modelo en el que el aumento de los niveles de transcripción antisentido conduce a un aumento en la ocupación de nucleosomas y la acetilación de histonas, mientras que disminuyen los niveles de H3K36me3.


Referencias

An JJ et al (2008) Función distintiva del ARNm largo de 3 ′ UTR BDNF en la morfología de la columna y la plasticidad sináptica en las neuronas del hipocampo. Celda 134 (1): 175–187

Beltran M et al (2008) Una transcripción antisentido natural regula la expresión del gen Zeb2 / Sip1 durante la transición epitelial-mesenquimal inducida por Snail1. Genes Dev 22 (6): 756–769

Berkovits BD, Mayr C (2015) Alternativas 3 ′ UTR actúan como andamios para regular la localización de proteínas de membrana. Nature 522 (7556): 363–367

Carrieri C et al (2012) El ARN antisentido no codificante largo controla la traducción de Uchl1 a través de una repetición SINEB2 incrustada. Nature 491 (7424): 454–457

Chen JJ et al (2005) Análisis de todo el genoma de la expresión coordinada y la evolución de transcripciones codificadas en cis de sentido-antisentido humanas. Trends Genet 21 (6): 326–329

Colgan DF, Manley JL (1997) Mecanismo y regulación de la poliadenilación del ARNm. Genes Dev 11 (21): 2755–2766

David L et al (2006) Un mapa de transcripción de alta resolución en el genoma de la levadura. Proc Natl Acad Sci USA 103 (14): 5320–5325

de la Mata M, Kornblihtt AR (2006) El dominio terminal de la RNA polimerasa IIC media la regulación del empalme alternativo por SRp20. Nat Struct Mol Biol 13 (11): 973–980

Derti A et al (2012) Un atlas cuantitativo de poliadenilación en cinco mamíferos. Genome Res 22 (6): 1173–1183

Di Giammartino DC, Nishida K, Manley JL (2011a) Mecanismos y consecuencias de la poliadenilación alternativa. Mol Cell 43 (6): 853–866

Di Giammartino DC, Nishida K, Manley JL (2011b) Mecanismos y consecuencias de la poliadenilación alternativa. Mol Cell 43 (6): 853–866

Elkon R, Ugalde AP, Agami R (2013) Escisión alternativa y poliadenilación: extensión, regulación y función. Nat Rev Genet 14 (7): 496–506

Faghihi MA et al (2010) Evidencia de inhibición natural de la función de microARN mediada por transcripción antisentido. Biol del genoma 11 (5): R56

Fu YG et al (2011) Perfilado diferencial de todo el genoma de las UTR 3 'en tándem entre el cáncer de mama humano y las células normales mediante secuenciación de alto rendimiento. Genome Res 21 (5): 741–747

Grinchuk OV, Motakis E, Kuznetsov VA (2010) La arquitectura compleja sentido-antisentido de TNFAIP1 / POLDIP2 en 17q11.2 representa un nuevo módulo genético transcripcional estructural-funcional involucrado en la progresión del cáncer de mama. BMC Genomics 11: S9

Gunderson SI, Polycarpou-Schwarz M, Mattaj IW (1998) U1 snRNP inhibe la poliadenilación de pre-ARNm a través de una interacción directa entre U1 70 K y poli (A) polimerasa. Mol Cell 1 (2): 255–264

Hsin JP, Manley JL (2012a) El CTD de la ARN polimerasa II coordina la transcripción y el procesamiento del ARN. Genes Dev 26 (19): 2119–2137

Hsin JP, Manley JL (2012b) El CTD de la ARN polimerasa II coordina la transcripción y el procesamiento del ARN. Genes Dev 26 (19): 2119–2137

Hu X et al (2009) Alteraciones genéticas y vías oncogénicas asociadas con subtipos de cáncer de mama. Mol Cancer Res 7 (4): 511–522

Hu S, Wang X, Shan G (2016) La inserción de un elemento Alu en un lncRNA conduce a una modulación específica de primates del empalme alternativo. Nat Struct Mol Biol 23 (11): 1011–1019

Ikura T et al (2000) Participación del complejo de acetilasa de histona TIP60 en la reparación del ADN y la apoptosis.Celda 102 (4): 463–473

Jao CY, Salic A (2008) Exploración de la transcripción y el recambio de ARN in vivo mediante el uso de la química del clic. Proc Natl Acad Sci USA 105 (41): 15779-15784

Ji Z, Tian B (2009) Reprogramación de regiones 3 'no traducidas de ARNm mediante poliadenilación alternativa en la generación de células madre pluripotentes a partir de diferentes tipos de células. PLoS ONE 4 (12): e8419

Ji Z et al (2009) Alargamiento progresivo de 3 'regiones no traducidas de ARNm por poliadenilación alternativa durante el desarrollo embrionario de ratón (vol 106, pg 7028, 2009). Proc Natl Acad Sci USA 106 (23): 9535

Ji Z et al (2011) La actividad transcripcional regula la escisión alternativa y la poliadenilación. Mol Syst Biol 7: 534

Kaida D et al (2010) U1 snRNP protege los pre-ARNm de la escisión prematura y la poliadenilación. Nature 468 (7324): 664–668

Katayama S et al (2005) Transcripción antisentido en el transcriptoma de mamíferos. Science 309 (5740): 1564–1566

Li H, Durbin R (2009) Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25 (14): 1754-1760

Licatalosi DD, Darnell RB (2010) Aplicaciones del procesamiento de secuenciación de ARN de próxima generación y su regulación: conocimientos globales sobre redes biológicas. Nat Rev Genet 11 (1): 75–87

Loeb LA (2011) Los cánceres humanos expresan fenotipos mutantes: origen, consecuencias y orientación. Nat Rev Cancer 11 (6): 450–457

Lopez-Otin C et al (2013) Los sellos distintivos del envejecimiento. Celda 153 (6): 1194-1217

Mayr C, Bartel DP (2009) El acortamiento generalizado de las 3 ′ UTR mediante la escisión alternativa y la poliadenilación activa los oncogenes en las células cancerosas. Celda 138 (4): 673–684

Millevoi S, Vagner S (2010) Mecanismos moleculares de la regulación del procesamiento del extremo 3 ′ del pre-mRNA eucariota. Ácidos nucleicos Res 38 (9): 2757–2774

Moskalev AA et al (2013) El papel del daño y la reparación del ADN en el envejecimiento a través del prisma de los criterios de Koch. Aging Res Rev 12 (2): 661–684

Ni T et al (2013) Distintos paisajes de poliadenilación de diversos tejidos humanos revelados por una estrategia de PA-seq modificada. BMC Genomics 14: 615

Onodera CS et al (2012) Especificidad de isoforma genética a través de la transcripción antisentido asociada al potenciador. PLoS ONE 7 (8): e43511

Ozsolak F et al (2010) Mapas completos de sitios de poliadenilación en levaduras y humanos revelan una poliadenilación alternativa generalizada. Celda 143 (6): 1018–1029

Park JY et al (2011) El análisis comparativo de la expresión de isoformas de ARNm en la hipertrofia cardíaca y el desarrollo revela múltiples módulos reguladores postranscripcionales. PLoS ONE 6 (7): e22391

Paulsen MT et al (2014) Uso de Bru-Seq y BruChase-Seq para la evaluación de todo el genoma de la síntesis y estabilidad del ARN. Métodos 67 (1): 45–54

Pelechano V, Steinmetz LM (2013) ARN NO CODIFICADOR Regulación génica por transcripción antisentido. Nat Rev Genet 14 (12): 880–893

Pinto PAB et al (2011) Cinética de la ARN polimerasa II en la selección de señales de poliadenilación de polo. EMBO J 30 (12): 2431–2444

Quinlan AR, Hall IM (2010) BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26 (6): 841–842

Reijns MA et al (2012) La eliminación enzimática de ribonucleótidos del ADN es esencial para la integridad y el desarrollo del genoma de los mamíferos. Celda 149 (5): 1008-1022

Sandberg R et al (2008) Las células en proliferación expresan ARNm con regiones sin traducir de 3 'acortadas y menos sitios diana de microARN. Science 320 (5883): 1643–1647

Spies N et al (2009) Firmas de cromatina sesgadas alrededor de exones y sitios de poliadenilación. Mol Cell 36 (2): 245-254

Squatrito M, Gorrini C, Amati B (2006) Tip60 en la respuesta al daño del ADN y el control del crecimiento: muchos trucos en un HAT. Trends Cell Biol 16 (9): 433–442

Thorvaldsdottir H, Robinson JT, Mesirov JP (2013) Visor de genómica integradora (IGV): visualización y exploración de datos de genómica de alto rendimiento. Breve Bioinform 14 (2): 178-192

Vanden Bempt I, Drijkoningen M, De Wolf-Peeters C (2007) La complejidad de las alteraciones genotípicas subyacentes al cáncer de mama HER2 positivo: una explicación de su heterogeneidad clínica. Curr Opin Oncol 19 (6): 552–557

Wallace SS, Murphy DL, Sweasy JB (2012) Reparación de escisión de base y cáncer. Cancer Lett 327 (1–2): 73–89

Xie Y et al (2017) Un sistema CRISPR / Cas9 basado en vectores episomales para la eliminación de genes altamente eficiente en células madre pluripotentes humanas. Representante de ciencia 7 (1): 2320

Yelin R et al (2003) Existencia generalizada de transcripción antisentido en el genoma humano. Nat Biotechnol 21 (4): 379–386

Yu M et al (2015) El factor 1 asociado a la ARN polimerasa II regula la liberación y fosforilación de la ARN polimerasa II en pausa. Science 350 (6266): 1383–1386


Procedimientos experimentales

Caracterización de la transcripción antisentido

Ustilago maydis Las transcripciones antisentido fueron identificadas por Ho et al. (2007) y Morrison et al. (2012) a través del análisis de tecnologías ecológicamente racionales de 5 ’representadas en U. maydis Bibliotecas de ADNc creadas a partir de teliosporas en germinación (T11) y latentes (TDO) (Sacadura y Saville, 2003 Ho et al., 2007), células haploides cultivadas en medio completo (HCM), medio de privación de carbono (MMC) o medio de privación de nitrógeno (MMN Ho et al., 2007), diploides forzados que crecen filamentosamente (D12 Nugent et al., 2004) o micelio dicariótico filamentoso (DIK Morrison et al., 2012 ).

Los clones que representan las transcripciones antisentido se seleccionaron para la secuenciación de 3 '. El aislamiento del ADN plasmídico siguió el procedimiento descrito en Nugent et al. (2004). La secuenciación desde el extremo 3 'de la transcripción antisentido se realizó utilizando los cebadores M13_R o dT19V (Tabla S5). Las secuencias de nucleótidos se determinaron usando la química Big Dye Terminator v3.1 (Applied Biosystems) y los productos de reacción se analizaron usando un analizador de ADN ABI PRISM 3730 (Applied Biosystems).

Se editaron nuevas tecnologías ecológicamente racionales para eliminar las secuencias de vectores contaminantes como se indica en Morrison et al. (2012), excepto que todas las secuencias se inspeccionaron manualmente para detectar la presencia de una cola de poli (A). Las tecnologías ecológicamente racionales de 5 'y 3' que representan las transcripciones antisentido se alinearon utilizando blastn para U. maydis archivo de ensamblaje de cromosomas "Umaydis_contigs.fas" (última modificación el 8 de septiembre de 2011) o el U. maydis archivo de marco de lectura abierto (ORF) "Umaydis_valid_orf.fas" (última modificación el 24 de mayo de 2011). Estos archivos FASTA (.fas) se descargaron del Centro de información de Munich para secuencias de proteínas (MIPS) U. maydis base de datos (MUMDB Mewes et al., 2008). Se confirmó que todas las tecnologías ecológicamente racionales 5 'y 3' de los clones que representan transcripciones antisentido contienen la hebra antisentido de un gen MUMDB. Además, al alinear el par de tecnologías ecológicamente racionales que representan los extremos 5 'y 3' de una transcripción antisentido al U. maydis genoma, o U. maydis Se determinaron los ORF, las características de las transcripciones antisentido, que incluyen: la longitud de la transcripción antisentido, el tipo y la longitud de la superposición (con respecto al ORF) y las transcripciones antisentido que contienen un intrón. Las transcripciones antisentido que contienen un intrón se confirmaron manualmente y se registraron los nucleótidos del sitio de corte y empalme. Se detectaron ORF putativos dentro de NAT de longitud completa y se usaron para predecir su secuencia de aminoácidos correspondiente utilizando Geneious Pro v5.6.5 (Biomatters). Las proteínas putativas resultantes se utilizaron en búsquedas blastp (realizadas en octubre de 2012) contra la base de datos de proteínas no redundantes NCBI con un umbral esperado de E & lt 1e-5. Para cada proteína, solo se informó el mejor golpe de blastp. Además, las proteínas putativas se inspeccionaron en busca de señales de secreción N-terminal utilizando SignalP v4.0 (Petersen et al., 2011), TargetP v1.1 (Emanuelsson et al., 2000) y ProtComp v9.0 (Softberry). Sólo se registraron aquellas proteínas que se predice que tienen una ubicación extracelular por los tres programas.

Construcciones de plásmidos y cepas

Todos los procedimientos se llevaron a cabo según lo sugerido por los fabricantes, a menos que se indique lo contrario. Los plásmidos utilizados en este estudio se enumeran en la Tabla S6. los U. maydis El vector de expresión pCM768 es un vector no integrante que contiene un U. maydis secuencia de replicación autónoma (ARS), un casete de resistencia a higromicina B (Hyg R), y el U. maydis promotor de gliceraldehído-3-fosfato deshidrogenasa (Pumgapd) que facilita la expresión de genes insertados en el sitio de clonación múltiple (Kojic y Holloman, 2000). Para expresar transcripciones antisentido de un vector de replicación autónoma, se amplificó una región del genoma correspondiente a una transcripción antisentido (identificada mediante análisis de ADNc de longitud completa) mediante PCR utilizando cebadores que introducen secuencias de reconocimiento de endonucleasas de restricción en sus extremos 5 '(Tabla S5). . El fragmento de PCR y pCM768 se digirieron con endonucleasas de restricción y se purificaron. Se trató pCM768 linealizado con fosfatasa antártica (New England BioLabs) y se ligó al fragmento de PCR digerido purificado. La resultante U. maydis El vector de expresión del transcrito antisentido se transformó en Células Competentes de Eficiencia de Subclonación DH5α (Invitrogen). Seis U. maydis Se construyeron vectores de expresión de transcripción antisentido usando este enfoque (Tabla S6). La secuencia de nucleótidos y la orientación correctas para la región del genoma que codifica la transcripción antisentido se confirmaron mediante secuenciación. Todas las reacciones de secuenciación se realizaron utilizando el cebador pgapd_79_F (Tabla S5). Los protoplastos FB1 o FB2 se transformaron con el vector de expresión antisentido, utilizando una modificación del protocolo de Yee (1998), previamente descrito en Morrison. et al. (2012). El ADN genómico se aisló de los supuestos transformantes usando el protocolo descrito por Hoffman y Winston (1987). Exitoso U. maydis Los transformantes se confirmaron mediante PCR. Se realizaron PCR para amplificar una región del casete Hyg R utilizando los cebadores pCM768_Hyg_F y pCM768_Hyg_R, o el Pumgapd- transcrito antisentido dirigido, usando el cebador pgapd_79_F y el cebador inverso usado para clonar la región genómica correspondiente al transcrito antisentido (Tabla S5). Además, la expresión de la transcripción antisentido se confirmó mediante RT-PCR semicuantitativa específica de cadena (ver análisis de expresión de la transcripción, más adelante). los U. maydis Las cepas derivadas de FB1 y FB2 creadas para análisis de expresión de transcritos antisentido se enumeran en la Tabla 4. En cada caso, se identificaron varias cepas.

Cepa Genotipo relevante Fuente
Ustilago maydis
518 a2 b2 Holliday (1961)
521a a Cepa de referencia utilizada para la secuenciación del genoma.
a1 b1 Holliday (1961)
d132 a1 / a2 b1 / b2 Kronstad y Leong (1989)
FB1 a1 b1 Banuett y Herskowitz (1989)
FB2 a2 b2 Banuett y Herskowitz (1989)
FBD12 a1 / a2 b1 / b2 Banuett y Herskowitz (1989)
SG200 a1 mfa2 bE1bW2 Kämper et al. ( 2006 )
FB1 [pCM768] a1 b1 [pCM768] Este trabajo
FB2 [pCM768] a2 b2 [pCM768] Este trabajo
FB2 [pCMas-um02114] a2 b2 [pCMas-um02114] Este trabajo
FB1 [pCMas-um02125] a1 b1 [pCMas-um02125] Este trabajo
FB1 [pCMas-um02150] a1 b1 [pCMas-um02150] Este trabajo
FB1 [pCMas-um02151] a1 b1 [pCMas-um02151] Este trabajo
FB2 [pCMas-um10002] a2 b2 [pCMas-um10002] Este trabajo
FB2 [pCMas-um12232] a2 b2 [pCMas-um12232] Este trabajo
SG200Δum02151 a1 mfa2 bE1bW2 Δum02151 Este trabajo
SG200ΔPas-um02151 a1 mfa2 bE1bW2 ΔPAGas-um02151 Este trabajo
SG200ΔncRNA1 a1 mfa2 bE1bW2 ΔncRNA1 Morrison et al. ( 2012 )
Ustilago hordei
Uh 4857-4 (alias Uh364) a a Cepa de referencia utilizada para la secuenciación del genoma.
MAT-1 Revestimiento et al. ( 2004 )
Uh 4857-5 (alias Uh365) MAT-2 Revestimiento et al. ( 2004 )

Ustilago maydis Las cepas de deleción se crearon reemplazando el locus de interés con un casete Hyg R siguiendo un enfoque basado en PCR (Kämper, 2004). Borrar um02151, Fragmentos de 1,1 kb flanqueando um02151 se amplificaron mediante PCR utilizando los cebadores um02151_Left_F y um02151_Left_R_SfiI para amplificar el flanco izquierdo, y los cebadores um02151_Right_F_SfiI y um02151_Right_R para amplificar el flanco derecho (Tabla S5). Para eliminar elementos regulatorios putativos para as-um02151, una región de 0,5 kb aguas arriba de as-um02151 (PAGas-um02151) fue el objetivo de su eliminación. Los cebadores pA_Left_F y pA_Left_R_SfiI, y pA_Right_F_SfiI y pA_Right_R se utilizaron para amplificar las regiones flanqueantes de 1,1 kb a Pas-um02151 (Tabla S5). Los fragmentos de PCR se digirieron con SfiI y se ligaron al casete Hyg R como se describe en Morrison et al. (2012). Los productos de ligación de 4,8 kb se amplificaron utilizando los cebadores um02151_Nested_F y um02151_Nested_R, o pA_Nested_F y pA_Nested_R (Tabla S5), y se clonaron en pCR-XL-TOPO (Invitrogen) produciendo pCR-XL-TOPO-Δum02P-XL, y pas-um02151 (Tabla S6). Estos vectores, que llevan las construcciones de deleción, se transformaron en TOP10 químicamente competente One Shot Escherichia coli células (Invitrogen). Las secuencias de nucleótidos se verificaron mediante secuenciación utilizando los cebadores pMF1_HygOUT_F y pMF1_HygOUT_R. los um02151 o Pas-um02151 Las construcciones de deleción se amplificaron mediante PCR utilizando los cebadores um02151_Nested_F y um02151_Nested_R, o pA_Nested_F y pA_Nested_R, y luego se purificaron con el kit de purificación de gel QIAquick (Qiagen) antes de U. maydis transformación. U. maydis Se transformaron los protoplastos SG200. Para identificar los supuestos transformantes, se realizaron PCR para amplificar una región que contiene parte del casete Hyg R y un área del flanco um02151 o Pas-um02151 locus, fuera del área de integración. Para estas pantallas, la PCR se realizó usando pares de cebadores um02151_Left_F y pMF1_HygOUT_F, y pMF1_HygOUT_R y um02151_Right_R, o pares de cebadores pA_Left_F y pMF1_HygOUT_F, y pMF1_HygOUT_R. Varias cepas que llevan deleciones a um02151 o Pas-um02151 fueron identificados por PCR.

Cepas de hongos, condiciones de crecimiento y producción de U. maydis tipos de células

Ustilago maydis y U. hordei Las cepas utilizadas en este estudio se enumeran en la Tabla 4. Para las RT-PCR realizadas para respaldar los datos de EST, U. maydis Las cepas haploides FB1 y FB2 se cultivaron en medio completo (CM) o sin nitrógeno (MN) como se describe en Ho et al. (2010), se indujo el crecimiento filamentoso de diploides FBD12 o dicariones FB1 × FB2 como se describe en Morrison et al., (2012), y las teliosporas se recolectaron de tumores maduros de maíz (Z. mays L. 'Golden Bantam') infectado con 518 × 521. La infección por mazorcas, la recolección de teliosporas y el almacenamiento de teliosporas se realizaron como se describe en Morrison et al., (2012). Para todos los demás experimentos: U. maydis Las células haploides se cultivaron durante la noche en medio YEPS (extracto de levadura al 1% p / v, peptona al 2% p / v, sacarosa al 2% p / v 250 r.p.m., 28ºC). U. maydis Se indujo la germinación de las teliosporas modificando el protocolo descrito en Zahiri. et al. (2005). Las diferencias incluyen: la germinación se indujo agitando en matraces Erlenmeyer de 250 ml que contenían 10 ml de medio YEPS, complementado con 160 μg ml -1 de sulfato de estreptomicina (90 r.p.m., 28 ° C). Las teliosporas en germinación se sedimentaron 16, 18, 24 o 40 h después de la inducción de la germinación (PIG) ​​por centrifugación (400 gramo, 5 min, TA).

Ustilago hordei cepas haploides Uh364 y ​​Uh365, y cebada (Hordeum vulgare L. ‘Odessa’) infectadas con Uh364 × Uh365 se obtuvieron de Guus Bakkeren (Agriculture & Agri-Food Canada, Pacific Agri-Food Research Centre, BC, Canadá). Las células haploides se cultivaron durante ~ 40 h en medio YEPS (250 r.p.m., 22 ° C). Mezclas de U. hordei Las teliosporas, recolectadas de muestras de campo en Manitoba y el este de Saskatchewan en 2007 o 2009, fueron proporcionadas por James Menzies (Agriculture & Agri-Food Canada, Cereal Research Centre, MB, Canadá). Las condiciones de crecimiento de las plantas y los ensayos de patogénesis se realizaron siguiendo los protocolos descritos en Morrison. et al. ( 2012 ).

Extracción de ARN, recorte de nucleasa S1 y transcripción inversa

Las extracciones de ARN para RT-PCR realizadas para respaldar los datos de EST se llevaron a cabo en células haploides sedimentadas cultivadas en CM o MN, o diploides filamentosos o dicariones recolectados de placas. El tejido de los tipos de células haploides o miceliales se congeló en nitrógeno líquido y se homogeneizó utilizando un mortero. Las teliosporas secadas al vacío se interrumpieron siguiendo el protocolo descrito en Zahiri et al. (2005). Para todos los demás experimentos, U. maydis células haploides, U. maydis germinación de teliosporas, o U. hordei las células haploides, se sedimentaron mediante centrifugación. Estas células, o U. hordei teliosporas (recolectadas de muestras de campo), se resuspendieron en reactivo TRIzol (Invitrogen) y se transfirieron a tubos con tapón de rosca de 2 ml que contenían Lysing Matrix C (MP Biomedicals). Las células se rompieron como se describe en Zahiri et al. (2005). Alternativamente, U. hordei-Las cabezas de cebada infectadas se trituraron en nitrógeno líquido inmediatamente antes de la extracción de ARN y se resuspendieron en reactivo TRIzol (Invitrogen). Después de la rotura celular, se aisló el ARN usando reactivo TRIzol (Invitrogen) de acuerdo con el protocolo del fabricante. Las muestras de ARN se precipitaron, se trataron con DNasa I, se analizaron para detectar contaminación de ADN genómico y se evaluó la calidad como se describe en Morrison. et al. ( 2012 ).

Para las reacciones de síntesis de la primera hebra, se utilizaron como molde 200 ng de ARN total tratado con DNasa I. Estas reacciones fueron preparadas con oligo-d (T)16, un cebador específico de sentido, un cebador específico antisentido, un cebador específico de cadena marcada o agua (para tener en cuenta el cebado falso). Los cebadores se diseñaron para reacciones de síntesis de primera hebra específicas de sentido o antisentido utilizando Primer3 (Rozen y Skaletsky, 2000) siguiendo el protocolo descrito en Ho et al. (2010). Las secuencias de cebadores específicas de cadena se enumeran en la Tabla S5. Todas las reacciones de síntesis de la primera hebra se llevaron a cabo utilizando el kit TaqMan Gold RT-PCR (Applied Biosystems) con las condiciones descritas en Ho et al. (2010). Después de la síntesis de la primera hebra, el ADNc se diluyó cuatro veces (1: 3) con agua tratada con DEPC.

Para detectar dsRNA, se incubaron 2,5 μg de RNA total tratado con DNasa I en reacciones de digestión con nucleasa S1 a 37 ° C durante 30 min. En reacciones separadas, la concentración final de nucleasa S1 (Invitrogen) incluyó: 0, 0.01, 0.1 o 1 U μl -1. A continuación, el dsRNA se extrajo con fenol / cloroformo, se precipitó con NH4Coprecipitante de Ac / Etanol / GlycoBlue (Invitrogen) a -20 ° C durante 60 min y resuspendido en 15 μl de H tratado con DEPC2O. Se utilizaron dos microlitros de ARN recortado en S1 como molde en las reacciones de síntesis de la primera hebra.

Análisis de expresión de transcripciones

Todos los cebadores utilizados en RT-PCR para analizar la expresión de la transcripción se diseñaron utilizando Primer3 (Rozen y Skaletsky, 2000) y se enumeran en la Tabla S5.Se utilizaron dos microlitros de ADNc diluido como molde para cada RT-PCR. Todas las RT-PCR se realizaron utilizando ADN polimerasa Amplitaq Gold (Applied Biosystems) y 30 o 35 ciclos. Se consideró que las RT-PCR con 30 ciclos eran semicuantitativas porque se usaron cantidades iguales de ARN total como molde para cada reacción de síntesis de la primera hebra, y se usaron volúmenes iguales de ADNc como molde para cada RT-PCR. Una cuarta parte de la mezcla de producto final se separó electroforéticamente en un gel de agarosa (1 x TAE) y se visualizó mediante tinción con bromuro de etidio.

Las sondas de aglutinante de surco menor (MGB) TaqMan se diseñaron utilizando Primer Express v2.0 (Applied Biosystems) y se enumeran en la Tabla S5. Se utilizaron dos microlitros de ADNc diluido como molde para cada PCR cuantitativa (RT-qPCR). Todas las RT-qPCR se realizaron utilizando TaqMan Universal PCR Master Mix (Applied Biosystems). Los datos se recopilaron y analizaron en un ABI PRISM 7900HT utilizando el sistema de detección de secuencias versión 2.1 (Applied Biosystems). Niveles de transcripción relativa para um02151 se midieron para ocho cepas independientes FB1 [pCMas-um02151], en comparación con un promedio de cuatro cepas independientes FB1 [pCM768] utilizando el método ΔΔCT. Se realizaron tres réplicas técnicas para cada muestra y umgapd se utilizó como patrón interno.

Amplificación rápida de extremos de ADNc mediada por ligasa de ARN (RLM-RACE)

Se empleó RLM-RACE para identificar los extremos 5 'y 3' de as-um02150, as-um02151 y as-uhor_03676. Diez microgramos de ARN total tratado con DNasa I de U. maydis (518 × 521) o U. hordei (Uh364 × Uh365) las teliosporas se procesaron y se sometieron a transcripción inversa utilizando el kit FirstChoice RLM-RACE (Ambion). Los ADNc resultantes, que contienen adaptadores de 5 'o 3', se utilizaron como plantilla para RACE. Se realizaron PCR sucesivas utilizando cebadores externos específicos de genes, seguidos de cebadores internos específicos de genes (Tabla S5) para producir productos RACE de 5 'o 3'. Todas las PCR se realizaron utilizando la ADN polimerasa HotStar HiFidelity (Qiagen). Los fragmentos amplificados se clonaron en el vector de clonación pDrive (Qiagen) y se transformaron en E. coli (Células competentes Qiagen EZ). Los transformantes se sembraron en placas de agar LB que contenían 100 μg ml -1 ampicilina, 50 μM isopropil β- d-tiogalactopiranósido (IPTG) y 80 μg ml -1 5-bromo-4-cloro-3-indolil β- d -galactopiranósido (X -gal), que permitió el cribado azul / blanco de colonias recombinantes. Después del crecimiento durante la noche a 37 ° C, 24 individuos E. coli Las colonias de cada transformación se inocularon en placas de microtitulación de 96 pocillos que contenían medio LB suplementado con 100 μg ml -1 de ampicilina y se cultivaron durante la noche a 250 r.p.m., 37 ° C. Se tomaron alícuotas de porciones de cada cultivo bacteriano en una placa de microtitulación de 96 pocillos separada y se almacenaron congeladas a -80 ° C en glicerol al 15%. Las células bacterianas restantes se recolectaron por centrifugación y el ADN plasmídico se aisló utilizando el protocolo descrito en Nugent. et al., (2004). Las secuencias de nucleótidos se determinaron usando el cebador M13_ F (Tabla S5).

Extracción y análisis de proteínas

Se extrajeron proteínas de células haploides cultivadas en 15 ml de medio YEPS o medio YEPS suplementado con 250 µg ml -1 de higromicina B (Bioshop Canada). Las células se sedimentaron mediante centrifugación (5250 gramo, 5 min, 4 ° C), y se lavó una vez en 1 ml de tampón de extracción de proteínas enfriado con hielo [KCl 10 mM, MgCl 5 mM2· 6H2O, sacarosa 400 mM, Tris-HCl 100 mM pH 8,1, glicerina al 10% v / v, β-mercaptoetanol al 0,007% v / v, cóctel inhibidor de proteasa al 1% v / v (Sigma-Aldrich)]. Las células se resuspendieron en 300 μl de tampón de extracción de proteínas helado, se transfirieron a tubos con tapón de rosca de 2 ml que contenían perlas de vidrio lavadas con ácido (425-600 μm, Sigma-Aldrich) y se rompieron como se describe en Zahiri. et al. (2005). Los restos celulares se sedimentaron mediante centrifugación (20 800 gramo, 5 min, 4 ° C), el sobrenadante se transfirió a un tubo de microcentrífuga de 1,5 ml y el extracto de proteína total se almacenó a -20 ° C.

Las concentraciones de proteína se estimaron utilizando el Ensayo de proteínas de Bradford de inicio rápido (Bio-Rad). Se siguió el protocolo estándar de microplacas. Se creó una curva estándar usando una serie de diluciones de γ-globulina bovina. Para cada muestra, se midió la absorbancia a 595 nm por triplicado, utilizando un espectrofotómetro NanoDrop 8000 (Thermo Scientific). Los extractos de proteínas totales se diluyeron a ∼ 1000 μg ml -1 y estas concentraciones se confirmaron usando el ensayo de Bradford.

Para visualizar el extracto de proteína total, se realizó SDS-PAGE, seguido de tinción de Coomassie. Brevemente, se combinaron partes iguales del extracto de proteína total diluido con tampón de muestra Laemmli (suplementado con β-mercaptoetanol al 5% v / v) y esta mezcla se hirvió durante 5 min. Se cargaron aproximadamente 10 μg de extracto de proteína total en los pocillos de un gel de poliacrilamida prefabricado Mini-PROTEAN TGX al 12% (Bio-Rad). Los geles se tiñeron con Coomassie Staining Solution (Sambrook y Russell, 2001), confirmando que había cantidades equivalentes de proteína total en las diluciones de ∼ 1000 μg ml -1.

Para la detección de Um02151, se realizó una transferencia Western. Después de SDS-PAGE, las proteínas se transfirieron electroforéticamente a una membrana de PVDF de 0,2 µm (Bio-Rad). Posteriormente, la membrana se tiñó con Ponceau S (Sigma-Aldrich) para verificar la misma carga de proteína en cada pocillo. Antes del bloqueo, la tinción Ponceau S se lavó de la membrana con agua destilada. El anticuerpo primario (dilución 1: 1000) usado para sondar la membrana fue un anticuerpo policlonal de conejo purificado por afinidad contra el péptido APGKTKEDTLESLRC Um02151 (GenScript). La unión del anticuerpo primario a la membrana se detectó usando un anticuerpo secundario (dilución 1: 3000) que consiste en inmunoglobulina G de cabra anti-conejo, conjugada con fosfatasa alcalina (Bio-Rad), junto con el kit de ensayo Immun-Blot (Bio -Rad). Se tomó una imagen de la transferencia Western utilizando el sistema de imágenes Geliance 600 (Perkin Elmer). Para estimar los niveles de Um02151, se determinó el volumen de píxeles de cada muestra utilizando el software GeneTools (Perkin Elmer). Se calculó un volumen de píxeles medio para tres réplicas biológicas del vector transformante vacío, FB1 [pCM768]. Utilizando este promedio como referencia, se determinó el volumen de píxeles relativo para cada muestra. Se repitió la transferencia Western y se calcularon por separado los volúmenes relativos de píxeles. El "cambio de veces, en relación con los controles" informado para cada muestra en la Fig. 7B es un promedio de los valores obtenidos de las dos réplicas técnicas.


CONCLUSIÓN

Nuestros resultados muestran la imagen más detallada de la regulación global de cis-NATS en plantas hasta el momento. Si bien pudimos mostrar que los pares cis-NAT tienden a tener más patrones de expresión anticorrelacionados que las transcripciones vecinas que no se superponen, descubrimos que una anticorrelación pronunciada en muchas muestras solo se puede encontrar en un pequeño subconjunto de cis-NAT. En este sentido, encontramos que los pares cis-NAT discretos muestran expresión anticorrelacionada en diferentes experimentos, lo que sugiere que la regulación transcripcional independiente de ambos miembros de un par tiene una fuerte influencia en la expresión cis-NAT. La correlación negativa de cis-NAT también se observó en un conjunto de datos específicos del tipo de célula, lo que indica que los cis-NAT afectan la expresión de los demás en células individuales. La observación de que los pequeños loci de ARN, que representan principalmente ARNip, estaban subrepresentados en cis-NAT, junto con el hecho de que las mutaciones en la maquinaria de silenciamiento del ARN no tuvieron un efecto significativo en la expresión de cis-NAT, confirman esta noción y complementan sugerencias previas de que los ARN pequeños y La interferencia de ARN es importante solo para un subconjunto de cis-NAT (Lu et al., 2005).

Sin embargo, hay al menos un ejemplo conocido en el que se ha demostrado que los pequeños ARN derivados de cis-NAT son importantes en la expresión mutuamente antagónica, a saber, la SRO5 y P5CDH par de cis-NAT implicados en la tolerancia a la sal de Arabidopsis (Borsani et al., 2005). Cuando se expone al estrés salino, SRO5 El mensaje es inducido, lo que lleva a la formación de pequeños ARN y a la activación de una vía de silenciamiento del ARN que finalmente conduce a la regulación a la baja de la P5CDH transcripción. Como se señaló anteriormente, no hay una pequeña etiqueta de ARN MPSS de mapas de tejidos de tipo salvaje a la región superpuesta de las dos transcripciones, de acuerdo con la naturaleza inducible de este ARNip particular. Borsani y col. (2005) también han sugerido que los microarrays son imperfectos para evaluar efectos mutuamente antagónicos, si los productos 3 ′ son en gran parte estables. En efecto, SRO5 y P5CDH están solo débilmente anticorrelacionados en nuestros conjuntos de datos y no son significativamente diferentes de las transcripciones que no se superponen. Sin embargo, el cambio significativo en los coeficientes de correlación de cis-NAT hacia valores negativos en comparación con las transcripciones que no se superponen indica que la expresión coordinada de cis-NAT puede detectarse mediante microarrays, incluso si el mecanismo por el cual esto se logra aún no está claro. Estos cis-NAT fuertemente anticorrelacionados serán objetivos atractivos para estudios mecanicistas adicionales.


Hay tres conjuntos distintos de fuentes para la anotación de genes y transcripciones en Vega. Estos se muestran como diferentes pistas y tienen diferentes esquemas de color.

  • Genes del núcleo de la Habana se han anotado en profundidad para identificar transcripciones alternativas y están presentes para todas las especies. Han sido comentados por el grupo de La Habana en la WTSI.
  • Genes LoF muestran las consecuencias de las variaciones en la secuencia sobre las propiedades funcionales de las transcripciones humanas.

Para cada uno de estos conjuntos, los genes y las transcripciones se clasifican como se muestra a continuación.


Ver el vídeo: Ejercicio: Transcripción de una cadena de ADN a ARNm (Mayo 2022).