Información

¿Cómo convertir el enriquecimiento / agotamiento en frecuencia para comparar la secuenciación profunda con el perfil de secuencia?

¿Cómo convertir el enriquecimiento / agotamiento en frecuencia para comparar la secuenciación profunda con el perfil de secuencia?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Tengo dos conjuntos de datos, de diferentes fuentes, que necesito comparar.

El primer conjunto son los resultados de secuenciación profunda de un experimento de evolución dirigida, donde tengo la biblioteca ingenua y los recuentos de bibliotecas seleccionadas, y he calculado el enriquecimiento / agotamiento (valores positivos y negativos sin límite superior o inferior).

El segundo conjunto es un conjunto de secuencias de proteínas para las que calculo frecuencias de aminoácidos (valores positivos de 0 a 1).

El objetivo es calcular una similitud entre los dos conjuntos de datos. Por lo general, tengo dos del segundo tipo de conjunto (secuencias de proteínas) y calculo la similitud en función de las frecuencias de aminoácidos ... ¿Cuál es la mejor manera de convertir el enriquecimiento / agotamiento en frecuencia para poder comparar?

Ejemplo de datos de secuenciación profunda, para la posición 77 de la proteína:

$$ text {enriquecimiento} = log_2 left ( frac {F_S} {F_N} right) $$

Dónde $ F_S $ es la frecuencia seleccionada y $ F_N $ es una frecuencia ingenua.

Se me ocurrió una posible solución para el equivalente de frecuencia del enriquecimiento ($ F_E $) pero estoy abierto a pensar si es bueno o no:

$$ F_E = frac { displaystyle frac {F_S} {F_N}} { displaystyle sum_ text {aminoácido} frac {F_S} {F_N}} $$


Aunque la pregunta es un poco confusa en algunos lugares, lo que entendí es que está tratando de comparar los enriquecimientos relativos de aminoácidos en los dos conjuntos de datos.

Hasta donde yo sé, podría construir las secuencias de proteínas a partir de un experimento de evolución dirigida (presumiblemente una serie de datos de tiempo. Por favor, aclare eso) y hacer una alineación de secuencia múltiple (MSA) de eso. Para construir las secuencias, habría algunos procedimientos técnicos que dependerían del tipo de datos de secuenciación profunda que tenga. Deberían tenerse en cuenta factores como la longitud de lectura, la longitud de la proteína y la cobertura.

De manera similar, también podría hacer MSA para segundos conjuntos de datos.

Luego, utilizando herramientas como Rate4site (https://www.ncbi.nlm.nih.gov/m/pubmed/12169533/), podrá obtener tarifas evoutionary por sitio de MSA. Luego, compare las tasas de evolución por sitio para dos conjuntos de datos correlacionándolos.

Si la correlación es alta, los enriquecimientos en ambos conjuntos de datos son similares; de lo contrario, no.


Agotamiento eficiente del ARN ribosómico para la secuenciación del ARN en planarias

Las asombrosas capacidades regenerativas de los gusanos planos de las planarias despiertan un interés cada vez mayor en examinar su base molecular. Se descubrió que la regeneración planaria requiere cientos de genes y, por lo tanto, es un proceso complejo. Por lo tanto, la interferencia de ARN seguida de un análisis de expresión génica de todo el transcriptoma mediante ARN-seq es una técnica popular para estudiar el impacto de cualquier gen planario en particular sobre la regeneración. Normalmente, la eliminación de ARN ribosómico (ARNr) es el primer paso de todos los protocolos de preparación de bibliotecas de ARN-seq. Hasta la fecha, la eliminación de ARNr en planarias se logró principalmente mediante el enriquecimiento de transcripciones poliadeniladas (poli (A)). Sin embargo, para reflejar mejor la dinámica del transcriptoma y para cubrir también las transcripciones no poli (A), se necesita un procedimiento para la eliminación dirigida de ARNr en planarias.

Resultados

En este estudio, describimos un flujo de trabajo para el agotamiento eficiente del ARNr en la especie modelo planaria. S. mediterranea. Nuestro protocolo se basa en la hibridación sustractiva utilizando sondas específicas de organismos. Es importante destacar que las sondas diseñadas también agotan el ARNr de otras familias de triclad de agua dulce, un hecho que amplía considerablemente la aplicabilidad de nuestro protocolo. Probamos nuestro enfoque en ARN total aislado de células madre (denominadas neoblastos) de S. mediterranea y comparó bibliotecas con ribo empobrecido con bibliotecas enriquecidas en poli (A) disponibles públicamente. En general, los niveles de ARNm después del agotamiento del ribo fueron consistentes con las bibliotecas de poli (A). Sin embargo, las bibliotecas con ribodepleción revelaron niveles de transcripción más altos para los elementos transponibles y los ARNm de histonas que permanecieron infrarrepresentados en las bibliotecas de poli (A). Como los neoblastos experimentan una alta actividad de transposones, esto sugiere que las bibliotecas con ribodepleción reflejan mejor la dinámica transcripcional de las células madre planarias. Además, el procedimiento de eliminación de ribodepleción presentado se expandió con éxito para eliminar el ARN ribosómico de la bacteria gramnegativa. Salmonella typhimurium.

Conclusiones

El protocolo de agotamiento del ribo que se presenta aquí asegura la eliminación eficiente del ARNr del ARN planario total de entrada baja, que puede procesarse aún más para aplicaciones de ARN-seq. Las bibliotecas resultantes contienen menos del 2% de ARNr. Además, para una eliminación rentable y eficiente del ARNr antes de las aplicaciones de secuenciación, nuestro procedimiento podría adaptarse a cualquier especie procariota o eucariota de elección.


Introducción

Las roturas de doble hebra del ADN (DSB) son lesiones importantes del ADN que se forman en una variedad de condiciones fisiológicas, como la transcripción 1,2, la meiosis 3 y la recombinación de VDJ 4, así como una consecuencia de la exposición a agentes que dañan el ADN y el estrés de la replicación. 5. Las DSB también se pueden inducir de manera controlada en sitios específicos del genoma utilizando nucleasas programables, como las endonucleasas guiadas por ARN, Cas9 y Cpf1, que tienen una edición genómica muy avanzada (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas). Sin embargo, la actividad de escisión del ADN fuera del objetivo potencialmente mutagénico de estas nucleasas representa un tema de gran preocupación que debe evaluarse a fondo antes de que estas enzimas se puedan utilizar de forma segura en el entorno clínico 6. Por lo tanto, desarrollar métodos que puedan mapear con precisión la ubicación de todo el genoma de DSB endógenos y exógenos en diferentes sistemas y condiciones no solo es esencial para avanzar en nuestra comprensión de la biología de DSB, sino que también es fundamental para la traducción exitosa de nucleasas programables a partir de herramientas de investigación. en aplicaciones clínicas.

En los últimos años, se han desarrollado varios métodos basados ​​en la secuenciación de próxima generación (NGS) para evaluar las DSB a escala genómica, incluida la secuenciación de inmunoprecipitación de cromatina 7,8, el etiquetado directo in situ de roturas, el enriquecimiento en estreptavidina y la secuenciación de próxima generación ( BLESS) 9,10,11, identificación imparcial de todo el genoma de los DSB habilitada por secuenciación (GUIDE-seq) 12, in vitro Secuenciación de genoma completo digerido con Cas9 (Digenome-seq) 13, captura de rotura de ADN mediada por vector lentiviral defectuoso en integrasa (IDLV) 14, secuenciación de translocación de alto rendimiento, en todo el genoma 15 y, más recientemente, End-Seq 16 y DSBCapture 17 . Aunque todos estos métodos representan importantes herramientas complementarias para detectar DSB en todo el genoma (Tabla complementaria 1), también tienen importantes inconvenientes. Por ejemplo, la secuenciación de inmunoprecipitación de cromatina de proteínas de reparación o detección de DSB, como la proteína de unión a p53 1 o la variante de histona fosforilada H2A.X (γH2A.X), no marca las DSB directamente y no puede identificar los puntos de ruptura del ADN con resolución de un solo nucleótido. . GUIDEseq, la captura de rotura de ADN mediada por IDLV y la secuenciación de translocación de alto rendimiento en todo el genoma detectan DSB cuantificando los productos de reparación de unión de extremos no homólogos, DSB potencialmente faltantes que se reparan a través de otras vías. Es más, en vivo la entrega de oligonucleótidos exógenos en GUIDEseq o casetes virales en la captura de ruptura de ADN mediada por IDLV para evaluar DSB en células primarias y tejidos intactos puede ser un desafío. Los DSB inducidos por nucleasas programables, como Cas9 y Cpf1 guiados por ARN asociado a CRISPR, pueden evaluarse in vitro utilizando Digenome-seq, pero este enfoque puede no ser representativo de las concentraciones de nucleasa relevantes y de las propiedades celulares, como el entorno de la cromatina y la arquitectura nuclear, que podrían influir en la frecuencia de rotura y reparación del ADN. Por último, BLESS y los métodos relacionados End-Seq 16 y DSBCapture 17 requieren cantidades sustanciales de material de entrada (normalmente, del orden de millones de células), requieren mucha mano de obra y son semicuantitativos debido a la falta de controles adecuados para la amplificación por PCR. sesgos, limitando sus aplicaciones y escalabilidad. Aquí describimos un método para etiquetar roturas. en el lugar y secuenciación (BLISS) que, en comparación con otros métodos de mapeo DSB, es más versátil, sensible y cuantitativa. Demostramos la amplia aplicabilidad de BLISS para la detección de todo el genoma de DSB endógenos y exógenos en muestras de células y tejidos de bajo ingreso, así como para el perfil de todo el genoma de DSB dentro y fuera del objetivo introducidos por nucleasas Cas9 y Cpf1. .


Resultados

El knockout de p53 de tipo salvaje mediado por CRISPR aumenta la proliferación celular en un subconjunto de líneas celulares cancerosas

Con el fin de identificar un sistema de modelo basado en células ideal para perfilar la función p53, aprovechamos los datos disponibles públicamente generados a través del Proyecto Achilles [32]. En resumen, el Proyecto Achilles utiliza pantallas knockout de CRISPR a escala genómica para identificar las dependencias genéticas en un gran compendio de líneas de células cancerosas. El efecto de anular cada gen individual durante un cribado CRISPR se informa como una "puntuación de enriquecimiento" a nivel de gen. Estas puntuaciones se calculan en función de los cambios en la abundancia relativa de células que albergan ARNsg que se dirigen a cada gen respectivo en el transcurso de un cribado. Por lo tanto, estas "Puntuaciones de enriquecimiento" sirven como proxy del impacto de la desactivación genética en la proliferación celular. Perfilamos las "Puntuaciones de enriquecimiento" de p53 en más de 350 líneas de células cancerosas y descubrimos que el knockout de p53 no tenía ningún efecto sobre la proliferación celular de muchas de las líneas celulares examinadas en el Proyecto Achilles. Sin embargo, pudimos identificar un subconjunto de líneas celulares en las que el knockout de p53 confería una ventaja proliferativa (Fig. 1a).

El knockout de p53 aumenta la proliferación celular. a Distribución de las puntuaciones de enriquecimiento de p53 de las pantallas de bloqueo de CRISPR agrupadas en 350 líneas de células cancerosas. B puntuaciones de enriquecimiento de p53 en un subconjunto seleccionado de líneas de células cancerosas que contienen p53 de tipo salvaje. C Análisis de transferencia Western de la expresión de Cas9 en células 769P. D Comparación de registro2 pliegue los cambios (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR entre réplicas. mi Visualización del enriquecimiento / agotamiento de sgRNA que se dirigen a un subconjunto seleccionado de genes (rojo) en comparación con todos los sgRNA en la biblioteca CRISPR (negro)

Para identificar las características moleculares asociadas con las líneas celulares en las que el knockout de p53 resultó en una ventaja proliferativa, intersectamos las "Puntuaciones de enriquecimiento" de p53 con datos de la base de datos TP53 de la IARC (Agencia Internacional para la Investigación del Cáncer) [33]. La base de datos IARC TP53 es un recurso seleccionado para el estado de mutación de p53, junto con varios otros oncogenes y supresores de tumores conocidos, en líneas celulares humanas. De acuerdo con la biología conocida de p53, encontramos que la ventaja proliferativa de la eliminación de p53 era específica de las líneas celulares que albergan p53 de tipo salvaje (Fig. 1a, archivo adicional 1: figura S1, archivo adicional 6: tabla S1). Por el contrario, la eliminación de p53 en líneas celulares que contienen mutaciones en el gen p53, la pérdida de mutaciones de expresión de p53 o las deleciones de p53 no tuvieron un impacto significativo en la proliferación celular (Fig.1a, archivo adicional 1: figura S1, archivo adicional 6: tabla S1) . En conjunto, estos resultados indican que la proliferación celular puede usarse como un fenotipo para seleccionar la función de p53 en líneas celulares que albergan copias de tipo salvaje del gen.

Para seleccionar una línea celular para la detección de la función de p53, primero redujimos la lista de líneas de células cancerosas examinadas a través del Proyecto Achilles a aquellas que albergan p53 de tipo salvaje. Luego, usamos datos de la base de datos IARC TP53 para restringir aún más esta lista a líneas celulares sin mutaciones documentadas en otros supresores de tumores u oncogenes conocidos (por ejemplo, PTEN, KRAS, BRAF) (Archivo adicional 6: Tabla S1). En total, identificamos 8 líneas celulares que cumplían con nuestros estrictos criterios (Fig. 1b). La línea celular 769P de adenocarcinoma renal humano mostró la "Puntuación de enriquecimiento" de p53 más alta en los datos del Proyecto Achilles y se seleccionó como línea celular modelo para todos los experimentos posteriores (Fig. 1b).

La pantalla CRISPR agrupada identifica genes regulados por p53 que influyen en la proliferación celular

Para determinar si un cribado CRISPR agrupado sería capaz de identificar objetivos posteriores de p53 que influyen en la proliferación celular, diseñamos un cribado CRISPR basado en la proliferación. Generamos una lista de 330 genes que tienen sitios de unión de p53 dentro de los 10 kb de su sitio de inicio de la transcripción y se predijo que serían regulados directamente por p53 en un estudio anterior [29]. Construimos una biblioteca CRISPR que contiene 4 sgRNA dirigidos a cada gen de esta lista, así como 4 sgRNA dirigidos a p53 (archivo adicional 7: Tabla S2). Como controles, esta biblioteca CRISPR incluía 70 sgRNA dirigidos a regiones intergénicas del genoma humano y 70 sgRNA sin objetivos genómicos (archivo adicional 7: Tabla S2). Nos referimos a esta biblioteca a lo largo de este informe como nuestra biblioteca CRISPR dirigida a genes.

Para realizar las pantallas de desactivación de CRISPR (CRISPRko), a continuación generamos una línea celular derivada de 769P que expresa Cas9. Integramos de manera estable Cas9 en una población de células 769P usando lentivirus y confirmamos la expresión de Cas9 por transferencia de Western (Fig. 1c). Luego infectamos las células 769P que expresan Cas9 con nuestra biblioteca de orientación genética en una multiplicidad de infección (MOI) de

0,5 y una representación de 1000 células por sgRNA. Las células infectadas con la biblioteca se cultivaron durante 21 días, se aisló el ADN genómico y se realizó una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con el pDNA de la biblioteca CRISPR (archivo adicional 8: Tabla S3).

Para calcular los cambios en la abundancia de sgRNA en el transcurso de la pantalla, utilizamos MAGeCK, una herramienta computacional para el análisis basado en modelos de pantallas CRISPR agrupadas [34]. El análisis con MAGeCK reveló una correlación significativa en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas, lo que indica que nuestros resultados de detección son altamente reproducibles (Fig. 1d, archivo adicional 9: Tabla S4). Además, los sgRNA que se dirigen a p53 se encuentran entre los más enriquecidos en nuestra pantalla, lo que confirma la validez de nuestro enfoque (Fig. 1e, archivo adicional 10: Tabla S5). Además de p53 identificamos varios genes regulados por p53 en los que el knockout resultó en una ventaja proliferativa significativa (Fig. 1e, archivo adicional 10: Tabla S5). Curiosamente, también descubrimos un subconjunto de genes regulados por p53 donde el knockout conduce a una desventaja proliferativa (Fig. 1e, archivo adicional 10: Tabla S5). Estos datos demuestran que las pantallas CRISPR basadas en la proliferación se pueden utilizar para perfilar funcionalmente eventos posteriores en la vía p53.

La pantalla CRISPR agrupada identifica elementos reguladores unidos a p53 que influyen en la proliferación celular

Habiendo establecido que los cribados CRISPR se pueden utilizar para perfilar eventos aguas abajo en la vía p53, a continuación diseñamos un enfoque de cribado para identificar elementos reguladores unidos por p53 que median su influencia en la proliferación celular. Más específicamente, diseñamos una biblioteca CRISPR para apuntar e inhibir la función de elementos reguladores unidos a p53. Utilizamos los datos de p53 ChIP-Seq informados anteriormente para identificar los sitios de unión de p53 en todo el genoma humano [29]. Luego, buscamos motivos de consenso de p53 (CWWG [N]2-12CWWG) ubicado dentro de cada pico de p53 ChIP-Seq (Fig. 2a). Una vez encontrados, diseñamos sgRNA que se dirigen a todas las secuencias que contienen PAM ubicadas dentro de 16 pb aguas arriba o aguas abajo del motivo de consenso. En total, diseñamos 11,434 sgRNA dirigidos a 4930 motivos ubicados dentro de 2036 p53 ChIP-Seq picos (Fig. 2b, c, d, archivo adicional 11: Tabla S6). Si bien muchos motivos de p53 solo podían ser dirigidos por un único sgRNA, la mayoría de los motivos que identificamos fueron dirigidos por múltiples sgRNA en nuestra biblioteca CRISPR (Fig. 2d). Asimismo, el 83% (1703/2036) de los picos de ChIP-Seq representados en nuestra biblioteca CRISPR fueron dirigidos por múltiples sgRNA (Fig. 2c). Como controles también incluimos 500 sgRNA dirigidos a regiones intergénicas del genoma humano y 500 sgRNA sin objetivos genómicos (archivo adicional 11: Tabla S6). Nos referimos a esta biblioteca a lo largo de este informe como nuestra biblioteca CRISPR de focalización máxima.

Los elementos reguladores unidos a p53 influyen en la proliferación celular. a Sitios de unión de p53 determinados por ChIP-Seq (negro) y motivos de consenso de p53 (gris). B Distribución de distancias al sitio de inicio de transcripción anotado más cercano para todos los sgRNA en la biblioteca CRISPR. C Distribución del número de diseños de sgRNA por pico de p53 ChIP-Seq. D Distribución del número de diseños de sgRNA por motivo de consenso de p53. mi Análisis de transferencia Western de la expresión de dCas9-KRAB en células 769P. F Comparación de registro2 pliegue los cambios (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR entre réplicas. gramo Gráfico de volcán que compara la importancia del enriquecimiento / agotamiento de sgRNA y el registro2 veces el cambio (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR. h Visualización del enriquecimiento / agotamiento de sgRNA que se dirigen a un subconjunto seleccionado de picos (rojo) en comparación con todos los sgRNA en la biblioteca CRISPR (negro). I Comparación de registro2 veces el cambio (en relación con el pDNA) y la distancia desde el TSS anotado más cercano para todos los sgRNA en la biblioteca CRISPR

Para realizar las pantallas de interferencia CRISPR (CRISPRi), a continuación generamos una línea celular derivada de 769P que expresa una versión muerta de nucleasa de Cas9 fusionada al dominio represivo KRAB (dCas9-KRAB). Integramos de forma estable dCas9-KRAB en una población de células 769P usando lentivirus y confirmamos la expresión de dCas9-KRAB por transferencia Western (Fig. 2e). Luego infectamos las células 769P que expresan dCas9-KRAB con nuestra biblioteca de selección de picos en un MOI de

0,5 y una representación de 1000 células por sgRNA. Las células infectadas con la biblioteca se cultivaron durante 21 días, se aisló el ADN genómico y se realizó una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con el pDNA de la biblioteca CRISPR (archivo adicional 12: Tabla S7).

De nuevo utilizamos MAGeCK para calcular los cambios en la abundancia de sgRNA durante la pantalla y observamos una correlación moderada en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas (Fig. 2f, archivo adicional 13: Tabla S8). Entre los sgRNA más enriquecidos en la pantalla se encontraban los que se dirigían a un pico de ChIP-Seq (pico 974) ubicado aguas arriba de CDKN1A, un gen que se enriqueció significativamente en las pantallas realizadas con la biblioteca CRISPR dirigida a genes (Fig. 2g, archivo adicional 14: Cuadro S9). Sorprendentemente, identificamos muchos sitios de unión de p53 en los que la represión mediada por CRISPRi resultó en una desventaja proliferativa significativa (Fig. 2g, h). Si bien algunos de estos sitios de unión de p53 se ubicaron proximales a un sitio de inicio de transcripción anotado (TSS), la mayoría se ubicaron a más de 10 kb de distancia del TSS más cercano (Fig. 2i). En conjunto, estos datos demuestran que las pantallas CRISPRi basadas en la proliferación se pueden utilizar para perfilar funcionalmente los elementos reguladores que están unidos por p53.

Para evaluar la capacidad de la tecnología CRISPRko para identificar elementos reguladores funcionales, realizamos pantallas utilizando nuestra biblioteca CRISPR de selección de picos en células que expresan Cas9 en lugar de dCas9-KRAB. Infectamos células 769P que expresan Cas9 con nuestra biblioteca CRISPR de selección de picos en un MOI de

0.5 y una representación de 1000 células por sgRNA, cultivaron las células infectadas durante 21 días, aislaron el ADN genómico y realizaron una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con la biblioteca CRISPR pDNA (archivo adicional 15: Tabla S10). El análisis con MAGeCK reveló una correlación moderada en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas, lo que indica que nuestros resultados de detección son reproducibles (archivo adicional 2: Figura S2A, archivo adicional 16: Tabla S11). De manera similar a nuestros hallazgos en células 769P que expresan dCas9-KRAB, identificamos muchos sitios de unión de p53 en los que el knockout mediado por CRISPR resultó en una desventaja proliferativa significativa (Archivo adicional 2: Figura S2B, Archivo adicional 2: Figura S2C, Archivo adicional 17: Tabla S12). Una vez más, la mayoría de estos sitios de unión de p53 se ubicaron a más de 10 kb del TSS más cercano (archivo adicional 2: Figura S2D). Curiosamente, observamos una superposición mínima en los sgRNA que se enriquecieron / agotaron significativamente en las pantallas CRISPRko y CRISPRi. Además, la concordancia general de enriquecimiento / agotamiento de todos los sgRNA en la biblioteca CRISPR de selección de picos fue sorprendentemente baja (archivo adicional 2: Figura S2E). En contraste con los resultados de nuestro cribado CRISPRi, no pudimos asociar ningún sitio de unión de p53 identificado en el cribado CRISPRko con genes que se enriquecieron / agotaron significativamente en nuestro cribado CRISPR dirigido a genes. Basándonos en estos datos, centramos nuestros esfuerzos de validación en los sitios de unión de p53 identificados en nuestra pantalla CRISPRi.

La represión de los elementos reguladores unidos a p53 afecta la proliferación celular

Entre los sgRNA que estaban más agotados en nuestra pantalla CRISPRi de selección de picos se encontraban los que tenían como objetivo el pico 2319 (Fig. 2h). El pico 2319 se encuentra dentro del primer intrón de RAD51C, un gen que se determina que es esencial para la proliferación celular en nuestra pantalla CRISPRko dirigida a genes (Fig. 3a, Fig. 1e). El pico 2319 contiene tres motivos de p53, dos de los cuales fueron dirigidos por sgRNA en nuestra biblioteca CRISPR dirigida a picos (Fig. 3a). Encontramos que los sgRNA que se dirigen a ambos motivos se agotaron significativamente en nuestra pantalla CRISPRi de selección de picos (Fig. 3b). Razonamos que los sitios de unión de p53 ubicados dentro del pico 2319 son componentes de un elemento regulador aguas abajo que modula la expresión de RAD51C y sgRNA seleccionados que se dirigen al pico 2319 y RAD51C para la validación experimental.

Caracterización funcional de elementos reguladores unidos a p53 que influyen en la proliferación celular. a Esquema de los motivos de p53 y dianas de sgRNA ubicadas en el pico 2319 (leyenda de la pista de ChromHMM: rojo = promotor activo naranja = potenciador fuerte) (B) Tronco2 cambios de veces (en relación con el pDNA) en el cribado CRISPR para sgRNA que se dirigen al pico 2319. Los valores de FDR se calcularon utilizando el método Benjamini-Hochberg. C Esquema de los motivos de p53 y los objetivos de sgRNA ubicados en el pico 384. (Leyenda de la pista de ChromHMM: amarillo = potenciador débil / equilibrado) (D) Tronco2 pliegues de cambios (en relación con el pDNA) en el cribado CRISPR para sgRNA que se dirigen al pico 384. Los valores de FDR se calcularon utilizando el método Benjamini-Hochberg. mi Comparación de las tasas de crecimiento celular después de la inhibición del pico 2319 o del pico 384. PAGLos valores se calcularon utilizando la prueba t de Student de dos colas no apareados con varianzas iguales. **PAG & lt 0.01, *PAG & lt 0.05

También entre los sgRNA más empobrecidos en nuestra pantalla CRISPRi de selección de picos se encontraban los que apuntaban al pico 384 (Fig. 2h). En contraste con la gran proximidad entre el pico 2319 y RAD51C, el pico 384 se encuentra a más de 200 kb del gen codificador de proteínas anotado más cercano (Fig. 3c). El pico 384 contiene tres motivos p53, dos de los cuales fueron dirigidos por sgRNA en nuestra biblioteca CRISPR dirigida a picos (Fig. 3c). Identificamos múltiples sgRNA que se dirigen al primero de esos motivos que se agotaron significativamente en nuestra pantalla CRISPRi de selección de picos (Fig. 3d). Presumimos que los sitios de unión de p53 dentro del pico 384 son componentes de un elemento regulador ubicado en lo profundo de una región intergénica del genoma y sgRNA seleccionados que se dirigen a este pico para la validación experimental.

Para validar experimentalmente que los sitios de unión de p53 seleccionados representan elementos reguladores funcionales, evaluamos el impacto de reprimir cada sitio de unión individual en la proliferación celular. Usamos lentivirus para transducir de manera estable ARNsg individuales dirigidos a los sitios de unión de p53 de interés en células 769P que expresan dCas9-KRAB. Además, generamos líneas celulares estables que expresan dCas9-KRAB que albergan un sgRNA dirigido a RAD51C, un sgRNA dirigido a una región intergénica del genoma o un sgRNA sin objetivo genómico. Las 7 líneas celulares resultantes se cultivaron en paralelo durante 18 días y se evaluaron las duplicaciones de la población en cada pase. Las líneas celulares que albergan ARNsg que se dirigen a RAD51C, Pico 2319 y Pico 384 experimentaron significativamente menos duplicaciones de población en comparación con las líneas celulares que contienen ARNsg de control negativo (Fig. 3e). Además, observamos una diferencia significativa en la duplicación de la población entre las células que albergan el sgRNA dirigido a RAD51C TSS (RAD51C) y las células que contienen un sgRNA dirigido al sitio de unión de p53 dentro del primer intrón de RAD51C (2319.1-1) (Fig. 3e). Esta observación sugiere que los sgRNA que se dirigen al RAD51C TSS y al intrón RAD51C influyen en la proliferación celular a través de distintos mecanismos (interferencia transcripcional directa de RAD51C e inhibición de la actividad del elemento regulador, respectivamente). Detectamos un impacto similar en la proliferación celular para dos sgRNA diferentes que se dirigen al pico 2319 en nuestros experimentos de validación a pesar de sus diferentes grados de agotamiento en nuestra pantalla CRISPRi (Fig. 3b, e). Esta observación sugiere que muchos de los modestos fenotipos de proliferación generados por sgRNA en nuestra pantalla CRISPRi pueden traducirse en impactos más potentes sobre la proliferación celular en experimentos de validación enfocados. En conjunto, nuestros resultados confirman que las pantallas CRISPR agrupadas se pueden utilizar para identificar elementos reguladores funcionales que influyen en la proliferación celular.

Además de los sgRNA que se agotaron significativamente en nuestra pantalla CRISPRi, identificamos varios sgRNA que se enriquecieron significativamente. Por ejemplo, múltiples sgRNA dirigidos al pico 1267 dieron como resultado una ventaja proliferativa significativa en nuestra pantalla CRISPRi (Fig. 2h). El pico 1267 contiene cinco motivos de p53, dos de los cuales fueron dirigidos por sgRNA en nuestra biblioteca CRISPR de focalización de picos (archivo adicional 3: Figura S3A). Aunque el pico 1267 se encuentra dentro del primer intrón de TNFRSF10A, la desactivación de TNFRSF10A no tuvo ningún impacto en la proliferación celular en nuestra pantalla CRISPRko dirigida a genes (archivo adicional 3: Figura S3A, Figura S3B). Por el contrario, identificamos múltiples sgRNA dirigidos al segundo motivo de consenso de p53 en el pico 1267 que se enriquecieron significativamente en nuestra pantalla CRISPRi de focalización de picos (archivo adicional 3: Figura S3C). Es importante destacar que estos resultados demuestran que los elementos reguladores pueden disociarse funcionalmente de los genes que codifican proteínas proximales.

La pantalla CRISPR agrupada identifica los elementos reguladores unidos a p53 que influyen en la respuesta al daño del ADN

Para evaluar la capacidad de una pantalla CRISPR combinada para identificar elementos reguladores que influyen en procesos biológicos adicionales, investigamos a continuación la respuesta mediada por p53 al daño del ADN. En primer lugar, utilizamos nuestra biblioteca CRISPR dirigida a genes para asegurarnos de que una pantalla CRISPR pudiera identificar los genes que codifican proteínas que se requieren para la detención del ciclo celular en respuesta al daño del ADN. Infectamos células 769P que expresan Cas9 con nuestra biblioteca de orientación genética en un MOI de

0,5 y una representación de 1000 células por sgRNA. Las células infectadas con la biblioteca se cultivaron en presencia del agente inductor de daños en el ADN doxorrubicina durante 21 días, se aisló el ADN genómico y se realizó una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con el pDNA de la biblioteca CRISPR (archivo adicional 8: Tabla S3 ). El análisis con MAGeCK reveló una fuerte correlación en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas, lo que indica que nuestros resultados de detección son altamente reproducibles (Fig. 4a, archivo adicional 18: Tabla S13). Identificamos varios sgRNA que impidieron la detención del ciclo celular en respuesta al daño del ADN. (Fig. 4a, archivo adicional 18: Tabla S13). Entre los sgRNA más enriquecidos se encuentran los que se dirigen a p53, CDKN1A y SLC30A1 (Fig. 4b, Fig. 4c, archivo adicional 19: Tabla S14). Estos datos demuestran que se puede utilizar un cribado CRISPR para identificar genes necesarios para la detención del ciclo celular en respuesta al daño del ADN.

Los elementos reguladores unidos a p53 influyen en la respuesta celular al daño del ADN. a Comparación de registro2 pliegues de cambios (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR dirigida a genes entre réplicas. B Tronco2 pliegues de cambios (en relación con el pDNA) en el cribado CRISPR para sgRNA que se dirigen a un subconjunto seleccionado de genes. Los valores de FDR se calcularon utilizando el método Benjamini-Hochberg. C Visualización del enriquecimiento / agotamiento de sgRNA que se dirigen a un subconjunto seleccionado de genes (rojo) en comparación con todos los sgRNA en la biblioteca CRISPR (negro). D Comparación de registro2 pliegues de cambios (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR de selección de picos entre réplicas. mi Gráfico de volcán que compara la importancia del enriquecimiento / agotamiento de sgRNA y el registro2 veces el cambio (en relación con el pDNA) para todos los sgRNA en la biblioteca CRISPR. F Visualización del enriquecimiento / agotamiento de sgRNA que se dirigen a un subconjunto seleccionado de picos (rojo) en comparación con todos los sgRNA en la biblioteca CRISPR (negro). gramo Comparación de registro2 veces el cambio (en relación con el pDNA) y la distancia desde el TSS anotado más cercano para todos los sgRNA en la biblioteca CRISPR

A continuación, utilizamos nuestra biblioteca CRISPRi de selección de picos para buscar elementos reguladores implicados en la respuesta mediada por p53 al daño del ADN. Infectamos células 769P que expresan dCas9-KRAB con nuestra biblioteca de selección de picos en un MOI de

0,5 y una representación de 1000 células por sgRNA. Las células infectadas con la biblioteca se cultivaron en presencia de doxorrubicina durante 21 días, se aisló el ADN genómico y se realizó una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con el pDNA de la biblioteca CRISPR (archivo adicional 12: Tabla S7). El análisis con MAGeCK reveló una correlación relativamente débil en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas (Fig. 4d). Es probable que esta correlación débil se deba a la combinación de una proliferación reducida en las células tratadas con doxorrubicina y los enriquecimientos / reducciones menos potentes observados en las pantallas realizadas con nuestra biblioteca CRISPR de selección de picos. A pesar de la débil correlación general en el enriquecimiento / agotamiento de sgRNA en las réplicas, pudimos identificar varios sgRNA que se enriquecieron significativamente en nuestra pantalla (Fig. 4e, archivo adicional 20: Tabla S15). Curiosamente, los tres picos que tuvieron el impacto más significativo en la detención del ciclo en respuesta al daño del ADN (pico 974, pico 975 y pico 976) se encuentran dentro de una ventana de 15 kb que rodea el sitio de inicio de la transcripción de CDKN1A. Aparte de p53, CDKN1A fue el gen más enriquecido en nuestra pantalla de daños en el ADN realizada con la biblioteca CRISPR dirigida a genes (Fig. 4b, c, f, archivo adicional 21: Tabla S16). Aunque la mayoría de los sitios de unión de p53 identificados en nuestro cribado se ubicaron dentro de los 10 kb de un TSS anotado, al menos uno se ubicó a más de 250 kb del TSS más cercano (Fig. 4g). En conjunto, estos datos proporcionan un ejemplo adicional de una pantalla CRISPR agrupada que se utiliza para identificar con éxito elementos reguladores funcionales.

Probamos nuevamente la capacidad de la tecnología CRISPRko para identificar elementos reguladores funcionales mediante la realización de una pantalla de respuesta al daño del ADN en células que expresan Cas9 en lugar de dCas9-KRAB. Infectamos células 769P que expresan Cas9 con nuestra biblioteca de selección de picos en un MOI de

0,5 y una representación de 1000 células por sgRNA. Las células infectadas con la biblioteca se cultivaron en presencia de doxorrubicina durante 21 días, se aisló el ADN genómico y se realizó una secuenciación dirigida para evaluar los cambios en la abundancia de sgRNA en relación con el pDNA de la biblioteca CRISPR (archivo adicional 15: Tabla S10). El análisis con MAGeCK reveló una correlación moderada en el enriquecimiento / agotamiento de sgRNA a través de réplicas biológicas (Archivo adicional 4: Figura S4A, Archivo adicional 22: Tabla S17). Si bien identificamos los sitios de unión de p53 en los que el knockout mediado por CRISPR previno la detención del ciclo celular en respuesta al daño del ADN, la magnitud del enriquecimiento de sgRNA fue menos significativa en comparación con la pantalla CRISPRi (archivo adicional 4: figura S4B, archivo adicional 23: tabla S18). Además, los enriquecimientos de sgRNA fueron mucho menos pronunciados de lo que observamos en la pantalla CRISPRi (archivo adicional 4: Figura S4C, Figura S4D). Una vez más, observamos una superposición mínima en los sgRNA que se enriquecieron / agotaron significativamente en las pantallas CRISPRko y CRISPRi de la respuesta al daño del ADN (archivo adicional 4: Figura S4E). Además, ninguno de los sitios de unión de p53 que parecían afectar la respuesta al daño del ADN en CRISPRko se ubicaron cerca de genes que se enriquecieron / agotaron significativamente en nuestra pantalla CRISPR dirigida a genes. Basándonos en estos datos, centramos nuestros esfuerzos de validación en los sitios de unión de p53 identificados en nuestra pantalla CRISPRi.

La represión de los elementos reguladores unidos a p53 previene la detención del ciclo celular en respuesta al daño del ADN

Entre los sgRNA que se enriquecieron más en nuestro cribado CRISPRi de detección de picos de la respuesta al daño del ADN se encontraban los que se dirigían a los picos de ChIP-Seq más cercanos a CDKN1A (Fig. 4f). Más específicamente, el pico 975 se superpone al CDKN1A TSS, el pico 974 está ubicado 10 kb aguas arriba del CDKN1A TSS y el pico 976 está ubicado 5 kb aguas abajo del CDKN1A TSS (Fig. 5a). El pico 975 contiene tres motivos de consenso de p53 y múltiples sgRNA que se dirigen al primero de esos motivos se enriquecieron significativamente en nuestro cribado CRISPRi (Fig. 5b). El pico 976 contiene ocho motivos de consenso de p53 e identificamos sgRNA que se dirigen a varios de esos motivos que se enriquecieron significativamente en nuestra pantalla CRISPRi (Fig. 5c). Por último, el pico 974 contiene cuatro motivos de consenso de p53 y los sgRNA que se dirigen a cada uno de esos motivos se enriquecieron significativamente en nuestra pantalla CRISPRi, aunque la magnitud del enriquecimiento no fue tan pronunciada como con los sgRNA que se dirigen al pico 975 y al pico 976 (figura 5d). Presumimos que los sitios de unión de p53 ubicados dentro de estos picos de ChIP-Seq son componentes de elementos reguladores que modulan la expresión de CDKN1A y seleccionamos un sgRNA dirigido al pico 975 para la validación experimental.

Caracterización funcional de elementos reguladores unidos a p53 que influyen en la respuesta celular al daño del ADN. a Esquema de los motivos de p53 y dianas de sgRNA ubicadas en los picos 974, 975 y 976. (Leyenda de la pista de ChromHMM: rojo = promotor activo naranja = potenciador fuerte amarillo = potenciador débil / equilibrado verde oscuro = transición / elongación transcripcional verde claro = transcrito débil) (b-d) Tronco2 pliegues de cambios (en relación con el pDNA) en la pantalla CRISPR para el direccionamiento de sgRNA B Pico 975, C Pico 976, y D Pico 974. Los valores de FDR se calcularon utilizando el método Benjamini-Hochberg. mi Esquema de motivos de p53 y dianas de sgRNA ubicadas en el pico 685. F Tronco2 pliegues de cambios (en relación con el pDNA) en el cribado CRISPR para sgRNA que se dirigen al pico 685. Los valores de FDR se calcularon utilizando el método Benjamini-Hochberg. gramo Análisis del ciclo celular de la respuesta al daño del ADN después de la inhibición del pico 975 o del pico 685. PAGLos valores se calcularon utilizando la prueba t de Student de dos colas no apareados con varianzas iguales. **PAG & lt 0.01

También entre los sgRNA más enriquecidos en nuestro cribado CRISPRi de selección de picos de la respuesta al daño del ADN se encontraba uno dirigido al pico 685 (Fig. 4e). El pico 685 se encuentra a más de 250 kb del gen codificante de proteína anotado más cercano y contiene dos motivos p53, ambos dirigidos por sgRNA en nuestra biblioteca CRISPR dirigida a picos (Fig. 5e). Identificamos un sgRNA dirigido al segundo de esos motivos que se enriqueció significativamente en nuestra pantalla CRISPRi de focalización de picos (Fig. 5f). Presumimos que este sitio de unión de p53 es un componente de un elemento regulador ubicado en lo profundo de una región intergénica del genoma y seleccionamos un sgRNA dirigido al pico 685 para la validación experimental.

Para validar experimentalmente que los sitios de unión de p53 seleccionados representan elementos reguladores funcionales, evaluamos el impacto de reprimir los sitios de unión individuales en la detención del ciclo celular en respuesta al daño del ADN. Usamos lentivirus para transducir de manera estable ARNsg individuales dirigidos a sitios de interés de unión de p53 en células 769P que expresan dCas9-KRAB. Además, generamos líneas celulares estables que expresan dCas9-KRAB que albergan un sgRNA dirigido a p53, un sgRNA dirigido a una región intergénica del genoma o un sgRNA sin objetivo genómico. Las 5 líneas celulares resultantes se cultivaron en presencia o ausencia de doxorrubicina durante 16 h, seguido de análisis del ciclo celular (archivo adicional 5: Figura S5). Todas las líneas celulares estables que generamos mostraron perfiles de ciclo celular similares en condiciones de cultivo estándar, con un 12-15% del total de células en fase S (Fig. 5g). En respuesta al tratamiento con doxorrubicina, las líneas celulares que albergaban sgRNA de control negativo cayeron al 0,5% del total de células en la fase S (Fig. 5g). Por el contrario, el 10% de las células que albergan ARNsg que se dirigen a p53 permanecieron en la fase S después del tratamiento con doxorrubicina (Fig. 5g). Asimismo, las células que contienen sgRNA que se dirigen al pico 975 y al pico 685 mostraron niveles significativamente más bajos de detención del ciclo celular con 4,27 y 3,72% del total de células en fase S, respectivamente (Fig. 5g). En conjunto, estos resultados confirman que las pantallas CRISPR agrupadas se pueden utilizar para identificar elementos reguladores funcionales que influyen en la respuesta al daño del ADN. Además, estos datos demuestran además que el cribado CRISPR agrupado se puede utilizar como un enfoque general para identificar elementos reguladores funcionales que influyen en diversos procesos biológicos.


Afiliaciones

Departamento de Ingeniería Biomédica, Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Timothy Gilpatrick, Isac Lee y Winston Timp

Oxford Nanopore Technologies, Oxford, Reino Unido

James E. Graham, Etienne Raimondeau, Rebecca Bowen y Andrew Heron

Departamento de Oncología, Facultad de Medicina Johns Hopkins, Baltimore, MD, EE. UU.

Bradley Downs y amp Saraswati Sukumar

Centro de secuenciación del genoma humano, Baylor College of Medicine, Houston, TX, EE. UU.

Departamento de Biología Molecular y Genética, Departamento de Medicina, División de Enfermedades Infecciosas, Escuela de Medicina Johns Hopkins, Baltimore, MD, EE. UU.

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Contribuciones

T.G. y W.T. construyeron el estudio. T.G. realizó los experimentos. T.G., I.L. y F.S. analizó los datos. T.G., J.G., E.R., R.B. y A.H. desarrollaron el método. S.S. y B.D. proporcionó tejido mamario primario y generó los xenoinjertos de ratón. T.G. y W.T. escribieron el artículo.

Autor correspondiente


Opciones de acceso

Obtenga acceso completo a la revista durante 1 año

Todos los precios son precios NETOS.
El IVA se agregará más adelante en el proceso de pago.
El cálculo de impuestos se finalizará durante el pago.

Obtenga acceso a artículos por tiempo limitado o completo en ReadCube.

Todos los precios son precios NETOS.


Herramientas computacionales específicas para analizar datos de secuenciación de metilación del ADN

La siguiente sección describe varias herramientas que se han desarrollado para analizar los datos de secuenciación de metilación del ADN generados utilizando los diferentes protocolos experimentales presentados anteriormente. Para cada técnica experimental, indicamos qué herramienta creemos que es la opción óptima para un científico con conocimientos limitados en análisis de datos computacionales. Para la selección y recomendaciones, usamos criterios de desempeño (desde el procesamiento de lecturas sin procesar hasta el análisis diferencial), opciones de salida gráfica y disponibilidad de un manual detallado (ver Tabla 1). Además, tomamos en cuenta criterios más prácticos, como lo fácil que era descargar, instalar y ejecutar la herramienta en particular, basándonos en la experiencia personal. Las herramientas se recomiendan para cada protocolo experimental, según el número de criterios que se puedan cumplir. Las recomendaciones se analizan con más detalle en la sección "Discusión".

Herramientas seleccionadas para el análisis de datos de secuenciación de bisulfito

Solo unas pocas herramientas pueden realizar todos o la mayoría de los pasos necesarios en el análisis de datos. Por ejemplo, BS Buscador, Bismark, y BSMAP son adecuados para secuenciación de bisulfito leer alineación solamente [37, 40, 42], mientras que GBSA y BSsuave son para análisis específicos posteriores [51, 60]. BS Buscador realiza llamadas de alineación y metilación, pero no calcula la relación de metilación ni las puntuaciones beta [42]. Por otra parte, Bicicleta es capaz de realizar todos los pasos necesarios y es relativamente universal para diferentes plataformas [54], mientras que SMAP es un gran ejemplo de una canalización conveniente, pero adecuada solo para datos RRBS [55].

BSsuave es una herramienta para el análisis de datos WGBS que realiza la alineación de las lecturas, mide los niveles de metilación y detecta DMR cuando se dispone de réplicas biológicas [51]. BSsuave tiene en cuenta la variabilidad biológica (no solo la muestra) al buscar DMR. El algoritmo detecta regiones que constan de varios CpG, por lo que se perderán en los resultados CpG individuales metilados diferencialmente significativos biológicamente, lo que puede ser una desventaja en un entorno de investigación [51]. Trabajando con el BSsuave El algoritmo puede ser un desafío para muchos usuarios, ya que los datos deben procesarse previamente y adaptarse para el análisis en un entorno R. Teniendo en cuenta el nivel de dificultad y las capacidades limitadas de la herramienta, por lo tanto, no se recomienda para la mayoría de los usuarios (Tabla 1).

MOABS (Análisis basado en modelos de datos de secuenciación de bisulfito) es una de las canalizaciones basadas en líneas de comando más potentes que son adecuadas para el análisis de datos WGBS, RRBS y 5hmC [52]. Es capaz de realizar alineaciones, llamadas de metilación, identificación de DMP y DMR y análisis de metilación diferencial (Tabla 1). Informa de un valor único que combina la significación biológica y estadística para la metilación diferencial: diferencia de metilación creíble (CDIF) [52]. Dado que la canalización no informa la puntuación beta de metilación, puede ser difícil comparar los resultados de MOABS con resultados de otros proyectos de investigación. los MOABS pipeline ofrece potentes algoritmos para el análisis de datos. Sin embargo, la configuración del análisis es complicada y probablemente demasiado complicada para los usuarios sin experiencia con respecto al uso de la línea de comandos. Parece complicado organizar los archivos de entrada y salida, y el usuario debe estar muy familiarizado con la escritura de definiciones y rutas. MOABS se puede ejecutar escribiendo un script maestro / de configuración o usando líneas de comando. El uso de un script de configuración es más conveniente, pero todo el análisis se realiza a la vez, lo que puede ser exigente con respecto a la potencia computacional y el tiempo de la CPU.

MethPipe es una tubería similar a MAOBS e integra varias herramientas para el análisis de datos de metilación, que incluyen alineación, llamada de metilación, análisis de regiones hipo e hipermetiladas y análisis de metilación diferencial (Tabla 1). También es aplicable para el análisis de hidroximetilación del ADN [53, 61]. Sin embargo, MethPipe es considerablemente más difícil de usar, en comparación con Bicicleta, SMAP, o incluso MOABS, ya que requiere que se escriban y ejecuten aún más comandos. Por otro lado, escribir y ejecutar comandos individuales en la tubería permite una cantidad máxima de control sobre el proceso: se puede ejecutar en pequeños pasos, con archivos de salida nombrados y ordenados según las preferencias del usuario. Es más, MethPipe tiene una documentación extensa con instrucciones detalladas, que es útil leer incluso sin tener la intención de utilizar la tubería en sí, ya que describe los principios básicos del análisis de datos de metilación del ADN [61]. MethPipe Los desarrolladores también han creado y seleccionado una base de datos de metilomas de referencia. MethBase, que puede ser útil para comparaciones biológicas [53]. Por ejemplo, agregando pistas de metilomas de diferentes tejidos humanos y líneas celulares al navegador UCSC y comparándolos con sus propios datos. Datos de MethBase puede descargarse usando UCSC Table Browser o desde el MethBase sitio web para metilomas individuales, donde los archivos contienen niveles de metilación e información de cobertura para cada CpG.

MOABS y MethPipe podría ser la canalización elegida por los usuarios más experimentados. Sin embargo, debido a su alta funcionalidad y su línea de comando fácil de usar, Bicicleta es la tubería principal que sugerimos para que la utilicen científicos con diferentes antecedentes.

Bicicleta (recomendado para WGBS, BS-seq dirigido y TAB-seq )

Bicicleta es una tubería para el análisis computacional de datos de secuenciación de bisulfito que es más poderosa o al menos tan poderosa como MOABS o MethPipe, pero innegablemente más fácil de usar, lo cual es un gran beneficio para los científicos sin habilidades computacionales avanzadas [54]. La tubería puede realizar todos los pasos necesarios, desde la conversión y la indexación del genoma de referencia hasta el análisis de metilación diferencial (Tabla 1). La herramienta es adecuada para lecturas de dos extremos y de un solo extremo. Bicicleta tiene varias ventajas sobre otras tuberías e incluye más opciones que cualquier otra tubería de análisis de secuenciación de bisulfito [54]. Puede analizar la eficiencia de la conversión de bisulfito, que es importante para la estimación correcta de los niveles de metilación. Además, identifica y elimina lecturas ambiguas, que no se incluyen en otras canalizaciones. La eliminación de lecturas clonales también es un Bicicleta característica que no se cubre a menudo en las tuberías de metilación. Ninguna otra tubería tiene una opción de corrección de contexto que no sea de CG a CG, mientras que Bicicleta lo realiza automáticamente durante el análisis de metilación.

El análisis de metilación de las lecturas de secuenciación sin procesar y el posterior análisis de metilación diferencial se pueden realizar con solo 4 comandos, y se requieren 2 comandos adicionales solo cuando se usa un genoma de referencia por primera vez [54].

Los 6 pasos en la tubería (archivo adicional 1):

Creando un proyecto. Todos los archivos de salida se guardan en una carpeta.

Creación de dos genomas de referencia bisulfitados in silico. Conversión de C a T para lecturas de hebras de Watson y conversión de G a A para lecturas de hebras de Crick.

Indexación de los genomas de referencia. Los pasos 2 y 3 deben ejecutarse solo como referencia cuando se utilizan por primera vez.

Análisis de metilación y llamada de metilcitosina.

Determinación de DMP y DMR. Las posiciones diferencialmente metiladas siempre se determinan, pero cuando se determinan las regiones de interés, solo se informan las posiciones relevantes junto con las regiones diferencialmente metiladas.

Bicicleta crea dos versiones bisulfitadas in silico de genomas de referencia: la conversión de C a T se realiza para acomodar las lecturas de la hebra de Watson y la conversión de G a A para las lecturas de la hebra de Crick [54]. Luego se indexan dos versiones de referencias. Las lecturas se procesan al mismo tiempo y se asignan a las referencias que ejecutan dos subprocesos separados. El comando de mapeo genera archivos SAM, que luego se convierten automáticamente en archivos BAM y se indexan con SAMtools [54].

Cada citosina se visita y se asigna a un contexto de metilación (CG, CHG o CHH). Se realizan el cálculo del nivel de metilación y la llamada de metilación [54]. Varias correcciones, que pueden controlarse mediante opciones, se realizan automáticamente. Por ejemplo, si una citosina se asigna inicialmente a CHG o CHH debido a un polimorfismo de un solo nucleótido (SNP), se reasigna correctamente a un CG. En este paso, se pueden aplicar filtros: ignorar las lecturas ambiguas, descartar las lecturas clonales y mantener la de mayor calidad, filtrar las lecturas convertidas incorrectamente [54]. Durante la llamada de metilación, en cada posición, la bicicleta estima la tasa de error en la conversión de bisulfito calculando el error como el porcentaje de C no convertido de un genoma de control no metilado (cuando está incluido en el experimento), calculando el error como el porcentaje de no convertido códigos de barras (cuando se adjuntaron códigos de barras con C sin metilar a las lecturas antes de la conversión de bisulfito) o mediante el uso de una tasa de error fija especificada [54].

La importante ventaja del Bicicleta pipeline es que también puede realizar un análisis de metilación diferencial. Tanto los DMP como los DMR se calculan comparándolos con grupos de muestras (control y condición). El análisis estadístico se basa en el algoritmo MethylSig [62].

Bicicleta se puede adaptar para el análisis de 5hmC, identificado mediante el método TAB-seq. 5hmC se informaría como citosina metilada durante el análisis con la tubería. El análisis también debe estar disponible para los datos de oxBS-seq, pero luego las posiciones que se superponen entre oxBS-seq y BS-seq de la misma muestra deben descartarse para identificar 5hmC pero dejar modificaciones de 5mC.

SMAP (recomendado para RRBS)

SMAP es otro ejemplo de un proceso de análisis de datos de secuenciación de bisulfito [55]. Se centra en el análisis de datos RRBS desde la preparación de referencias hasta la detección de DMP, DMR, SNP y metilación específica de alelos (ASM). En el paso 1 de la tubería, el genoma de referencia se prepara convirtiendo todas las C en Ts para ambas hebras e indexando esas hebras. La referencia se corta en regiones objetivo, según la enzima que se utilizó en el protocolo RRBS. En el paso 2, las lecturas se recortan y alinean en el paso 3 (archivo adicional 1). Se pueden elegir dos algoritmos de alineación: Bowtie2 o bsmap y sus opciones seleccionadas. En el paso 4, se calculan los niveles de metilación para las regiones objetivo. Los DMP y los DMR se detectan en el paso 5 utilizando la prueba exacta de Fisher cuando el número de semillas es menor que 5. De lo contrario, t La prueba o las pruebas de chi-cuadrado se eligen automáticamente. Los SNP y ASM se analizan en el paso 6 utilizando Bis-SNP o Bcftools. Luego, los SNP heterocigotos se filtran para la detección de eventos de ASM. En un paso final, los resultados se resumen en un informe [55].

Alternativas basadas en la web a las herramientas de línea de comandos

Hay varias canalizaciones en línea para el análisis de metilación, donde los datos propios se pueden cargar y analizar utilizando una interfaz visual en lugar de una línea de comandos. Sin embargo, a menudo las plataformas en línea requieren un mantenimiento frecuente, y la falta de este conduce a un rendimiento deficiente del sitio web, errores molestos y bloqueos. Otra preocupación importante es la protección de datos para datos genéticos humanos sensibles en servidores o nubes utilizados por la plataforma en particular, ya que los datos deben cargarse para realizar el análisis, y dicho manejo y almacenamiento de datos sigue siendo un tema de discusión [63,64,65 ].

Genestack.com es una plataforma en línea que ofrece canales para el análisis de varios tipos de datos, incluidos WGBS (y RRBS) (https://genestack.com) [56]. Está disponible una prueba gratuita de 30 días para probar las herramientas. Sin embargo, desde septiembre de 2019 el acceso a la Genestack La plataforma ha sido restringida y después del período de prueba gratuito se requiere una suscripción paga. La plataforma es visualmente agradable y visualiza los resultados de todos los pasos necesarios del proceso de análisis de datos de metilación, lo cual es una gran ventaja, en comparación con las herramientas basadas en la línea de comandos. Desafortunadamente, la carga de big data no es lo suficientemente eficiente y requiere mucho tiempo. La ventaja es que las cargas se pueden reanudar después de un tiempo, incluso si la computadora está apagada o la conexión a Internet se interrumpe. Además, algunos de los datos públicos disponibles ya son accesibles y no es necesario cargarlos. Sin embargo, el acceso de las herramientas y su aplicación a los datos puede resultar confuso, ya que no están bien listados en el menú. Para hacerlo más fácil, hay un administrador de tareas disponible para rastrear la actividad y acceder a los resultados. además, el Genestack El sitio web tiene varios tutoriales completos, creados especialmente para WGBS, RNA-Seq y otros datos ómicos.

El mapeo del genoma de referencia se realiza utilizando el BSMAP algoritmo, y se pueden elegir varias opciones tales como el número de desajustes o el protocolo de generación de datos BS. Desafortunadamente, la metilación diferencial no está disponible en Genestack, que es una desventaja significativa de la plataforma. En general, considerando las desventajas de la plataforma y las controversias con respecto al tratamiento de datos sensibles, esta plataforma no sería nuestra primera opción para el análisis de datos (Tabla 1).

Procesamiento de datos MeDIP-seq

Las primeras herramientas desarrolladas específicamente para el análisis de datos MeDIP-seq fueron hombre murciélago y MEDIPS (que es posiblemente la herramienta más utilizada para el análisis de datos de MeDIP), pero estas herramientas no realizan control de calidad ni mapeo de las lecturas [57]. Por lo tanto, se requieren herramientas adicionales para preparar los datos para el análisis, lo que requiere mucho tiempo y puede ser un desafío computacional. Como solución, existen varias canalizaciones que combinan varias herramientas, incluyendo MEDIPS. Las canalizaciones descritas y recomendadas con más frecuencia en varias publicaciones son MeQA y Medusa.

Huang y col. creó el MeQA canalización para "preprocesamiento, evaluación de la calidad de los datos y distribución de lecturas de secuencias, y estimación de los niveles de metilación del ADN de los conjuntos de datos MeDIP-seq" [57]. Para ejecutar la canalización, se debe preparar un archivo de configuración, que luego es llamado por una línea de comando. La tubería consta de dos partes principales. La Parte A realiza un control de calidad (resumido en un informe pdf con gráficos) y una alineación que da como resultado archivos BAM y control de calidad de alineación. Los índices y el genoma de referencia se descargan automáticamente de UCSC, lo cual es una gran ventaja de MeQA. Los niveles de metilación del ADN se estiman en la parte B y las regiones mapeadas se extraen en formato BED. Se identifican las regiones o partes de regiones que corresponden a promotores, promotores bidireccionales, genes o cadena abajo de genes y se estima el enriquecimiento de CpG. Se genera un resumen de los resultados.

Desafortunadamente, MeQA no realiza análisis de metilación diferencial (análisis DMR) [57]. Además, actualmente el pipeline parece no estar disponible, lo que nos impide recomendarlo.

MeDUSA (recomendado para análisis de datos MeDIP-seq)

Medusa (Utilidad de ADN metilado para el análisis de secuencias) es una tubería para el análisis de datos MeDIP-seq que se centra en la detección precisa de DMR [43, 58]. Contiene varios paquetes para realizar un análisis completo de los datos MeDIP-seq: alineación de secuencia, control de calidad e identificación DMR (Tabla 1) [58]. BWA se utiliza para la alineación, SAMtools para el filtrado posterior, y FastQC para métricas de control de calidad. Medusa integra y utiliza MEDIPS como herramienta para el análisis de metilación. La canalización se ejecuta escribiendo un archivo de configuración, que ejecuta los scripts de la canalización. La plantilla y los archivos de configuración de ejemplo están disponibles para descargar.

La tubería consta de cuatro partes. En la parte 1, se realiza la alineación de lecturas y filtrado, utilizando BWA y SAMtools. Algunos de los parámetros de alineación se configuran en el archivo de configuración, mientras que se pueden agregar más modificando el script de la parte 1. El script de la parte 2 se ejecuta MEDIPS y su control de calidad y genera pistas WIG para hebras individuales y ambas hebras combinadas. Las pistas se convierten al formato bigWig. Los DMR se llaman en la parte 3 usando MEDIPS. En la parte 4, estos DMR están anotados (archivo adicional 1). En este paso, se requieren archivos de anotaciones y deben estar escritos en formato de archivo GFF y organizados en la estructura de directorio correcta. Los archivos de anotaciones están disponibles junto con MeDUSA v2.0, mientras que la versión más reciente 2.1 no incluye estos archivos. Sin embargo, se pueden copiar fácilmente de una versión a otra.

Procesamiento de datos MRE-seq

MRE-seq no es el enfoque más popular para estudiar la metilación del ADN, aunque algunos conjuntos de datos están disponibles públicamente y pueden utilizarse. Por lo tanto, no es común desarrollar herramientas y canalizaciones específicas para este tipo de datos. Sin embargo, R Bioconductor tiene un paquete solo para datos de secuenciación de enzimas de restricción sensibles a la metilación, msgbsR [44].

MsgbsR (recomendado para análisis de datos MRE-seq)

El genotipado sensible a la metilación mediante la secuenciación del paquete R (msgbsR) contiene una colección de funciones para el análisis de datos MRE-seq [44, 59]. Sin embargo, la entrada debe ser archivos BAM indexados, lo que significa que el usuario debe realizar un preprocesamiento de datos antes de usar msgbsR. Esto se puede hacer con Bowtie2 o BWA alineadores. msgbsR luego identifica y cuantifica los recuentos de lecturas en los sitios metilados. También se verifican los sitios de corte de la enzima y se evalúa la metilación del ADN en función de la cobertura de lectura [44]. Una de las ventajas de este paquete es el análisis de metilación diferencial.

En la canalización, se leen los archivos BAM de entrada. Luego, se extraen y controlan los sitios de corte. Los cortes incorrectos se filtran y se genera una tabla de recuento de lecturas preliminar. msgbsR puede trazar los resultados usando plotCounts.

El usuario debe tener en cuenta que este paquete requiere preprocesamiento de datos brutos y conocimiento del lenguaje de programación R y el análisis de datos MRE-seq significa que tanto el lenguaje de programación R como las herramientas de línea de comandos deberán usarse. Sin embargo, en el sitio web se proporciona un script de ejemplo junto con un manual [59].


Referencias

Goll MG, Bestor TH. Citosina metiltransferasas eucariotas.Annu Rev Biochem. 200574: 481–514.

Lister R, Pelizzola M, Dowen RH, Hawkins RD, Hon G, Tonti-Filippini J, et al. Los metilomas del ADN humano en la resolución de la base muestran diferencias epigenómicas generalizadas. Naturaleza. 2009462: 315–22.

Laurent L, Wong E, Li G, Huynh T, Tsirigos A, Ong CT, et al. Cambios dinámicos en el metiloma humano durante la diferenciación. Genome Res. 201020: 320–31.

Bergman Y, Cedar H. Dinámica de metilación del ADN en la salud y la enfermedad. Nat Struct Mol Biol. 201320: 274–81.

Busche S, Ge B, Vidal R, Spinella JF, Saillour V, Richer C, et al. Integración de análisis de metilomas y transcriptomas de alta resolución para diseccionar los cambios epigenómicos en la leucemia linfoblástica aguda infantil. Cancer Res. 201373: 4323–36.

Kleinman CL, Gerges N, Papillon-Cavanagh S, Sin-Chan P, Pramatarova A, Quang DA, et al. La fusión de TTYH1 con el grupo de microARN C19MC impulsa la expresión de una isoforma DNMT3B específica del cerebro en el tumor cerebral embrionario ETMR. Nat Genet. 201446: 39–44.

Huynh JL, Garg P, Thin TH, Yoo S, Dutta R, Trapp BD, et al. Diferencias en todo el epigenoma en regiones libres de patología de cerebros afectados por esclerosis múltiple. Nat Neurosci. 201417: 121–30.

De Jager PL, Srivastava G, Lunnon K, Burgess J, Schalkwyk LC, Yu L, et al. Enfermedad de Alzheimer: alteraciones tempranas en la metilación del ADN cerebral en ANK1, BIN1, RHBDF2 y otros loci. Nat Neurosci. 201417: 1156–63.

Liu Y, Aryee MJ, Padyukov L, Fallin MD, Hesselberg E, Runarsson A, et al. Los datos de asociación de todo el epigenoma implican a la metilación del ADN como un intermediario del riesgo genético en la artritis reumatoide. Nat Biotechnol. 201331: 142–7.

Liang L, Willis-Owen SA, Laprise C, Wong KC, Davies GA, Hudson TJ, et al. Un estudio de asociación de todo el epigenoma de la concentración sérica total de inmunoglobulina E. Naturaleza. 2015520 (7549): 670–4.

Petersen AK, Zeilinger S, Kastenmuller G, Romisch-Margl W, Brugger M, Peters A, et al. La epigenética se encuentra con la metabolómica: un estudio de asociación de todo el epigenoma con rasgos metabólicos del suero sanguíneo. Hum Mol Genet. 201423: 534–45.

Dick KJ, Nelson CP, Tsaprouni L, Sandling JK, Aissi D, Wahl S, et al. Metilación del ADN e índice de masa corporal: un análisis de todo el genoma. Lanceta. 2014383: 1990–8.

Irvin MR, Zhi D, Joehanes R, Mendelson M, Aslibekyan S, Claas SA, et al. Estudio de asociación de todo el epigenoma de los lípidos en sangre en ayunas en el estudio sobre la genética de fármacos reductores de lípidos y la red de dietas. Circulación. 2014130 (7): 565–72.

Grundberg E, Meduri E, Sandling JK, Hedman AK, Keildson S, Buil A, et al. El análisis global de la variación de la metilación del ADN en el tejido adiposo de gemelos revela vínculos con variantes asociadas a la enfermedad en elementos reguladores distales. Soy J Hum Genet. 201393: 876–90.

Ziller MJ, Gu H, Muller F, Donaghey J, Tsai LT, Kohlbacher O, et al. Trazar un panorama dinámico de metilación del ADN del genoma humano. Naturaleza. 2013500: 477–81.

Hon GC, Rajagopal N, Shen Y, McCleary DF, Yue F, Dang MD, et al. Memoria epigenética en potenciadores embrionarios identificados en mapas de metilación de ADN de tejidos de ratones adultos. Nat Genet. 201345: 1198–206.

Stadler MB, Murr R, Burger L, Ivanek R, Lienert F, Scholer A, et al. Los factores de unión al ADN dan forma al metiloma del ratón en las regiones reguladoras distales. Naturaleza. 2011480: 490–5.

Xie W, Barr CL, Kim A, Yue F, Lee AY, Eubanks J, et al. Análisis de resolución de bases de la metilación del ADN dependiente de la secuencia y del padre de origen en el genoma del ratón. Celda. 2012148: 816–31.

Shirane K, Toh H, Kobayashi H, Miura F, Chiba H, Ito T, et al. Los metilomas de ovocitos de ratón en resolución de bases revelan la acumulación de metilación no CpG en todo el genoma y el papel de las metiltransferasas de ADN. PLoS Genet. 20139: e1003439.

Patil V, Ward RL, Hesson LB. La evidencia de metilación funcional no CpG en células de mamíferos. Epigenética. 20149 (6): 823–8.

Ziller MJ, Hansen KD, Meissner A, Aryee MJ. Recomendaciones de cobertura para el análisis de metilación mediante secuenciación de bisulfito de genoma completo. Métodos Nat. 201512 (3): 230–2.

Grundberg E, Small KS, Hedman AK, Nica AC, Buil A, Keildson S, et al. Mapeo de efectos reguladores cis y trans en múltiples tejidos en gemelos. Nat Genet. 201244: 1084–9.

Spector TD, Williams FM. Registro de gemelos adultos del Reino Unido (TwinsUK). Genet Twin Res Hum. 20069: 899–906.

Dunham I, Kundaje A, Aldred SF, Collins PJ, Davis CA, Doyle F, et al. Una enciclopedia integrada de elementos del ADN en el genoma humano. Naturaleza. 2012489: 57–74.

Sherry ST, Ward MH, Kholodov M, Baker J, Phan L, Smigielski EM, et al. dbSNP: la base de datos NCBI de variación genética. Ácidos nucleicos Res. 200129: 308–11.

Hamburguesa L, Gaidatzis D, Schubeler D, Stadler MB. Identificación de regiones reguladoras activas a partir de datos de metilación del ADN. Ácidos nucleicos Res. 201341: e155.

Allum F, Shao X, Guénard F, Simon MM, Busche S, Caron M, et al. La caracterización de los metilomas funcionales mediante la secuenciación de captura de próxima generación identifica nuevas variantes asociadas a enfermedades. Nat Commun. 20156: 7211.

Bernstein BE, Stamatoyannopoulos JA, Costello JF, Ren B, Milosavljevic A, Meissner A, et al. El Consorcio de Mapeo de Epigenómica Roadmap de los NIH. Nat Biotechnol. 201028: 1045–8.

Rada-Iglesias A, Ameur A, Kapranov P, Enroth S, Komorowski J, Gingeras TR, et al. Los mapas del genoma completo de la unión de USF1 y USF2 y la acetilación de la histona H3 revelan nuevos aspectos de la estructura del promotor y genes candidatos para trastornos humanos comunes. Genome Res. 200818: 380–92.

Heintzman ND, Hon GC, Hawkins RD, Kheradpour P, Stark A, Harp LF, et al. Las modificaciones de histonas en los potenciadores humanos reflejan la expresión génica global específica del tipo de célula. Naturaleza. 2009459: 108–12.

Dyke SO, Cheung WA, Joly Y, Ammerpohl O, Lutsik P, Rothstein MA, et al. Publicación de datos del epigenoma: un enfoque centrado en el participante para la protección de la privacidad. Genome Biol. 201516: 142.

Kasowski M, Kyriazopoulou-Panagiotopoulou S, Grubert F, Zaugg JB, Kundaje A, Liu Y, et al. Amplia variación en los estados de la cromatina en los seres humanos. Ciencias. 2013342: 750–2.

Heinz S, Benner C, Spann N, Bertolino E, Lin YC, Laslo P, et al. Las combinaciones simples de factores de transcripción determinantes del linaje priman los elementos reguladores en cis necesarios para las identidades de los macrófagos y las células B. Mol Cell. 201038: 576–89.

Deblois G, Giguere V. Genómica funcional y fisiológica de los receptores relacionados con los estrógenos (ERR) en la salud y la enfermedad. Biochim Biophys Acta. 20111812: 1032–40.

Luo J, Sladek R, Carrier J, Bader JA, Richard D, Giguere V. Reducción de la masa de grasa en ratones que carecen de receptor nuclear alfa huérfano relacionado con el estrógeno. Mol Cell Biol. 200323: 7947–56.

Tontonoz P, Graves RA, Budavari AI, Erdjument-Bromage H, Lui M, Hu E, et al. El factor de transcripción ARF6 específico de adipocitos es un complejo heterodimérico de dos receptores de hormonas nucleares, PPAR gamma y RXR alfa. Ácidos nucleicos Res. 199422: 5628–34.

Singh MV, Ntambi JM. El factor nuclear 1 es esencial para la expresión del gen de la estearoil-CoA desaturasa 1 durante la diferenciación de preadipocitos. Biochim Biophys Acta. 19981398: 148–56.

Yang VW, Christy RJ, Cook JS, Kelly TJ, Lane MD. Mecanismo de regulación del gen 422 (aP2) por cAMP durante la diferenciación de preadipocitos. Proc Natl Acad Sci U S A. 198986: 3629–33.

Breitling LP, Yang R, Korn B, Burwinkel B, Brenner H. Metilación diferencial del ADN relacionada con el tabaquismo: descubrimiento y replicación de 27 K. Soy J Hum Genet. 201188: 450–7.

Shenker NS, Polidoro S, van Veldhoven K, Sacerdote C, Ricceri F, Birrell MA, et al. El estudio de asociación de todo el epigenoma en la Investigación prospectiva europea sobre el cáncer y la nutrición (EPIC-Turín) identifica nuevos loci genéticos asociados con el tabaquismo. Hum Mol Genet. 201322: 843–51.

Zeilinger S, Kuhnel B, Klopp N, Baurecht H, Kleinschmidt A, Gieger C y col. El tabaquismo produce cambios importantes en la metilación del ADN en todo el genoma. Más uno. 20138: e63812.

Tsaprouni LG, Yang TP, Bell J, Dick KJ, Kanoni S, Nisbet J y col. Fumar cigarrillos reduce los niveles de metilación del ADN en múltiples loci genómicos, pero el efecto es parcialmente reversible al dejar de fumar. Epigenética. 20149: 1382–96.

Bukvic BK, Blekic M, Simpson A, Marinho S, Curtin JA, Hankinson J, et al. Severidad del asma, polimorfismos en 20p13 y su interacción con la exposición al humo del tabaco. Pediatr Allergy Immunol. 201324: 10–8.

Gieger C, Radhakrishnan A, Cvejic A, Tang W, Porcu E, Pistis G, et al. Nuevas funciones de genes en la megacariopoyesis y la formación de plaquetas. Naturaleza. 2011480: 201–8.

Ziller MJ, Muller F, Liao J, Zhang Y, Gu H, Bock C, et al. Distribución genómica y variación entre muestras de la metilación sin CpG en los tipos de células humanas. PLoS Genet. 20117: e1002389.

Guo JU, Su Y, Shin JH, Shin J, Li H, Xie B, et al. Distribución, reconocimiento y regulación de la metilación no CpG en el cerebro de mamíferos adultos. Nat Neurosci. 201417: 215–22.

Step SE, Lim HW, Marinis JM, Prokesch A, Steger DJ, You SH, et al. La rosiglitazona antidiabética remodela el transcriptoma de los adipocitos al redistribuir la transcripción a potenciadores impulsados ​​por PPARgamma. Genes Dev. 201428: 1018–28.

Nica AC, Partes L, Vidrio D, Nisbet J, Barrett A, Sekowska M, et al. La arquitectura de la variación reguladora de genes en múltiples tejidos humanos: el estudio MuTHER. PLoS Genet. 20117: e1002003.

Johnson MD, Mueller M, Juego L, Aitman TJ. Análisis de un solo nucleótido de la metilación de citosina mediante secuenciación de bisulfito de escopeta de genoma completo. Curr Protoc Mol Biol. 2012 Capítulo 21: Unidad 21.23.

Liu Y, Siegmund KD, Laird PW, Berman BP. Bis-SNP: Metilación de ADN combinada y SNP que requieren datos de Bisulfite-seq. Genome Biol. 201213: R61.

Guenard F, Houde A, Bouchard L, Tchernof A, Deshaies Y, Biron S, et al. Asociación de polimorfismos del gen LIPA con complicaciones metabólicas relacionadas con la obesidad en pacientes con obesidad grave. Obesidad (Silver Spring). 201220: 2075–82.

Turcot V, Tchernof A, Deshaies Y, Perusse L, Belisle A, Marceau S, et al. La metilación de LINE-1 en el tejido adiposo visceral de individuos con obesidad severa se asocia con el estado del síndrome metabólico y fenotipos relacionados. Clin Epigenetics. 20124: 10.

Lohse M, Bolger A, Nagel A, Fernie AR, Lunn JE, Stitt M y col. RobiNA: una solución de software integrada y fácil de usar para transcriptómica basada en RNA-Seq. Ácidos nucleicos Res. 201240 (problema del servidor web): W622–7.

Trapnell C, Pachter L, Salzberg SL. TopHat: descubriendo uniones de empalme con RNA-Seq. Bioinformática. 200925: 1105-11.

Langmead B, Trapnell C, Pop M, Salzberg SL. Alineación ultrarrápida y eficiente para la memoria de secuencias cortas de ADN con el genoma humano. Genome Biol. 200910: R25.

Anders S, Huber W. Análisis de expresión diferencial para datos de recuento de secuencias. Genome Biol. 201011: R106.

Quinlan AR, Hall IM. BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática. 201026: 841–2.

Equipo central de desarrollo de R. R: Un lenguaje y un entorno para la computación estadística. Viena, Austria: la Fundación R para la Computación Estadística 2011.

Mahony S, Auron PE, Benos PV. Perfiles de unión familiar de ADN simplificados: comparación de varias estrategias de agrupación y alineación de motivos. PLoS Comput Biol. 20073: e61.


Introducción

Comprender las relaciones entre las secuencias de proteínas y sus funciones es un objetivo fundamental de la ciencia de las proteínas. Nuestra capacidad para mapear estas relaciones ha mejorado con los avances tecnológicos. Hasta hace poco, la capacidad de decodificar información de experimentos que caracterizan la función de la proteína estaba limitada por la necesidad de clonar y / o secuenciar individualmente cada gen de interés con un rendimiento relativamente bajo. La secuenciación de próxima generación ha cambiado esto, y varias publicaciones importantes describen técnicas que combinan el cribado fenotípico y la secuenciación profunda para investigar cómo la secuencia de proteínas influye en la estructura, el plegamiento, la unión o el crecimiento / aptitud del organismo [1 & # x0201310]. Araya y Fowler han escrito una buena reseña de los avances recientes [11]. Generalmente, el enfoque experimental implica la construcción de una biblioteca de muchas variantes mutantes diferentes de una proteína de interés. Luego, la biblioteca se analiza / selecciona para alguna propiedad o función. El conjunto de bibliotecas retenido se secuencia, y las características de las secuencias que se observan con alta frecuencia están implicadas como importantes para la propiedad relevante. En esta introducción, discutimos las aplicaciones de este enfoque al problema de determinar las interacciones de las proteínas con un objetivo.

Los sistemas de interacción que se han sometido a un enfoque de detección y secuenciación incluyen ligandos peptídicos del dominio PDZ [4, 5], ligandos peptídicos del dominio Pin WW [6], inhibidores de la hemaglutinina de la influenza [7], socios de interacción de la quinasa LYN [8], computacionalmente diseñaron quelantes de digoxigenina [9] y complejos de receptor tipo Bcl-2 / BH3 [10]. Los experimentos variaron en tamaño de biblioteca (

600.000 miembros), así como en el tipo de cribado utilizado para detectar la unión (presentación de fagos, presentación de levaduras, presentación de ribosomas, dos híbridos bacterianos). Estos estudios son hitos interesantes que amplían drásticamente la cantidad de datos disponibles para describir las interacciones de las proteínas. Sin embargo, es importante considerar qué información contienen los datos de varias pantallas de interacción y cómo se pueden utilizar. Un enfoque estándar ha sido cuantificar el enriquecimiento de cada secuencia o mutación puntual entre los miembros de la biblioteca clasificados como aglutinantes, en relación con la biblioteca no seleccionada, y usar esto como un proxy de afinidad. Esto puede ser problemático, ya que se basa en una secuenciación profunda adecuada de la biblioteca de partida y una amplificación libre de sesgos de las secuencias durante el cribado y la preparación de la muestra. De hecho, Derda et al. encontraron que la abundancia relativa de péptidos mostrados en fagos podría estar significativamente sesgada si los fagos se amplificaran después de un paso de selección [12]. McLaughlin y col. han informado datos que apoyan una correlación impresionante de las puntuaciones de enriquecimiento con las afinidades de unión [5], pero la idoneidad y resolución de los nuevos métodos para la determinación de la afinidad no está bien establecida.

Recientemente, Kinney et al. fue pionero en un enfoque detallado del esquema de selección y secuencia y lo aplicó para medir las interacciones proteína-ADN [13]. Adoptando el nivel de expresión de GFP como indicador de la fuerza de unión del factor de transcripción, emplearon la clasificación de células activadas por fluorescencia (FACS) para clasificar una biblioteca bacteriana de

20000 promotores lacZ mutantes con diferentes actividades en grupos y los decodificaron mediante secuenciación profunda. Una rutina computacional de máxima probabilidad transformó los datos de secuenciación en una matriz de puntuación específica de la posición que describía la afinidad de unión al ADN del factor de transcripción. En un enfoque similar, Sharon et al. monitoreó la afinidad de los factores de transcripción para cientos de promotores de levadura mutantes que se acoplaron a YFP y derivaron una clasificación de las actividades de los factores de transcripción [14].

Sharon y col. y Kinney et al. emplearon clases de varios contenedores que aumentaron la resolución de sus experimentos (es decir, la capacidad de distinguir entre dos constantes de disociación diferentes o medidas equivalentes de afinidad) y permitieron el análisis de distribuciones de frecuencia en lugar de los valores de enriquecimiento más difíciles de interpretar. Sin embargo, quedan cuestiones por abordar. En primer lugar, solo se controló la expresión de la proteína fluorescente en los estudios de unión proteína-ADN, sin tener en cuenta las variaciones en los niveles de factor de transcripción que afectan la expresión del gen informador. El trabajo previo respalda la importancia de una corrección. Liang y col. desarrolló una pantalla FACS de dos colores para dispositivos reguladores de genes de ARN [15]. Una señal de fluorescencia informó la actividad del dispositivo, la otra fue una medida de los niveles básicos de transcripción. Esta configuración aumentó drásticamente la resolución del esquema de clasificación en comparación con una estrategia de un solo color. Del mismo modo, Dutta et al. midió la estabilidad de las proteínas mutantes mediante la reconstitución de fragmentos y la presentación de levaduras [16]. Observaron la expresión y presentación de un fragmento mutante con una señal de fluorescencia y la unión de un fragmento complementario con otra señal. Sus hallazgos sugirieron una correlación entre la estabilidad de las proteínas mutantes y la proporción de las dos señales de fluorescencia. Chao y col. demostraron cualitativamente que una mezcla de dos anticuerpos mostrados en levaduras con afinidades muy similares por una diana puede enriquecerse para el aglutinante más fuerte mediante FACS cuando se tienen en cuenta los niveles de expresión. En segundo lugar, Kinney et al. [13] y Sharon et al. [14] consideró promedios de su información experimental detallada durante los análisis computacionales. Calcularon matrices de puntuación específicas de posición y valores medios de expresión, respectivamente. Los efectos cooperativos y la variación de la señal pueden limitar la precisión de los modelos derivados con tales suposiciones.

La caracterización de alto rendimiento de las interacciones de proteínas será más útil si puede proporcionar estimaciones precisas de afinidad o clasificaciones de afinidad. Por ejemplo, tales estimaciones podrían permitir la construcción de modelos predictivos más precisos o podrían orientar el refinamiento de los diseños de proteínas [7]. Presentamos un protocolo que utiliza una estrategia de clasificación rigurosa en combinación con el procesamiento computacional aguas abajo que devuelve una clasificación de afinidad precisa de secuencias individuales. Aprovechando la visualización de la superficie de la levadura, en la que una señal resultante de la unión de un péptido a una proteína se puede normalizar por el nivel de expresión de ese péptido, desarrollamos un marco teórico para derivar las señales esperadas para los aglutinantes de diferentes afinidades. La clasificación experimental utilizando FACS, más la secuenciación de bibliotecas, produjo distribuciones de señal de grano grueso para

1000 clones que muestran péptidos en un solo experimento. El procesamiento computacional generó una clasificación global de afinidades peptídicas, y nuestro modelo teórico permitió un análisis estadístico detallado de las fuentes de error en los resultados finales. Debido a que los métodos existentes ya son capaces de discernir los aglutinantes fuertes de los débiles y no aglutinantes, nos hemos centrado en discriminar aglutinantes ajustados dentro de un rango de afinidades de 500 veces (0,1 nM-60 nM).Los datos precisos en este régimen pueden ayudar en el diseño de aglutinantes muy fuertes que pueden ser importantes agentes terapéuticos y de diagnóstico [17 & # x0201319]. Realizamos nuestro estudio utilizando una pequeña biblioteca de aproximadamente 1000 levaduras que mostraban péptidos BH3 que se unen a Bcl-XL, un regulador clave de la apoptosis. Aglutinantes de alta afinidad de Bcl-XL son de gran interés debido a su potencial para diagnosticar o superar bloqueos apoptóticos en numerosos cánceres [20 & # x0201322].


Información del colaborador

Consorcio NHLBI Trans-Omics for Precision Medicine (TOPMed):

Namiko Abe

11 New York Genome Center, Nueva York, NY EE. UU.

Laura Almasy

157 Hospital de Niños y # x02019s de Filadelfia, Filadelfia, PA, EE. UU.

Seth Ament

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Peter Anderson

159 Universidad de Washington, Seattle, WA EE. UU.

Pramod Anugu

160 Universidad de Mississippi, Jackson, MS EE. UU.

Deborah Applebaum-Bowden

161 Institutos Nacionales de Salud, Bethesda, MD, EE. UU.

Tim Assimes

162 Universidad de Stanford, Stanford, CA EE. UU.

Dimitrios Avramopoulos

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Emily Barron-Casella

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Terri Beaty

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Gerald Beck

23 Clínica Cleveland, Cleveland, OH EE. UU.

Diane Becker

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Ámbar beitelshees

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Takis Benos

163 Universidad de Pittsburgh, Pittsburgh, PA EE. UU.

Marcos Bezerra

164 Funda & # x000e7 & # x000e3o de Hematologia e Hemoterapia de Pernambuco & # x02013Hemope, Recife, Brasil

Joshua Bis

159 Universidad de Washington, Seattle, WA, EE. UU.

Russell Bowler

165 National Jewish Health, Denver, CO EE. UU.

Ulrich Broeckel

166 Medical College of Wisconsin, Milwaukee, WI EE. UU.

Jai Broome

159 Universidad de Washington, Seattle, WA, EE. UU.

Empavesado de Karen

11 New York Genome Center, Nueva York, NY EE. UU.

Carlos Bustamante

162 Universidad de Stanford, Stanford, CA EE. UU.

Erin Buth

159 Universidad de Washington, Seattle, WA EE. UU.

Jonathan Cardwell

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Vincent Carey

95 Brigham and Women & # x02019s Hospital, Boston, MA EE. UU.

Cara Carty

167 Universidad Estatal de Washington, Seattle, WA, EE. UU.

Richard Casaburi

168 Universidad de California, Los Ángeles, Los Ángeles, CA EE. UU.

Peter Castaldi

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Mark Chaffin

169 Broad Institute, Cambridge, MA EE. UU.

Christy Chang

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Yi-Cheng Chang

170 Universidad Nacional de Taiwán, Taipei, Taiwán

Sameer Chavan

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Bo-Juen Chen

11 New York Genome Center, Nueva York, NY EE. UU.

Wei-Min Chen

171 Universidad de Virginia, Charlottesville, VA, EE. UU.

Lee-Ming Chuang

170 Universidad Nacional de Taiwán, Taipei, Taiwán

Ren-Hua Chung

172 Instituto Nacional de Investigaciones Sanitarias de Taiwán, municipio de Zhunan, Taiwán

Suzy Comhair

23 Clínica Cleveland, Cleveland, OH EE. UU.

Elaine Cornell

173 Universidad de Vermont, Burlington, VT EE. UU.

Carolyn Crandall

168 Universidad de California, Los Ángeles, Los Ángeles, CA EE. UU.

James Crapo

165 National Jewish Health, Denver, CO EE. UU.

Jeffrey Curtis

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Coleen Damcott

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Sean David

175 Universidad de Chicago, Chicago, IL EE. UU.

Colleen Davis

159 Universidad de Washington, Seattle, WA EE. UU.

Lisa de las Fuentes

176 Washington University en St Louis, St Louis, MO EE. UU.

Michael DeBaun

177 Vanderbilt University, Nashville, TN EE. UU.

Ranjan Deka

178 Universidad de Cincinnati, Cincinnati, OH EE. UU.

Scott Devine

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Qing Duan

179 Universidad de Carolina del Norte, Chapel Hill, NC EE. UU.

Ravi Duggirala

180 Facultad de Medicina del Valle del Río Grande de la Universidad de Texas, Edinburg, TX, EE. UU.

Jon Peter Durda

173 Universidad de Vermont, Burlington, VT EE. UU.

Charles Eaton

181 Brown University, Providence, RI EE. UU.

Lynette Ekunwe

160 Universidad de Mississippi, Jackson, MS EE. UU.

Adel El Boueiz

182 Universidad de Harvard, Boston, MA EE. UU.

Serpil Erzurum

23 Clínica Cleveland, Cleveland, OH EE. UU.

Charles Farber

171 Universidad de Virginia, Charlottesville, VA, EE. UU.

Matthew Flickinger

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Myriam Fornage

183 Universidad de Texas Health en Houston, Houston, TX, EE. UU.

Chris Frazar

159 Universidad de Washington, Seattle, WA EE. UU.

Mao Fu

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Lucinda Fulton

176 Washington University en St Louis, St Louis, MO EE. UU.

Shanshan Gao

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Yan Gao

160 Universidad de Mississippi, Jackson, MS EE. UU.

Margery Gass

184 Fred Hutchinson Cancer Research Center, Seattle, WA EE. UU.

Bruce Gelb

16 Escuela de Medicina Icahn en Mount Sinai, Nueva York, NY EE. UU.

Xiaoqi Priscilla Geng

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Mark Geraci

185 Universidad de Indiana, Indianápolis, EE. UU.

Auyon Ghosh

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Chris Gignoux

162 Universidad de Stanford, Stanford, CA EE. UU.

David Glahn

186 Universidad de Yale, New Haven, CT EE. UU.

Da-Wei Gong

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Harald Goring

187 Facultad de Medicina del Valle del Río Grande de la Universidad de Texas, San Antonio, TX, EE. UU.

Sharon Graw

188 Campus Médico Anschutz de la Universidad de Colorado, Aurora, CO EE. UU.

Daniel Grine

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

C. Charles Gu

176 Washington University en St Louis, St Louis, MO EE. UU.

Yue Guan

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Namrata Gupta

169 Broad Institute, Cambridge, MA EE. UU.

Jeff Haessler

184 Fred Hutchinson Cancer Research Center, Seattle, WA EE. UU.

Nicola L. Hawley

186 Universidad de Yale, New Haven, CT EE. UU.

Ben Heavner

159 Universidad de Washington, Seattle, WA, EE. UU.

David Herrington

189 Wake Forest Baptist Health, Winston-Salem, NC EE. UU.

Craig Hersh

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Bertha Hidalgo

21 Universidad de Alabama, Birmingham, AL EE. UU.

James Hixson

183 Universidad de Texas Health en Houston, Houston, TX, EE. UU.

Brian Hobbs

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

John Hokanson

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Elliott Hong

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Karin Hoth

190 Universidad de Iowa, Iowa City, IA EE. UU.

Chao Agnes Hsiung

172 Instituto Nacional de Investigaciones Sanitarias de Taiwán, municipio de Zhunan, Taiwán

Yi-Jen Hung

191 Tri-Service General Hospital National Defense Medical Center, Taipei, Taiwán

Haley Huston

192 Blood Works Northwest, Seattle, WA EE. UU.

Chii Min Hwu

132 Hospital General de Veteranos de Taichung Taiwán, ciudad de Taichung, Taiwán

Rebecca Jackson

193 Centro Médico Wexner de la Universidad Estatal de Ohio, Columbus, OH EE. UU.

Deepti Jain

159 Universidad de Washington, Seattle, WA, EE. UU.

Min A. Jhun

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Craig Johnson

159 Universidad de Washington, Seattle, WA, EE. UU.

Rich Johnston

194 Emory University, Atlanta, GA, EE. UU.

Kimberly Jones

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Sekar Kathiresan

169 Broad Institute, Cambridge, MA EE. UU.

Alyna Khan

159 Universidad de Washington, Seattle, WA EE. UU.

Wonji Kim

182 Universidad de Harvard, Boston, MA EE. UU.

Greg Kinney

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Holly Kramer

195 Loyola University, Maywood, IL EE. UU.

Christoph Lange

196 Escuela de Salud Pública de Harvard, Boston, MA EE. UU.

Ethan Lange

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Leslie Lange

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Cecelia Laurie

159 Universidad de Washington, Seattle, WA EE. UU.

Meryl LeBoff

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Jiwon Lee

95 Brigham and Women & # x02019s Hospital, Boston, MA EE. UU.

Seunggeun Shawn Lee

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Wen-Jane Lee

132 Hospital General de Veteranos de Taichung Taiwán, ciudad de Taichung, Taiwán

David Levine

159 Universidad de Washington, Seattle, WA, EE. UU.

Joshua Lewis

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Xiaohui Li

197 Instituto Lundquist, Torrance, CA EE. UU.

Yun Li

179 Universidad de Carolina del Norte, Chapel Hill, NC EE. UU.

Henry Lin

197 Instituto Lundquist, Torrance, CA EE. UU.

Honghuang Lin

198 Universidad de Boston, Boston, MA EE. UU.

Keng Han Lin

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Simin Liu

181 Brown University, Providence, RI EE. UU.

Yongmei Liu

136 Duke University, Durham, NC EE. UU.

Yu Liu

199 Universidad de Stanford, Palo Alto, CA EE. UU.

James Luo

28 Instituto Nacional del Corazón, los Pulmones y la Sangre, Institutos Nacionales de Salud, Bethesda, MD, EE. UU.

Michael Mahaney

200 Facultad de Medicina del Valle del Río Grande de la Universidad de Texas, Brownsville, TX, EE. UU.

Barry hacer

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

JoAnn Manson

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Lauren Margolin

169 Broad Institute, Cambridge, MA EE. UU.

Lisa Martín

201 Universidad George Washington, Washington, DC, EE. UU.

Susan Mathai

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Susanne mayo

159 Universidad de Washington, Seattle, WA EE. UU.

Patrick McArdle

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Merry-Lynn McDonald

21 Universidad de Alabama, Birmingham, AL EE. UU.

Sean McFarland

202 Universidad de Harvard, Cambridge, MA EE. UU.

Daniel McGoldrick

159 Universidad de Washington, Seattle, WA, EE. UU.

Caitlin McHugh

159 Universidad de Washington, Seattle, WA, EE. UU.

Hao Mei

160 Universidad de Mississippi, Jackson, MS EE. UU.

Luisa Mestroni

188 Campus Médico Anschutz de la Universidad de Colorado, Aurora, CO EE. UU.

Nancy Min

160 Universidad de Mississippi, Jackson, MS EE. UU.

Ryan L. Minster

163 Universidad de Pittsburgh, Pittsburgh, PA EE. UU.

Matt Moll

95 Brigham and Women & # x02019s Hospital, Boston, MA EE. UU.

Arden Moscati

16 Escuela de Medicina Icahn en Mount Sinai, Nueva York, NY EE. UU.

Salomón Musani

160 Universidad de Mississippi, Jackson, MS EE. UU.

Stanford Mwasongwe

160 Universidad de Mississippi, Jackson, MS EE. UU.

Josyf C. Mychaleckyj

171 Universidad de Virginia, Charlottesville, VA, EE. UU.

Girish Nadkarni

16 Escuela de Medicina Icahn en Mount Sinai, Nueva York, NY EE. UU.

Rakhi Naik

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Toma Naseri

203 Ministerio de Salud, Gobierno de Samoa, Apia, Samoa

Sergei Nekhai

204 Howard University, Washington, DC, EE. UU.

Bonnie Neltner

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Heather Ochs-Balcom

205 University at Buffalo, Buffalo, NY EE. UU.

David Paik

162 Universidad de Stanford, Stanford, CA EE. UU.

James Pankow

206 Universidad de Minnesota, Minneapolis, MN EE. UU.

Afshin Parsa

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Juan Manuel Peralta

180 Facultad de Medicina del Valle del Río Grande de la Universidad de Texas, Edinburg, TX, EE. UU.

Marco Perez

162 Universidad de Stanford, Stanford, CA EE. UU.

James Perry

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Ulrike Peters

184 Fred Hutchinson Cancer Research Center, Seattle, WA EE. UU.

Lawrence S. Phillips

194 Emory University, Atlanta, GA, EE. UU.

Toni Pollin

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Julia Powers Becker

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Meher Preethi Boorgula

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Michael Preuss

16 Escuela de Medicina Icahn en Mount Sinai, Nueva York, NY EE. UU.

Dandi Qiao

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Zhaohui Qin

194 Emory University, Atlanta, GA, EE. UU.

Nicolás Rafaels

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Laura Raffield

179 Universidad de Carolina del Norte, Chapel Hill, NC EE. UU.

Laura Rasmussen-Torvik

207 Northwestern University, Chicago, IL EE. UU.

Aakrosh Ratan

171 Universidad de Virginia, Charlottesville, VA, EE. UU.

Robert Reed

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Elizabeth Regan

165 National Jewish Health, Denver, CO EE. UU.

Muagututi & # x02018a Sefuiva Reupena

208 Lutia I Puava Ae Mapu I Fagalele, Apia, Samoa

Carolina Roselli

169 Broad Institute, Cambridge, MA EE. UU.

Pamela Russell

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Sarah Ruuska

192 Blood Works Northwest, Seattle, WA EE. UU.

Kathleen Ryan

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Ester Cerdeira Sabino

209 Universidade de Sao Paulo, Sao Paulo, Brasil

Saleheen danés

210 Columbia University, Nueva York, NY EE. UU.

Shabnam Salimi

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Steven Salzberg

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Kevin Sandow

197 Instituto Lundquist, Torrance, CA EE. UU.

Vijay G. Sankaran

211 Broad Institute, Harvard University, Boston, MA EE. UU.

Christopher Scheller

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Ellen Schmidt

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Karen Schwander

176 Washington University en St Louis, St Louis, MO EE. UU.

Frank Sciurba

163 Universidad de Pittsburgh, Pittsburgh, PA EE. UU.

Christine Seidman

46 Harvard Medical School, Boston, MA EE. UU.

Jonathan Seidman

46 Harvard Medical School, Boston, MA EE. UU.

Stephanie L. Sherman

194 Emory University, Atlanta, GA, EE. UU.

Aniket Shetty

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Wayne Hui-Heng Sheu

132 Hospital General de Veteranos de Taichung Taiwán, ciudad de Taichung, Taiwán

Brian Silver

212 UMass Memorial Medical Center, Worcester, MA EE. UU.

Josh Smith

159 Universidad de Washington, Seattle, WA EE. UU.

Tanja Smith

11 New York Genome Center, Nueva York, NY EE. UU.

Sylvia Smoller

85 Albert Einstein College of Medicine, Nueva York, NY EE. UU.

Beverly Snively

189 Wake Forest Baptist Health, Winston-Salem, NC EE. UU.

Michael Snyder

162 Universidad de Stanford, Stanford, CA EE. UU.

Tamar Sofer

95 Brigham and Women & # x02019s Hospital, Boston, MA EE. UU.

Garrett Storm

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Elizabeth Streeten

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Yun Ju Sung

176 Washington University en St Louis, St Louis, MO EE. UU.

Jody Sylvia

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Adam Szpiro

159 Universidad de Washington, Seattle, WA, EE. UU.

Carole Sztalryd

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Hua Tang

162 Universidad de Stanford, Stanford, CA EE. UU.

Margaret Taub

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Matthew Taylor

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Simeón Taylor

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Machiko Threlkeld

159 Universidad de Washington, Seattle, WA EE. UU.

Lesley Tinker

184 Fred Hutchinson Cancer Research Center, Seattle, WA EE. UU.

David Tirschwell

159 Universidad de Washington, Seattle, WA, EE. UU.

Sarah Tishkoff

213 Universidad de Pensilvania, Filadelfia, PA EE. UU.

Hemant Tiwari

21 Universidad de Alabama, Birmingham, AL EE. UU.

Catherine Tong

159 Universidad de Washington, Seattle, WA, EE. UU.

Michael Tsai

206 Universidad de Minnesota, Minneapolis, MN EE. UU.

Dhananjay Vaidya

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Peter VandeHaar

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Tarik Walker

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Robert Wallace

190 Universidad de Iowa, Iowa City, IA EE. UU.

Avram Walts

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Fei Fei Wang

159 Universidad de Washington, Seattle, WA EE. UU.

Heming Wang

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Karol Watson

168 Universidad de California, Los Ángeles, Los Ángeles, CA EE. UU.

Jennifer Wessel

185 Universidad de Indiana, Indianápolis, EE. UU.

Kayleen Williams

159 Universidad de Washington, Seattle, WA, EE. UU.

L. Keoki Williams

214 Henry Ford Health System, Detroit, MI EE. UU.

Carla Wilson

95 Brigham and Women & # x02019s Hospital, Boston, MA, EE. UU.

Joseph Wu

162 Universidad de Stanford, Stanford, CA EE. UU.

Huichun Xu

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Lisa Yanek

27 Universidad Johns Hopkins, Baltimore, MD, EE. UU.

Ivana Yang

125 Universidad de Colorado en Denver, Denver, CO EE. UU.

Rongze Yang

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Norann Zaghloul

158 Universidad de Maryland, Baltimore, MD, EE. UU.

Maryam Zekavat

169 Broad Institute, Cambridge, MA EE. UU.

Nieve Xueyan Zhao

165 National Jewish Health, Denver, CO EE. UU.

Wei Zhao

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Degui Zhi

183 Universidad de Texas Health en Houston, Houston, TX, EE. UU.

Xiang Zhou

174 Universidad de Michigan, Ann Arbor, MI EE. UU.

Xiaofeng Zhu

215 Case Western Reserve University, Cleveland, OH EE. UU.


Ver el vídeo: Enriquecimiento ilegítimo o sin causa. (Agosto 2022).