Información

Tamaño cromosómico sin heterocromatina

Tamaño cromosómico sin heterocromatina



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy haciendo diferentes análisis de los cromosomas humanos y diferentes loci, sin embargo, cuando utilizo diferentes bases de datos, las estructuras de heterocromatina no son parte de los genomas humanos. Sé que la heterocromatina es una estructura más densa dentro del ADN y se tiñe de manera diferente y no forma parte de los diferentes genomas de referencia.

Sin embargo, toda la información sobre los tamaños de los cromosomas humanos, que puedo encontrar, incluye las regiones de heterocromatina.

Entonces, me gustaría saber, ¿hay algún lugar donde pueda encontrar la longitud de los cromosomas humanos sin las estructuras de heterocromatina?

Gracias por tu tiempo y ayuda.


Hay un par de advertencias que deben abordarse antes de responder a esta pregunta:

  1. No conocemos todas las regiones del genoma humano que pueden ser heterocromáticas. En algunos casos, simplemente faltan grandes trozos de heterocromatina en el ensamblaje del genoma. Para una revisión algo desactualizada pero aún informativa del tema, consulte aquí.
  2. Qué regiones son heterocromáticas difiere de una célula a otra. Por ejemplo, recomendaría leer sobre las diferencias entre heterocromatina constitutiva y facultativa en wikipedia.
  3. Las regiones heterocromáticas del genoma son muy importantes biológicamente y no tenerlas en cuenta podría ser un error, aunque depende de tus motivaciones.

El proyecto del genoma humano estimó inicialmente que el 92% de la construcción de su genoma original es eucromática, 2,85 Gbp en total. Sin embargo, esa construcción del genoma original se ha actualizado sustancialmente. Esa estimación es lo suficientemente cercana para muchos propósitos, probablemente. Pero hemos aprendido mucho sobre la estructura del genoma y la biología desde entonces.

Tenemos muchos datos que están altamente correlacionados con lo que consideramos heterocromatina. El navegador del genoma humano de UCSC tiene mucha información sobre las modificaciones de la cromatina (miraría la sección de análisis de ENCODE aquí). En principio, puede hacer conjeturas fundamentadas sobre regiones de heterocromatina basadas en modificaciones de cromatina. Esto será algo ruidoso y tendrá que tomar decisiones sobre qué tipos de células son relevantes, ya que tendrán regiones algo diferentes.

Para obtener más información sobre qué modificaciones de cromatina podrían ser relevantes, puede comenzar a buscar aquí. Es probable que deba analizar algunos datos usted mismo para encontrar una respuesta más precisa.


Ensamblaje y caracterización de heterocromatina y eucromatina en cromosomas artificiales humanos

Las regiones del centrómero humano se caracterizan por la presencia de ADN satélite alfa, replicación tardía en la fase S y apariencia heterocromática. Modelos recientes proponen que el centrómero está organizado en dominios de cromatina conservados en los que la cromatina que contiene CenH3 (variante H3 específica del centrómero) en el centrómero funcional (cinetocoro) se forma dentro de regiones de heterocromatina. Para abordar estos modelos, analizamos la formación de heterocromatina y eucromatina en de novo cromosomas artificiales humanos que contienen ADN satélite alfa. También examinamos la relación entre la composición de la cromatina y el tiempo de replicación de los cromosomas artificiales.

Resultados

Los factores de heterocromatina (metilación de lisina 9 de histona H3 y HP1α) se enriquecieron en cromosomas artificiales que se estimó que tenían un tamaño superior a 3 Mb, pero se redujeron en aquellos menores de 3 Mb. Todos los cromosomas artificiales ensamblaron marcadores de eucromatina (metilación de la histona H3 lisina 4), que pueden reflejar en parte la expresión del gen marcador. Los estudios de tiempo de replicación revelaron que el tiempo de replicación de los cromosomas artificiales era heterogéneo. Los cromosomas artificiales empobrecidos en heterocromatina se replicaron en la fase S temprana, mientras que los cromosomas artificiales enriquecidos en heterocromatina se replicaron en la fase S media o tardía.

Conclusiones

Las regiones de los centrómeros en los cromosomas artificiales humanos y los cromosomas del huésped tienen cantidades similares de CenH3 pero exhiben grados muy variables de heterocromatina, lo que sugiere que solo una pequeña cantidad de heterocromatina puede ser necesaria para la función del centrómero. La formación de eucromatina en todos los cromosomas artificiales demuestra que pueden proporcionar un contexto cromosómico adecuado para la expresión génica. La replicación anterior de los cromosomas artificiales empobrecidos en heterocromatina sugiere que la replicación tardía en la fase S no es un requisito para la función del centrómero.


INTRODUCCIÓN

¿Cómo se organizan los genomas en el núcleo y cuál es el papel de la organización del genoma en las funciones celulares? Estas cuestiones fundamentales de la biología celular están atrayendo una mayor atención a medida que se secuencian los genomas de eucariotas superiores. Se han propuesto diversos modelos, que van desde muy aleatorios a muy organizados, para la organización de la cromatina en interfase (para revisiones, véase Manuelidis, 1990 Haaf y Schmid, 1991 Cremer et al., 1993). La evidencia reciente sugiere que la cromatina en interfase está organizada en bucles grandes, de varios pares de megabase en tamaño (Sachs et al., 1995 Yokota et al., 1995 Ostashevsky, 1998). Si bien dentro de cada bucle, la cromatina se pliega al azar, los sitios específicos de unión al bucle pueden imponer una estructura de la columna vertebral restringida (Yokota et al., 1995 Marshall et al., 1997 Ostashevsky, 1998, 2000 Cremeret al., 2000).

En la actualidad, está bien establecido que tanto los cromosomas mitóticos como la cromatina en interfase están compuestos de dominios funcionales distintos (para revisiones recientes, ver Cockell y Gasser, 1999 Belmont et al., 1999 Cremer et al., 2000). Cada dominio ocupa una posición espacial específica y se replica en un momento preciso durante la fase S. En los cromosomas en metafase, los dominios se identifican como bandas transversales alternas a lo largo de la longitud del cromosoma (revisado por Sumner, 1990). Poco después de la mitosis, los dominios cromosómicos se descondensan y se reposicionan en el núcleo, donde se designan como eucromatina o heterocromatina (para revisiones, véase Manuelidis, 1990 Haaf y Schmid, 1991 Craig y Bickmore, 1993). La heterocromatina representa la cromatina que permanece condensada durante todo el ciclo celular, excepto durante su replicación, que ocurre al final de la fase S. La heterocromatina incluye la heterocromatina constitutiva, que está compuesta casi en su totalidad por secuencias de ADN satélite no codificantes, repetidas en tándem, y heterocromatina facultativa, que consiste principalmente en genes potencialmente transcribibles. Las regiones constitutivamente heterocromáticas en los cromosomas en metafase se denominan bandas C y se localizan principalmente en las regiones centroméricas o adyacentes a ellas, mientras que la heterocromatina facultativa reside en las denominadas bandas oscuras G (Craig y Bickmore, 1993). Las bandas G-oscuras comprenden genes específicos de tejido que se transcriben solo en tipos de células seleccionados (Manuelidis, 1990). Los genes de mantenimiento, que se replican temprano y se transcriben activamente en casi todas las células, residen en bandas de luz G (también llamadas bandas R). Durante la interfase, la gran mayoría de las bandas de replicación tardía de la mayoría (si no todos) de los cromosomas se localizan en la periferia nuclear, con una fracción más pequeña presente alrededor del nucleolo o dispersa en el nucleoplasma. Por el contrario, las bandas de luz G de replicación temprana parecen extenderse por todo el interior nuclear (Ferreiraet al., 1997 Sadoni et al., 1999). Tanto el reposicionamiento intranuclear como el tiempo de replicación de los dominios cromosómicos se establecen en la fase G1 temprana del ciclo celular, lo que sugiere que la distribución espacial dentro del núcleo está estrechamente relacionada con el establecimiento de un programa de tiempo de replicación (Dimitrova y Gilbert, 1999). Dado que durante la diferenciación celular hay cambios en el tiempo de replicación, que a menudo están acoplados a cambios en la actividad transcripcional (ver Dimitrova y Gilbert, 1999 y sus referencias), una cuestión clave es si la posición espacial dentro del núcleo juega un papel regulador epigenético en los genes. expresión.

Desde hace mucho tiempo, se sabe que la heterocromatina inactiva genes. Por ejemplo, cuando un gen normalmente eucromático se yuxtapone a la heterocromatina por reordenamiento cromosómico, puede silenciarse transcripcionalmente en una fracción de las células. La expresión en mosaico del gen transpuesto se denomina variegación de efecto de posición heterocromática, PEV (revisado por Wakimoto, 1998). Aunque la explicación clásica de PEV invoca la propagación del estado de heterocromatina a lo largo del cromosoma en genes vecinos, hay casos de PEV para los cuales un “transSe ha propuesto un mecanismo de "inactivación". Un ejemplo particularmente bien caracterizado ocurre cuando la inserción de un gran bloque de heterocromatina en la secuencia codificante del gen del color de ojos marrón en Drosophila provoca la inactivación variada de una copia normal del gen presente en un cromosoma homólogo. En etapas definidas de desarrollo, se muestra que esta inserción se asocia físicamente con la cromatina centromérica en el mismo cromosoma de una manera estocástica (Dernburg et al., 1996). Por tanto, en este caso, la asociación con la heterocromatina responsable de la variegación se debe a un bucle de larga distancia más que a una proximidad lineal a lo largo del cromosoma. Ejemplos adicionales de silenciamientotransinteracciones entre genes específicos de tejido y heterocromatina centromérica se describieron recientemente en células linfoides de mamíferos (Brown et al., 1997, 1999).

A pesar de la evidencia actual que indica que el posicionamiento intranuclear de los loci genómicos en relación con la heterocromatina centromérica afecta su actividad transcripcional, se sabe muy poco sobre los principios que gobiernan la distribución espacial dentro del núcleo de los centrómeros per se. Durante la interfase, la heterocromatina centromérica se encuentra predominantemente en la periferia nuclear o alrededor del nucleolo (revisado en Haaf y Schmid, 1991 Pluta et al., 1995). ¿Es esta distribución estocástica o existen restricciones posicionales definidas para centrómeros individuales? Claramente, se espera que los centrómeros de los cromosomas que contienen genes que codifican el ARNr (es decir, la región organizadora nucleolar o NOR) se asocien con el nucleolo. Sin embargo, la pregunta sigue siendo para los centrómeros de los cromosomas sin NOR. ¿Se distribuyen aleatoriamente entre la periferia nuclear y el nucleolo? Para abordar esta cuestión, utilizamos la hibridación in situ de fluorescencia, para etiquetar diferencialmente la heterocromatina centromérica de 15 cromosomas humanos, y microscopía confocal para determinar su patrón de distribución tridimensional dentro del núcleo de células linfoides inactivas. Nuestros resultados revelan que el posicionamiento de la heterocromatina centromérica en relación con la envoltura nuclear y el nucleolo tiende a ser específico para cada cromosoma. Lo más importante es que se puede predecir el posicionamiento centromérico, teniendo en cuenta la abundancia de bandas oscuras G en el mismo cromosoma. Proponemos un modelo para el posicionamiento de centrómeros durante la interfase basado en interacciones intra e intercromosómicas entre dominios de heterocromatina constitutivos y facultativos en el núcleo.


Los dos tipos de heterocromatina: constitutiva y facultativa

No es sorprendente que la forma en que se empaqueta el ADN esté relacionada con el ciclo celular. Cuando es necesario copiar (replicar) el ADN y sintetizar las proteínas (transcripción y luego traducción), el ADN se encuentra en forma de eucromatina. Cuando los genes no necesitan ser replicados y transcritos, el ADN está en forma de heterocromatina. Además, cuando el ADN está en forma de cromosoma activo, la célula está en la etapa de interfase del ciclo celular, y cuando está en forma de cromosoma en metafase, la célula se está dividiendo, es decir, está en la etapa de mitosis o meiosis.

En consonancia con esto, se ha propuesto que regular la forma en que se empaqueta el ADN es una forma de regular la expresión génica. Por lo tanto, los genes de mantenimiento que mantienen las funciones y la supervivencia de la célula están siempre en forma de eucromatina, mientras que los que no necesitan expresarse están en forma de heterocromatina. El medio por el cual esto se logra es mediante la modificación del cola de histona, una parte de las histonas que pueden acetilarse o metilarse. La modificación de la cola de histonas da como resultado cambios en el empaquetado del ADN. Por ejemplo, la hipoacetilación en la cola de las histonas está asociada con la conformación heterocromática, por lo que el ADN no está expuesto y, en consecuencia, se evita la transcripción de genes.

1. ¿Qué revela la presencia de heterocromatina?
UNA. Que las células son transcripcionalmente activas.
B. Que las células se están dividiendo.
C. Esa transcripción genética no se está llevando a cabo.
D. Ese ADN está expuesto a polimerasas y otras proteínas reguladoras.

2. ¿Cuáles son las dos diferencias principales entre heterocromatina constitutiva y facultativa?
UNA. La heterocromatina constitutiva es reversible y tiene secuencias LINE, mientras que la heterocromatina facultativa es estable y tiene ADN satélite.
B. La heterocromatina constitutiva es estable y tiene secuencias LINE, mientras que la heterocromatina facultativa es reversible y tiene ADN satélite.
C. La heterocromatina constitutiva es reversible y tiene ADN satélite, mientras que la heterocromatina facultativa es estable y tiene secuencias LINE.
D. La heterocromatina constitutiva es estable y tiene ADN satélite, mientras que la heterocromatina facultativa es reversible y tiene secuencias LINE.

3. ¿Cuál es otro nombre con el que se conoce a la heterocromatina?
UNA. Cuentas de un collar
B. Fibra de 30 nm
C. Cromático activo
D. Cromado en metafase


Resultados

PREditOR (lectura de proteínas y edición de residuos) elimina eficazmente la heterocromatina de las regiones pericentroméricas

Para manipular el estado epigenético de las clases de cromatina definidas, diseñamos un nuevo enfoque de biología sintética que nos permite unir la cromatina mi editores a regiones específicas del genoma, lectura de proteínas y edición de residuos (PREditOR). PREditOR se basa en el uso de proteínas de fusión que constan de tres dominios (Figura complementaria 1a): (i) a R eader dominio que reconoce modificaciones epigenéticas específicas, (ii) un marcador fluorescente para seguir la localización de la proteína de fusión y (iii) una cromatina mi ditor que funciona específicamente en o cerca del sitio de anclaje. Para analizar el papel de la heterocromatina pericetromérica en la segregación cromosómica, fusionamos el cromodominio N-terminal de la metiltransferasa SUV39H1 específica de H3K9 (SUV39H1ΔSET) (a R eader de H3K9me3) a un marcador EYFP (Fig. 1a, b). La eliminación del dominio SET asegura que esta molécula funcione únicamente como un R eader y no como enzimáticamente activo mi ditor .

La unión de JMJD2D a la heterocromatina disminuye los niveles de H3K9me3. a Esquema del enfoque de PREdiTOR para unir modificadores de cromatina a regiones de heterocromatina. B Dibujos esquemáticos de las construcciones de fusión SUV39H1ΔSET-EYFP. C Diagrama del diseño experimental. D Imágenes de inmunofluorescencia representativas de células HeLa que expresan las proteínas de fusión SUV39H1ΔSET-EYFP indicadas y teñidas para H3K9me3. Barra de escala 10 μm. mi Cuantificación de señales de fluorescencia de tinción de H3K9me3 en células transfectadas individuales como en d representadas como unidades de fluorescencia arbitrarias (A.F.U). Barras sólidas indicar las medianas de tres experimentos independientes y barras de error representan el error estándar de la media (s.e.m). Asteriscos indican diferencias estadísticamente significativas en comparación con EYFP (*PAG & lt 0.05 **PAG & lt 0.001 Estudiante t prueba)

El análisis de inmunofluorescencia después de la expresión de la proteína de fusión SUV39H1ΔSET-EYFP en células HeLa mostró colocalización con focos H3K9me3 y CENP-B (figura 1d y figura complementaria 1b). Por tanto, esta proteína de fusión se dirige específicamente a la heterocromatina pericentromérica. SUV39H1ΔSET-EYFP se libera de la cromatina en la mitosis temprana y se vuelve a unir más tarde en la anafase (Figura complementaria 1c). Lo más probable es que esto se deba a un efecto de cambio metil / fos causado por la fosforilación de la histona H3 en la Serina 10 catalizada por la quinasa Aurora B (Fischle et al. 2005 Hirota et al. 2005).

Como un mi ditor Para eliminar H3K9me3 de las regiones pericentroméricas, fusionamos SUV39H1ΔSET-EYFP con la desmetilasa JMJD2D / KDM4 específica de H3K9me3 (SUV39H1ΔSET-EYFP-JMJD2D WT) (Fig. 1b, c). También se construyeron dos moléculas de control (Fig. 1b, c). El primero era un mutante catalíticamente muerto de JMJD2D que portaba una mutación en su dominio enzimático jmjC fusionado con SUV39H1ΔSET-EYFP (SUV39H1ΔSET-EYFP-JMJD2D D195A). Esta molécula se dirige a la heterocromatina pero no puede desmetilar H3K9. El segundo era un mutante de unión deficiente de SUV39H1ΔSET que portaba dos mutaciones de su dominio de unión a cromatina fusionado a JMJD2D de tipo salvaje (SUV39H1ΔSET W61AY67A -EYFP-JMJD2D WT). Esta molécula tiene una desmetilasa activa pero no puede dirigirse específicamente a la heterocromatina.

La expresión transitoria de SUV39H1ΔSET-EYFP-JMJD2D WT en células HeLa durante 48 h eliminó eficazmente H3K9me3 de los loci pericentroméricos. El análisis de inmunofluorescencia reveló niveles significativamente reducidos de H3K9me3 en células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con los controles de transfección y anclaje (EYFP y SUV39H1ΔSET-EYFP, respectivamente) (Fig. 1d, e). Es importante destacar que no se observaron diferencias en los niveles de H3K9me3 después de expresar el mutante catalíticamente muerto (SUV39H1ΔSET-EYFP-JMJD2D D195A) o el mutante deficiente en unión (SUV39H1ΔSET W61AY67A -EYFP-JMJD2D WT) (Fig. 1d, e). Aparentemente, JMJD2D solo desmetila eficazmente H3K9me3 cuando está unido a regiones heterocromáticas. De acuerdo con estos resultados, la tinción de inmunofluorescencia para HP1α, otro sello distintivo de la heterocromatina, reveló una disminución muy significativa en los focos de HP1α en las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con las células que expresan las otras construcciones de control (Figura complementaria 1d y e).

También investigamos si los cromosomas en general parecían más descondensados ​​después de la expresión de la proteína de fusión SUV39H1ΔSET-EYFP-JMJD2D WT. Aunque pareció haber una ligera descompactación en las imágenes en vivo, cuando se fijaron los cromosomas y se prepararon las extensiones, no se observaron diferencias significativas.

Concluimos que PREditOR puede eliminar eficazmente H3K9me3 y alterar específicamente la heterocromatina, liberando heterocromatina aguas abajo R comedores como HP1α.Es importante destacar que JMJD2D solo elimina la heterocromatina cuando está unida a las regiones pericentroméricas de los cromosomas.

La eliminación de heterocromatina provoca una acumulación mitótica y defectos de segregación cromosómica

Para analizar los efectos de la eliminación de heterocromatina en la división celular, expresamos las diferentes proteínas de fusión SUV39H1ΔSET-EYFP en células HeLa durante 48 horas y examinamos sus efectos sobre la mitosis. Nuestros resultados muestran un aumento de tres veces en el índice mitótico de las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con las células que expresan las proteínas de fusión de control (Fig. 2a). Los resultados de control demuestran que la unión de SUV39H1ΔSET-EYFP a las regiones pericentroméricas no interfiere con la progresión mitótica y que el aumento del índice mitótico se debe a la actividad desmetilasa de JMJD2D.

La eliminación de heterocromatina interrumpe la mitosis y la segregación cromosómica. a Análisis de la frecuencia de células mitóticas después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de cinco experimentos independientes. B Análisis de la frecuencia de cada fase mitótica individual en relación al número total de mitosis. Los datos representan la media y el error estándar de la media (p.ej.) de seis experimentos independientes. C Imágenes de IF representativas que muestran anomalías mitóticas en células HeLa. Las imágenes muestran ejemplos de puentes cromosómicos (cima), cromosomas rezagados (medio) y cromosomas no progresados ​​(fondo). D Análisis de la frecuencia de mitosis anormales después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de cuatro experimentos independientes. mi Análisis de la frecuencia de células mitóticas que muestran puentes o cromosomas rezagados después de la expresión de las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de cuatro experimentos independientes. F Imágenes de IF representativas que muestran anomalías en interfase en células HeLa. Las imágenes muestran una célula con micronúcleo (cima) y una célula binucleada (fondo). gramo Cuantificación de anomalías en interfase después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de tres experimentos independientes. Asteriscos indican diferencias estadísticamente significativas en comparación con EYFP (*PAG & lt 0.05, **PAG & lt 0.01, ***PAG & lt 0.001 Estudiante t prueba)

Observamos niveles significativamente disminuidos de células profase, metafase y anafase que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con los controles (Fig. 2b). No se observaron diferencias en la frecuencia de las células en la telofase, aunque se observó un pequeño aumento en las células en la citocinesis.

Para analizar los efectos de la eliminación de heterocromatina sobre la segregación cromosómica, cuantificamos las frecuencias de anomalías mitóticas en células HeLa que expresan las diferentes proteínas de fusión SUV39H1ΔSET-EYFP. Cuantificamos las frecuencias de puentes anafase, cromosomas rezagados, cromosomas no progresados ​​en metafase y husos malformados. En general, las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT mostraron una frecuencia significativamente mayor de mitosis anormal en comparación con las células que expresan los otros vectores (40 frente a 8-15%, respectivamente) (Fig. 2c, d). En particular, observamos frecuencias significativamente aumentadas de cromosomas y puentes rezagados en células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT (Fig. 2e). Aunque no hubo un aumento significativo en los husos multipolares a juzgar por la tinción con pericentrina, sí vimos una alta frecuencia de otras malformaciones del huso (Figura complementaria 2). En consonancia con el aumento de la frecuencia de las anomalías mitóticas, también observamos un aumento significativo de la frecuencia de los micronúcleos, un indicador sensible de los defectos de segregación cromosómica, en las células en interfase que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con los controles (13 frente a 4-6%) (fig. 2f, g).

Estos datos sugieren que la heterocromatina es necesaria para la segregación cromosómica correcta durante la mitosis y que su eliminación interfiere con la progresión mitótica y la fidelidad de la segregación cromosómica.

La heterocromatina perturbadora conduce a defectos en el centrómero

Los centrómeros dirigen el ensamblaje del cinetocoro, un complejo de múltiples proteínas que se une a los microtúbulos y dirige la segregación cromosómica (Fukagawa y Earnshaw 2014). Sin embargo, se ha informado que algunas proteínas del cinetocoro, incluido el complejo Mis12, se unen a la heterocromatina que flanquea la centrocromatina central (Obuse et al. 2004). En vista de los defectos de segregación cromosómica informados anteriormente, preguntamos si la eliminación de heterocromatina está asociada con defectos del cinetocoro.

La tinción de inmunofluorescencia para la proteína del cinetocoro externo HEC1 se realizó después de la expresión de las diferentes proteínas de fusión SUV39H1ΔSET-EYFP durante 48 h (el momento en el que observamos defectos significativos en la segregación cromosómica). Observamos disminuciones leves pero significativas en los niveles de HEC1 en las células que expresan todos los vectores SUV39H1ΔSET-EYFP en comparación con el control de transfección (Fig. 3a, b). Esto sugiere que la unión de SUV39H1ΔSET-EYFP solo tiene un efecto sobre la estructura del cinetocoro.

La eliminación de heterocromatina conduce a defectos en el centrómero. a Imágenes de inmunofluorescencia representativas de células HeLa que expresan las proteínas de fusión SUV39H1ΔSET-EYFP indicadas y teñidas para HEC1. Barra de escala 10 μm. B Cuantificación de señales de fluorescencia de tinción con HEC1 en células individuales transfectadas como en (a) representadas como unidades de fluorescencia arbitrarias (A.F.U). Barras sólidas indicar las medianas de dos experimentos independientes y barras de error representan el error estándar de la media (s.e.m). C Imágenes de inmunofluorescencia representativas que muestran células en prometafase con (cima) o dispersos (fondo) SGO1, utilizando CENP-A como marcador centrómero. Barra de escala 10 μm. D Análisis de la frecuencia de células que muestran tinción de SGO1 localizada o dispersa después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de tres experimentos independientes

Aunque todas las construcciones mostraron niveles disminuidos estadísticamente significativos de HEC1 en comparación con las células que expresan EYFP, la mayor disminución se observó en las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT (-49%). Se observaron disminuciones menores en las células que expresan SUV39H1ΔSET-EYFP (-36%), SUV39H1ΔSET-EYFP-JMJD2D D195A (-24%) y SUV39H1ΔSET W61AY67A -EYFP-JMJD2D WT (-9%). Por lo tanto, perturbar la heterocromatina tiene un efecto deletéreo sobre la estructura del cinetocoro. El módulo SUV39H1ΔSET puede ejercer un efecto negativo dominante al competir con R comedores que se unen a H3K9me3. Esto es consistente con la observación de que el mutante de unión a SUV39H1ΔSET exhibió el fenotipo más leve.

La heterocromatina pericentromérica se ha asociado con el mantenimiento de la cohesina en metafase (Nonaka et al. 2002). Después de la profase, los complejos de cohesina se eliminan de los brazos cromosómicos, pero se retienen en los centrómeros como resultado de la actividad de Shugoshin 1 (SGO1) (Losada et al. 2002). Dados los vínculos previos entre heterocromatina y cohesina en S. pombe (Nonaka et al. 2002), analizamos la localización de SGO1 después de expresar las diferentes proteínas de fusión SUV39H1ΔSET-EYFP en células HeLa. En los controles de transfección, SGO1 mostró una clara localización centromérica en el 95% de las células (Fig. 3c, d). La expresión de las diferentes proteínas SUV39H1ΔSET-EYFP dio como resultado aumentos significativos en la frecuencia de células con SGO1 dispersas en brazos cromosómicos (Fig. 3c, d). Por tanto, la unión de SUV39H1ΔSET-EYFP a la heterocromatina pericentromérica perturba la localización centromérica de SGO1. Como fue el caso de la tinción de HEC1, las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT exhibieron defectos de localización de SGO1 con más frecuencia que las células que expresan otros controles de SUV39H1ΔSET-EYFP (Fig. 3c, d).

Concluimos que las proteínas de fusión SUV39H1ΔSET-EYFP que se unen a los pericentrómeros generan defectos leves en el cinetocoro y SGO1. Sin embargo, estos defectos son consistentemente más altos después de eliminar la heterocromatina.

La heterocromatina coopera con la condensina para mantener la rigidez centromérica

Nosotros y otros demostramos previamente que el complejo de condensina es importante para mantener la rigidez del centrómero (Gerlich et al. 2006 Ribeiro et al. 2009 Jaqaman et al. 2010). Presumimos que la condensina podría actuar regulando el cumplimiento de la heterocromatina centromérica (Ribeiro et al. 2009). Para probar el efecto de eliminar la heterocromatina sobre la rigidez del centrómero, expresamos las diversas proteínas de fusión SUV39H1ΔSET-EYFP en células HeLa durante 48 horas y analizamos las distancias entre cinetocoros hermanos en cromosomas en metafase. Observamos un aumento significativo en esta distancia después de expresar SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con los controles (Fig. 4a, b). Esto apoya la idea de que la heterocromatina pericentromérica tiene un papel en el mantenimiento de la rigidez centromérica.

La heterocromatina es necesaria para mantener la rigidez del centrómero en metafase. a Imágenes de inmunofluorescencia representativas de células HeLa que expresan las proteínas de fusión SUV39H1ΔSET-EYFP indicadas y teñidas para CENP-C y tubulina. B Cuantificación de distancias intercentroméricas en cromosomas bajo tensión después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de tres experimentos independientes. C Inmunotransferencia de extracto de proteína de células HeLa completa transfectadas con los ARNip y los ADN indicados. Immunoblot para SMC2 con tubulina como control de carga. D Imágenes de inmunofluorescencia representativas de células HeLa que expresan las proteínas de fusión SUV39H1ΔSET-EYFP indicadas y transfectadas con el ARNip indicado. mi Cuantificación de distancias intercentroméricas en cromosomas bajo tensión después de expresar las proteínas de fusión SUV39H1ΔSET-EYFP y ARNip indicados. Los datos representan la media y el error estándar de la media (s.e.m) de tres experimentos independientes. Asteriscos indican diferencias estadísticamente significativas en comparación con EYFP (*PAG & lt 0.05, **PAG & lt 0.01, ***PAG & lt 0.001 Estudiante t prueba)

Para investigar nuestra hipótesis de que existe una interacción entre la condensina y la heterocromatina en el mantenimiento de la rigidez centromérica, reducimos parcialmente el SMC2 en las células HeLa utilizando ARNip publicados (Gerlich et al. 2006). El análisis de transferencia Western mostró una disminución del 61% en los niveles de SMC2 después de la transfección de ARNip (Figura complementaria 3a). Esto se confirmó mediante análisis de inmunofluorescencia, que mostró una reducción de los niveles de SMC2 en los cromosomas en comparación con el ARNip de control (Figura complementaria 3b). Aunque el 39% del SMC2 permaneció en las células en estas condiciones, observamos los fenotipos característicos de las células empobrecidas en condensina, incluidos cambios drásticos en la morfología cromosómica, aumento de la frecuencia de cromosomas rezagados y puentes cromosómicos (Figura complementaria 3b yc).

Una vez que se establecieron las condiciones para el agotamiento de SMC2 con ARNip, analizamos las distancias intercentroméricas de los cromosomas en metafase después de expresar SUV39H1ΔSET-EYFP o SUV39H1ΔSET-EYFP-JMJD2D WT en presencia o ausencia de agotamiento de SMC2 (Fig. 4c). De acuerdo con los resultados previos de nuestro grupo (Ribeiro et al. 2009), observamos un fuerte aumento en las distancias intercentroméricas en las células empobrecidas de SMC2 en comparación con las transfectadas con el ARNip de control (Fig. 4d, e). Sorprendentemente, nuestro análisis mostró aumentos significativos adicionales de las distancias intercentroméricas en las células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT en comparación con los controles que expresan SUV39H1ΔSET-EYFP. Este efecto adicional sobre la eliminación de heterocromatina se observó tanto en presencia como en ausencia de SMC2 (Fig. 4d, e).

Estos resultados muestran que la heterocromatina coopera con la condensina para mantener la rigidez centromérica. Sin embargo, la naturaleza aditiva del efecto observado sugiere que la condensina y la heterocromatina hacen contribuciones al menos parcialmente independientes.

La heterocromatina es esencial para la localización adecuada del complejo pasajero cromosómico

El complejo cromosómico pasajero (CPC) de Survivin, INCENP, Borealin y su subunidad catalítica Aurora B Quinasa se localiza en diferentes objetivos durante la mitosis, donde regula eventos mitóticos clave (Carmena et al. 2012). En la mitosis temprana, el CPC se localiza en los centrómeros internos, donde asegura que las uniones cinetocoro-microtúbulos sean correctas y regula el punto de control del ensamblaje del huso. Durante la anafase, se transfiere a la zona media donde regula la finalización de la citocinesis (Fig. 5a) (Carmena et al. 2012).

La eliminación de heterocromatina altera la localización de los pasajeros cromosómicos en la mitosis. a, B Imágenes de inmunofluorescencia representativas de células HeLa que expresan SUV39H1ΔSET-EYFP (a) o SUV39H1ΔSET-EYFP-JMJD2D WT (B) proteína de fusión y teñida para Survivina y Tubulina. Barra de escala 10 μm. C Análisis de la frecuencia de células que muestran CPC disperso en prometafase y metafase después de expresar las proteínas de fusión SUV39H1ΔSET indicadas. Los datos representan la media y el error estándar de la media (s.e.m) de dos experimentos independientes. Asteriscos indican diferencias estadísticamente significativas en comparación con EYFP (*PAG & lt 0.05, **PAG & lt 0.01 Estudiante t prueba)

Se ha informado que HP1 centromérico dirige el CPC a los centrómeros en la mitosis temprana (Ainsztein et al. 1998 Liu et al. 2014). Para estudiar el papel de la heterocromatina en la localización de CPC en los centrómeros, expresamos los diferentes vectores SUV39H1ΔSET-EYFP en células HeLa durante 48 hy analizamos la localización de la CPC mediante tinción para Survivina (Fig. 5a, b). En las células de control que expresan SUV39H1ΔSET-EYFP, el CPC se concentra en los centrómeros durante la prometafase (Fig. 5a, c). Sorprendentemente, nuestro análisis de inmunofluorescencia de células que expresan SUV39H1ΔSET-EYFP-JMJD2D WT mostró un aumento de la frecuencia de células con la CPC dispersa en los brazos cromosómicos en la mitosis temprana (Fig. 5b, c). Además, observamos defectos en la transferencia de CPC a la zona media en la mitosis tardía (Fig. 5a, b, paneles inferiores). La expresión de SUV39H1ΔSET-EYFP-JMJD2D WT condujo a una mayor frecuencia de células en la mitosis tardía en la que la CPC permaneció unida a los cromosomas y no pudo concentrarse en la zona media del huso.

Concluimos que la heterocromatina es necesaria para la localización eficaz de CPC en los centrómeros y también para su transferencia a la zona media en la mitosis tardía.


Información del autor

Afiliaciones

Investigación previa para la ciencia y tecnología embrionarias (PRESTO) de la Agencia de Ciencia y Tecnología de Japón (JST), el Instituto Nacional de Genética y la Universidad de Graduados de Estudios Avanzados, Mishima, 411-8540, Shizuoka, Japón

Tatsuo Fukagawa, Masahiro Nogami y amp Mitsuko Yoshikawa

Instituto de Ciencias Médicas Integrales, Universidad de Salud de Fujita, Toyoake, 470-1101, Aichi, Japón

Masashi Ikeno y el amperio Tuneko Okazaki

Departamento de Bioquímica, Miyazaki Medical College, Kiyotake, 889-1692, Miyazaki, Japón

Yasunari Takami y amp Tatsuo Nakayama

Departamento de Ciencias Biomédicas, Instituto de Medicina Regenerativa y Biofunción, Facultad de Ciencias Médicas, Universidad de Tottori, Nishimachi 86, Yonago, 683-8503, Tottori, Japón


Contenido

Las primeras secuencias del genoma humano fueron publicadas en forma de borrador casi completo en febrero de 2001 por el Proyecto Genoma Humano [15] y Celera Corporation. [16] La finalización del esfuerzo de secuenciación del Proyecto del Genoma Humano se anunció en 2004 con la publicación de un borrador de la secuencia del genoma, dejando solo 341 espacios en la secuencia, lo que representa ADN altamente repetitivo y de otro tipo que no se pudo secuenciar con la tecnología disponible en el tiempo. [8] El genoma humano fue el primero de todos los vertebrados en ser secuenciado casi hasta su finalización y, a partir de 2018, los genomas diploides de más de un millón de humanos individuales se habían determinado mediante secuenciación de próxima generación. [17] En 2021 se informó que el consorcio T2T había llenado todos los vacíos. Así nació un genoma humano completo sin lagunas. [18]

Estos datos se utilizan en todo el mundo en ciencias biomédicas, antropología, medicina forense y otras ramas de la ciencia. Estos estudios genómicos han dado lugar a avances en el diagnóstico y tratamiento de enfermedades y a nuevos conocimientos en muchos campos de la biología, incluida la evolución humana.

En junio de 2016, los científicos anunciaron formalmente HGP-Write, un plan para sintetizar el genoma humano. [19] [20]

Aunque la "finalización" del proyecto del genoma humano se anunció en 2001, [14] quedaron cientos de lagunas, con aproximadamente un 5-10% de la secuencia total sin determinar. La información genética faltante se encontraba principalmente en regiones heterocromáticas repetitivas y cerca de los centrómeros y telómeros, pero también en algunas regiones eucromáticas que codifican genes. [21] Quedaron 160 lagunas eucromáticas en 2015 cuando se determinaron las secuencias que abarcan otras 50 regiones no secuenciadas anteriormente. [22] Solo en 2020 se determinó la primera secuencia de telómero a telómero verdaderamente completa de un cromosoma humano, a saber, del cromosoma X. [23]

La longitud total del genoma de referencia humano, que no representa la secuencia de ningún individuo específico, supera los 3 mil millones de pares de bases. El genoma está organizado en 22 cromosomas pareados, denominados autosomas, más el par 23 de cromosomas sexuales (XX) en la hembra y (XY) en el macho. Todas estas son moléculas de ADN lineales grandes contenidas dentro del núcleo celular. El genoma también incluye el ADN mitocondrial, una molécula circular comparativamente pequeña presente en múltiples copias en cada mitocondria.

Datos del genoma de referencia humano, por cromosoma [24]
Cromosoma Largo
(mm)
Base
pares
Variaciones Proteína-
codificación
genes
Seudo-
genes
Total
largo
ncRNA
Total
pequeña
ncRNA
miARN ARNr snRNA snoRNA Misc
ncRNA
Enlaces Centrómero
posición
(Mbp)
Acumulativo
(%)
1 85 248,956,422 12,151,146 2058 1220 1200 496 134 66 221 145 192 EBI 125 7.9
2 83 242,193,529 12,945,965 1309 1023 1037 375 115 40 161 117 176 EBI 93.3 16.2
3 67 198,295,559 10,638,715 1078 763 711 298 99 29 138 87 134 EBI 91 23
4 65 190,214,555 10,165,685 752 727 657 228 92 24 120 56 104 EBI 50.4 29.6
5 62 181,538,259 9,519,995 876 721 844 235 83 25 106 61 119 EBI 48.4 35.8
6 58 170,805,979 9,130,476 1048 801 639 234 81 26 111 73 105 EBI 61 41.6
7 54 159,345,973 8,613,298 989 885 605 208 90 24 90 76 143 EBI 59.9 47.1
8 50 145,138,636 8,221,520 677 613 735 214 80 28 86 52 82 EBI 45.6 52
9 48 138,394,717 6,590,811 786 661 491 190 69 19 66 51 96 EBI 49 56.3
10 46 133,797,422 7,223,944 733 568 579 204 64 32 87 56 89 EBI 40.2 60.9
11 46 135,086,622 7,535,370 1298 821 710 233 63 24 74 76 97 EBI 53.7 65.4
12 45 133,275,309 7,228,129 1034 617 848 227 72 27 106 62 115 EBI 35.8 70
13 39 114,364,328 5,082,574 327 372 397 104 42 16 45 34 75 EBI 17.9 73.4
14 36 107,043,718 4,865,950 830 523 533 239 92 10 65 97 79 EBI 17.6 76.4
15 35 101,991,189 4,515,076 613 510 639 250 78 13 63 136 93 EBI 19 79.3
16 31 90,338,345 5,101,702 873 465 799 187 52 32 53 58 51 EBI 36.6 82
17 28 83,257,441 4,614,972 1197 531 834 235 61 15 80 71 99 EBI 24 84.8
18 27 80,373,285 4,035,966 270 247 453 109 32 13 51 36 41 EBI 17.2 87.4
19 20 58,617,616 3,858,269 1472 512 628 179 110 13 29 31 61 EBI 26.5 89.3
20 21 64,444,167 3,439,621 544 249 384 131 57 15 46 37 68 EBI 27.5 91.4
21 16 46,709,983 2,049,697 234 185 305 71 16 5 21 19 24 EBI 13.2 92.6
22 17 50,818,468 2,135,311 488 324 357 78 31 5 23 23 62 EBI 14.7 93.8
X 53 156,040,895 5,753,881 842 874 271 258 128 22 85 64 100 EBI 60.6 99.1
Y 20 57,227,415 211,643 71 388 71 30 15 7 17 3 8 EBI 10.4 100
ADNmt 0.0054 16,569 929 13 0 0 24 0 2 0 0 0 EBI N / A 100
total 3,088,286,401 155,630,645 20412 14600 14727 5037 1756 532 1944 1521 2213

Análisis original publicado en la base de datos Ensembl del Instituto Europeo de Bioinformática (EBI) y del Wellcome Trust Sanger Institute.Longitudes de los cromosomas estimadas multiplicando el número de pares de bases por 0,34 nanómetros (distancia entre pares de bases en la estructura más común de la doble hélice de ADN, una estimación reciente de las longitudes de los cromosomas humanos basada en informes de datos actualizados 205,00 cm para el genoma masculino diploide y 208,23 cm para las hembras, correspondientes a pesos de 6,41 y 6,51 picogramos (pg), respectivamente [25]). El número de proteínas se basa en el número de transcripciones de ARNm precursoras iniciales y no incluye productos de empalme alternativo de ARNm previo ni modificaciones en la estructura de la proteína que se producen después de la traducción.

Las variaciones son diferencias únicas en la secuencia de ADN que se han identificado en las secuencias del genoma humano individual analizadas por Ensembl en diciembre de 2016. Se espera que el número de variaciones identificadas aumente a medida que se secuencian y analizan más genomas personales. Además del contenido de genes que se muestra en esta tabla, se ha identificado un gran número de secuencias funcionales no expresadas en todo el genoma humano (ver más abajo). Vincula ventanas abiertas a las secuencias de cromosomas de referencia en el navegador del genoma de EBI.

Los ARN pequeños no codificantes son ARN de hasta 200 bases que no tienen potencial de codificación de proteínas. Estos incluyen: microARN o miARN (reguladores postranscripcionales de la expresión génica), ARN nucleares pequeños o ARNsn (los componentes de ARN de los espliceosomas) y ARN nucleolares pequeños o ARNsno (que participan en la guía de modificaciones químicas de otras moléculas de ARN). Los ARN largos no codificantes son moléculas de ARN de más de 200 bases que no tienen potencial de codificación de proteínas. Estos incluyen: ARN ribosómico o ARNr (los componentes de ARN de los ribosomas) y una variedad de otros ARN largos que participan en la regulación de la expresión génica, modificaciones epigenéticas de nucleótidos de ADN y proteínas histonas, y regulación de la actividad de codificación de proteínas. genes. Pequeñas discrepancias entre los números de ncRNA pequeños totales y los números de tipos específicos de ncNRA pequeños son el resultado de que los primeros valores provienen de la versión 87 de Ensembl y el último de la versión 68 de Ensembl.

El número de genes en el genoma humano no está del todo claro porque la función de numerosas transcripciones sigue sin estar clara. Esto es especialmente cierto para el ARN no codificante. El número de genes que codifican proteínas se conoce mejor, pero todavía hay del orden de 1.400 genes cuestionables que pueden o no codificar proteínas funcionales, generalmente codificadas por marcos de lectura abiertos cortos.

Discrepancias en las estimaciones del número de genes humanos entre diferentes bases de datos, a julio de 2018 [26]
Gencode [27] Conjunto [28] Refseq [29] AJEDREZ [30]
genes que codifican proteínas 19,901 20,376 20,345 21,306
genes de lncRNA 15,779 14,720 17,712 18,484
ARN antisentido 5501 28 2694
ARN misceláneo 2213 2222 13,899 4347
Pseudogenes 14,723 1740 15,952
transcripciones totales 203,835 203,903 154,484 328,827

Contenido de la información Editar

El genoma humano haploide (23 cromosomas) tiene aproximadamente 3 mil millones de pares de bases y contiene alrededor de 30,000 genes. [31] Dado que cada par de bases se puede codificar con 2 bits, esto equivale a unos 750 megabytes de datos. Una célula somática (diploide) individual contiene el doble de esta cantidad, es decir, alrededor de 6 mil millones de pares de bases. Los hombres tienen menos que las mujeres porque el cromosoma Y tiene unos 57 millones de pares de bases, mientras que el X tiene unos 156 millones. Dado que los genomas individuales varían en secuencia en menos del 1% entre sí, las variaciones del genoma de un humano dado a partir de una referencia común pueden comprimirse sin pérdidas a aproximadamente 4 megabytes. [32]

La tasa de entropía del genoma difiere significativamente entre secuencias codificantes y no codificantes. Está cerca del máximo de 2 bits por par de bases para las secuencias de codificación (alrededor de 45 millones de pares de bases), pero menos para las partes no codificantes. Varía entre 1,5 y 1,9 bits por par de bases para el cromosoma individual, a excepción del cromosoma Y, que tiene una tasa de entropía por debajo de 0,9 bits por par de bases. [33]

El contenido del genoma humano se divide comúnmente en secuencias de ADN codificantes y no codificantes. El ADN codificante se define como aquellas secuencias que pueden transcribirse en ARNm y traducirse en proteínas durante el ciclo de vida humano; estas secuencias ocupan solo una pequeña fracción del genoma (& lt2%). El ADN no codificante está formado por todas esas secuencias (aproximadamente el 98% del genoma) que no se utilizan para codificar proteínas.

Algunos ADN no codificantes contienen genes para moléculas de ARN con funciones biológicas importantes (ARN no codificantes, por ejemplo, ARN ribosómico y ARN de transferencia). La exploración de la función y el origen evolutivo del ADN no codificante es un objetivo importante de la investigación del genoma contemporáneo, incluido el proyecto ENCODE (Encyclopedia of DNA Elements), que tiene como objetivo estudiar todo el genoma humano, utilizando una variedad de herramientas experimentales cuyos resultados son indicativos. de actividad molecular.

Debido a que el ADN no codificante supera en gran medida al ADN codificante, el concepto del genoma secuenciado se ha convertido en un concepto analítico más centrado que el concepto clásico del gen que codifica el ADN. [34] [35]

Las secuencias codificantes de proteínas representan el componente más estudiado y mejor entendido del genoma humano. En última instancia, estas secuencias conducen a la producción de todas las proteínas humanas, aunque varios procesos biológicos (por ejemplo, reordenamientos del ADN y empalme alternativo de pre-ARNm) pueden conducir a la producción de muchas más proteínas únicas que el número de genes que codifican proteínas. La capacidad modular completa de codificación de proteínas del genoma está contenida dentro del exoma y consiste en secuencias de ADN codificadas por exones que pueden traducirse en proteínas. Debido a su importancia biológica y al hecho de que constituye menos del 2% del genoma, la secuenciación del exoma fue el primer hito importante del Proyecto Genoma Humano.

Número de genes que codifican proteínas. Se han anotado alrededor de 20.000 proteínas humanas en bases de datos como Uniprot. [37] Históricamente, las estimaciones para el número de genes de proteínas han variado ampliamente, llegando a 2,000,000 a fines de la década de 1960, [38] pero varios investigadores señalaron a principios de la década de 1970 que la carga mutacional estimada de mutaciones deletéreas colocaba un límite superior de aproximadamente 40.000 para el número total de loci funcionales (esto incluye genes codificantes de proteínas y no codificantes funcionales). [39] El número de genes que codifican proteínas humanas no es significativamente mayor que el de muchos organismos menos complejos, como el gusano redondo y la mosca de la fruta. Esta diferencia puede resultar del uso extensivo de empalme de pre-ARNm alternativo en humanos, que proporciona la capacidad de construir una gran cantidad de proteínas modulares mediante la incorporación selectiva de exones.

Capacidad de codificación de proteínas por cromosoma. Los genes que codifican proteínas se distribuyen de manera desigual en los cromosomas, desde unas pocas docenas hasta más de 2000, con una densidad genética especialmente alta en los cromosomas 1, 11 y 19. Cada cromosoma contiene varias regiones ricas y pobres en genes, que puede estar correlacionado con bandas de cromosomas y contenido de GC. [40] No se comprende bien la importancia de estos patrones no aleatorios de densidad genética. [41]

Tamaño de los genes que codifican proteínas. El tamaño de los genes que codifican proteínas dentro del genoma humano muestra una enorme variabilidad. Por ejemplo, el gen de la histona H1a (HIST1HIA) es relativamente pequeño y simple, carece de intrones y codifica un ARNm de 781 nucleótidos de longitud que produce una proteína de 215 aminoácidos a partir de su marco de lectura abierto de 648 nucleótidos. La distrofina (DMD) fue el gen codificador de proteínas más grande en el genoma de referencia humano de 2001, con un total de 2,2 millones de nucleótidos, [42] mientras que un metanálisis sistemático más reciente de datos actualizados del genoma humano identificó un gen codificador de proteínas aún más grande, RBFOX1 (Proteína de unión al ARN, homólogo 1 de fox-1), que abarca un total de 2,47 millones de nucleótidos. [43] La titina (TTN) tiene la secuencia codificante más larga (114,414 nucleótidos), el mayor número de exones (363), [42] y el exón único más largo (17,106 nucleótidos). Según una estimación basada en un conjunto curado de genes que codifican proteínas en todo el genoma, el tamaño medio es 26.288 nucleótidos (media = 66.577), el tamaño medio del exón, 133 nucleótidos (media = 309), el número medio de exones, 8 ( media = 11), y la proteína codificada mediana tiene 425 aminoácidos (media = 553) de longitud. [43]

Ejemplos de genes codificadores de proteínas humanas [44]
Proteína Crom Gene Largo Exones Longitud del exón Longitud del intrón Empalme alternativo
Proteína de susceptibilidad al cáncer de mama tipo 2 13 BRCA2 83,736 27 11,386 72,350
Fibrosis quística regulador de la conductancia transmembrana 7 CFTR 202,881 27 4,440 198,441
Citocromo b MONTE MTCYB 1,140 1 1,140 0 no
Distrofina X DMD 2,220,381 79 10,500 2,209,881
Gliceraldehído-3-fosfato deshidrogenasa 12 GAPDH 4,444 9 1,425 3,019
Subunidad beta de hemoglobina 11 HBB 1,605 3 626 979 no
Histona H1A 6 HIST1H1A 781 1 781 0 no
Titin 2 TTN 281,434 364 104,301 177,133

El ADN no codificante se define como todas las secuencias de ADN dentro de un genoma que no se encuentran dentro de los exones que codifican proteínas y, por lo tanto, nunca están representadas dentro de la secuencia de aminoácidos de las proteínas expresadas. Según esta definición, más del 98% de los genomas humanos está compuesto por ncDNA.

Se han identificado numerosas clases de ADN no codificante, incluidos genes para ARN no codificante (por ejemplo, ARNt y ARNr), pseudogenes, intrones, regiones no traducidas de ARNm, secuencias reguladoras de ADN, secuencias repetitivas de ADN y secuencias relacionadas con elementos genéticos móviles.

Numerosas secuencias que se incluyen dentro de los genes también se definen como ADN no codificante. Estos incluyen genes para ARN no codificante (por ejemplo, ARNt, ARNr) y componentes no traducidos de genes que codifican proteínas (por ejemplo, intrones y regiones no traducidas 5 'y 3' de ARNm).

Las secuencias codificantes de proteínas (específicamente, exones codificantes) constituyen menos del 1,5% del genoma humano. [14] Además, alrededor del 26% del genoma humano son intrones. [45] Aparte de los genes (exones e intrones) y secuencias reguladoras conocidas (8-20%), el genoma humano contiene regiones de ADN no codificante. La cantidad exacta de ADN no codificante que juega un papel en la fisiología celular ha sido objeto de acalorados debates. Un análisis reciente del proyecto ENCODE indica que el 80% de todo el genoma humano se transcribe, se une a proteínas reguladoras o está asociado con alguna otra actividad bioquímica. [12]

Sin embargo, sigue siendo controvertido si toda esta actividad bioquímica contribuye a la fisiología celular, o si una parte sustancial de esto es el resultado de ruido transcripcional y bioquímico, que el organismo debe filtrar activamente. [46] Excluyendo las secuencias codificantes de proteínas, los intrones y las regiones reguladoras, gran parte del ADN no codificante se compone de: Muchas secuencias de ADN que no juegan un papel en la expresión génica tienen funciones biológicas importantes. Los estudios de genómica comparativa indican que alrededor del 5% del genoma contiene secuencias de ADN no codificante que están muy conservadas, a veces en escalas de tiempo que representan cientos de millones de años, lo que implica que estas regiones no codificantes están bajo una fuerte presión evolutiva y selección positiva. [47]

Muchas de estas secuencias regulan la estructura de los cromosomas limitando las regiones de formación de heterocromatina y regulando las características estructurales de los cromosomas, como los telómeros y centrómeros. Otras regiones no codificantes sirven como orígenes de la replicación del ADN. Finalmente, varias regiones se transcriben en ARN funcional no codificante que regulan la expresión de genes que codifican proteínas (por ejemplo [48]), la traducción y estabilidad del ARNm (ver miARN), la estructura de la cromatina (incluidas las modificaciones de histonas, por ejemplo [49]), el ADN metilación (por ejemplo [50]), recombinación de ADN (por ejemplo [51]) y regulación cruzada de otros ARN no codificantes (por ejemplo [52]). También es probable que muchas regiones no codificantes transcritas no desempeñen ningún papel y que esta transcripción sea el producto de la actividad de la ARN polimerasa no específica. [46]

Pseudogenes editar

Los pseudogenes son copias inactivas de genes que codifican proteínas, a menudo generados por duplicación de genes, que se han vuelto no funcionales debido a la acumulación de mutaciones inactivadoras. El número de pseudogenes en el genoma humano es del orden de 13.000, [53] y en algunos cromosomas es casi el mismo que el número de genes codificantes de proteínas funcionales. La duplicación de genes es un mecanismo importante a través del cual se genera nuevo material genético durante la evolución molecular.

Por ejemplo, la familia de genes del receptor olfatorio es uno de los ejemplos mejor documentados de pseudogenes en el genoma humano. Más del 60 por ciento de los genes de esta familia son pseudogenes no funcionales en humanos. En comparación, sólo el 20 por ciento de los genes de la familia de genes del receptor olfativo de ratón son pseudogenes. La investigación sugiere que esta es una característica específica de la especie, ya que los primates más estrechamente relacionados tienen proporcionalmente menos pseudogenes. Este descubrimiento genético ayuda a explicar el sentido del olfato menos agudo en los humanos en relación con otros mamíferos. [54]

Genes para ARN no codificante (ncRNA) Editar

Las moléculas de ARN no codificantes desempeñan muchas funciones esenciales en las células, especialmente en las numerosas reacciones de síntesis de proteínas y procesamiento de ARN. El ARN no codificante incluye ARNt, ARN ribosómico, microARN, ARNnn y otros genes de ARN no codificante, incluidos aproximadamente 60.000 ARN largos no codificantes (lncRNA). [12] [55] [56] [57] Aunque el número de genes de lncRNA informados continúa aumentando y el número exacto en el genoma humano aún no se ha definido, se argumenta que muchos de ellos no son funcionales. [58]

Muchos ncRNA son elementos críticos en la regulación y expresión de genes. El ARN no codificante también contribuye a la epigenética, la transcripción, el empalme de ARN y la maquinaria de traducción. El papel del ARN en la regulación genética y la enfermedad ofrece un nuevo nivel potencial de complejidad genómica inexplorada. [59]

Intrones y regiones no traducidas de ARNm Editar

Además de las moléculas de ncRNA codificadas por genes discretos, las transcripciones iniciales de genes codificantes de proteínas suelen contener secuencias no codificantes extensas, en forma de intrones, regiones 5 'sin traducir (5'-UTR) y regiones 3' sin traducir (3'-UTR). Dentro de la mayoría de los genes que codifican proteínas del genoma humano, la longitud de las secuencias de intrones es de 10 a 100 veces la longitud de las secuencias de exones.

Secuencias de ADN reguladoras Editar

El genoma humano tiene muchas secuencias reguladoras diferentes que son cruciales para controlar la expresión génica. Las estimaciones conservadoras indican que estas secuencias constituyen el 8% del genoma, [60] sin embargo, las extrapolaciones del proyecto ENCODE dan que el 20 [61] -40% [62] del genoma es una secuencia reguladora de genes. Algunos tipos de ADN no codificante son "interruptores" genéticos que no codifican proteínas, pero sí regulan cuándo y dónde se expresan los genes (llamados potenciadores). [63]

Las secuencias reguladoras se conocen desde finales de la década de 1960. [64] La primera identificación de secuencias reguladoras en el genoma humano se basó en la tecnología del ADN recombinante. [65] Más tarde, con el advenimiento de la secuenciación genómica, la identificación de estas secuencias podría inferirse por conservación evolutiva. La rama evolutiva entre los primates y el ratón, por ejemplo, se produjo hace 70 a 90 millones de años. [66] Por lo tanto, las comparaciones por computadora de secuencias de genes que identifican secuencias no codificantes conservadas serán una indicación de su importancia en tareas como la regulación de genes. [67]

Se han secuenciado otros genomas con la misma intención de ayudar a los métodos guiados por la conservación, por ejemplo, el genoma del pez globo. [68] Sin embargo, las secuencias reguladoras desaparecen y vuelven a evolucionar durante la evolución a un ritmo elevado. [69] [70] [71]

A partir de 2012, los esfuerzos se han orientado hacia la búsqueda de interacciones entre el ADN y las proteínas reguladoras mediante la técnica ChIP-Seq, o espacios donde el ADN no está empaquetado por histonas (sitios hipersensibles a la ADNasa), los cuales indican dónde hay secuencias reguladoras activas en el tipo de célula investigado. [60]

Secuencias de ADN repetitivas Editar

Las secuencias de ADN repetitivas comprenden aproximadamente el 50% del genoma humano. [72]

Aproximadamente el 8% del genoma humano consiste en matrices de ADN en tándem o repeticiones en tándem, secuencias repetidas de baja complejidad que tienen múltiples copias adyacentes (por ejemplo, "CAGCAGCAG"). [73] Las secuencias en tándem pueden tener longitudes variables, desde dos nucleótidos hasta decenas de nucleótidos. Estas secuencias son muy variables, incluso entre individuos estrechamente relacionados, por lo que se utilizan para pruebas de ADN genealógico y análisis forense de ADN. [74]

Secuencias repetidas de menos de diez nucleótidos (por ejemplo, la repetición de dinucleótidos (AC)norte) se denominan secuencias de microsatélites. Entre las secuencias de microsatélites, las repeticiones de trinucleótidos son de particular importancia, ya que a veces ocurren dentro de las regiones codificantes de genes para proteínas y pueden conducir a trastornos genéticos. Por ejemplo, la enfermedad de Huntington es el resultado de una expansión de la repetición de trinucleótidos (CAG)norte dentro de Huntingtin gen en el cromosoma humano 4. Los telómeros (los extremos de los cromosomas lineales) terminan con una repetición de la secuencia de hexanucleótidos microsatélites (TTAGGG)norte.

Las repeticiones en tándem de secuencias más largas (matrices de secuencias repetidas de 10 a 60 nucleótidos de longitud) se denominan minisatélites.

Elementos genéticos móviles (transposones) y sus reliquias Editar

Los elementos genéticos transponibles, secuencias de ADN que pueden replicarse e insertar copias de sí mismos en otras ubicaciones dentro del genoma del huésped, son un componente abundante en el genoma humano. El linaje de transposones más abundante, Alu, tiene alrededor de 50.000 copias activas, [75] y puede insertarse en regiones intragénicas e intergénicas. [76] Otro linaje, LINE-1, tiene alrededor de 100 copias activas por genoma (el número varía entre personas). [77] Junto con las reliquias no funcionales de viejos transposones, representan más de la mitad del ADN humano total. [78] A veces llamados "genes saltarines", los transposones han desempeñado un papel importante en la escultura del genoma humano. Algunas de estas secuencias representan retrovirus endógenos, copias de ADN de secuencias virales que se han integrado permanentemente en el genoma y ahora se transmiten a las generaciones siguientes.

Los elementos móviles dentro del genoma humano se pueden clasificar en retrotransposones LTR (8,3% del genoma total), SINE (13,1% del genoma total), incluidos elementos Alu, LINE (20,4% del genoma total), SVA y transposones de ADN de clase II (2,9%). del genoma total).

Genoma de referencia humano Editar

Con la excepción de los gemelos idénticos, todos los seres humanos muestran una variación significativa en las secuencias de ADN genómico. El genoma de referencia humano (HRG) se utiliza como referencia de secuencia estándar.

Hay varios puntos importantes relacionados con el genoma de referencia humano:

  • La HRG es una secuencia haploide. Cada cromosoma está representado una vez.
  • La HRG es una secuencia compuesta y no corresponde a ningún individuo humano real.
  • El HRG se actualiza periódicamente para corregir errores, ambigüedades y "lagunas" desconocidas.
  • El HRG de ninguna manera representa un individuo humano "ideal" o "perfecto". Es simplemente una representación o modelo estandarizado que se utiliza con fines comparativos.

El Consorcio de Referencia del Genoma es responsable de actualizar el HRG. La versión 38 se publicó en diciembre de 2013. [79]

Midiendo la variación genética humana Editar

La mayoría de los estudios de variación genética humana se han centrado en polimorfismos de un solo nucleótido (SNP), que son sustituciones en bases individuales a lo largo de un cromosoma. La mayoría de los análisis estiman que los SNP ocurren en 1 de cada 1000 pares de bases, en promedio, en el genoma humano eucromático, aunque no ocurren con una densidad uniforme. Así sigue la afirmación popular de que "todos, independientemente de la raza, genéticamente 99,9% iguales", [80] aunque esto sería algo calificado por la mayoría de los genetistas. Por ejemplo, ahora se cree que una fracción mucho mayor del genoma está involucrada en la variación del número de copias. [81] El Proyecto Internacional HapMap está llevando a cabo un esfuerzo de colaboración a gran escala para catalogar las variaciones de SNP en el genoma humano.

Los loci genómicos y la longitud de ciertos tipos de pequeñas secuencias repetitivas varían mucho de una persona a otra, lo cual es la base de las tecnologías de huellas dactilares de ADN y pruebas de paternidad de ADN. También se cree que las porciones heterocromáticas del genoma humano, que suman varios cientos de millones de pares de bases, son bastante variables dentro de la población humana (son tan repetitivas y tan largas que no se pueden secuenciar con precisión con la tecnología actual). Estas regiones contienen pocos genes y no está claro si algún efecto fenotípico significativo resulta de una variación típica en las repeticiones o heterocromatina.

La mayoría de las mutaciones genómicas graves en las células germinales de los gametos probablemente dan como resultado embriones inviables; sin embargo, varias enfermedades humanas están relacionadas con anomalías genómicas a gran escala. El síndrome de Down, el síndrome de Turner y una serie de otras enfermedades son el resultado de la no disyunción de cromosomas completos. Las células cancerosas con frecuencia tienen aneuploidía de cromosomas y brazos cromosómicos, aunque no se ha establecido una relación de causa y efecto entre aneuploidía y cáncer.

Mapeo de la variación genómica humana Editar

Mientras que una secuencia del genoma enumera el orden de cada base de ADN en un genoma, un mapa del genoma identifica los puntos de referencia. Un mapa del genoma es menos detallado que una secuencia del genoma y ayuda a navegar por el genoma. [82] [83]

Un ejemplo de mapa de variación es el HapMap que está desarrollando el Proyecto Internacional HapMap. El HapMap es un mapa de haplotipos del genoma humano, "que describirá los patrones comunes de variación de la secuencia del ADN humano". [84] Cataloga los patrones de variaciones a pequeña escala en el genoma que involucran letras o bases de ADN individuales.

Los investigadores publicaron el primer mapa basado en secuencias de variación estructural a gran escala en el genoma humano en la revista. Naturaleza en mayo de 2008. [85] [86] Las variaciones estructurales a gran escala son diferencias en el genoma entre las personas que van desde unos pocos miles a unos pocos millones de bases de ADN, algunas son ganancias o pérdidas de tramos de la secuencia del genoma y otras aparecen como arreglos de tramos de secuencia. Estas variaciones incluyen diferencias en el número de copias que los individuos tienen de un gen particular, deleciones, translocaciones e inversiones.

Variación estructural Editar

La variación estructural se refiere a variantes genéticas que afectan a segmentos más grandes del genoma humano, a diferencia de las mutaciones puntuales. A menudo, las variantes estructurales (SV) se definen como variantes de 50 pares de bases (pb) o más, como deleciones, duplicaciones, inserciones, inversiones y otros reordenamientos. Aproximadamente el 90% de las variantes estructurales son deleciones no codificantes, pero la mayoría de los individuos tienen más de mil de tales deleciones; el tamaño de las deleciones varía desde docenas de pares de bases hasta decenas de miles de pb. [87] En promedio, las personas llevan

3 variantes estructurales raras que alteran las regiones codificantes, p. Ej. eliminar exones. Aproximadamente el 2% de los individuos portan variantes estructurales de escala de megabase ultra raras, especialmente reordenamientos. Es decir, millones de pares de bases pueden estar invertidos dentro de un cromosoma ultra raro, lo que significa que solo se encuentran en individuos o en sus familiares y, por lo tanto, han surgido muy recientemente. [87]

Frecuencia de SNP en todo el genoma humano Editar

Los polimorfismos de un solo nucleótido (SNP) no ocurren de manera homogénea en todo el genoma humano. De hecho, existe una enorme diversidad en la frecuencia de SNP entre genes, lo que refleja diferentes presiones selectivas en cada gen, así como diferentes tasas de mutación y recombinación en todo el genoma. Sin embargo, los estudios sobre SNP están sesgados hacia regiones codificantes, es poco probable que los datos generados a partir de ellos reflejen la distribución general de SNP en todo el genoma. Por lo tanto, el protocolo del SNP Consortium se diseñó para identificar SNP sin sesgo hacia las regiones codificantes y los 100.000 SNP del Consorcio generalmente reflejan la diversidad de secuencias en los cromosomas humanos. El SNP Consortium tiene como objetivo ampliar el número de SNP identificados en todo el genoma a 300 000 para fines del primer trimestre de 2001. [88]

Cambios en secuencia no codificante y cambios sinónimos en secuencia de codificación son generalmente más comunes que los cambios no sinónimos, lo que refleja una mayor presión selectiva que reduce la diversidad en las posiciones que dictan la identidad de los aminoácidos. Los cambios de transición son más comunes que las transversiones, y los dinucleótidos CpG muestran la tasa de mutación más alta, presumiblemente debido a la desaminación.

Genomas personales Editar

Una secuencia del genoma personal es una secuencia (casi) completa de los pares de bases químicas que componen el ADN de una sola persona. Debido a que los tratamientos médicos tienen diferentes efectos en diferentes personas debido a variaciones genéticas, como los polimorfismos de un solo nucleótido (SNP), el análisis de genomas personales puede conducir a un tratamiento médico personalizado basado en genotipos individuales. [89]

La primera secuencia del genoma personal que se determinó fue la de Craig Venter en 2007. Los genomas personales no se habían secuenciado en el Proyecto Genoma Humano público para proteger la identidad de los voluntarios que proporcionaron muestras de ADN. Esa secuencia se derivó del ADN de varios voluntarios de una población diversa. [90] Sin embargo, al principio del esfuerzo de secuenciación del genoma de Celera Genomics dirigido por Venter, se tomó la decisión de cambiar de secuenciar una muestra compuesta a usar ADN de un solo individuo, que luego se reveló que había sido el propio Venter. Por lo tanto, la secuencia del genoma humano de Celera publicada en 2000 fue en gran parte la de un hombre. El reemplazo posterior de los primeros datos derivados de compuestos y la determinación de la secuencia diploide, que representa ambos conjuntos de cromosomas, en lugar de una secuencia haploide informada originalmente, permitió la liberación del primer genoma personal. [91] En abril de 2008, también se completó el de James Watson. En 2009, Stephen Quake publicó su propia secuencia de genoma derivada de un secuenciador de su propio diseño, el Heliscope. [92] Un equipo de Stanford dirigido por Euan Ashley publicó un marco para la interpretación médica de los genomas humanos implementado en el genoma de Quake y tomó decisiones médicas basadas en el genoma completo por primera vez. [93] Ese equipo amplió aún más el enfoque a la familia West, la primera familia secuenciada como parte del programa de secuenciación del genoma personal de Illumina. [94] Desde entonces se han publicado cientos de secuencias genómicas personales, [95] incluidas las de Desmond Tutu, [96] [97] y de un Paleo-Eskimo. [98] En 2012, se hicieron públicas las secuencias del genoma completo de dos tríos familiares entre 1092 genomas. [3] En noviembre de 2013, una familia española puso a disposición del público cuatro conjuntos de datos de exomas personales (alrededor del 1% del genoma) bajo una licencia de dominio público de Creative Commons. [99] [100] El Proyecto Genoma Personal (iniciado en 2005) se encuentra entre los pocos que ponen a disposición del público tanto las secuencias del genoma como los fenotipos médicos correspondientes. [101] [102]

La secuenciación de genomas individuales reveló niveles de complejidad genética que no se habían apreciado antes. La genómica personal ayudó a revelar el nivel significativo de diversidad en el genoma humano atribuido no solo a los SNP sino también a las variaciones estructurales. Sin embargo, la aplicación de tal conocimiento al tratamiento de enfermedades y en el campo médico está solo en sus inicios. [103] La secuenciación del exoma se ha vuelto cada vez más popular como una herramienta para ayudar en el diagnóstico de enfermedades genéticas porque el exoma contribuye solo con el 1% de la secuencia genómica pero representa aproximadamente el 85% de las mutaciones que contribuyen significativamente a la enfermedad. [104]

Nocauts humanos Editar

En los seres humanos, los knockouts de genes ocurren naturalmente como knockouts de genes heterocigotos u homocigotos con pérdida de función. Estos nocauts son a menudo difíciles de distinguir, especialmente dentro de antecedentes genéticos heterogéneos. También son difíciles de encontrar ya que ocurren en bajas frecuencias.

Las poblaciones con altas tasas de consanguinidad, como los países con altas tasas de matrimonios entre primos hermanos, muestran las frecuencias más altas de knockouts de genes homocigotos. Dichas poblaciones incluyen a las poblaciones de Pakistán, Islandia y Amish. Estas poblaciones con un alto nivel de parentesco han sido objeto de una investigación de knock out en humanos que ha ayudado a determinar la función de genes específicos en humanos. Al distinguir knockouts específicos, los investigadores pueden utilizar análisis fenotípicos de estos individuos para ayudar a caracterizar el gen que ha sido eliminado.

Los knockouts en genes específicos pueden causar enfermedades genéticas, potencialmente tener efectos beneficiosos o incluso resultar en ningún efecto fenotípico. Sin embargo, determinar el efecto fenotípico de un knockout y en humanos puede ser un desafío. Los desafíos para caracterizar e interpretar clínicamente los knockouts incluyen la dificultad para llamar variantes de ADN, determinar la interrupción de la función de la proteína (anotación) y considerar la cantidad de influencia que tiene el mosaicismo en el fenotipo. [105]

Un estudio importante que investigó los nocauts humanos es el estudio Pakistan Risk of Myocardial Infarction. Se descubrió que los individuos que poseían un gen de pérdida de función heterocigoto knockout para el gen APOC3 tenían triglicéridos más bajos en la sangre después de consumir una comida rica en grasas en comparación con los individuos sin la mutación. Sin embargo, los individuos que poseen knockouts de genes homocigotos de pérdida de función del gen APOC3 mostraron el nivel más bajo de triglicéridos en la sangre después de la prueba de carga de grasa, ya que no producen proteína APOC3 funcional. [106]

La mayoría de los aspectos de la biología humana involucran factores genéticos (heredados) y no genéticos (ambientales). Algunas variaciones heredadas influyen en aspectos de nuestra biología que no son de naturaleza médica (altura, color de ojos, capacidad para saborear u oler ciertos compuestos, etc.). Además, algunos trastornos genéticos solo causan enfermedades en combinación con los factores ambientales apropiados (como la dieta). Con estas advertencias, los trastornos genéticos pueden describirse como enfermedades clínicamente definidas causadas por la variación de la secuencia del ADN genómico. En los casos más sencillos, el trastorno puede asociarse con la variación en un solo gen. Por ejemplo, la fibrosis quística es causada por mutaciones en el gen CFTR y es el trastorno recesivo más común en poblaciones caucásicas con más de 1300 mutaciones diferentes conocidas. [107]

Las mutaciones que causan enfermedades en genes específicos suelen ser graves en términos de función genética y, afortunadamente, son raras, por lo que los trastornos genéticos son igualmente raros a nivel individual. Sin embargo, dado que hay muchos genes que pueden variar para causar trastornos genéticos, en conjunto constituyen un componente importante de las afecciones médicas conocidas, especialmente en la medicina pediátrica. Los trastornos genéticos caracterizados molecularmente son aquellos para los que se ha identificado el gen causal subyacente. Actualmente hay aproximadamente 2.200 de estos trastornos anotados en la base de datos OMIM. [107]

Los estudios de trastornos genéticos a menudo se realizan mediante estudios basados ​​en la familia. En algunos casos, se emplean enfoques basados ​​en la población, particularmente en el caso de las denominadas poblaciones fundadoras, como las de Finlandia, Canadá-Francia, Utah, Cerdeña, etc. El diagnóstico y el tratamiento de los trastornos genéticos suelen ser realizados por un médico-genetista. entrenado en genética clínica / médica. Es probable que los resultados del Proyecto Genoma Humano proporcionen una mayor disponibilidad de pruebas genéticas para los trastornos relacionados con los genes y, finalmente, un tratamiento mejorado. Los padres pueden ser evaluados para detectar condiciones hereditarias y asesorarles sobre las consecuencias, la probabilidad de herencia y cómo evitarlas o mejorarlas en su descendencia.

Hay muchos tipos diferentes de variación de la secuencia de ADN, que van desde cromosomas completos extra o faltantes hasta cambios de un solo nucleótido. Generalmente se presume que gran parte de la variación genética que ocurre naturalmente en las poblaciones humanas es fenotípicamente neutra, es decir, tiene poco o ningún efecto detectable en la fisiología del individuo (aunque puede haber diferencias fraccionarias en la aptitud definidas a lo largo de los marcos de tiempo evolutivos). Los trastornos genéticos pueden ser causados ​​por cualquiera o todos los tipos conocidos de variación de secuencia. Para caracterizar molecularmente un nuevo trastorno genético, es necesario establecer un vínculo causal entre una variante de secuencia genómica particular y la enfermedad clínica bajo investigación. Estos estudios constituyen el ámbito de la genética molecular humana.

Con el advenimiento del Proyecto Genoma Humano e Internacional HapMap, se ha vuelto factible explorar influencias genéticas sutiles en muchas enfermedades comunes como diabetes, asma, migraña, esquizofrenia, etc. Aunque se han establecido algunos vínculos causales entre variantes de secuencia genómica en genes particulares y algunas de estas enfermedades, a menudo con mucha publicidad en los medios de comunicación generales, generalmente no se consideran trastornos genéticos per se ya que sus causas son complejas e involucran muchos factores genéticos y ambientales diferentes. Por lo tanto, puede haber desacuerdo en casos particulares sobre si una afección médica específica debe denominarse trastorno genético.

Otros trastornos genéticos a mencionar son el síndrome de Kallman y el síndrome de Pfeiffer (gen FGFR1), la distrofia corneal de Fuchs (gen TCF4), la enfermedad de Hirschsprung (genes RET y FECH), el síndrome de Bardet-Biedl 1 (genes CCDC28B y BBS1), el síndrome de Bardet-Biedl 10 (gen BBS10) y distrofia muscular facioescapulohumeral tipo 2 (genes D4Z4 y SMCHD1). [108]

La secuenciación del genoma ahora puede reducir el genoma a ubicaciones específicas para encontrar con mayor precisión mutaciones que resultarán en un trastorno genético. Las variantes de número de copias (CNV) y las variantes de un solo nucleótido (SNV) también se pueden detectar al mismo tiempo que la secuenciación del genoma con procedimientos de secuenciación más nuevos disponibles, denominados Secuenciación de próxima generación (NGS). Esto solo analiza una pequeña porción del genoma, alrededor del 1-2%. Los resultados de esta secuenciación se pueden utilizar para el diagnóstico clínico de una afección genética, incluido el síndrome de Usher, enfermedad de la retina, problemas de audición, diabetes, epilepsia, enfermedad de Leigh, cánceres hereditarios, enfermedades neuromusculares, inmunodeficiencias primarias, inmunodeficiencia combinada grave (SCID) y enfermedades de las mitocondrias. [109] NGS también se puede utilizar para identificar a los portadores de enfermedades antes de la concepción. Las enfermedades que se pueden detectar en esta secuenciación incluyen la enfermedad de Tay-Sachs, el síndrome de Bloom, la enfermedad de Gaucher, la enfermedad de Canavan, la disautonomía familiar, la fibrosis quística, la atrofia muscular espinal y el síndrome de X frágil. La secuenciación del próximo genoma se puede reducir para buscar específicamente enfermedades más prevalentes en determinadas poblaciones étnicas. [110]

1: 15000 en caucásicos estadounidenses

1: 176 en comunidades menonitas / amish

Los estudios de genómica comparativa de genomas de mamíferos sugieren que aproximadamente el 5% del genoma humano se ha conservado por evolución desde la divergencia de linajes existentes hace aproximadamente 200 millones de años, que contienen la gran mayoría de genes. [111] [112] El genoma publicado del chimpancé difiere del genoma humano en un 1,23% en las comparaciones de secuencia directa. [113] Alrededor del 20% de esta cifra se explica por la variación dentro de cada especie, dejando solo

1.06% de divergencia de secuencia consistente entre humanos y chimpancés en genes compartidos. [114] Sin embargo, esta diferencia de nucleótido a nucleótido se ve eclipsada por la parte de cada genoma que no se comparte, incluido alrededor del 6% de los genes funcionales que son exclusivos de los humanos o los chimpancés. [115]

En otras palabras, las considerables diferencias observables entre humanos y chimpancés pueden deberse tanto o más a la variación a nivel del genoma en el número, función y expresión de genes más que a cambios en la secuencia de ADN en genes compartidos. De hecho, incluso dentro de los seres humanos, se ha descubierto que existe una cantidad de variación en el número de copias (CNV) que antes no se apreciaba y que puede constituir hasta un 5 - 15% del genoma humano. En otras palabras, entre humanos, podría haber +/- 500,000,000 pares de bases de ADN, algunos son genes activos, otros inactivados o activos a diferentes niveles. Queda por ver el significado completo de este hallazgo. En promedio, un gen codificador de proteínas humano típico se diferencia de su ortólogo de chimpancé en solo dos sustituciones de aminoácidos, casi un tercio de los genes humanos tienen exactamente la misma traducción de proteínas que sus ortólogos de chimpancé. Una diferencia importante entre los dos genomas es el cromosoma 2 humano, que es equivalente a un producto de fusión de los cromosomas 12 y 13 de los chimpancés [116] (posteriormente renombrados como cromosomas 2A y 2B, respectivamente).

Los seres humanos han sufrido una pérdida extraordinaria de genes receptores olfativos durante nuestra evolución reciente, lo que explica nuestro sentido del olfato relativamente crudo en comparación con la mayoría de los otros mamíferos. La evidencia evolutiva sugiere que el surgimiento de la visión del color en humanos y varias otras especies de primates ha disminuido la necesidad del sentido del olfato. [117]

En septiembre de 2016, los científicos informaron que, basándose en estudios genéticos de ADN humano, todos los no africanos en el mundo de hoy se pueden rastrear hasta una sola población que salió de África hace entre 50.000 y 80.000 años. [118]

El ADN mitocondrial humano es de gran interés para los genetistas, ya que indudablemente juega un papel en la enfermedad mitocondrial. También arroja luz sobre la evolución humana, por ejemplo, el análisis de la variación en el genoma mitocondrial humano ha llevado a la postulación de un ancestro común reciente para todos los humanos en la línea de descendencia materna (ver Eva mitocondrial).

Debido a la falta de un sistema para verificar errores de copia, [119] el ADN mitocondrial (ADNmt) tiene una tasa de variación más rápida que el ADN nuclear. Esta tasa de mutación 20 veces mayor permite que el ADNmt se utilice para un rastreo más preciso de la ascendencia materna. [ cita necesaria ] Los estudios de ADNmt en poblaciones han permitido rastrear antiguas rutas migratorias, como la migración de nativos americanos desde Siberia [120] o polinesios del sureste de Asia. [ cita necesaria ] También se ha utilizado para demostrar que no hay rastros de ADN neandertal en la mezcla de genes europeos heredados a través de un linaje puramente materno. [121] Debido a la restricción total o nula de herencia del mtDNA, este resultado (sin rastro de mtDNA de Neandertal) sería probable a menos que hubiera un gran porcentaje de ascendencia neandertal, o hubiera una fuerte selección positiva para ese mtDNA. Por ejemplo, retrocediendo 5 generaciones, solo 1 de los 32 antepasados ​​de una persona contribuyó al ADNmt de esa persona, por lo que si uno de estos 32 era neandertal puro, se esperaba

El 3% del ADN autosómico de esa persona sería de origen neandertal, pero tendría un

97% de probabilidad de no tener rastros de ADNmt de Neandertal. [ cita necesaria ]

La epigenética describe una variedad de características del genoma humano que trascienden su secuencia de ADN primaria, como el empaquetamiento de la cromatina, las modificaciones de histonas y la metilación del ADN, y que son importantes en la regulación de la expresión génica, la replicación del genoma y otros procesos celulares. Los marcadores epigenéticos fortalecen y debilitan la transcripción de ciertos genes, pero no afectan la secuencia real de los nucleótidos del ADN. La metilación del ADN es una forma importante de control epigenético sobre la expresión génica y uno de los temas más estudiados en epigenética. Durante el desarrollo, el perfil de metilación del ADN humano experimenta cambios dramáticos. En las células de la línea germinal temprana, el genoma tiene niveles de metilación muy bajos. Estos niveles bajos generalmente describen genes activos. A medida que avanza el desarrollo, las etiquetas de impronta parental conducen a una mayor actividad de metilación. [122] [123]

Los patrones epigenéticos pueden identificarse entre tejidos dentro de un individuo, así como entre los propios individuos. Los genes idénticos que tienen diferencias solo en su estado epigenético se denominan epialleles. Los epialleles se pueden clasificar en tres categorías: los que están directamente determinados por el genotipo de un individuo, los que están influenciados por el genotipo y los que son completamente independientes del genotipo. El epigenoma también está influenciado significativamente por factores ambientales. La dieta, las toxinas y las hormonas afectan el estado epigenético. Los estudios sobre manipulación dietética han demostrado que las dietas deficientes en metilo están asociadas con la hipometilación del epigenoma. Dichos estudios establecen a la epigenética como una interfaz importante entre el medio ambiente y el genoma. [124]

  1. ^"GRCh38.p13". ncbi. Consorcio de referencia del genoma. Consultado el 8 de junio de 2020.
  2. ^
  3. Brown TA (2002). El genoma humano (2ª ed.). Oxford: Wiley-Liss.
  4. ^ aB
  5. Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang HM, Marth GT, McVean GA (noviembre de 2012). "Un mapa integrado de variación genética de 1.092 genomas humanos". Naturaleza. 491 (7422): 56–65. Código bibliográfico: 2012Natur.491. 56T. doi: 10.1038 / nature11632. PMC3498066. PMID23128226.
  6. ^
  7. Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, et al. (Octubre de 2015). "Una referencia mundial para la variación genética humana". Naturaleza. 526 (7571): 68–74. Código Bib: 2015Natur.526. 68T. doi: 10.1038 / nature15393. PMC4750478. PMID26432245.
  8. ^
  9. Consorcio de análisis de secuenciación de chimpancés (2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano" (PDF). Naturaleza. 437 (7055): 69–87. Código bibliográfico: 2005Natur.437. 69 .. doi: 10.1038 / nature04072. PMID16136131. S2CID2638825.
  10. ^
  11. Varki A, Altheide TK (diciembre de 2005). "Comparando los genomas humanos y de chimpancé: buscando agujas en un pajar". Investigación del genoma. 15 (12): 1746–58. doi: 10.1101 / gr.3737405. PMID16339373.
  12. ^
  13. Wade N (23 de septiembre de 1999). "Número de genes humanos se pone en 140.000, una ganancia significativa". Los New York Times.
  14. ^ aB
  15. Consorcio Internacional de Secuenciación del Genoma Humano (octubre de 2004). "Terminando la secuencia eucromática del genoma humano". Naturaleza. 431 (7011): 931–45. Código Bibliográfico: 2004Natur.431..931H. doi: 10.1038 / nature03001. PMID15496913.
  16. ^
  17. Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML (noviembre de 2014). "Varias hebras de evidencia sugieren que puede haber tan solo 19.000 genes codificadores de proteínas humanas". Genética molecular humana. 23 (22): 5866–78. doi: 10.1093 / hmg / ddu309. PMC4204768. PMID24939910.
  18. ^
  19. Saey TH (17 de septiembre de 2018). "Un recuento de genes humanos eleva el número a al menos 46.831". Noticias de ciencia.
  20. ^
  21. Alles J, Fehlmann T, Fischer U, Backes C, Galata V, Minet M, et al. (Abril de 2019). "Una estimación del número total de verdaderos miARN humanos". Investigación de ácidos nucleicos. 47 (7): 3353–3364. doi: 10.1093 / nar / gkz097. PMC6468295. PMID30820533.
  22. ^ aBC
  23. Pennisi E (septiembre de 2012). "Genómica. Proyecto ENCODE escribe elogio para el ADN basura". Ciencias. 337 (6099): 1159-1161. doi: 10.1126 / science.337.6099.1159. PMID22955811.
  24. ^
  25. Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano". El Atlántico.
  26. ^ aBC
  27. Consorcio Internacional de Secuenciación del Genoma Humano (febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Naturaleza. 409 (6822): 860–921. Código Bib: 2001Natur.409..860L. doi: 10.1038 / 35057062. PMID11237011.
  28. ^El Consorcio Internacional de Secuenciación del Genoma Humano publica la secuencia y el análisis del genoma humano
  29. ^
  30. Pennisi E (febrero de 2001). "El genoma humano". Ciencias. 291 (5507): 1177–80. doi: 10.1126 / science.291.5507.1177. PMID11233420. S2CID38355565.
  31. ^
  32. Molteni M (19 de noviembre de 2018). "Ahora puede secuenciar todo su genoma por sólo $ 200". Cableado.
  33. ^
  34. Wrighton K (febrero de 2021). "Llenar los huecos de telómero a telómero". Hitos de la naturaleza: secuenciación genómica: S21.
  35. ^
  36. Pollack A (2 de junio de 2016). "Los científicos anuncian HGP-Write, proyecto para sintetizar el genoma humano". New York Times . Consultado el 2 de junio de 2016.
  37. ^
  38. Boeke JD, Church G, Hessel A, Kelley NJ, Arkin A, Cai Y, et al. (Julio de 2016). "El Proyecto Genoma-Escritura". Ciencias. 353 (6295): 126–7. Código bibliográfico: 2016Sci. 353..126B. doi: 10.1126 / science.aaf6850. PMID27256881. S2CID206649424.
  39. ^
  40. Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano". El Atlántico . Consultado el 16 de agosto de 2019.
  41. ^
  42. Chaisson MJ, Huddleston J, Dennis MY, Sudmant PH, Malig M, Hormozdiari F, et al. (Enero de 2015). "Resolver la complejidad del genoma humano mediante secuenciación de una sola molécula". Naturaleza. 517 (7536): 608-11. Código Bibliográfico: 2015Natur.517..608C. doi: 10.1038 / nature13907. PMC4317254. PMID25383537.
  43. ^
  44. Miga KH, Koren S, Rhie A, Vollger MR, Gershman A, Bzikadze A y col. (Septiembre de 2020). "Ensamblaje de telómero a telómero de un cromosoma X humano completo". Naturaleza. 585 (7823): 79–84. Bibcode: 2020Natur.585. 79M. doi: 10.1038 / s41586-020-2547-7. PMC7484160. PMID32663838.
  45. ^Lanzamiento 87 del navegador del genoma Ensembl [enlace muerto permanente] (Diciembre de 2016) para la mayoría de los valores, la versión 68 del navegador del genoma Ensembl (julio de 2012) para miRNA, rRNA, snRNA, snoRNA.
  46. ^
  47. Piovesan A, Pelleri MC, Antonaros F, Strippoli P, Caracausi M, Vitale L (febrero de 2019). "Sobre la longitud, el peso y el contenido de GC del genoma humano". Notas de investigación de BMC. 12 (1): 106. doi: 10.1186 / s13104-019-4137-z. PMC6391780. PMID30813969.
  48. ^
  49. Salzberg SL (agosto de 2018). "Preguntas abiertas: ¿Cuántos genes tenemos?". Biología BMC. 16 (1): 94. doi: 10.1186 / s12915-018-0564-x. PMC6100717. PMID30124169.
  50. ^
  51. "Estadísticas de Gencode, versión 28". Archivado desde el original el 2 de marzo de 2018. Consultado el 12 de julio de 2018.
  52. ^
  53. "Estadísticas de Ensembl para la versión 92.38, correspondiente a Gencode v28". Consultado el 12 de julio de 2018.
  54. ^
  55. "NCBI Homo sapiens Annotation Release 108". NIH. 2016.
  56. ^
  57. "Estadísticas de AJEDREZ, versión 2.0". Centro de Biología Computacional. Universidad Johns Hopkins.
  58. ^
  59. "Finalización del proyecto del genoma humano: preguntas más frecuentes". Instituto Nacional de Investigación del Genoma Humano (NHGRI) . Consultado el 2 de febrero de 2019.
  60. ^
  61. Christley S, Lu Y, Li C, Xie X (enero de 2009). "Genomas humanos como archivos adjuntos de correo electrónico". Bioinformática. 25 (2): 274–5. doi: 10.1093 / bioinformatics / btn582. PMID18996942.
  62. ^
  63. Liu Z, Venkatesh SS, Maley CC (octubre de 2008). "Cobertura del espacio de secuencia, entropía de genomas y potencial para detectar ADN no humano en muestras humanas". BMC Genomics. 9: 509. doi: 10.1186 / 1471-2164-9-509. PMC2628393. PMID18973670. , higo. 6, utilizando los estimadores de tasa de entropía de Lempel-Ziv.
  64. ^
  65. Waters K (7 de marzo de 2007). "Genética molecular". Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013.
  66. ^
  67. Gannett L (26 de octubre de 2008). "El Proyecto del Genoma Humano". Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013.
  68. ^Gráfico circular PANTHER en la página de inicio del Sistema de clasificación PANTHER. Consultado el 25 de mayo de 2011
  69. ^Lista de proteínas humanas en el proteoma de referencia humano de Uniprot, consultado el 28 de enero de 2015
  70. ^
  71. Kauffman SA (marzo de 1969). "Estabilidad metabólica y epigénesis en redes genéticas construidas aleatoriamente". Revista de biología teórica. 22 (3): 437–67. doi: 10.1016 / 0022-5193 (69) 90015-0. PMID5803332.
  72. ^
  73. Ohno S (1972). "Un argumento a favor de la simplicidad genética del hombre y otros mamíferos". Revista de la evolución humana. 1 (6): 651–662. doi: 10.1016 / 0047-2484 (72) 90011-5.
  74. ^
  75. Sémon M, Mouchiroud D, Duret L (febrero de 2005). "Relación entre la expresión génica y el contenido de GC en mamíferos: significación estadística y relevancia biológica". Genética molecular humana. 14 (3): 421–7. doi: 10.1093 / hmg / ddi038. PMID15590696.
  76. ^ M. Huang, H. Zhu, B. Shen, G. Gao, "Una marcha no aleatoria a través del genoma humano", 3er Congreso Internacional de Bioinformática e Ingeniería Biomédica (UCBBE, 2009), 1–3
  77. ^ aB
  78. Bang ML, Centner T, Fornoff F, Geach AJ, Gotthardt M, McNabb M, Witt CC, Labeit D, Gregorio CC, Granzier H, Labeit S (2001). "La secuencia completa del gen de la titina, la expresión de una isoforma de titina inusual de aproximadamente 700 kDa y su interacción con la obscurina identifican un nuevo sistema de unión de la línea Z a la banda I". Investigación de circulación. 89 (11): 1065–72. doi: 10.1161 / hh2301.100981. PMID11717165.
  79. ^ aB
  80. Piovesan A, Caracausi M, Antonaros F, Pelleri MC, Vitale L (2016). "GeneBase 1.1: una herramienta para resumir datos de conjuntos de datos de genes NCBI y su aplicación a una actualización de las estadísticas de genes humanos". Base de datos: The Journal of Biological Databases and Curation. 2016: baw153. doi: 10.1093 / database / baw153. PMC5199132. PMID28025344.
  81. ^Navegador del genoma Ensembl (julio de 2012)
  82. ^
  83. Gregory TR (septiembre de 2005). "Sinergia entre secuencia y tamaño en genómica a gran escala". Nature Reviews Genética. 6 (9): 699–708. doi: 10.1038 / nrg1674. PMID16151375. S2CID24237594.
  84. ^ aB
  85. Palazzo AF, Akef A (junio de 2012). "La exportación nuclear como árbitro clave de la" identidad del ARNm "en eucariotas". Biochimica et Biophysica Acta (BBA) - Mecanismos reguladores de genes. 1819 (6): 566–77. doi: 10.1016 / j.bbagrm.2011.12.012. PMID22248619.
  86. ^
  87. Ludwig MZ (diciembre de 2002). "Evolución funcional del ADN no codificante". Opinión actual sobre genética y desarrollo de amplificadores. 12 (6): 634–9. doi: 10.1016 / S0959-437X (02) 00355-6. PMID12433575.
  88. ^
  89. Martens JA, Laprade L, Winston F (junio de 2004). "Se requiere transcripción intergénica para reprimir el gen SER3 de Saccharomyces cerevisiae". Naturaleza. 429 (6991): 571–4. Código Bibliográfico: 2004Natur.429..571M. doi: 10.1038 / nature02538. PMID15175754. S2CID809550.
  90. ^
  91. Tsai MC, Manor O, Wan Y, Mosammaparast N, Wang JK, Lan F, Shi Y, Segal E, Chang HY (agosto de 2010). "ARN no codificante largo como andamio modular de complejos de modificación de histonas". Ciencias. 329 (5992): 689–93. Código bibliográfico: 2010Sci. 329..689T. doi: 10.1126 / science.1192002. PMC2967777. PMID20616235.
  92. ^
  93. Bartolomei MS, Zemel S, Tilghman SM (mayo de 1991). "Impresión parental del gen H19 del ratón". Naturaleza. 351 (6322): 153–5. Código Bibliográfico: 1991Natur.351..153B. doi: 10.1038 / 351153a0. PMID1709450. S2CID4364975.
  94. ^
  95. Kobayashi T, Ganley AR (septiembre de 2005). "Regulación de recombinación por disociación de cohesina inducida por transcripción en repeticiones de ADNr". Ciencias. 309 (5740): 1581–4. Código bibliográfico: 2005Sci. 309.1581K. doi: 10.1126 / science.1116102. PMID16141077. S2CID21547462.
  96. ^
  97. Salmena L, Poliseno L, Tay Y, Kats L, Pandolfi PP (agosto de 2011). "Una hipótesis de ceRNA: ¿la piedra de Rosetta de un lenguaje de ARN oculto?". Celda. 146 (3): 353–8. doi: 10.1016 / j.cell.2011.07.014. PMC3235919. PMID21802130.
  98. ^
  99. Pei B, Sisu C, Frankish A, Howald C, Habegger L, Mu XJ, Harte R, Balasubramanian S, Tanzer A, Diekhans M, Reymond A, Hubbard TJ, Harrow J, Gerstein MB (2012). "El recurso pseudogénico GENCODE". Biología del genoma. 13 (9): R51. doi: 10.1186 / gb-2012-13-9-r51. PMC3491395. PMID22951037.
  100. ^
  101. Gilad Y, Man O, Pääbo S, Lancet D (marzo de 2003). "Pérdida humana específica de genes receptores olfativos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. 100 (6): 3324–7. Código Bibliográfico: 2003PNAS..100.3324G. doi: 10.1073 / pnas.0535697100. PMC152291. PMID12612342.
  102. ^
  103. Iyer MK, Niknafs YS, Malik R, Singhal U, Sahu A, Hosono Y, Barrette TR, Prensner JR, Evans JR, Zhao S, Poliakov A, Cao X, Dhanasekaran SM, Wu YM, Robinson DR, Beer DG, Feng FY , Iyer HK, Chinnaiyan AM (marzo de 2015). "El panorama de los ARN largos no codificantes en el transcriptoma humano". Genética de la naturaleza. 47 (3): 199-208. doi: 10.1038 / ng.3192. PMC4417758. PMID25599403.
  104. ^
  105. Eddy SR (diciembre de 2001). "Genes de ARN no codificantes y el mundo moderno del ARN". Nature Reviews Genética. 2 (12): 919-29. doi: 10.1038 / 35103511. PMID11733745. S2CID18347629.
  106. ^
  107. Managadze D, Lobkovsky AE, Wolf YI, Shabalina SA, Rogozin IB, Koonin EV (2013). "El vasto y conservado lincRNome de mamíferos". PLOS Biología Computacional. 9 (2): e1002917. Código bibliográfico: 2013PLSCB. 9E2917M. doi: 10.1371 / journal.pcbi.1002917. PMC3585383. PMID23468607.
  108. ^
  109. Palazzo AF, Lee ES (2015). "ARN no codificante: ¿qué es funcional y qué es basura?". Fronteras en genética. 6: 2. doi: 10.3389 / fgene.2015.00002. PMC4306305. PMID25674102.
  110. ^
  111. Mattick JS, Makunin IV (abril de 2006). "ARN no codificante". Genética molecular humana. 15 Especificación nº 1: R17–29. doi: 10.1093 / hmg / ddl046. PMID16651366.
  112. ^ aB
  113. Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M (septiembre de 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano". Naturaleza. 489 (7414): 57–74. Código Bib: 2012Natur.489. 57T. doi: 10.1038 / nature11247. PMC3439153. PMID22955616.
  114. ^
  115. Birney E (5 de septiembre de 2012). "CODIFICAR: Mis propios pensamientos". Blog de Ewan: Bioinformático en general.
  116. ^
  117. Stamatoyannopoulos JA (septiembre de 2012). "¿Qué codifica nuestro genoma?". Investigación del genoma. 22 (9): 1602-11. doi: 10.1101 / gr.146506.112. PMC3431477. PMID22955972.
  118. ^
  119. Carroll SB, Gompel N, Prudhomme B (mayo de 2008). "Regulación de la evolución". Científico americano. 298 (5): 60–67. Código Bibliográfico: 2008SciAm.298e..60C. doi: 10.1038 / scientificamerican0508-60. PMID18444326.
  120. ^
  121. Miller JH, Ippen K, Scaife JG, Beckwith JR (1968). "La región promotor-operador del operón lac de Escherichia coli". J. Mol. Biol. 38 (3): 413-20. doi: 10.1016 / 0022-2836 (68) 90395-1. PMID4887877.
  122. ^
  123. Wright S, Rosenthal A, Flavell R, Grosveld F (1984). "Secuencias de ADN necesarias para la expresión regulada de genes de beta-globina en células de eritroleucemia murina". Celda. 38 (1): 265–73. doi: 10.1016 / 0092-8674 (84) 90548-8. PMID6088069. S2CID34587386.
  124. ^
  125. Nei M, Xu P, Glazko G (febrero de 2001). "Estimación de los tiempos de divergencia de secuencias multiproteínas para algunas especies de mamíferos y varios organismos relacionados lejanamente". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. 98 (5): 2497–502. Código bibliográfico: 2001PNAS. 98.2497N. doi: 10.1073 / pnas.051611498. PMC30166. PMID11226267.
  126. ^
  127. Loots GG, Locksley RM, Blankespoor CM, Wang ZE, Miller W, Rubin EM, Frazer KA (abril de 2000). "Identificación de un regulador coordinado de las interleucinas 4, 13 y 5 mediante comparaciones de secuencia entre especies". Ciencias. 288 (5463): 136–40. Código Bibliográfico: 2000Sci. 288..136L. doi: 10.1126 / science.288.5463.136. PMID10753117. Resumen
  128. ^
  129. Meunier M. "Genoscope y Whitehead anuncian una cobertura de secuencia alta del genoma de Tetraodon nigroviridis". Genoscopio. Archivado desde el original el 16 de octubre de 2006. Consultado el 12 de septiembre de 2006.
  130. ^
  131. Romero IG, Ruvinsky I, Gilad Y (julio de 2012). "Estudios comparativos de expresión génica y evolución de la regulación génica". Nature Reviews Genética. 13 (7): 505–16. doi: 10.1038 / nrg3229. PMC4034676. PMID22705669.
  132. ^
  133. Schmidt D, Wilson MD, Ballester B, Schwalie PC, Brown GD, Marshall A, Kutter C, Watt S, Martinez-Jimenez CP, Mackay S, Talianidis I, Flicek P, Odom DT (mayo de 2010). "ChIP-seq de cinco vertebrados revela la dinámica evolutiva de la unión del factor de transcripción". Ciencias. 328 (5981): 1036–40. Código bibliográfico: 2010Sci. 328.1036S. doi: 10.1126 / science.1186176. PMC3008766. PMID20378774.
  134. ^
  135. Wilson MD, Barbosa-Morais NL, Schmidt D, Conboy CM, Vanes L, Tybulewicz VL, Fisher EM, Tavaré S, Odom DT (octubre de 2008). "Transcripción específica de la especie en ratones portadores del cromosoma 21 humano". Ciencias. 322 (5900): 434–8. Código Bibliográfico: 2008Sci. 322..434W. doi: 10.1126 / science.1160930. PMC3717767. PMID18787134.
  136. ^
  137. Treangen TJ, Salzberg SL (enero de 2012). "ADN repetitivo y secuenciación de próxima generación: desafíos y soluciones computacionales". Nature Reviews Genética. 13 (1): 36–46. doi: 10.1038 / nrg3117. PMC3324860. PMID22124482.
  138. ^
  139. Duitama J, Zablotskaya A, Gemayel R, Jansen A, Belet S, Vermeesch JR, Verstrepen KJ, Froyen G (mayo de 2014). "Análisis a gran escala de la variabilidad de repetición en tándem en el genoma humano". Investigación de ácidos nucleicos. 42 (9): 5728–41. doi: 10.1093 / nar / gku212. PMC4027155. PMID24682812.
  140. ^
  141. Pierce BA (2012). Genética: un enfoque conceptual (4ª ed.). Nueva York: W.H. Hombre libre. págs. 538–540. ISBN978-1-4292-3250-0.
  142. ^
  143. Bennett EA, Keller H, Mills RE, Schmidt S, Moran JV, Weichenrieder O, Devine SE (diciembre de 2008). "Retrotransposones activos de Alu en el genoma humano". Investigación del genoma. 18 (12): 1875–83. doi: 10.1101 / gr.081737.108. PMC2593586. PMID18836035.
  144. ^
  145. Liang KH, Yeh CT (2013). "Una red de restricción de expresión génica mediada por secuencias de Alu sentido y antisentido ubicadas en ARN mensajeros que codifican proteínas". BMC Genomics. 14: 325. doi: 10.1186 / 1471-2164-14-325. PMC3655826. PMID23663499.
  146. ^
  147. Brouha B, Schustak J, Badge RM, Lutz-Prigge S, Farley AH, Moran JV, Kazazian HH (abril de 2003). "Hot L1s representan la mayor parte de la retrotransposición en la población humana". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. 100 (9): 5280–5. Código Bibliográfico: 2003PNAS..100.5280B. doi: 10.1073 / pnas.0831042100. PMC154336. PMID12682288.
  148. ^
  149. Barton NH, Briggs DE, Eisen JA, Goldstein DB, Patel NH (2007). Evolución. Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN978-0-87969-684-9.
  150. ^
  151. NCBI. "GRCh38 - hg38 - Genoma - Ensamblaje - NCBI". ncbi.nlm.nih.gov . Consultado el 15 de marzo de 2019.
  152. ^
  153. "del discurso sobre el estado de la Unión de 2000 de Bill Clinton". Archivado desde el original el 21 de febrero de 2017. Consultado el 14 de junio de 2007.
  154. ^
  155. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD y col. (Noviembre de 2006). "Variación global en el número de copias en el genoma humano". Naturaleza. 444 (7118): 444–54. Código bibliográfico: 2006Natur.444..444R. doi: 10.1038 / nature05329. PMC2669898. PMID17122850.
  156. ^
  157. "¿Qué es un genoma?". Genomenewsnetwork.org. 15 de enero de 2003. Consultado el 31 de mayo de 2009.
  158. ^
  159. NCBI_user_services (29 de marzo de 2004). "Hoja de datos de mapeo". Ncbi.nlm.nih.gov. Archivado desde el original el 19 de julio de 2010. Consultado el 31 de mayo de 2009.
  160. ^
  161. "Sobre el proyecto". HapMap. Consultado el 31 de mayo de 2009.
  162. ^
  163. "Versión de 2008: los investigadores producen el primer mapa de secuencia de variación estructural a gran escala en el genoma humano". genome.gov. Consultado el 31 de mayo de 2009.
  164. ^
  165. Kidd JM, Cooper GM, Donahue WF, Hayden HS, Sampas N, Graves T, et al. (Mayo de 2008). "Mapeo y secuenciación de la variación estructural de ocho genomas humanos". Naturaleza. 453 (7191): 56–64. Código Bibliográfico: 2008Natur.453. 56K. doi: 10.1038 / nature06862. PMC2424287. PMID18451855.
  166. ^ aB
  167. Abel HJ, Larson DE, Regier AA, Chiang C, Das I, Kanchi KL, et al. (Julio de 2020). "Mapeo y caracterización de la variación estructural en 17.795 genomas humanos". Naturaleza. 583 (7814): 83–89. doi: 10.1038 / s41586-020-2371-0. PMC7547914. PMID32460305.
  168. ^
  169. Gray IC, Campbell DA, Spurr NK (2000). "Polimorfismos de un solo nucleótido como herramientas en genética humana". Genética molecular humana. 9 (16): 2403–2408. doi: 10.1093 / hmg / 9.16.2403. PMID11005795.
  170. ^
  171. Lai E (junio de 2001). "Aplicación de tecnologías SNP en medicina: lecciones aprendidas y desafíos futuros". Investigación del genoma. 11 (6): 927–9. doi: 10.1101 / gr.192301. PMID11381021.
  172. ^
  173. "Finalización del proyecto del genoma humano: preguntas más frecuentes". genome.gov. Consultado el 31 de mayo de 2009.
  174. ^
  175. Singer E (4 de septiembre de 2007). "Genoma de Craig Venter". Revisión de tecnología del MIT . Consultado el 25 de mayo de 2010.
  176. ^
  177. Pushkarev D, Neff NF, Quake SR (septiembre de 2009). "Secuenciación de una sola molécula de un genoma humano individual". Biotecnología de la naturaleza. 27 (9): 847–50. doi: 10.1038 / nbt.1561. PMC4117198. PMID19668243.
  178. ^
  179. Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE, et al. (Mayo de 2010). "Evaluación clínica incorporando un genoma personal". Lanceta. 375 (9725): 1525–35. doi: 10.1016 / S0140-6736 (10) 60452-7. PMC2937184. PMID20435227.
  180. ^
  181. Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, et al. (Septiembre de 2011). "Riesgo genético de genoma completo en fase en un cuarteto familiar utilizando una secuencia de referencia de alelos principales". PLOS Genetics. 7 (9): e1002280. doi: 10.1371 / journal.pgen.1002280. PMC3174201. PMID21935354.
  182. ^
  183. "Complete Genomics agrega 29 conjuntos de datos completos de secuenciación del genoma humano de alta cobertura a su repositorio genómico público".
  184. ^
  185. Muestra I (17 de febrero de 2010). "El genoma de Desmond Tutu secuenciado como parte del estudio de diversidad genética". El guardián.
  186. ^
  187. Schuster SC, Miller W, Ratan A, Tomsho LP, Giardine B, Kasson LR, et al. (Febrero de 2010). "Completar genomas khoisan y bantú del sur de África". Naturaleza. 463 (7283): 943–7. Código Bibliográfico: 2010Natur.463..943S. doi: 10.1038 / nature08795. PMC3890430. PMID20164927.
  188. ^
  189. Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I y col. (Febrero de 2010). "Secuencia del genoma humano antiguo de un paleo-esquimal extinto". Naturaleza. 463 (7282): 757–62. Código Bibliográfico: 2010Natur.463..757R. doi: 10.1038 / nature08835. PMC3951495. PMID20148029.
  190. ^
  191. Corpas M, Cariaso M, Coletta A, Weiss D, Harrison AP, Moran F, Yang H (12 de noviembre de 2013). "Un conjunto de datos completo de genómica familiar de dominio público". bioRxiv10.1101 / 000216.
  192. ^
  193. Corpas M (junio de 2013). "Crowdsourcing del corpasome". Código fuente para biología y medicina. 8 (1): 13. doi: 10.1186 / 1751-0473-8-13. PMC3706263. PMID23799911.
  194. ^
  195. Mao Q, Ciotlos S, Zhang RY, Ball MP, Chin R, Carnevali P, et al. (Octubre de 2016). "Las secuencias del genoma completo y los haplotipos en fase experimental de más de 100 genomas personales". GigaScience. 5 (1): 42. doi: 10.1186 / s13742-016-0148-z. PMC5057367. PMID27724973.
  196. ^
  197. Cai B, Li B, Kiga N, Thusberg J, Bergquist T, Chen YC, et al. (Septiembre de 2017). "Coincidencia de fenotipos con genomas completos: lecciones aprendidas de cuatro iteraciones de los desafíos de la comunidad del proyecto del genoma personal". Mutación humana. 38 (9): 1266–1276. doi: 10.1002 / humu.23265. PMC5645203. PMID28544481.
  198. ^
  199. Gonzaga-Jauregui C, Lupski JR, Gibbs RA (2012). "Secuenciación del genoma humano en salud y enfermedad". Revisión anual de medicina. 63: 35–61. doi: 10.1146 / annurev-med-051010-162644. PMC3656720. PMID22248320.
  200. ^
  201. Choi M, Scholl UI, Ji W, Liu T, Tikhonova IR, Zumbo P, Nayir A, Bakkaloğlu A, Ozen S, Sanjad S, Nelson-Williams C, Farhi A, Mane S, Lifton RP (noviembre de 2009). "Diagnóstico genético por captura de todo el exoma y secuenciación masiva de ADN en paralelo". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. 106 (45): 19096–101. Código bibliográfico: 2009PNAS..10619096C. doi: 10.1073 / pnas.0910672106. PMC2768590. PMID19861545.
  202. ^ aB
  203. Narasimhan VM, Xue Y, Tyler-Smith C (abril de 2016). "Portadores de knockout humanos: muertos, enfermos, sanos o mejorados?". Tendencias en medicina molecular. 22 (4): 341–351. doi: 10.1016 / j.molmed.2016.02.006. PMC4826344. PMID26988438.
  204. ^
  205. Saleheen D, Natarajan P, Armean IM, Zhao W, Rasheed A, Khetarpal SA, et al. (Abril de 2017). "Knockouts humanos y análisis fenotípico en una cohorte con alta tasa de consanguinidad". Naturaleza. 544 (7649): 235–239. Código Bib: 2017Natur.544..235S. doi: 10.1038 / nature22034. PMC5600291. PMID28406212.
  206. ^ aB
  207. Hamosh A, Scott AF, Amberger J, Bocchini C, Valle D, McKusick VA (enero de 2002). "Herencia mendeliana en línea en el hombre (OMIM), una base de conocimientos de genes humanos y trastornos genéticos". Investigación de ácidos nucleicos. 30 (1): 52–5. doi: 10.1093 / nar / 30.1.52. PMC99152. PMID11752252.
  208. ^
  209. Katsanis N (noviembre de 2016). "El continuo de la causalidad en los trastornos genéticos humanos". Biología del genoma. 17 (1): 233. doi: 10.1186 / s13059-016-1107-9. PMC5114767. PMID27855690.
  210. ^
  211. Wong LC (2017). "Resumen de la utilidad clínica de la secuenciación de próxima generación en el diagnóstico molecular de los trastornos genéticos humanos". En Wong LC (ed.). Diagnóstico molecular clínico basado en secuenciación de próxima generación de trastornos genéticos humanos. Springer International Publishing. págs. 1-11. doi: 10.1007 / 978-3-319-56418-0_1. ISBN978-3-319-56418-0. Falta o está vacío | título = (ayuda)
  212. ^
  213. Fedick A, Zhang J (2017). "Próxima generación de detección de portadores". En Wong LC (ed.). Diagnóstico molecular clínico basado en secuenciación de próxima generación de trastornos genéticos humanos. Springer International Publishing. págs. 339–354. doi: 10.1007 / 978-3-319-56418-0_16. ISBN978-3-319-56418-0. Falta o está vacío | título = (ayuda)
  214. ^
  215. Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, et al. (Diciembre de 2002). "Secuenciación inicial y análisis comparativo del genoma del ratón". Naturaleza. 420 (6915): 520–62. Código Bibliográfico: 2002Natur.420..520W. doi: 10.1038 / nature01262. PMID12466850. la proporción de segmentos pequeños (50-100 pb) en el genoma de los mamíferos que están bajo selección (purificadora) se puede estimar en alrededor del 5%. Esta proporción es mucho más alta de lo que puede explicarse por secuencias codificantes de proteínas solas, lo que implica que el genoma contiene muchas características adicionales (como regiones no traducidas, elementos reguladores, genes no codificantes de proteínas y elementos estructurales cromosómicos) bajo selección para función biológica. .
  216. ^
  217. Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, et al. (Junio ​​de 2007). "Identificación y análisis de elementos funcionales en el 1% del genoma humano por el proyecto piloto ENCODE". Naturaleza. 447 (7146): 799–816. Código Bibliográfico: 2007Natur.447..799B. doi: 10.1038 / nature05874. PMC2212820. PMID17571346.
  218. ^
  219. The Chimpanzee Sequencing Analysis Consortium (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza. 437 (7055): 69–87. Código bibliográfico: 2005Natur.437. 69 .. doi: 10.1038 / nature04072. PMID16136131. Calculamos que la divergencia de nucleótidos en todo el genoma entre humanos y chimpancés es del 1,23%, lo que confirma los resultados recientes de estudios más limitados.
  220. ^
  221. The Chimpanzee Sequencing Analysis Consortium (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano". Naturaleza. 437 (7055): 69–87. Código bibliográfico: 2005Natur.437. 69 .. doi: 10.1038 / nature04072. PMID16136131. estimamos que el polimorfismo representa el 14-22% de la tasa de divergencia observada y, por lo tanto, la divergencia fija es

120 ms 9.2% Scribunto_LuaSandboxCallback :: simple 100 ms 7.7% Scribunto_LuaSandboxCallback :: callParserFunction 100 ms 7.7% tipo 40 ms 3.1% Scribunto_LuaSandboxCallback :: sub 40 ms 3.1% 40 ms 3.1% Scribunto_LuaSandboxCallback :: getAllExpandedArguments 40 ms 280 ms 21,5% Número de entidades de Wikibase cargadas: 1/400 ->


Referencias

Grewal SI, Elgin SC: Heterocromatina: nuevas posibilidades para la herencia de estructura. Curr Opin Genet Dev. 2002, 12: 178-187. 10.1016 / S0959-437X (02) 00284-8.

Heitz E: Das Heterochromatin der Moose. Jahrbucher fur Wissenschaftliche Botanik. 1928, 69: 762-818.

Hoskins RA, Smith CD, Carlson JW, Carvalho AB, Halpern A, Kaminker JS, Kennedy C, Mungall CJ, Sullivan BA, Sutton GG, et al: Secuencias heterocromáticas en una Drosophila ensamblaje de escopeta de genoma completo. Genome Biol. 2002, 3: R1-0085. 10.1186 / gb-2002-3-12-research0085.

Dimitri P, Junakovic N, Arca B: Colonización de genes heterocromáticos por elementos transponibles en Drosophila. Mol Biol Evol. 2003, 20: 503-512. 10.1093 / molbev / msg048.

Pardue ML, Lowenhaupt K, Rich A, Nordheim A: (dC-dA) n. (DG-dT) n secuencias tienen ubicaciones cromosómicas conservadas evolutivamente en Drosophila con implicaciones para los roles en la estructura y función de los cromosomas. EMBO J. 1987, 6: 1781-1789.

Richards EJ, Elgin SC: Códigos epigenéticos para la formación y el silenciamiento de heterocromatina: reuniendo a los sospechosos habituales. Celda. 2002, 108: 489-500. 10.1016 / S0092-8674 (02) 00644-X.

James TC, Elgin SC: Identificación de una proteína cromosómica no histona asociada con heterocromatina en Drosophila melanogaster y su gen. Mol Cell Biol. 1986, 6: 3862-3872.

Eissenberg JC, Elgin SC: La familia de proteínas HP1: cómo controlar la cromatina. Curr Opin Genet Dev. 2000, 10: 204-210. 10.1016 / S0959-437X (00) 00058-7.

Schotta G, Ebert A, Krauss V, Fischer A, Hoffmann J, Rea S, Jenuwein T, Dorn R, Reuter G: papel central de Drosophila SU (VAR) 3-9 en la metilación de histonas H3-K9 y silenciamiento de genes heterocromáticos. EMBO J. 2002, 21: 1121-1131. 10.1093 / emboj / 21.5.1121.

Bannister AJ, Zegerman P, Partridge JF, Miska EA, Thomas JO, Allshire RC, Kouzarides T: reconocimiento selectivo de lisina 9 metilada en la histona H3 por el dominio cromático HP1. Naturaleza. 2001, 410: 120-124. 10.1038 / 35065138.

Eissenberg JC, James TC, Foster-Hartnett DM, Hartnett T, Ngan V, Elgin SC: la mutación en una proteína cromosómica específica de heterocromatina se asocia con la supresión de la variación del efecto de posición en Drosophila melanogaster. Proc Natl Acad Sci USA. 1990, 87: 9923-9927.

Misra S, Crosby MA, Mungall CJ, Matthews BB, Campbell KS, Hradecky P, Huang Y, Kaminker JS, Millburn GH, Prochnik SE, et al: Anotación de la Drosophila melanogaster genoma eucromático: una revisión sistemática. Genome Biol. 2002, R3: 1-0083. 10.1186 / gb-2002-3-12-research0083.

Drysdale RA, Crosby MA: FlyBase: genes y modelos de genes. Ácidos nucleicos Res. 2005, 33 (Base de datos): D390-395. 10.1093 / nar / gki046.

Barigozzi C, Dolfini S, Fraccaro M, Raimondi GR, Tiepolo L: In vitro estudio de los patrones de replicación del ADN de los cromosomas somáticos de Drosophila melanogaster. Exp Cell Res. 1966, 43: 231-234. 10.1016 / 0014-4827 (66) 90399-5.

Bridges CB: Los mutantes y los datos de ligamiento del cromosoma cuatro de Drosophila melanogaster. Biol Zh. 1935, 4: 401-420.

Miklos GL, Yamamoto MT, Davies J, Pirrotta V: La microclonación revela una alta frecuencia de secuencias repetitivas características del cromosoma 4 y la beta-heterocromatina de Drosophila melanogaster. Proc Natl Acad Sci USA. 1988, 85: 2051-2055.

Locke J, Podemski L, Roy K, Pilgrim D, Hodgetts R: Análisis de dos clones de cósmidos del cromosoma 4 de Drosophila melanogaster revela dos nuevos genes en medio de una disposición inusual de secuencias repetidas. Genome Res. 1999, 9: 137-149.

Kaminker JS, Bergman CM, Kronmiller B, Carlson J, Svirskas R, Patel S, Frise E, Wheeler DA, Lewis SE, Rubin GM, et al: Los elementos transponibles del Drosophila melanogaster eucromatina: una perspectiva genómica. Genome Biol. 2002, 3: R1-0084. 10.1186 / gb-2002-3-12-research0084.

Bartolome C, Maside X, Charlesworth B: Sobre la abundancia y distribución de elementos transponibles en el genoma de Drosophila melanogaster. Mol Biol Evol. 2002, 19: 926-937.

James TC, Eissenberg JC, Craig C, Dietrich V, Hobson A, Elgin SC: patrones de distribución de HP1, una proteína cromosómica no histona asociada a heterocromatina de Drosophila. Eur J Cell Biol. 1989, 50: 170-180.

Haynes KA, Leibovitch BA, Rangwala SH, Craig C, Elgin SC: Análisis de la formación de heterocromatina utilizando el cromosoma 4 de Drosophila melanogaster. Cold Spring Harb Symp Quant Biol. 2004, 69: 267-272. 10.1101 / sqb.2004.69.267.

Wallrath LL, Elgin SC: Variación del efecto de posición en Drosophila está asociado con una estructura de cromatina alterada. Genes Dev. 1995, 9: 1263-1277.

Sun FL, Cuaycong MH, Craig CA, Wallrath LL, Locke J, Elgin SC: El cuarto cromosoma de Drosophila melanogaster : dominios eucromáticos y heterocromáticos intercalados. Proc Natl Acad Sci USA. 2000, 97: 5340-5345. 10.1073 / pnas.090530797.

Sun FL, Haynes K, Simpson CL, Lee SD, Collins L, Wuller J, Eissenberg JC, Elgin SC: cis -Actuando los determinantes de la formación de heterocromatina en Drosophila melanogaster cromosoma cuatro. Mol Cell Biol. 2004, 24: 8210-8220. 10.1128 / MCB.24.18.8210-8220.2004.

Matzke MA, Birchler JA: Vías mediadas por ARNi en el núcleo. Nat Rev Genet. 2005, 6: 24-35. 10.1038 / nrg1500.

Pal-Bhadra M, Leibovitch BA, Gandhi SG, Rao M, Bhadra U, Birchler JA, Elgin SC: Silenciamiento heterocromático y localización HP1 en Drosophila dependen de la maquinaria de ARNi. Ciencias. 2004, 303: 669-672. 10.1126 / science.1092653.

Aravin AA, Lagos-Quintana M, Yalcin A, Zavolan M, Marks D, Snyder B, Gaasterland T, Meyer J, Tuschl T: El pequeño perfil de ARN durante Drosophila melanogaster desarrollo. Dev Cell. 2003, 5: 337-350. 10.1016 / S1534-5807 (03) 00228-4.

Clayton FE, Guest WC: Descripción general de la evolución cromosómica en la familia Drosophilidae. La genética y la biología de Drosophila. 1986, 3E: 1-38.

Sturtevant AH, Novitski E: Las homologías de los elementos cromosómicos del género Drosophila. Genética. 1941, 26: 517-538.

Gubenko IS, Evgen'ev MB: Mapas citológicos y de ligamiento de Drosophila virilis cromosomas. Genetica. 1984, 65: 127-139. 10.1007 / BF00135277.

Podemski L, Ferrer C, Locke J: Inversiones del brazo completo del cromosoma 4 en Drosophila especies. Cromosoma. 2001, 110: 305-312.

Powell JR, DeSalle R: filogenias moleculares de Drosophila y sus usos. Evol Biol. 1995, 28: 87-138.

Lowenhaupt K, Rich A, Pardue ML: Distribución no aleatoria de repeticiones largas de mono y dinucleótidos en Drosophila cromosomas: correlaciones con compensación de dosis, heterocromatina y recombinación. Mol Cell Biol. 1989, 9: 1173-1182.

Chino M, Kikkawa H: mutantes y cruces en el cromosoma con forma de punto de Drosophila virilis. Genética. 1933, 18: 111-116.

Cliften PF, Hillier LW, Fulton L, Graves T, Miner T, Gish WR, Waterston RH, Johnston M: Topografía Saccharomyces genomas para identificar elementos funcionales mediante análisis comparativo de secuencias de ADN. Genome Res. 2001, 11: 1175-1186. 10.1101 / gr.182901.

Bergman CM, Pfeiffer BD, Rincon-Limas DE, Hoskins RA, Gnirke A, Mungall CJ, Wang AM, Kronmiller B, Pacleb J, Park S, et al: Evaluación del impacto de los datos de la secuencia genómica comparativa en la anotación funcional de la Drosophila genoma. Genome Biol. 2002, 3: R1-0086. 10.1186 / gb-2002-3-12-research0086.

Richards S, Liu Y, Bettencourt BR, Hradecky P, Letovsky S, Nielsen R, Thornton K, Hubisz MJ, Chen R, Meisel RP, et al: secuenciación comparativa del genoma de Drosophila pseudoobscura : cromosómico, gen y cis-Evolución de elementos. Genome Res. 2005, 15: 1-18. 10.1101 / gr.3059305.

Myers EW, Sutton GG, Delcher AL, Dew IM, Fasulo DP, Flanigan MJ, Kravitz SA, Mobarry CM, Reinert KH, Remington KA, et al: Un conjunto de genoma completo de Drosophila. Ciencias. 2000, 287: 2196-2204. 10.1126 / science.287.5461.2196.

Hartl DL, Nurminsky DI, Jones RW, Lozovskaya ER: Estructura y evolución del genoma en Drosophila : aplicaciones del mapa marco P1. Proc Natl Acad Sci USA. 1994, 91: 6824-6829.

Drosophila Proyecto Genoma en Baylor College of Medicine. [http://www.hgsc.bcm.tmc.edu/projects/drosophila/]

Ewing B, Hillier L, Wendl MC, Green P: Llamada básica de trazas de secuenciador automático mediante phred. I. Evaluación de la precisión. Genome Res. 1998, 8: 175-185.

Ewing B, Green P: Llamada base de trazas de secuenciador automático usando phred. II. Probabilidades de error. Genome Res. 1998, 8: 186-194.

Gordon D, Abajian C, Green P: Consed: una herramienta gráfica para el acabado de secuencias. Genome Res. 1998, 8: 195-202.

Devlin RH, Bingham B, Wakimoto BT: La organización y expresión del gen de la luz, un gen heterocromático de Drosophila melanogaster. Genética. 1990, 125: 129-140.

Jurka J: Repeticiones en el ADN genómico: minería y significado. Curr Opin Struct Biol. 1998, 8: 333-337. 10.1016 / S0959-440X (98) 80067-5.

Jurka J: Actualización Repbase: una base de datos y un diario electrónico de elementos repetitivos. Trends Genet. 2000, 16: 418-420. 10.1016 / S0168-9525 (00) 02093-X.

Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ: herramienta básica de búsqueda de alineación local. J Mol Biol. 1990, 215: 403-410. 10.1006 / jmbi.1990.9999.

Quesneville H, Bergman CM, Andrieu O, Autard D, Nouaud D, Ashburner M, Anxolabehere D: anotación de evidencia combinada de elementos transponibles en secuencias del genoma. PLoS Comput Biol. 2005, 1: 166-175.

Edgar RC, Myers EW: PILER: Identificación y clasificación de repeticiones genómicas. Bioinformática. 2005, 21 (Supl. 1): i152-i158. 10.1093 / bioinformática / bti1003.

Precio AL, Jones NC, Pevzner PA: De novo identificación de familias repetidas en genomas grandes. Bioinformática. 2005, 21 (Supl. 1): i351-i358. 10.1093 / bioinformática / bti1018.

Montaje / Alineación / Anotación de 12 relacionados Drosophila especies. [http://rana.lbl.gov/drosophila]

Yang HP, Hung TL, You TL, Yang TH: El análisis comparativo de todo el genoma del elemento transponible altamente abundante DINE-1 sugiere una explosión transposicional reciente en Drosophila yakuba. Genética. 2005, doi: 10.1534 / genetics.105.051714

Quesneville H, Nouaud D, Anxolabehere D: Detección de nuevas familias de elementos transponibles en Drosophila melanogaster y Anopheles gambiae genomas. J Mol Evol. 2003, 57 (Supl. 1): S50-59. 10.1007 / s00239-003-0007-2.

Singh ND, Arndt PF, Petrov DA: heterogeneidad genómica de patrones de sustitución de fondo en Drosophila melanogaster. Genética. 2005, 169: 709-722. 10.1534 / genetics.104.032250.

Locke J, Howard LT, Aippersbach N, Podemski L, Hodgetts RB: La caracterización de DINE-1, un elemento repetitivo corto e intercalado presente en el cromosoma y en la heterocromatina céntrica de Drosophila melanogaster. Cromosoma. 1999, 108: 356-366. 10.1007 / s004120050387.

Kapitonov VV, Jurka J: Paleontología molecular de elementos transponibles en el Drosophila melanogaster genoma. Proc Natl Acad Sci USA. 2003, 100: 6569-6574. 10.1073 / pnas.0732024100.

Pyatkov KI, Shostak NG, Zelentsova ES, Lyozin GT, Melekhin MI, Finnegan DJ, Kidwell MG, Evgen'ev MB: retroelementos de Penelope de Drosophila virilis están activos después de la transformación de Drosophila melanogaster. Proc Natl Acad Sci USA. 2002, 99: 16150-16155. 10.1073 / pnas.252641799.

Evgen'ev M, Zelentsova H, Mnjoian L, Poluectova H, Kidwell MG: Invasión de Drosophila virilis por el elemento transponible Penélope. Cromosoma. 2000, 109: 350-357.

Coelho PA, Queiroz-Machado J, Hartl D, Sunkel CE: Patrón de localización cromosómica de la familia de elementos transponibles Hoppel en la Drosophila melanogaster subgrupo. Cromosoma Res. 1998, 6: 385-395. 10.1023 / A: 1009277322626.

Reiss D, Quesneville H, Nouaud D, Andrieu O, Anxolabehere D: Hoppel, un elemento similar a P sin intrones: ¿una estructura ancestral del elemento P o un derivado de retrotranscripción ?. Mol Biol Evol. 2003, 20: 869-879. 10.1093 / molbev / msg090.

Sijen T, Plasterk RH: Silenciamiento de transposones en el Caenorhabditis elegans línea germinal por ARNi natural. Naturaleza. 2003, 426: 310-314. 10.1038 / nature02107.

Dorer DR, Henikoff S: Las expansiones de las repeticiones de transgenes causan la formación de heterocromatina y el silenciamiento de genes en Drosophila. Celda. 1994, 77: 993-1002. 10.1016 / 0092-8674 (94) 90439-1.

Smalheiser NR, Torvik VI: microARN de mamíferos derivados de repeticiones genómicas. Trends Genet. 2005, 21: 322-326. 10.1016 / j.tig.2005.04.008.

Matthews DH, Sabina J, Zuker M, Turner DH: La dependencia de secuencia expandida de los parámetros termodinámicos mejora la predicción de la estructura secundaria del ARN. J Mol Biol. 1999, 288: 911-940. 10.1006 / jmbi.1999.2700.

Stephens GE, Craig CA, Li Y, Wallrath LL, Elgin SCR: tinción inmunofluorescente de cromosomas politénicos: explotación de herramientas genéticas. Métodos Enzymol. 2004, 376: 372-393.

Henikoff S, Henikoff JG, Alford WJ, Pietrokovski S: Construcción automatizada y presentación gráfica de bloques de proteínas a partir de secuencias no alineadas. Gene. 1995, 163: GC17-26. 10.1016 / 0378-1119 (95) 00486-P.

Rose TM, Schultz ER, Henikoff JG, Pietrokovski S, McCallum CM, Henikoff S: cebadores de oligonucleótidos híbridos consensuados degenerados para la amplificación de secuencias relacionadas lejanamente. Ácidos nucleicos Res. 1998, 26: 1628-1635. 10.1093 / nar / 26.7.1628.

Casacuberta E, Pardue ML: Coevolución de los retrotransposones teloméricos a través Drosophila especies. Genética. 2002, 161: 1113-1124.

Consorcio Internacional de Secuenciación del Genoma Humano: Finalización de la secuencia eucromática del genoma humano. Naturaleza. 2004, 431: 931-945. 10.1038 / nature03001.

Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ: Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda de bases de datos de proteínas. Ácidos nucleicos Res. 1997, 25: 3389-3402. 10.1093 / nar / 25.17.3389.

Burge C, Karlin S: Predicción de estructuras genéticas completas en el ADN genómico humano. J Mol Biol. 1997, 268: 78-94. 10.1006 / jmbi.1997.0951.

Kent WJ: BLAT - la herramienta de alineación similar a BLAST. Genome Res. 2002, 12: 656-664. 10.1101 / gr.229202. Artículo publicado en línea antes de marzo de 2002.

Drosophila Proyecto Genoma de Heterocromatina Bibliotecas PILER-DF. [ftp://ftp.dhgp.org/pub/DHGP/PILER-DF/]

Benson G: Buscador de repeticiones en tándem: un programa para analizar secuencias de ADN. Ácidos nucleicos Res. 1999, 27: 573-580. 10.1093 / nar / 27.2.573.

Wooton J, Federhen S: Estadísticas de complejidad local en secuencias de aminoácidos y bases de datos de secuencias. Comput Chem. 1993, 17: 149-163. 10.1016 / 0097-8485 (93) 85006-X.


Opciones de acceso

Obtenga acceso completo a la revista durante 1 año

Todos los precios son precios NETOS.
El IVA se agregará más adelante en el proceso de pago.
El cálculo de impuestos se finalizará durante el pago.

Obtenga acceso a artículos por tiempo limitado o completo en ReadCube.

Todos los precios son precios NETOS.


Cromosomas politeno, heterocromatina y variación del efecto de posición

Este capítulo describe que los problemas relacionados con la organización de la heterocromatina son prominentes en el pensamiento general sobre la organización del material genético en los cromosomas. El hallazgo de secuencias repetitivas de ADN en el genoma eucariota y el método de en el lugar La hibridación proporcionó una base más amplia para la comprensión de la estructura de la heterocromatina y la detección de su riqueza en secuencias repetitivas de ADN. Un modelo experimental notable para estudiar el papel fisiológico de la heterocromatina es el efecto de posición. Cuando una región eucromática se transpone a heterocromatina, los genes inmediatamente adyacentes a ella pueden inactivarse bajo el efecto de posición. El grado de inactivación genética puede ser modificado por varios agentes, incluida la variación en la cantidad de heterocromatina en la célula. Por lo tanto, al aprovechar el efecto de posición, la influencia de la actividad génica en ambos trans y cis las posiciones se pueden aclarar. El capítulo presenta los estudios sobre la organización morfológica y morfofuncional de los fragmentos de cromosomas en estrecha proximidad a la heterocromatina, demostrando que la inactivación genética está relacionada con la compactación de la región cromosómica y con la adquisición de las propiedades de una heterocromatina. Un gran avance en los estudios de la heterocromatina y el efecto de posición se produjo con el descubrimiento del complejo sistema de genes que afecta la expresión de la inactivación genética y, en consecuencia, el grado de compactación de la cromatina. El capítulo concluye que se ha acumulado nueva información que requiere un examen más detenido en el área de investigación de la heterocromatina.


Ver el vídeo: 01 La cromatina en el cariotipo humano (Agosto 2022).