Información

Vinculación y LD: ¿cuantitativo o cualitativo?


Tengo entendido que el concepto de "vinculación genética" se puede expresar en forma cuantitativa, como:

Se encontró un gen X predisponente en estrecho vínculo genético con Y.

Y ese desequilibrio de ligamiento (LD) es una cualidad, como estar embarazada, o estás en LD o no lo estás:

Se encontró un gen X predisponente en estrecho vínculo genético con Y y en desequilibrio de ligamiento con Z.

¿Es esto correcto?


El desequilibrio de ligamiento (LD) ocurre cuando hay una asociación o correlación no aleatoria entre genotipos. Tenga en cuenta que utilicé la palabra correlación; este es un rasgo cuantitativo.

Algunos genotipos pueden correlacionarse perfectamente (R = 1), es decir, siempre se heredan juntos. Otros pueden no estar en un enlace 'perfecto' (por ejemplo, R = 0,9), pero aún se considera que están en LD porque existe una fuerte correlación entre los genotipos (creo que 0,8 se considera generalmente en los artículos publicados como el 'límite' ).

El coeficiente de correlación se deriva del valor D '; esto (simplemente) denota las frecuencias observadas frente a las esperadas de los genotipos (ya sea que estén vinculados o no). Por lo tanto, se puede usar cualquier valor, pero creo que es más común (y más interpretable) expresar el coeficiente de correlación (o para ser más precisos, el coeficiente de determinación, R ^ 2).

Si desea un ejemplo: podría estar interesado en saber si algún SNP está en LD con rs10757278 (ubicado en 9p21, asociado con enfermedad cardíaca). Usando SNAP (by the BROAD) puedo ingresar mi búsqueda, elegir mis opciones (por ejemplo, usar 1000 datos de genomas y un límite de R ^ 2 de 0.8) y buscar. ~ 5 SNP se encuentran en LD 'perfecto' (R ^ 2 = 1), pero todavía se considera que ~ 40 más están vinculados con el SNP de entrada porque sus valores R ^ 2 están por encima de 0.8.

Entonces, en resumen, ambas declaraciones se pueden usar correctamente, pero siempre es más informativo indicar el grado de vinculación (de lo contrario, se podría suponer que están en perfecta correlación).


Herencia poligénica

Mendel realizó sus experimentos con la planta de guisantes de jardín, que tiene rasgos o alelos que tienen un dominio completo y, por lo tanto, se probaron las leyes de la herencia. Otros científicos realizaron sus experimentos en diferentes plantas y animales y encontraron desviaciones en las proporciones mendelianas. Dependiendo de estos experimentos y observaciones, se descubrió un patrón diferente de herencia llamado interacciones genéticas. Este estudio se conoce como genética Post & # 8211 Mendeliana o genética Neo-Mendeliana. En este artículo estudiaremos el concepto de herencia poligénica.

Herencia poligénica o herencia cuantitativa:

Estos caracteres están determinados por dos o más pares de genes y tienen un efecto aditivo o acumulativo. Estos genes se denominan genes acumulativos o poligénicos o factores múltiples. Los polygenes son dos o más pares diferentes de genes no alélicos, presentes en diferentes loci, que influyen en un único carácter fenotípico y tienen un efecto aditivo o acumulativo. También se denominan genes cuantitativos o genes acumulativos o factores múltiples.

Un único carácter fenotípico gobernado por más de un par de genes se denomina carácter poligénico o carácter cuantitativo. Los caracteres poligénicos o cuantitativos muestran una variación continua. Galton (1883) predijo que en la población humana caracteres como la altura, el color de la piel y la inteligencia muestran variaciones continuas en la expresión y no solo dos expresiones contrastantes.

En la herencia acumulativa o poligénica, cada gen tiene una cierta cantidad de efecto. Cuanto mayor es el número de genes dominantes, mayor es la expresión del carácter. Generalmente se cree que durante la evolución hubo una duplicación de cromosomas o partes de cromosomas. Esto resultó en múltiples copias del mismo gen. Tenga en cuenta que Mendel estudió la herencia cualitativa, donde se observa un dominio completo.

Herencia poligénica en el color del grano de trigo:

El genetista sueco H. Nilsson-Ehle descubrió la herencia poligénica. Cruzó una variedad de trigo de grano rojo con una variedad de grano blanco. En F1 generación todas las plantas tienen granos con color intermedio entre rojo y blanco. En F2 generación de cinco expresiones fenotípicas diferentes (el rojo más oscuro, rojo medio, rojo intermedio, rojo claro, blanco) aparecieron en la proporción 1: 4: 6: 4: 1. Nilson Ehle sugirió que el color del grano en el trigo está controlado por dos pares de genes, Aa y Bb. Los genes A y B determinan el color rojo. ayb que no producen pigmento de color rojo y su expresión es un color blanco del grano.

Herencia poligénica en el color de la piel humana:

La presencia de pigmento de melanina es responsable del color de la piel en un ser humano. Cada gen dominante es responsable de la síntesis de una cantidad fija de melanina. La cantidad de melanina sintetizada es directamente proporcional al número de genes dominantes.

La cantidad de melanina que se desarrolla en las personas está determinada por tres pares de genes A, B, C. Estos están presentes en tres loci diferentes y cada gen dominante es responsable de la síntesis de una cantidad fija de melanina. Un genotipo de un progenitor negro puro en el que se produce melanina es el más alto es AABBCC, mientras que el del blanco puro también llamado albino no se forma melanina es aabbcc.

Mulatos, es decir, F1 la descendencia produce (2 3 = 8) diferentes tipos de gametos. Consideremos mulato intermedio cuyo genotipo es AaBbCc. Haciendo cruce entre dos mulatos intermedios obtenemos (2 6 = 64) combinaciones en F2 Generacion. Pero solo hay 7 fenotipos debido a un efecto acumulativo de cada gen dominante.

Cuando analizamos todas las combinaciones posibles y trazamos el gráfico de probabilidad tomando la distribución de frecuencia del color, el número de genes dominantes en varios tonos en el eje xy la frecuencia de diferentes tonos en el eje y. En la herencia poligénica a menudo obtenemos una curva en forma de campana como se muestra a continuación.

Esto significa que la mayoría de las personas se encuentran en el medio del rango fenotípico, como el color de la piel, mientras que muy pocas personas se encuentran en los extremos, como el blanco puro o el oscuro puro. En un extremo de la curva habrá individuos que son recesivos para todos los alelos (por ejemplo, aabbcc). Son raros en el otro extremo serán los individuos que son dominantes para todos los alelos (por ejemplo, AABBCC) son raros. En el medio de la curva habrá individuos que tengan una combinación de alelos dominantes y recesivos (por ejemplo, AaBbCc o AaBBcc). El gráfico también muestra que el nivel de expresión del fenotipo depende del número de alelos contribuyentes y, por tanto, es más cuantitativo.

Otros ejemplos son la altura del ser humano, la longitud de la mazorca de maíz.

Estudio comparativo de herencia cualitativa y cuantitativa:

Herencia cualitativa:

  • Los caracteres cualitativos son rasgos mendelianos clásicos que tienen dos expresiones contrastantes y están controlados por un solo par de genes. p.ej. plantas de guisantes altos y enanos. Un carácter cualitativo puede expresarse mediante un solo par del gen. Por lo tanto, los rasgos se denominan rasgos monogénicos. La herencia de rasgos monogénicos (monogénico) o caracteres cualitativos se denomina herencia cualitativa o monogénica.
  • Un rasgo cualitativo se expresa cualitativamente, lo que significa que el fenotipo se divide en diferentes categorías. Estas categorías no tienen necesariamente un orden determinado.
  • La herencia cualitativa fue estudiada por primera vez por Mendel.

Características de la herencia cualitativa:

  • Una herencia cuantitativa o herencia monogénica se ocupa de las herencias de caracteres cualitativos que tienen dos expresiones contrastantes, p. plantas de guisantes altos y enanos.
  • Cada carácter está controlado por un solo par de alelos contrastantes.
  • No existe un tipo intermedio.
  • Cada personaje tiene dos expresiones contrastantes distintas, es decir, exhiben dos fenotipos distintos.
  • El grado de expresión sigue siendo el mismo si el carácter está controlado por uno o ambos genes dominantes.
  • Se ven genes de efecto único.
  • No está influenciado por factores ambientales.
  • Muestra un patrón de herencia discontinuo.
  • Los individuos de la generación F1 se parecen al padre dominante.
  • Los individuos de la generación F2 están en una proporción de 3: 1. Falta una expresión intermedia.
  • Se trata de apareamientos individuales y su progenie.
  • El análisis de esta herencia se puede realizar contando y encontrando proporciones.
  • Ejemplos: Herencias de caracteres cualitativos como la altura, la cubierta de la semilla y el color de la semilla de la planta de guisante.

Herencia cuantitativa:

Una herencia cuantitativa o herencia poligénica se ocupa de las herencias de caracteres cuantitativos como altura, peso, color de piel, inteligencia, etc. en la población humana y exhibe una variación continua. Pocos caracteres en las plantas como la altura, el tamaño, la forma, el número de semillas y frutos también exhiben herencia cuantitativa.

En la herencia cuantitativa, cada gen tiene una cierta cantidad de efecto y cuanto mayor es el número de genes dominantes, mayor es el grado de expresión del carácter. La gradación en la expresión de los caracteres está determinada por el número de pares de genes y todos los pares de genes tienen un efecto aditivo o acumulativo.

La herencia cuantitativa o poligénica fue estudiada por primera vez por J. Kolreuter (1760) en el caso de la altura en el tabaco y F. Galton (1883) en el caso de la altura y la inteligencia en los seres humanos. Nilsson-Ehle (1908) obtuvo la primera prueba experimental de herencia poligénica en el caso del color del grano en el trigo. El posible origen de la herencia poligénica se debe a la duplicación de un cromosoma o su parte, el aumento del número de cromosomas (poliploidía) o las mutaciones que producen genes que tienen un efecto similar.


Acceso al documento

  • APA
  • Estándar
  • Harvard
  • Vancouver
  • Autor
  • BIBTEX
  • RIS

En: epidemiología genética, vol. 22, núm. 4, 2002, pág. 298-312.

Resultado de la investigación: Contribución a la revista ›Artículo› revisión por pares

T1 - Enfoque de muestreo unificado para el mapeo de desequilibrio de ligamiento multipunto de rasgos cualitativos y cuantitativos

N2 - El rápido desarrollo de la biotecnología ha mejorado la oportunidad de abordar el mapeo de genes multipunto para enfermedades complejas, y recientemente se ha prestado mucha atención a los estudios de asociación que utilizan rasgos cuantitativos. A diferencia del enfoque convencional de prueba de hipótesis para el mapeo fino, proponemos un método multipunto unificado para localizar un gen que controla un rasgo cuantitativo. Primero calculamos el tamaño de muestra necesario para detectar ligamiento y desequilibrio de ligamiento (LD) para un rasgo cuantitativo, categorizado por decil, bajo tres modos diferentes de herencia. Nuestros resultados muestran que el muestreo de tríos de descendientes y sus padres de probandos extremadamente bajos (EL) o extremadamente altos (EH) proporciona mayor poder estadístico que el muestreo en el rango intermedio. A continuación, proponemos un enfoque de muestreo unificado para el mapeo LD multipunto, donde el objetivo es estimar la posición del mapa (τ) de un locus de rasgo y calcular un intervalo de confianza junto con su incertidumbre de muestreo. Nuestro método se basa en un modelo para una estadística de transmisión preferencial esperada en un locus arbitrario condicionado al esquema de muestreo, como el muestreo de probandos EL y EH. Este enfoque es válido independientemente del modelo genético subyacente. El único supuesto principal para este modelo es que no más de un locus de rasgos cuantitativos (QTL) está vinculado a la región que se está mapeando. Finalmente, ilustramos el método propuesto utilizando datos familiares sobre los niveles séricos totales de IgE recolectados en familias de asmáticos múltiples de Barbados. Un QTL no observado parece estar ubicado en τ̂ = 41,93 cM con un intervalo de confianza del 95% de (40,84, 43,02) a través de la región de 20 cM enmarcada por los marcadores D12S1052 y D12S1064 en el cromosoma 12. La estadística de prueba muestra una fuerte evidencia de ligamiento y LD ( estadístico de chi-cuadrado = 18,39 con 2 gl, valor P = 0,0001).

AB - El rápido desarrollo de la biotecnología ha mejorado la oportunidad de abordar el mapeo de genes multipunto para enfermedades complejas, y recientemente se ha prestado mucha atención a los estudios de asociación que utilizan rasgos cuantitativos. A diferencia del enfoque convencional de prueba de hipótesis para el mapeo fino, proponemos un método multipunto unificado para localizar un gen que controla un rasgo cuantitativo. Primero calculamos el tamaño de muestra necesario para detectar ligamiento y desequilibrio de ligamiento (LD) para un rasgo cuantitativo, categorizado por decil, bajo tres modos diferentes de herencia. Nuestros resultados muestran que el muestreo de tríos de descendientes y sus padres de probandos extremadamente bajos (EL) o extremadamente altos (EH) proporciona mayor poder estadístico que el muestreo en el rango intermedio. A continuación, proponemos un enfoque de muestreo unificado para el mapeo LD multipunto, donde el objetivo es estimar la posición del mapa (τ) de un locus de rasgo y calcular un intervalo de confianza junto con su incertidumbre de muestreo. Nuestro método se basa en un modelo para una estadística de transmisión preferencial esperada en un locus arbitrario condicionado al esquema de muestreo, como el muestreo de probandos EL y EH. Este enfoque es válido independientemente del modelo genético subyacente. La única suposición principal para este modelo es que no más de un locus de rasgos cuantitativos (QTL) está vinculado a la región que se está mapeando. Finalmente, ilustramos el método propuesto utilizando datos familiares sobre los niveles séricos totales de IgE recolectados en familias de asmáticos múltiples de Barbados. Un QTL no observado parece estar ubicado en τ̂ = 41,93 cM con un intervalo de confianza del 95% de (40,84, 43,02) a través de la región de 20 cM enmarcada por los marcadores D12S1052 y D12S1064 en el cromosoma 12. La estadística de prueba muestra una fuerte evidencia de ligamiento y LD ( estadístico de chi-cuadrado = 18,39 con 2 gl, valor de P = 0,0001).


Notación y datos

La notación utilizada en los diversos artículos de TDT cuantitativos en los que se basan nuestros comentarios no es coherente de un autor a otro, y adoptamos una notación unificadora que se basa libremente en la de estos artículos. De acuerdo con la práctica estadística estándar, utilizamos la notación en mayúsculas para las variables aleatorias y la correspondiente notación en minúsculas para los valores observados de estas variables aleatorias. Para centrarnos en los puntos principales de esta revisión expositiva, asumimos una forma de datos específica (y restringida). Suponemos que los datos se refieren a un locus marcador "A, ”Que tiene dos alelos posibles, denotados por A y ay constan de información sobre norte tríos familiares, con información completa del genotipo del locus marcador sobre los dos padres y el niño en cada trío. El valor del rasgo cuantitativo de interés es conocido por el niño en cada trío, pero no por los padres. Suponemos, de acuerdo con la TDT cualitativa original, que todos los tipos de apareamiento parental son informativos (es decir, contienen al menos una Automóvil club británico padre). El número observado de A alelos en el niño en trío I se denota por XI (I = 1, 2,…, norte), y el valor observado del rasgo cuantitativo de interés en el niño en trío I se denota por yI.

No consideramos aquí hasta qué punto los comentarios hechos a continuación se trasladan a datos distintos a los descritos anteriormente, por ejemplo, casos en los que se observan varios niños en cada familia, en los que se dispone de información sobre el fenotipo de los padres y en los que los datos contienen familias con datos no informativos. tipos de apareamiento. Restringimos nuestro análisis de esta manera para resaltar las características principales de los procedimientos de prueba que discutimos sin entrar en los análisis requeridos para formas de datos más complicadas que las que consideramos.

La hipótesis nula probada es "sin vinculación (o sin desequilibrio de vinculación) entre el locus del marcador y un locus involucrado con el rasgo cuantitativo". Bajo esta hipótesis nula, el número medio de A alelos, XI, en el niño en trío I dependerá del tipo de apareamiento parental, siendo 0.5 si es Automóvil club británico×Automóvil club británico, 1.0 si es Automóvil club británico×Automóvil club británico, y 1.5 si es Automóvil club británico×Automóvil club británico. La varianza de la hipótesis nula de XI también depende del tipo de apareamiento de los padres, siendo 0,25 si es Automóvil club británico×Automóvil club británico o Automóvil club británico×Automóvil club británico y 0.5 si es Automóvil club británico×Automóvil club británico. Usamos frecuentemente la conveniente notación Abecasis [5] WI ("Dentro de la familia") para describir XI menos su media de hipótesis nula calculada a partir del tipo de apareamiento en trío I. La media de la hipótesis nula de WI es cero y la varianza de la hipótesis nula de WI es lo mismo que para XI, y depende del tipo de apareamiento en trío I. Cuando hablamos de la familia típica dejamos caer el sufijo I y usa la notación genérica W, w, X, X, Y, y y.


Resultados

Evaluamos diferentes métodos para manejar LD en el marco de nuestra estrategia de procesamiento de dos pasos propuesta. En el paso 1, realizamos un análisis de NPL sobre 1,000 réplicas de los datos simulados en diferentes umbrales de LD para familias con 2, 3 o 4 hermanos afectados y cero o dos padres no genotipados para determinar qué subconjunto de SNP retuvo el IC completo mientras se reducía el sesgo de puntuación de LOD . En el paso 2, realizamos un análisis de NPL de más de 1000 réplicas de los datos simulados en diferentes umbrales de LD utilizando el subconjunto de SNP obtenido en el paso 1 para los 9 diseños de estudio, con cero o dos padres no genotipados. Evaluamos diferentes enfoques en diversos grados de LD (D 'yr 2) en términos de reducir el sesgo de puntuación de LOD. En general, con datos completos donde ambos padres están genotipados, no hubo inflación de la puntuación LOD en todos los diseños de estudio. Por lo tanto, nuestras discusiones a continuación se centran principalmente en aquellos resultados en los que ambos padres no son genotipados.

Paso 1

La Tabla & # x200B La Tabla1 1 resume la puntuación LOD máxima promedio (MLS) y el IC promedio obtenido usando las tres técnicas en comparación con el subconjunto no ajustado de SNP. Los valores de CI obtenidos en el subconjunto no ajustado de SNP fueron 0,72, 0,80 y 0,84 para los datos de 2, 3 o 4 hermanos, respectivamente.

Tabla 1

Paso 1: Resumen de estadísticas descriptivas de las puntuaciones medias máximas de NPL LOD y la media de CI con padres no genotipados.

2 hermanos afectados3 hermanos afectados4 hermanos afectados
Ave # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
No ajustado601213.27 (2.77)0.7214.41 (3.64)0.807.86 (2.20)0.84
MAF & # x02265 0.05538713.49 (2.66)0.7214.77 (3.64)0.808.06 (2.23)0.84
MAF & # x02265 0.10461613.87 (2.64)0.7215.00 (3.61)0.808.18 (2.25)0.84
MAF & # x02265 0,20320315.01 (2.69)0.7215.47 (3.61)0.797.90 (2.42)0.84
r 2 & # x02265 0,9545965.47 (1.79)0.724.93 (2.06)0.802.96 (1.55)0.85
MAF & # x02265 0.05 & # x00026 r 2 & # x02265 0.9537139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85

La eliminación de los SNP no informativos redujo el número de marcadores mientras se mantenía el nivel de CI; sin embargo, la inflación de la puntuación LOD se mantuvo sin cambios en comparación con la inflación de la puntuación LOD de referencia. La eliminación de los SNP redundantes no provocó pérdida de CI y mostró una reducción moderada del sesgo de la puntuación LOD y superó la técnica de combinación, sin embargo, todavía hubo una gran cantidad de marcadores seleccionados. Cuando se combinaron las dos técnicas, se seleccionaron un 38% menos de SNP que el subconjunto de referencia de SNP mientras se mantenía la CI. Además, esta técnica combinada mostró una reducción moderada en el sesgo de la puntuación LOD. En general, para todos los subconjuntos de marcadores, el MLS promedio se mantuvo por encima de la expectativa nula, lo que indica la necesidad de un mayor ajuste / selección de SNP para reducir el sesgo introducido al ignorar LD en conjuntos de marcadores densos. Llevamos adelante el subconjunto de marcadores creado por el enfoque de combinación para ser evaluado en el paso 2 porque logramos el mismo contenido de información mientras redujimos el sesgo. Establecer los resultados del enfoque combinado en el Paso 1 como la línea de base para el Paso 2 nos permitió evaluar los diferentes enfoques y medir el nivel de sesgo que cada enfoque podría reducir partiendo de una línea de base moderada de sesgo.

Paso 2

En el paso 2, examinamos cuatro enfoques diferentes para manejar LD entre SNP densos utilizando el subconjunto seleccionado de 3.713 SNP en el paso 1 como el subconjunto de marcadores de línea de base. Comparamos el MLS promedio resultante de estos diferentes enfoques con la línea de base y consideramos que muestran una reducción del sesgo donde notamos el MLS promedio observado al menos un 10% por debajo de la línea de base. Tabla & # x200B La Tabla2 2 muestra el MLS promedio con padres no genotipados, donde se observó sesgo en la puntuación LOD. Como nota, con la adición de uno o dos hermanos no afectados, observamos un sesgo de puntuación de LOD más bajo como se muestra en la Tabla & # x200B Tabla1. 1. Por ejemplo, observamos 9,62 (DE = 2,75), 8,66 (DE = 2,49) y 4,41 (DE = 1,80) MLS promedio para familias de 2 hermanos afectados y cero, uno o dos hermanos no afectados, respectivamente, con padres no genotipados. Se observaron tendencias similares para otros diseños de estudio con 3 o 4 hermanos afectados. En términos de CI, observamos un aumento de la CI promedio a medida que aumentaba el tamaño de una hermandad en una familia.

Tabla 2

Resumen de las puntuaciones medias máximas de LOD e IC media utilizando el subconjunto de marcadores de línea de base del paso 1 para los 9 diseños de estudio con padres no genotipados.

Número de hermanosMLS (SD)IC promedio
2 afectados9.62 (2.75)0.72
3 afectados14.01 (3.43)0.80
4 afectados5.02 (1.95)0.85
2 afectados + 1 no afectado8.66 (2.49)0.80
3 afectados + 1 no afectado5.41 (2.12)0.85
4 afectados + 1 no afectado3.17 (1.55)0.88
2 afectados + 2 no afectados4.41 (1.80)0.85
3 afectados + 2 no afectados3.18 (1.57)0.88
4 afectados + 2 no afectados1.89 (1.29)0.90

En la Tabla & # x200B Tabla3 3 y & # x200B y4, 4, resumimos el MLS promedio usando los cuatro métodos para manejar LD en diferentes puntos de corte LD usando familias con 2, 3 o 4 hermanos afectados y padres no genotipados. La Tabla & # x200B La Tabla3 3 muestra los resultados obtenidos usando los umbrales D ', y la Tabla & # x200B La Tabla4 4 muestra los resultados obtenidos usando los umbrales r 2 para familias con 2, 3 o 4 hermanos afectados con padres no genotipados. Además, se observaron patrones similares en los puntos de corte de LD con una mayor reducción del sesgo de puntuación de LOD para familias con 1 o 2 hermanos adicionales que no se vieron afectados (datos no mostrados). A medida que aumentó el número de hermanos no afectados en una familia, la inflación de las puntuaciones LOD disminuyó aún más y, en algunos casos, se eliminó por completo.

Tabla 3

Paso 2 usando el umbral D 'LD y MT: Resumen de estadísticas descriptivas de las puntuaciones medias máximas de NPL LOD y el IC promedio para familias con 2, 3 o 4 hermanos afectados y padres no genotipados *.

2 hermanos afectados3 hermanos afectados4 hermanos afectados
MétodoUmbral LDAve # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
No ajustado 37139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85
MONTE8snp1cM4801.20 (0.96)0.721.34 (1.01)0.800.36 (0.47)0.85
MONTE4snp1cM2590.65 (0.67)0.710.60 (0.63)0.800.22 (0.36)0.85
MONTE2snp1cM1350.66 (0.68)0.670.76 (0.74)0.790.26 (0.38)0.84
MONTE1snp1cM680.76 (0.73)0.611.05 (0.88)0.760.34 (0.47)0.83
RE0.74090.44 (0.53)0.730.54 (0.61)0.800.2 (0.33)0.85
RE0.53090.37 (0.50)0.720.45 (0.55)0.800.18 (0.34)0.85
RE0.32000.43 (0.54)0.70.58 (0.60)0.800.23 (0.39)0.85
RE0.1620.73 (0.73)0.611.18 (0.96)0.760.44 (0.57)0.83
SNPLINK0.75310.65 (0.78)0.730.66 (0.79)0.800.3 (0.46)0.85
SNPLINK0.54010.75 (0.81)0.720.73 (0.83)0.800.31 (0.46)0.85
SNPLINK0.32870.85 (0.88)0.710.81 (0.84)0.800.33 (0.47)0.85
SNPLINK0.11200.65 (0.74)0.640.70 (0.81)0.770.31 (0.46)0.83

* Con datos completos donde ambos padres están genotipados, el MLS promedio no ajustado para 2, 3 o 4 hermanos afectados es 0.58, 0.5 y 0.47.

Cuadro 4

Paso 2 usando el umbral r 2 LD: Resumen de estadísticas descriptivas de las puntuaciones promedio máximas de NPL LOD y el IC promedio para familias con 2, 3 o 4 hermanos afectados y padres no genotipados *.

2 hermanos afectados3 hermanos afectados4 hermanos afectados
MétodoUmbral LDAve # SNPMLS (SD)ICMLS (SD)ICMLS (SD)IC
No ajustado 37139.62 (2.75)0.7214.01 (3.43)0.805.02 (1.95)0.85
RE0.715621.39 (0.98)0.732.00 (1.28)0.800.73 (0.70)0.85
RE0.512401.21 (0.90)0.731.67 (1.17)0.810.59 (0.63)0.85
RE0.38920.45 (0.53)0.730.66 (0.68)0.810.26 (0.39)0.85
RE0.14350.32 (0.44)0.720.40 (0.49)0.800.18 (0.34)0.85
MERLINLD0.75621.35 (0.97)0.731.83 (1.22)0.800.62 (0.61)0.85
MERLINLD0.55751.12 (0.96)0.731.53 (1.19)0.800.53 (0.59)0.85
MERLINLD0.35420.55 (0.61)0.740.77 (0.77)0.800.32 (0.43)0.85
MERLINLD0.14230.51 (0.58)0.740.69 (0.70)0.810.29 (0.41)0.85
SNPLINK0.725963.94 (1.85)0.735.10 (2.11)0.802.06 (1.23)0.85
SNPLINK0.523513.63 (1.81)0.734.88 (2.09)0.801.97 (1.20)0.85
SNPLINK0.320573.04 (1.73)0.734.10 (1.95)0.801.56 (1.07)0.85
SNPLINK0.115192.69 (1.64)0.733.57 (1.87)0.801.28 (0.98)0.85

* Con datos completos donde ambos padres están genotipados, el MLS promedio no ajustado para 2, 3 o 4 hermanos afectados es 0.58, 0.5 y 0.47

Algoritmo de reducción de marcador (MT)

Para los cuatro puntos de corte de MT con 8, 4, 2 o 1 SNP por región de 1 cM, observamos el MLS promedio de 1,20 (DE = 0,96), 0,65 (DE = 0,67), 0,66 (DE = 0,68) y 0,76 (DE = 0,73), respectivamente (Tabla & # x200B (Tabla3). 3). Los correspondientes valores medios de CI fueron 0,72, 0,71, 0,67 y 0,61, respectivamente. En comparación con la puntuación LOD inicial de 9,62 (DE = 2,75), los cuatro subconjuntos de marcadores dieron como resultado un sesgo de puntuación LOD muy reducido. En los puntos de corte de 8 y 4 SNP por cM, hubo una pérdida de información insignificante; sin embargo, en los otros dos puntos de corte más bajos, hubo cierta pérdida de información en comparación con el IC inicial de 0,72. Sin embargo, ninguno de estos conjuntos de marcadores eliminó por completo el sesgo de la puntuación LOD, en comparación con los valores promedio de MLS observados con datos completos donde ambos padres están genotipados. Se observaron tendencias similares para familias con 3 o 4 hermanos.

Algoritmo de eliminación recursiva (RE)

Utilizando los puntos de corte D ', observamos una reducción sustancial del sesgo de la puntuación LOD en comparación con la puntuación LOD inicial de 9,62 (DE = 2,75) que se muestra en la Tabla & # x200B Tabla 3. 3. En comparación con el MLS promedio observado con datos completos, el uso del enfoque RE eliminó el sesgo en D '& # x0003e 0.3, pero no observamos el mismo patrón en el punto de corte D' más bajo. Se observó cierta pérdida de información en los puntos de corte D '0,3 (IC = 0,70) y 0,1 (IC = 0,61) en comparación con la línea de base. Con r 2 umbrales aplicados a los datos con 2 hermanos afectados, también observamos una reducción del sesgo de puntuación LOD para los cuatro puntos de corte r 2, respectivamente (Tabla & # x200B (Tabla4). 4). Cuando se comparó con los datos completos, el sesgo de la puntuación LOD ya no se observó en los dos puntos de corte r 2 más bajos. Además, los valores de CI no cambiaron desde el valor inicial de CI de 0,72. En general, para ambas medidas de LD, se observaron tendencias similares para familias con 3 o 4 hermanos afectados.

SNPLINK

En comparación con la puntuación LOD inicial de 9,62, los subconjuntos de marcadores ajustados de SNPLINK redujeron el sesgo de la puntuación LOD cuando se usaron umbrales D '(Tabla & # x200B (Tabla3) 3) sin embargo, ninguno de los puntos de corte eliminó completamente el sesgo. Hubo cierta pérdida de información solo en el punto de corte más bajo (IC = 0,64) en comparación con el IC inicial de 0,72. Por el contrario, al utilizar los umbrales r 2, observamos solo una reducción moderada del sesgo de la puntuación LOD (Tabla & # x200B (Tabla4), 4), y no hubo pérdida de información en ningún nivel de umbral. Se observaron patrones de reducción relativamente similares en familias con 3 o 4 hermanos en todos los puntos de corte para ambas medidas de LD.

MERLIN-LD

Se aplicó el método de agrupamiento implementado en MERLIN, MERLIN-LD, utilizando cuatro puntos de corte r 2. Se formaron 562, 575, 542 y 423 conglomerados en 0,7, 0,5, 0,3 y 0,1 r 2 puntos de corte, respectivamente (Tabla & # x200B (Tabla4). 4). En todos los umbrales, el IC se mantuvo sin cambios desde el IC inicial. Para las familias con 2 hermanos afectados y padres no genotipados, observamos una reducción sustancial del sesgo de la puntuación LOD en comparación con la puntuación LOD inicial de 9,62 (Tabla & # x200B (Tabla4). 4). En los dos puntos de corte más bajos, observamos la eliminación del sesgo de puntuación LOD en comparación con el MLS promedio con datos completos.


Abstracto

Un desafío importante en la biología actual es comprender la base genética de la variación de los rasgos cuantitativos. Revisamos los principios del mapeo de locus de rasgos cuantitativos y resumimos los conocimientos sobre la arquitectura genética de los rasgos cuantitativos que se han obtenido durante las últimas décadas. Actualmente nos encontramos en medio de una revolución genómica, que nos permite incorporar la variación genética en la abundancia de transcripciones y otros fenotipos moleculares intermedios en un marco de mapeo de locus de rasgos cuantitativos. Este enfoque de la genética de sistemas nos permite comprender la biología dentro de la "caja negra" que se encuentra entre el genotipo y el fenotipo en términos de redes causales de genes que interactúan.


Enfoque basado en agrupamiento de desequilibrio de ligamiento para mapeo de asociación con datos de todo el genoma estrechamente vinculados

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Zitong Li, Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia.

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Zitong Li, Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia.

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Unidad de Investigación en Genética Ecológica, Programa de Investigación en Biología Organismal y Evolutiva, Facultad de Ciencias Biológicas y Ambientales, Departamento de Biociencias, Universidad de Helsinki, Helsinki, Finlandia

Abstracto

Los estudios de asociación del genoma (GWAS) tienen como objetivo identificar marcadores genéticos fuertemente asociados con rasgos cuantitativos mediante la utilización de desequilibrio de ligamiento (LD) entre genes candidatos y marcadores. Sin embargo, debido a LD entre marcadores genéticos cercanos, los enfoques GWAS estándar generalmente detectan una serie de SNP correlacionados que cubren regiones genómicas largas, lo que hace que las correcciones para pruebas múltiples sean demasiado conservadoras. Además, la alta dimensionalidad de los datos GWAS modernos plantea desafíos considerables para los procedimientos GWAS, como las pruebas de permutación, que son computacionalmente intensivas. Proponemos un enfoque de GWAS basado en clústeres que primero divide el genoma en muchas ventanas grandes que no se superponen y utiliza el análisis de redes de desequilibrio de enlace en combinación con el análisis de componentes principales (PC) como herramientas de reducción dimensional para resumir los datos de SNP en PC independientes dentro de grupos de loci conectados por LD alto. Luego, presentamos modelos de enfoque único y múltiple que pueden realizar de manera eficiente las pruebas de asociación en datos de tan alta dimensión. Los métodos se pueden adaptar a diferentes estructuras de modelos y se pueden utilizar para analizar muestras recolectadas en el medio silvestre o de F biparental2 poblaciones, que se utilizan comúnmente en estudios de mapeo de genética ecológica. Demostramos el desempeño de nuestros enfoques con dos conjuntos de datos disponibles públicamente de una planta (Arabidopsis thaliana) y un pez (Pungitius pungitius), así como con datos simulados.

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea el contenido faltante) debe dirigirse al autor correspondiente del artículo.


Desequilibrio de ligamiento complejo y de largo alcance y su relación con QTL para la resistencia a la enfermedad de Marek en poblaciones de pollos

El desequilibrio de ligamiento de largo alcance del pollo (LRLD) y los bloques de LD, y su relación con las regiones de loci de rasgos cuantitativos (QTLR) de la enfermedad de Marek (MD) descritas anteriormente, se estudiaron en un F6 población de una línea entrecruzada avanzada de hermanos completos (FSAIL), y en ocho líneas comerciales de ponedoras puras. LRLD de todo el genoma se estudió en el F6 población por muestras aleatorias de pares de marcadores no sinténicos y sinténicos genotipados por la matriz Affymetrix HD 600K SNP. Para ilustrar la relación con los QTLR, los bloques LRLD y LD en y entre los MD QTLR fueron estudiados por todos los posibles pares de marcadores de todos los marcadores de matriz en los QTLR, utilizando la misma F6 Genotipos QTLR y genotipos de los marcadores de elementos QTLR en las ocho líneas utilizadas en el estudio de mapeo MD. LRLD se definió como r 2 ≥ 0,7 en una distancia ≥ 1 Mb, y el 1,5% de todos los pares de marcadores sinténicos se clasificaron como LRLD. Se encontraron bloques LD complejos, fragmentados e interdigitados, a distancias que van desde unos pocos cientos hasta unos pocos millones de bases. Se encontró LD enorme, de largo alcance y complejo entre dos de los QTLR MD. Cross QTLRs STRING networks and gene interactions suggested possible origins of this exceptional QTLRs’ LD. Thus, causative mutations can be located at a much larger distance from a significant marker than previously appreciated. LRLD range and LD block complexity may be used to identify mapping errors, and should be accounted for while interpreting genetic mapping studies. All sites with high LD with a significant marker should be considered as candidate for the causative mutation.


Discusión

This study provides an overview of LD in the Thoroughbred using a high density SNP panel. Validation work by Khatkar et al. (2008) on their cattle data suggests that our sample size of more than 800 horses is more than sufficient to obtain an unbiased picture of LD in our population. The pattern of decline of LD with distance in this population is consistent with that reported by Wade et al. (2009) in a sample of 24 Thoroughbreds, with both data sets exhibiting a decrease in r 2 from ∼0.6 to 0.2 when the distance between markers is increased to 0.5 Mb. The LD observed is higher at short distances and more extensive than that observed in human populations ( Shifman et al. 2003). Linkage disequilibrium declines more slowly in our population than in the range of cattle populations studied by de Roos et al. (2008) , with r 2 remaining above 0.3 for distances up to 185 kb in our data, compared with a maximum distance of 35 kb in the cattle data.

El valor medio de r 2 between non-syntenic SNPs was 0.0018, and this provides an approximation of the LD that can be expected by chance, assuming that the markers used have not undergone simultaneous selection. The value observed here is lower than, but of a similar magnitude to, that observed by Khatkar et al. (2008) in a sample of over 1500 cattle (0.0032). The mean non-syntenic r 2 value reflects both sampling of animals and genetic sampling (drift), and hence may be expected to decrease with increases in both sample size and Nmi. Therefore, the larger non-syntenic value in Australian Holstein–Friesian cattle may more reflect a lower Nmi in this cattle population. The low LD seen between non-syntenic SNPs in our population suggests that the LD created by admixture during breed formation ( Hill et al. 2002 ) has declined to negligible levels for these markers. A similar decline of LD between non-syntenic markers was observed in Coopworth sheep approximately ten generations after the foundation of the breed through crossing ( McRae et al. 2002). At distances greater than 100 Mb, average r 2 between syntenic SNPs is reduced to non-syntenic or background levels, and is no longer a function of distance. This is expected, as the recombination rate at such distances approaches 0.5.

By using Sved’s (1971) formula for the expectation of r 2 , a non-linear regression model was fitted to the data to describe the relationship between linkage distance and LD. Without making any assumptions about the value of r 2 at the intercept, estimates of a y B, as predicted using Eq. 3 and averaged over all autosomes, were 2.25 and 103, respectively. Parámetro a determines the value of expected r 2 when the line crosses the y-axis (i.e. when the distance between markers is effectively zero). Our estimate of a supports an alternative version of Sved’s (1971) equation, derived by Tenesa et al. (2007) , which takes into account mutation and puts a equal to two, whilst at the same time raising the question of whether fixing a to unity in the model (as in Abasht et al. (2009) , Toosi et al. (2010) and Zhao et al. (2005) ) is appropriate. The impact of such model assumptions are explored in Corbin et al. (2010) . The heterogeneity of variance associated with the observed r 2 , such that the variance of r 2 declined with increasing distance between markers, may also have impacted on our results. We observed a significant negative relationship between chromosome length (cM) and estimates of B from the non-linear model, suggesting LD is higher in longer chromosomes. This contrasts with the findings of Tenesa et al. (2007) , who observed a positive relationship, but is in keeping with the observations of Khatkar et al. (2008) and Muir et al. (2008) in domestic livestock species.

Our estimate of B (103) is an estimate of Nmi assuming constant population size. However, this assumption is difficult to sustain, and therefore, B more likely represents a conceptual average Nmi over the period inferred from the marker distance range, for example see Toosi et al. (2010) . For this reason, Fig. 5 shows the results following the approach of Hayes et al. (2003) by calculating historical Nmi, assuming linear population growth. The pattern observed shows a decrease in Nmi up until around 20 generations ago, followed by an increase until one generation ago. The interpretation of such trends is difficult, with the observed dip in Nmi potentially representing any one of a number of scenarios, including a founder event, an immigration event, a hybridization event or any combination of these ( Wang 2005 ). Therefore, it is useful to consider our observation in the context of what is known about the Thoroughbred’s demographic history.

Documentary evidence suggests that the Thoroughbred was derived from a cross between sires originating from the Mediterranean Middle East and British native breeds, and the breed was established during the seventeenth century ( Hill et al. 2002). It is not clear from published literature what effects an admixture like this would have on patterns of estimated Nmi prior to the crossing event, although clues may be observed in Toosi et al. (2010) . However, what may be predicted is that such a crossing event would appear as a bottleneck in the population, creating an initially high level of LD in the beginning. Therefore, one might infer from our results that the lowest point of the curve reflects the point at which the breed was formed this approximately coincides with the findings of Mahon & Cunningham (1982) that Thoroughbreds born in the 1960s were separated from seventeenth century founders by an average of 21.5 generations. Cunningham et al. (2001) also found evidence for a population bottleneck at the time of breed formation.

The reliability of this method depends both on the technical implementation ( Corbin et al. 2010 ) and, as discussed above, on the demographic history of the breed. Some calibration of the accuracy of the Nmi profile presented can be obtained by comparison with values obtained from pedigree analyses. For example, Cunningham et al. (2001) calculate the effective number of studbook founders of the Thoroughbred to be 28.2. As this relies on calculating the long-term contributions of the founders, quantitative genetic theory ( Woolliams & Bijma 2000 ) suggests that the Nmi for this generation is twice this value if in HWE, providing an estimate of 56 soon after breed formation. This may be compared with the minimum Nmi of 88 obtained in this analysis, which gives fair agreement. A further estimate of reliability can be obtained by comparing the mean inbreeding of 0.125 (SE 0.005) obtained by Mahon & Cunningham (1982) for the 21.5 generations from breed foundation to 1964 with the accumulated inbreeding for generations four to 25 (assuming four generations since 1964) using , with Nmi being estimated from Fig. 5. The value obtained of 0.112 is remarkably close. Therefore, our minimum of Nmi ≈ 90 is of the correct magnitude, and the increase in Nmi over the last ten generations may be explained by an increase in actual population size. In Thoroughbreds, with low reproductive rate of the mare and the ban upon use of artificial insemination, there is a greater likelihood that increases in census size will be translated into effective population sizes. The trend in Nmi observed in the most recent generations should be interpreted with caution because of the technical limitations of the methods.

Implications for genome-wide association studies, marker-assisted selection and genomic selection

The extent of LD in a population can be used to estimate the SNP density required for GWAS studies to be effective, as well as giving some indication as to the likely precision with which the QTL region will be located. The required sample size is said to be inflated by 1/r 2 , when it is necessary to rely on marker-QTL LD, rather than on the QTL itself ( Du et al. 2007 ), and this has prompted authors to propose thresholds for useful LD. The term ‘useful LD’ has been described as the proportion of QTL variance explained by a marker ( Zhao et al. 2005 ), and the consensus is that an average r 2 > 0.3 will permit reasonable sample sizes to be employed for GWAS ( Ardlie et al. 2002 Du et al. 2007 Khatkar et al. 2008). In this dataset, markers 185 kb apart achieve an average LD of r 2 = 0.3, and this corresponds to approximately 14 500 evenly spaced markers across the genome. However, because markers with r 2 = 1 will likely be excluded in genomic selection, and given the high variability of r 2 values at small distances, this is likely to be an underestimation of the actual number of SNPs needed. Indeed, in this study, whilst markers separated by less than 250 kb had a mean r 2 of 0.32 (after the exclusion of those pairs in complete LD), less than half the SNP pairs exhibited r 2 values of greater than 0.3. With MAS also relying on close and consistent linkage between markers and QTL, the high LD observed here is promising. Genomic selection (GS) appears to be effective at lower average r 2 than that required for GWAS, with simulation results demonstrating accuracies of up to 0.65 with an average r 2 between adjacent SNPs as low as 0.2 and a trait heritability of 0.1 ( Calus et al. 2008). Deterministic equations derived by ( Daetwyler et al. 2009 ) demonstrate that the accuracy of GS can be expressed as a function of the effective number of loci (Mmi) in a population. METROmi relates to the number of independent chromosome segments and, given our current Nmi estimate of ∼180 and assuming a random mating population, the Mmi for our population is ∼1500 ( Meuwissen 2009 ). Thus, we are now able to predict the potential accuracy of GS in this population for a range of scenarios.

In summary, we used dense SNP genotype data to characterize LD and make inferences regarding ancestral Nmi for a large sample of Thoroughbred horses. In the population studied, LD extended for long distances, reaching baseline levels at around 50 Mb. From the decay in LD with distance, we inferred ancestral Nmi and observed a decrease in Nmi since the distant past, which reached a minimum of ∼90 20 generations ago, followed by an increase until the present time. Such an approach could be used to investigate the demographic histories and rates of inbreeding of horse breeds with less extensive pedigree records than the Thoroughbred. The results indicate that genomic methodologies which are reliant on LD between markers and QTL have the potential to perform well within Thoroughbred populations genotyped for the 50-K SNP chip.


Basic Genetics

David P. Clark,. Michelle R. McGehee, en Biología Molecular (tercera edición), 2019

8.1 Recombination During Meiosis Ensures Genetic Diversity

However, the alleles A, B, and C (or a, b, and c) do not always stay together during reproduction. Swapping of segments of the chromosomes can occur by breaking and rejoining of the neighboring DNA strands. Note that the breaking and joining occurs in equivalent regions of the two chromosomes and neither chromosome gains or loses any genes overall. The point at which the two strands of DNA cross over and recombine is called a chiasma (plural, chiasmata) . The genetic result of such cruzando , the shuffling of different alleles between the two members of a chromosomal pair, is called recombination ( Fig. 2.21 ). The farther apart two genes are on the chromosome, the more likely a crossover will form between them and the higher will be their frequency of recombination. Recombination frequency is an important value for a geneticist, and the values range between 0% or 0, which means that the two genes are so close together, they are always found in the same progeny after a mating, to 50% or 0.5, which means that the two genes are so far apart that they appear to be on separate chromosomes.

Figure 2.21 . Linkage of Genes and Recombination During Meiosis

At the top, the two members of a chromosome pair are shown, each carrying different alleles. Because the three alleles A, B, and C are on the same molecule of DNA, they will tend to stay together. So if the offspring inherits allele A from one parent, it will usually get alleles B and C, rather than b and c. If recombination occurs during meiosis, the DNA breaks and the chromosomes rejoin such that part of one chromosome is exchanged with the homologous partner. Now, the offspring can receive allele A with alleles b and c from one parent.

This type of recombination occurs during meiosis, the process that reduces the genome from diploid to haploid. The process of meiosis is divided into two parts, meiosis I and meiosis II ( Fig. 2.22 ). Table 2.01 describes the events that occur at each stage of meiosis. In a typical diploid organism, there are two homologs for each chromosome inside the normal cell. After a single round of DNA replication, there are four different copies of each chromosome, two copies of homolog 1 and two copies of homolog 2. These are attached at their centromeres and form what is called a tetrad .

Figure 2.22 . Meiosis Forms Haploid Gametes

This figure demonstrates how the diploid cell forms four haploid gametes during a special cell division called meiosis. Only one homologous chromosome (red and green) is shown for clarity, but it has undergone DNA replication to create two copies of each homolog.

DivisiónStage of MeiosisSubstage of Prophase IEstructura cromosómica
MEIOSIS IProfase ILeptonemaTetrads begin to condense
ZygonemaHomologous chromosomes begin to pair up
PachynemaHomologous chromosomes are fully paired recombination occurs
DiplonemaHomologous chromosomes separate (except at the centromere) chiasmata are visible
DiakinesisPaired chromosomes condense further and attach to spindle fibers
Metafase I Paired tetrads align at the middle of the cell
Anafase I Homologous chromosomes split so that two copies move to each half of the cell
Telophase I Two new nuclei form, each containing a set of two sister chromatids
MEIOSIS IIProfase II Each chromosome condenses once again and start to attach to spindle fibers
Metafase II Chromosomes align in the center of each new cell
Anafase II Each of the sister chromatids separates and moves to each side of the new cell
Telofase II Chromosomes decondense and two new nuclei form
Cytokinesis Each of the two cells divides, completely forming four new cells, each containing one copy of each chromosome (a haploid genome)

When cells are in the substages of meiosis I, the genetic information on each of the four copies of the chromosomes aligns perfectly, matching gene for gene along the entire length of each chromosome. When the chromosomes are in this state, genetic information is exchanged with the other copies, forming new genetic combinations. The alignment stage, called sinapsis , occurs due to a set of conserved proteins that link the chromosomes. These proteins form a structure where the DNA of each pair of homologous chromosomes is linked together with a zipper-like structure consisting of lateral elements and central elements connected by transverse fibers ( Fig. 2.23 ).

Figure 2.23 . Complejo sinaptonemal

The synaptonemal complex is a set of proteins that link the two homologous chromosomes during the zygotema stage of meiosis I. Only one chromosome pair is shown for clarity. The red and green chromosomes form a homologous pair.

Genetic linkage is often defined, from a molecular viewpoint, as the tendency of alleles carried by the same DNA molecule to be inherited together. However, if two genes are very far apart on a very long DNA molecule, linkage may not be observed in practice. In this example, consider a long chromosome, carrying all five genes, A, B, C, D, and E. It can be observed that A is linked to B and C, and that C and D are linked to E, but that no linkage is observed between A and E ( Fig. 2.24 ). Given that A is on the same DNA molecule as B and that B is on the same DNA molecule as C, etc., it can be deduced that A, B, C, D, and E must all be on the same chromosome. In genetic terminology, it is said that A, B, C, D, and E are all in the same linkage group . Even though the most distant members of a linkage group may not directly show linkage to each other, their relationship can be deduced from their mutual linkage to intervening genes.

Figure 2.24 . Linkage Groups

In this example chromosome, genes A and E are linked even though the recombination frequencies suggest they are not linked. After this parent mates, the percentage of progeny that have a recombination event between the labeled genes is indicated above the chromosome. When the progeny are assayed for the presence of both the A and C allele, there are only 30% that have this combination of genes. When progeny are assayed for the presence of both the C and E allele, about 25% of the progeny have this combination. Since A is linked to C, and C is linked to E, it can be deduced that A and E are on the same linkage group.

The exchange of alleles between homologous chromosomes and independent assortment of chromosomes during anaphase provide all the new combinations of genes to make each person unique.


Ver el vídeo: INVESTIGACION (Enero 2022).