Información

¿Diferencia entre publicaciones curadas y publicaciones adicionales en la base de datos nextProt?

¿Diferencia entre publicaciones curadas y publicaciones adicionales en la base de datos nextProt?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Con referencia a los artículos de referencia incluidos en la base de datos nextProt, ¿cuál es la diferencia entre las publicaciones seleccionadas y las publicaciones adicionales? Cualquiera que use nextProt, por favor explique los términos. Por ejemplo, cuando busco SLC22A23 en el motor de búsqueda simple nextProt, obtengo lo que se menciona a continuación en la barra de herramientas del lado izquierdo.

Referencias

Publicaciones seleccionadas (21)

Publicaciones adicionales (2)

Patentes (0)

Envíos (0)

Recursos web (0)

Enlace: https://search.nextprot.org/entry/NX_A1A5C7/

Gracias


SynergyAge, una base de datos seleccionada para interacciones sinérgicas y antagónicas de genes asociados a la longevidad

Los estudios de intervención sobre moduladores genéticos de la longevidad han cambiado significativamente la gerontología. Si bien los datos disponibles sobre la vida útil se acumulan continuamente, una mayor comprensión del proceso de envejecimiento sigue estando limitada por la escasa comprensión de la epistasis y de las interacciones no lineales entre múltiples genes asociados a la longevidad. Desafortunadamente, según las observaciones realizadas hasta ahora, no existe un método sencillo para predecir el impacto acumulativo de los genes en la vida útil. Como un paso hacia la aplicación de métodos predictivos, pero también para proporcionar información para un diseño guiado de experimentos de vida útil de la epistasis, desarrollamos SynergyAge, una base de datos que contiene datos genéticos y de vida útil para modelos animales obtenidos a través de múltiples intervenciones moduladoras de la longevidad. Los estudios incluidos en SynergyAge se centran en la vida útil de las cepas animales que se modifican mediante al menos dos intervenciones genéticas, con mutantes de un solo gen incluidos como referencia. SynergyAge, que está disponible públicamente en www.synergyage.info, proporciona una plataforma web fácil de usar para navegar, buscar y filtrar los datos, así como un módulo interactivo basado en la red para visualización y análisis.

Mediciones) longevidad • epistasis • interacciones sinérgicas de genes asociados a la longevidad • interacciones antagonistas de genes asociados a la longevidad
Tipo (s) de tecnología curación digital
Tipo (s) de factor tipo de mutante • modelo animal
Característica de la muestra: organismo Caenorhabditis elegans • Drosophila melanogaster • Mus musculus

Archivo de metadatos accesible por máquina que describe los datos reportados: https://doi.org/10.6084/m9.figshare.13049696


Fondo

Con el rápido aumento de los datos genómicos y epigenómicos en los últimos años, nuestra capacidad para anotar elementos reguladores en todo el genoma humano y predecir sus actividades en tipos específicos de células y tejidos ha mejorado sustancialmente. Los enfoques ampliamente utilizados integran múltiples señales epigenéticas, como la accesibilidad de la cromatina, las marcas de histonas y los ARN transcritos [1, 2, 3, 4, 5, 6, 7] para definir colecciones de elementos reguladores que se pueden utilizar para estudiar programas reguladores en diversas células. tipos y diseccionar las variaciones genéticas asociadas con enfermedades humanas [5, 8, 9, 10, 11].

Para maximizar la utilidad de los elementos reguladores, es necesario saber qué genes regulan. Recientemente desarrollamos el Registro de elementos reguladores cis candidatos (cCRE), una colección de regiones genómicas reguladoras candidatas en humanos y ratones, mediante la integración de datos de accesibilidad de cromatina (DNase-seq) y datos de ChIP-seq de marca de histona de cientos de biosamuestras generadas por el Consorcio ENCODE (http://screen.encodeproject.org). Más del 75% de estos cCRE tienen firmas de tipo potenciador (alta accesibilidad a la cromatina medida por una señal de secuencia de ADNasa alta y un alto nivel de la marca de histona específica del potenciador H3K27ac) y se encuentran distal (& gt 2 kb) a una transcripción anotada sitio de inicio (TSS). Para los cCRE proximales a un TSS, puede ser seguro asumir que el TSS corresponde al gen diana, pero para anotar la función biológica de los TSS-cCREs distales e interpretar las variantes genéticas que albergan, necesitamos determinar qué genes regular.

Asignar potenciadores a genes diana a escala genómica sigue siendo una tarea difícil. Si bien se podría asignar un potenciador al gen más cercano utilizando la distancia lineal, hay muchos ejemplos de potenciadores que se saltan genes cercanos en favor de objetivos más distales [12]. Ensayos experimentales como Hi-C y ChIA-PET examinan las interacciones físicas entre las regiones genómicas [13,14,15,16,17], y superponiendo los anclajes de estas interacciones con potenciadores y promotores anotados, podemos inferir conexiones reguladoras. Los enfoques basados ​​en loci de rasgos cuantitativos (QTL) asocian variantes genéticas en regiones intergénicas con genes a través de la variación en sus niveles de expresión a través de múltiples individuos en una población humana [18, 19]. Recientemente, un enfoque de perturbación unicelular amplió esta idea [20]. Sin embargo, estos ensayos son costosos de realizar y solo se han realizado a alta resolución en un pequeño número de tipos de células. Por lo tanto, debemos confiar en métodos computacionales para predecir ampliamente las interacciones genético-potenciador.

Un método computacional popular para identificar interacciones potenciador-gen es correlacionar señales genómicas y epigenómicas en potenciadores y promotores genéticos en múltiples muestras biológicas. Este método se basa en la suposición de que los potenciadores y los genes tienden a estar activos o inactivos en los mismos tipos de células. El primer estudio en utilizar este método vinculó potenciadores con genes mediante la correlación de señales de marca de histonas activas en potenciadores con expresión génica en nueve tipos de células [1]. Posteriormente, varios grupos utilizaron enfoques similares para vincular potenciadores y genes mediante la correlación de diversas combinaciones de ADNasa, marca de histona, factor de transcripción y datos de expresión génica [8, 21, 22, 23]. Si bien estos métodos identificaron con éxito un subconjunto de interacciones biológicamente relevantes, su desempeño aún no se ha evaluado sistemáticamente.

Otros grupos han desarrollado métodos de aprendizaje automático supervisados ​​que entrenan modelos estadísticos en conjuntos de pares potenciadores-genes conocidos. La mayoría de estos modelos utilizan señales epigenómicas (por ejemplo, marcas de histonas, TF, DNasa) en potenciadores, promotores o ventanas intermedias como características de entrada [24, 25, 26, 27]. El motivo PEP, por otro lado, utiliza características basadas en secuencias [28]. El rendimiento de estos métodos no se ha evaluado sistemáticamente por varias razones. En primer lugar, los diferentes métodos utilizan diferentes definiciones para los potenciadores que van desde los picos EP300 [26] hasta los segmentos de cromatina [27]. En segundo lugar, estos métodos utilizan diferentes conjuntos de datos para definir sus estándares de oro, como las interacciones ChIA-PET [24, 26] o bucles Hi-C [26, 27], junto con diferentes métodos para generar pares negativos. Por último, muchos de estos métodos utilizan un esquema de validación cruzada aleatoria tradicional, que resulta en un sobreajuste severo de algunos modelos supervisados ​​debido a características superpuestas [29, 30].

Para facilitar el desarrollo de métodos de predicción de genes diana, desarrollamos una colección de conjuntos de datos de referencia mediante la integración del Registro de cCRE con interacciones genómicas derivadas experimentalmente. Luego probamos varios métodos publicados para vincular potenciadores con genes, incluida la correlación de señales y los métodos de aprendizaje supervisado TargetFinder y PEP [27, 28]. En general, descubrimos que si bien TargetFinder era el método de mejor rendimiento, solo era modestamente mejor que un método de distancia de referencia para la mayoría de los conjuntos de datos de referencia cuando se entrenaba y probaba en el mismo tipo de celda, y Target Finder a menudo no superaba el método de distancia cuando se aplicaba en todos los tipos de células. Nuestros resultados sugieren que los métodos computacionales actuales deben mejorarse y que nuestro punto de referencia presenta un marco útil para el desarrollo y la prueba de métodos.


Afiliaciones

Instituto de Investigación de Cultivos, Academia de Ciencias Agrícolas de Sichuan, Chengdu, 610066, China

Songtao Yang, Shuai Qiao y el amplificador Wenfang Tan

Laboratorio clave de biología molecular e ingeniería genética en la provincia de Jiangxi, Facultad de Ciencias de la vida, Universidad de Nanchang, Nanchang, 330031, China

Xiaojing Liu, Xiang Kang, Youlin Zhu, Lan Yang y amp Dong Wang

Instituto de Biotecnología y Tecnología Nuclear, Academia de Ciencias Agrícolas de Sichuan, Chengdu, 610061, China


¿Diferencia entre publicaciones curadas y publicaciones adicionales en la base de datos nextProt? - biología

Este documento de preguntas frecuentes es complementario a la documentación de ayuda orientada al uso práctico y a la página Acerca de. Esto se centra más en el "cómo, por qué y para qué" del contenido de nuestra base de datos.

Preguntas generales

Nuestro documento de acceso abierto en la edición anual de la base de datos de la NAR 2014 resume la base de datos a septiembre de 2013. Los antecedentes técnicos más recientes de algunos de los problemas curatoriales a continuación se proporcionan en nuestras publicaciones de blog, el boletín y las presentaciones recientes de los miembros del equipo en SlideShare.

Nuestra página Acerca de tiene una instantánea gráfica de los recuentos de entidades para la versión actual, desglosados ​​por clases de destino y tipos de ligandos.

La expansión de contenido y las mejoras de funciones se anuncian en la página principal. Las versiones son aproximadamente trimestrales, designadas como incrementos (por ejemplo, 2014.1 en abril, 2014.2 en junio y 2014.3 en noviembre).

Esta página proporciona pautas sobre cómo citar la Guía de FARMACOLOGÍA.

Sí, "GtoPdb". Tenga en cuenta que en PubChem nuestro nombre de fuente es "IUPHAR / BPS Guide to PHARMACOLOGY" (para sustancias, compuestos y bioensayos). Cuando inspecciona nuestros registros de sustancias, el número de identificación del ligando tiene el prefijo "GTPL". La publicación de la Guía Concisa de FARMACOLOGÍA en el Revista británica de farmacología se puede abreviar como "CGTP".

Surgió de la base de datos IUPHAR (IUPHAR-DB) a partir de 2011. Esto se describió en una serie de publicaciones y una entrada de Wikipedia, pero ahora tiene una redirección del sitio web original. El sitio web preexistente se integró en GtoPdb y se amplió con información de una serie establecida de artículos de revistas denominada "Guía de receptores y canales" (GRAC). GRAC ahora es reemplazado por la serie "Guía Concisa de FARMACOLOGÍA" (CGTP).

Si bien las publicaciones anteriores son anteriores a la base de datos, se concibieron como complementos para facilitar la navegación recíproca. Todas las entradas de ligandos y proteínas de los artículos designados como revisiones NC-IUPHAR ahora tienen registros en la base de datos. Obviamente, hay más detalles contextuales en los artículos de revisión independientes de los que podríamos indexar, pero la información resumida (por ejemplo, para las familias de proteínas) no solo se captura en la base de datos, sino que también se vincula a los artículos relevantes.

Sí, el British Journal of Pharmacology y su editor Wiley han estado probando esto durante algún tiempo. Puede ver ejemplos tanto en la serie CGTP 2013/14 como en revisiones recientes de NC-IUPHAR (por ejemplo, esta de 2014 sobre vías epigenéticas)

Como recurso abierto, fomentamos la redistribución y la integración de valor agregado de nuestro contenido. También mantenemos una red de colaboración en expansión para el enlace cruzado recíproco de otras fuentes de alta utilidad (estas se enumeran en nuestro sitio web y conocemos a la mayoría de los equipos personalmente). Sin embargo, es posible que no siempre actualicen nuestros enlaces actualizados en su lado (por ejemplo, es posible que aún se encuentre con los enlaces IUPHAR-DB reemplazados). Esta actualización de enlaces es un problema importante en el ecosistema de base de datos global (vea esta publicación de blog) pero estamos abordando esto alertando a aquellos que conocemos sobre nuevas versiones de GtoPdb. Sin embargo, lo que es más preocupante es dónde nuestro contenido se descargó o incluso se raspó en la web y luego volvió a aparecer en bases de datos adicionales sin contactarnos. Ciertamente, el problema no se limita solo a nuestro recurso, pero obviamente no tenemos control sobre esto. En consecuencia, los enlaces pueden incluir registros obsoletos (si forma parte del equipo de un recurso de este tipo, estaremos encantados de analizar los aspectos técnicos de la actualización de nuestros enlaces).

La base de datos está alojada en la Universidad de Edimburgo, que está registrada como organización benéfica en Escocia (SC005336). Nuestros principales patrocinadores son UK Wellcome Trust (a través de la subvención número 099156 / Z / 12 / Z), la Sociedad Farmacológica Británica (BPS) y la Unión Internacional de Farmacología Clínica y Básica (IUPHAR). También contamos con algunas becas educativas sin restricciones de empresas. Tenga en cuenta que siempre estamos abiertos a nuevos patrocinadores (envíenos un correo electrónico)

Observará que los contenidos descargables de la base de datos tienen generosos términos de licencia (compartir, copiar, redistribuir, adaptar, remezclar, transformar, desarrollar, incluso comercialmente). No obstante, solicitamos que las partes que incorporen el contenido de GtoPdb en su propio trabajo, incluidas sus propias integraciones, se pongan en contacto con nosotros. Esto no es solo por la cortesía de que sepamos quién está haciendo qué con nuestro trabajo financiado, sino que también podemos ayudar con los aspectos técnicos. Actualmente estamos colaborando con el consorcio OpenPhacts sobre la integración, así como con algunos proveedores de información comercial y las principales empresas farmacéuticas.

Preguntas sobre datos

Sí, como se describe, IUPHAR-DB se originó a partir de la farmacología de receptores y canales. Si bien GtoPdb continúa manteniendo este enfoque, durante 2013/14, como un objetivo dirigido a subvenciones, se ha extendido a los mecanismos moleculares de acción (mmoa), con la correspondiente anotación de proteínas humanas para las nuevas clases objetivo. Además, ha habido expansiones selectivas impulsadas por los intereses de los usuarios y colaboraciones específicas. Por ejemplo, ahora tenemos una amplia captura de candidatos de desarrollo y compuestos de investigación para el tratamiento de la enfermedad de Alzheimer. Una diferencia que los usuarios pueden notar entre los registros antiguos y los nuevos es que los ligandos del receptor o del canal a menudo tienen un rango de valores de actividad de diferentes publicaciones que se consideran farmacológicamente relevantes (esto no debe confundirse con los rangos +/- informados en individuos para la misma determinación) . Sin embargo, para nuestra reciente expansión a objetivos de fármacos enzimáticos, normalmente solo seleccionamos un valor. Además, la mayoría de estos objetivos más nuevos tienen solo un ligando en contraposición a muchos ligandos para receptores y canales bien estudiados. Estamos solucionando las asignaciones de relaciones más antiguas, en particular aquellas sin valores de actividad referenciados. Además, convertiremos algunas de nuestras entradas históricas de péptidos en representaciones moleculares más definidas.

Nuestra primera fuente es la literatura primaria revisada por pares. Explotamos los diferentes conjuntos de características de UK PubMed Central y NCBI Entrez (tenga en cuenta que esto ocasionalmente da coincidencias en PubMed Central que no están en PubMed / MeSH) y, por último, pero no menos importante, la gama completa de bases de datos públicas. Tenemos la suerte de tener un amplio acceso a la Revista a través de la Universidad de Edimburgo, pero hay casos en los que no tienen suscripciones a algunas que nos gustaría verificar. La única base de datos comercial que utilizamos actualmente es CAS SciFinder, también cortesía de una licencia de la Universidad de Edimburgo. Cabe señalar que el contenido de CAS se extrae de fuentes públicas primarias, pero ocasionalmente lo usamos para localizar entidades que son difíciles de resolver en otros lugares.

Aplicamos criterios selectivos si hay una opción de a) múltiples referencias para ligandos establecidos y / o objetivos bien caracterizados o, b) si necesitamos seleccionar ligandos más recientes para un objetivo de investigación emergente. En ambos casos, primero buscamos publicaciones primarias en revistas de primer nivel en el campo con SAR detallado, resolución inequívoca del ligando y entidades diana (es decir, estructuras moleculares y especies para las proteínas), así como condiciones de ensayo definidas. Tenga en cuenta que hay un cambio en el tiempo entre los artículos de química médica primaria de los que podemos capturar in vitro parámetros cinéticos y artículos posteriores sobre en vivo farmacología, así como eventuales resultados de ensayos clínicos. Estos pueden abarcar entre 5 y 20 años, pero seleccionamos referencias clave en todo el rango. En términos de tipos de actividad, priorizamos la K más estandarizadaI sobre un IC50 pero incluirá ambos si están disponibles. Somos conscientes de la línea algo gris para las asignaciones de destino de los datos de unión para los receptores expresados ​​con lecturas acopladas en líneas celulares (a diferencia de las proteínas purificadas que se utilizan normalmente para los ensayos de enzimas solubles). Dado el valor intrínseco de los datos de unión celular, juzgamos si el mapeo a un identificador de proteína está suficientemente resuelto (y la referencia detalla el ensayo basado en células). Para los objetivos de investigación, los autores pueden indicar compuestos de plomo optimizados en el artículo o, si no, se selecciona la potencia más alta. Si un ligando está indexado en PDB como el par objetivo-ligando correcto, obviamente daremos prioridad a esto, pero también intentaremos encontrar los valores de actividad de artículos anteriores. En términos de tipos de actividad, generalmente nos referimos a los autores (es decir, si lo llaman un KD o una CE50 entonces también lo hacemos nosotros) pero nuestros subcomités de destino pueden decidir cambiar la anotación con respecto al tipo de ensayo (como se detalla en las pautas de IUPHAR). Tenga en cuenta que también hemos estado acomodando nuevas expansiones de nomenclatura de ligando propuestas como lo ejemplifican las recomendaciones de IUPHAR para la nomenclatura del receptor alosterismo y ligandos alostéricos.

Las referencias de 20K tienen ID de PubMed, pero incluimos una pequeña cantidad de enlaces de referencia para datos que creemos que es importante capturar, pero que se encuentran en revistas no indexadas en PubMed, patentes, capítulos de libros, conjuntos de diapositivas o resúmenes de reuniones. De la misma manera que evaluamos la calidad de los artículos revisados ​​por pares, también juzgamos estas fuentes según a) procedencia creíble b) resolución de la entidad yc) una URL o DOI estable. También configuramos una alerta de literatura para los números de código de la empresa donde nuestra extracción inicial era solo de resúmenes o diapositivas. Más recientemente, hemos extraído datos de (y, por lo tanto, vinculados a) hojas de información abiertas de compañías farmacéuticas para reutilizar candidatos (en lugar de los artículos esperados). Observamos el aumento en otros tipos de datos que no son de PubMed (por ejemplo, Open ELN y Figshare), por lo que los grupos que deseen sacar a la luz conjuntos de datos farmacológicos a través de estas nuevas rutas pueden ponerse en contacto con nosotros.

Seleccionamos referencias de patentes para generalmente dos casos a) ligandos donde podemos encontrar el único SAR publicado ob) los datos son ampliamente complementarios a los de los artículos del mismo equipo (porque se incluyen muchos más análogos, junto con datos cuantitativos y síntesis descripciones). La gran explosión de la extracción de química de patentes ha resultado en la presentación de más de 15 millones de estructuras extraídas de patentes en PubChem y EBI se ha hecho cargo del nuevo recurso SureChEMBL.En consecuencia, nos resulta cada vez más fácil resolver la estructura y los vínculos de datos entre los artículos, las entradas de la base de datos y las patentes. Generalmente seleccionamos solo aquellos de compañías farmacéuticas e instituciones académicas con una reputación establecida en química médica. Hay algunos ligandos en los que agregamos más asignaciones especulativas (por ejemplo, como un puntero de comentario curatorial a la patente en el que la serie principal se puede identificar con alta probabilidad). Esto es para los casos en los que el nombre del código de una empresa es ciego (es decir, no se declara públicamente el nombre de la estructura), pero se ha divulgado información farmacológicamente importante (incluidos datos cuantitativos vinculantes del objetivo) en los sitios web de la empresa, en listas abiertas de reutilización o en ensayos clínicos. entradas. En unos pocos casos también hemos podido explotar las patentes como fuente de datos de unión de diana para los estudios publicados de anticuerpos monoclonales.

Independientemente de la primacía del autor, no informamos cifras significativas que superen claramente la varianza de los ensayos experimentales (es decir, hasta +/- 50%) y, por lo tanto, solo citamos como máximo tres (es decir, 1%). Tenga en cuenta también que nuestra transformación logarítmica a pAct también produce tres cifras. Existe una advertencia con respecto a la aparición de diferentes cifras (para redondeado frente a como está escrito) en otras fuentes de extracción de literatura para el mismo informe (por ejemplo, en PubChem BioAssay) pero las consecuencias no se pueden detallar aquí.

Si. Esto ocurre principalmente a través de a) nuestros comités objetivo de

650 expertos mundiales, b) el grupo directivo de NC-IUPHAR y co-becarios yc) el equipo de la base de datos de la Universidad de Edimburgo (que en conjunto son autores de 129 artículos de PubMed). Esto se manifiesta como una selección intensa y revisada continuamente (también teniendo en cuenta los comentarios de los usuarios) de qué incluir o dejar de lado y, a veces, eliminar. Poblar la base de datos, por definición, busca imponer una estructura a través de la abstracción de la relación entre entidades de un gran corpus de documentos no estructurados. Sin embargo, las complejidades y los matices de la farmacología, así como (hay que decirlo) la calidad científica variable de la publicación, significan que el análisis de reglas sin cerebro (y la cobertura máxima) son incompatibles con nuestra visión de "sesgo de utilidad". Por lo tanto, nuestras reglas se implementan más como pautas curatoriales (es decir, podemos doblarlas o incluso romperlas cuando sea útil y las consecuencias de la base de datos no sean demasiado problemáticas). El desafío es equilibrar la velocidad y la flexibilidad de la captura con las limitaciones necesarias de un modelo de datos formalizado. Por lo tanto, hacemos un uso extensivo de las notas de los curadores (también conocidas como nanopublicaciones) para capturar hechos tácitos como texto libre y relaciones a través de referencias cruzadas que no son campos indexados en el esquema actual. A largo plazo, podemos adaptar nuevas relaciones según sea necesario. Estos aspectos nos diferencian de otros recursos valiosos pero con diferentes escalas de captura y objetivos. Algunas de nuestras opciones son pragmáticas. Por ejemplo, agregaremos ligandos de los primeros informes de moduladores químicos para un nuevo objetivo (posiblemente solo de patente), incluso si estos son de tan baja potencia y / o especificidad como para que no se puedan publicar para un objetivo establecido (por ejemplo, ligandos sustitutos para receptores huérfanos). . Es importante destacar que nuestras anotaciones son reversibles a medida que remediamos y hacemos correcciones comunicadas por el comité o el usuario (tenga en cuenta que agregaremos ligandos mejorados a medida que se publiquen, pero generalmente no eliminamos ligandos más antiguos con citas sólidas).

Solo para quinasas. Los datos de la matriz constituyen conjuntos de resultados estandarizados de ensayos paralelos de n-ligandos x n-proteínas a gran escala (también llamado cribado o perfil de panel). Los que aparecen en DiscoverRx, Reaction Biology y Millipore son valiosos para que los usuarios accedan a ellos, a través de una tabla separada. Sin embargo, si estos resultados fueran mapeados en la base de datos principal, interpondrían un conjunto de relaciones confuso, en comparación con las asignaciones estrictas que seleccionamos de la literatura.

Sí, y tenga en cuenta que puede enviar sus propios documentos nuevos (y es posible que nos comuniquemos con usted para obtener aclaraciones sobre la entidad). Los miembros de nuestro comité nos alertan regularmente sobre contenido nuevo durante nuestros ciclos de actualización de la familia objetivo y en el medio de los "temas candentes" como se anuncia en la página web (tenga en cuenta que tendrá que permitirnos juzgar la relevancia antes de que entre en la lista de selección) . También puede ser invitado a unirse a nuestro grupo de clasificación CiteULike Guide to PHARMACOLOGY donde publica artículos con sus propias notas agregadas para que las evaluemos, o simplemente haga esto en su propia biblioteca CUL (para agregar notas, esperamos que encuentre nuestra guía de resolución de entidades útil).

Esto se refiere a la práctica de copiar de forma manual o automática anotaciones y enlaces entre bases de datos sin evaluación. Siempre verificamos los enlaces que agregamos y, lo que es más importante, también leemos los documentos para verificar que los datos de actividad para ingresar en la base de datos sean correctos. En muchos casos hemos dibujado estructuras químicas. de novo de artículos en los que no había coincidencias de CID disponibles en el momento de la curación. Es por eso que más de 250 de nuestros CID son novedosos en PubChem. Para algunas tareas de control de calidad, usamos verificación cruzada computacional (por ejemplo, para asegurarnos de que nuestros enlaces de origen sean concordantes dentro de PubChem), pero solo cuando hemos establecido la consistencia operativa del enfoque automatizado.

Preguntas de destino

Como término general, esto tiene una variedad de significados. Uno de ellos, como se detalla en otras secciones, está asociado con medicamentos para tratar enfermedades humanas que típicamente tienen un objetivo proteico respaldado por datos para su mecanismo de acción. En segundo lugar, los ligandos se seleccionan habitualmente sobre la base de sus interacciones proteicas. Por tanto, pueden denominarse "dianas" en el sentido más amplio, incluso si no se incluyen en los esfuerzos de descubrimiento de fármacos para enfermedades humanas. En particular, nuestros objetivos incluyen los emparejamientos de receptor-ligando más nuevos que los comités consideran creíbles (es decir, desorfanización, ver PMID 23957221). En tercer lugar, realizamos la curación de ortólogos seleccionados en el sentido de que incluimos datos de unión no humanos o anotamos los ortólogos de referencia de roedores. La cuarta categoría (discutida en PMID 21569515) surge del contexto de desarrollo de fármacos de interacciones de ligandos indeseables (a veces denominadas "anti-dianas"). Un ejemplo de base de datos es el que se encuentra entre el fármaco retirado terfenadina y el canal HERG (KCNH2) como objetivo de riesgo de toxicidad cardíaca. Como quinta categoría, nuestro mapeo de ligandos se extiende a los huérfanos funcionales. Con esto nos referimos a informes de modulación química específicos para proteínas que aún no tienen suficientes datos de validación para ser consideradas. De buena fe objetivos de fármacos terapéuticos, pero se están investigando para establecer su función normal y evaluar la posible participación de la enfermedad causal (por ejemplo, catepsina A). En consecuencia, hemos curado ligandos dirigidos contra quinasas, proteasas, enzimas modificadoras de cromatina y GPCR que pueden clasificarse como huérfanos funcionales. Esta es claramente una categorización transitoria en el contexto de la genómica funcional y esfuerzos igualmente intensos para validar nuevas dianas terapéuticas tanto en el sector académico como en el comercial.

Además de una descripción general y una lectura de antecedentes, las páginas de la familia objetivo incluyen resúmenes concisos de un vistazo para cada objetivo. Estos describen la nomenclatura, los genes y los ligandos clave, incluidos los compuestos de herramientas selectivas recomendados por expertos, los ligandos endógenos y los fármacos aprobados. Para las proteínas más importantes (incluidos los objetivos de los medicamentos aprobados), estamos trabajando para incluir una curación más detallada dirigida por el subcomité de farmacología, fisiología, función molecular, ensayos, relevancia de enfermedades humanas y variantes clínicamente significativas más detalladas. Esto incluye presentaciones para familias extendidas adaptadas de artículos de revisión.

Uno de los objetivos fundamentales (y continuos) de NC-IUPHAR es supervisar la nomenclatura de los receptores y canales humanos para que estas clases de proteínas humanas estén completas en la base de datos (con la excepción de los GPCR olfatorios y de tipo opsina). Más recientemente, como parte de nuestros objetivos de subvención, nos hemos expandido a otras familias. Esto incluye: transportadores, el complemento completo de quinasas, un subconjunto de proteasas caracterizadas, otras hidrolasas, así como enzimas involucradas en modificaciones de histonas. Puede encontrar el desglose actual de las familias en la página Acerca de, que a partir de noviembre de 2014 incluye 2708 identificadores UniProt.

Siempre que sea posible, resolvemos la referencia de la literatura a un ID de UniProtKB / Swiss-Prot como nuestro identificador principal. Tenga en cuenta que para las especies no humanas, como los roedores, restringimos estos enlaces a las secuencias en Swiss-Prot, ya que están seleccionadas y revisadas. Hay muchas razones para elegir la primacía UniProt, pero incluyen a) la utilidad de la filosofía canónica Swiss-Prot de anotación de proteínas, b) especificidad de especie, c) referencias cruzadas recíprocas globales, d) persistencia como un recurso central de EBI e) como de 2014, tenemos control colaborativo sobre nuestras propias referencias cruzadas yf) podemos corregir las entradas a través de nuestros propios comentarios al equipo de UniProt. Es importante señalar que esta elección se centra en las proteínas en lugar de en los genes. Si bien la dicotomía puede causar problemas (por ejemplo, los nombres de las proteínas Swiss-Prot, los nombres de los genes HGNC y la nomenclatura NC-IUPHAR no están completamente armonizados), las asignaciones entre la tétrada central (UniProt, HGNC, Ensembl y Entrez Gene) son concordantes (es decir, tienen un Mapeo cruzado de secuencias 1: 1: 1: 1) para solo 18,787 entradas humanas (a septiembre de 2014). Las otras proteínas y recursos genéticos a los que nos vinculamos se enumeran en Ayuda. Tenga en cuenta, para nosotros, estas son fuentes secundarias. Lo que esto significa en la práctica es que aseguramos la fidelidad de nuestros enlaces "de salida" seleccionados, pero no podemos controlar su correcta reciprocidad al señalar "dentro" o entre ellos. Si bien los casos ambiguos en nuestra base de datos son pocos, afecta a casi 1500 proteínas humanas con discordancias entre las principales cadenas de anotación de proteínas y genes. Los usuarios también deben tener en cuenta que las entradas de Swiss-Prot pueden tener asignaciones de uno a muchos a RefSeq (ya que estas últimas no son canónicas). Cuando no podemos resolver los miembros de la familia de proteínas a los ID de UniProt a partir de la descripción de los autores (pero el artículo se consideró farmacológicamente importante), comentamos esta ambigüedad.

Las entradas de UniProt que enlazan con las entradas de GtoPdb se seleccionaron para las relaciones "tiene ligando" de cualquier tipo. A partir de 2014, esto representa más de 2,000 proteínas de las cuales alrededor de dos tercios son de Swiss-Prot humano. Tenga en cuenta que los enlaces externos de UniProt con nosotros se encuentran ahora en una nueva categoría de referencias cruzadas de "Química" que nos incluye a nosotros, BindingDB, DrugBank y ChEMBL (pero tenga en cuenta que los tiempos de sincronización entre estas fuentes son diferentes). Actualmente estamos explorando la ampliación de las opciones de selección (por ejemplo, para los objetivos principales de los medicamentos aprobados).

Este es un desafío para la curación ya que muchos objetivos son complejos heteroméricos in vivo (por ejemplo, consisten en múltiples ID de UniProt). Incluimos sus designaciones NC-IUPHAR como complejos y proporcionamos enlaces a páginas de referencias farmacológicas (como se especifica en PMID 17329545). Sin embargo, para los ligandos, anotamos las asignaciones de UniProt como 1: 1 siempre que sea posible. La justificación mecanicista es que, al menos para la mayoría de los complejos, los datos indican que sólo una o dos proteínas participan directamente en la unión del ligando. Esta anotación más estricta mejora la precisión de la base de datos de tres maneras, a) tomando un enfoque de mapeo de objetivos mínimo en lugar de uno máximo (ver PMID 24533037) b) restringiendo los objetivos a aquellos con sitios de unión manejables c) unión de ligando putativo por extrapolación de homología se vuelve más confiable. Por ejemplo, hemos mapeado los inhibidores de la gamma secretasa actuales a PSEN1 en lugar de aumentar la complejidad de nuestra matriz de mapeo objetivo agregando cinco ID de UniProt adicionales para los cuales no hay evidencia de una unión de inhibidores significativa.

Nuestras páginas de destino incluyen variantes de empalme alternativas biológicamente significativas y estas tienen enlaces a las correspondientes entradas de nucleótidos y proteínas de RefSeq. La creciente importancia de las variantes de empalme en farmacología se reconoce en esta revisión reciente de IUPHAR (PMID 24670145). Por tanto, las actualizaciones futuras pueden incluir datos de unión específicos de empalme. Si la variante de empalme está claramente definida en el documento, deberíamos poder hacer coincidir esto con una línea característica de Swiss-Prot y un ID de RefSeqNP.

Capturamos interacciones de ligandos farmacológicamente importantes seleccionadas en estos dominios (por ejemplo, unión del transportador de alta afinidad para algunos fármacos, metabolitos con datos de unión al sustrato para objetivos de fármacos seleccionados y ciertas toxinas utilizadas como herramientas farmacológicas). Sin embargo, dejamos la matriz más amplia de captura de interacciones moleculares para estos dominios a otras bases de datos especializadas.

Si. Esto surge de miembros individuales de las familias de proteínas que aún no han registrado interacciones de ligando en la base de datos. Tenga en cuenta que esta ausencia de ligandos siempre tiene la advertencia "hasta ahora" y el número de proteínas con interacciones curadas se expande con cada lanzamiento.

No, por tres razones: a) Si bien generalmente seleccionamos datos humanos, cuando no están disponibles, podemos incluir datos de roedores (y en menos casos de otros ortólogos como perros) cuando están disponibles b) nuestra recopilación de medicamentos aprobados ha capturado estructuras para varios antiinfecciosos. Estos pueden consolidarse agregando mapeos de mecanismos moleculares de acción (mmoa) a su debido tiempo, pero nuestro enfoque curatorial actual es humano c) Hay casos de medicamentos más antiguos (es decir, antes de que la clonación de expresión diana fuera rutinaria) donde humanos in vitro los datos nunca se publicaron, por lo que solo podemos encontrar datos para un animal de prueba (por ejemplo, inhibidores de la ECA con IC50s contra la enzima de conejo).

Podríamos expandirnos para cubrir más de 2,000 proteínas humanas que tienen informes de modulación química en artículos o patentes que pasarían nuestros criterios de curación. Sin embargo, este es un problema de financiamiento futuro.

Como se explicó anteriormente, utilizamos datos de actividad citables para definir una interacción molecular farmacológicamente significativa. El concepto de objetivo primario es aquel en el que se ha optimizado un ligando en un contexto de descubrimiento de fármacos con un mecanismo de acción molecular distinto (mmoa) (normalmente medible in vitro con potencia y especificidad plausibles), y se supone que es causalmente responsable de la farmacología observada. en vivo (por ejemplo, el efecto de los inhibidores de la ECA en la reducción de la presión arterial se debe a la unión competitiva del sustrato). Esto no debe confundirse con la "validación del objetivo", donde la traducción del mmoa primario en eficacia terapéutica se ha demostrado clínicamente (pero, como sabemos, muchos candidatos a fármacos con un mmoa respaldado por datos aún no logran mejorar los resultados de la enfermedad en los ensayos clínicos).

Preguntas sobre ligandos

Ligando se usa como término genérico para las interacciones farmacológicamente importantes de moléculas pequeñas de moléculas grandes, pero no hay un límite de tamaño estricto (es decir, se extiende a ciertas interacciones proteína-proteína, como la citocina al receptor). Los ligandos se capturan en la base de datos porque las publicaciones (u otros datos que juzgamos que tienen una procedencia adecuada) han caracterizado experimentalmente su interacción con una proteína o un complejo macromolecular. Estas interacciones se seleccionan como a) mediadas por unión directa (es decir, impulsadas termodinámicamente), b) específicas (es decir, reactividad cruzada limitada), c) medibles experimentalmente, d) dan como resultado una modulación de la actividad con consecuencias bioquímicas e) las consecuencias mecánicas son farmacológicamente relevante yf) podemos resolver la identidad del ligando en una estructura molecular (ver más abajo). Nuestra clasificación de alto nivel se divide en ligandos endógenos (por ejemplo, metabolitos, hormonas y citocinas) y exógenos (por ejemplo, fármacos, toxinas y compuestos de herramientas). Las categorías más profundas se encuentran en las pestañas de la lista de ligandos.

El concepto básico es que un ligando debe tener una estructura molecular definida (con algunas excepciones, como la heparina como extracto de polímero fraccionado). La mayoría son moléculas orgánicas descritas como entidades químicas de varias formas formales (detalladas en la Ayuda). En consecuencia, hemos resuelto (y realizado una verificación cruzada automatizada) más del 70% de nuestros ligandos al mapeo primario de un Identificador de Compuesto PubChem (CID). Esto significa que la estructura está definida por las reglas de química de PubChem (documentadas en sus propias preguntas frecuentes). Hay muchas razones para esta elección (que podemos detallar), pero la primera es el mapeo de relaciones detallado y transparente entre más de 60 millones de CID y 350 fuentes de datos. El segundo es nuestra colaboración activa con el equipo de PubChem en aspectos de nuestra propia resolución molecular de ligandos, mapeo de datos de BioAssay y verificación iterativa de control de calidad de las entradas (consulte nuestros conjuntos actuales de SID y CID). Aparte de un pequeño número de entradas inorgánicas, utilizamos péptidos y proteínas como los otros dos niveles de descripción estructural del ligando. Estos se pueden mezclar, por ejemplo, cuando un péptido de tamaño moderado tiene un CID que define el esqueleto con una modificación química (por ejemplo, amidación C-terminal). Tenga en cuenta que también conservamos la secuencia de secuencia primaria en el registro, además de incluir el ID de UniProt humano dentro del cual esa secuencia nativa tiene una coincidencia idéntica (muchas de estas corresponden a referencias cruzadas de Swiss-Prot para péptidos cortados por escisión). Los ligandos de proteína única se designan mediante UniProt ID (por ejemplo, citocinas). Tenga en cuenta que los mAb son una clase especial de ligando, ya que las secuencias generalmente se definen pero no tienen ID de UniProt (por varias razones). Desde nuestra colaboración con IMGT mAb-DB, proporcionamos indicadores a sus asignaciones de secuencia derivadas de INN.

Las imágenes de moléculas pequeñas representadas en nuestro sitio son generadas por un solucionador de identificadores en línea que toma el ligando SMILES como entrada. Este servicio gratuito del grupo NCI / CADD del Instituto Nacional del Cáncer se basa en el software CACTVS. Tenga en cuenta que esto tiene una ventaja sobre algunos otros estilos de renderizado al marcar explícitamente los centros estéreo.

Proporcionamos una pestaña "Ligandos similares" en las páginas de ligandos. Estos se calculan previamente para cada versión mediante la agrupación mediante un enfoque de exclusión de esferas modificado. Esto se basa en la similitud tanto de las propiedades como de las huellas dactilares estructurales de las moléculas. Los usuarios también pueden explorar las similitudes dentro de la base de datos a través de la subestructura proporcionada y la búsqueda de coincidencia de patrones SMARTS (consulte la Ayuda). Para aquellos ligandos que no muestran ningún vecino en nuestra colección (o incluso si lo hacen, pero desea extender esto a un espacio de estructura química más grande), recomendamos usar el enlace "Compuestos similares" de PubChem. Esto mostrará todos los CID con una similitud de Tanimoto precalculada superior al 90% y estos se pueden mostrar como agrupaciones en 2D o 3D (nb si son muy grandes debido a muchos análogos cercanos en PubChem, se puede ejecutar una búsqueda relacionada con mayor rigurosidad, por ejemplo 95%).

Dada su importancia para la farmacología y la medicina, se ha señalado la divergencia problemática en las estructuras moleculares de las bases de datos para los medicamentos aprobados (PMID 20298516). Por esta razón, hemos optado por utilizar conjuntos de consenso compilados desde PubChem como puntos de partida curatoriales (descritos en este póster). Esto se debe a que es más probable que sea correcta una coincidencia exacta de la estructura química entre múltiples fuentes. Sin embargo, en solo

900 CID, este consenso es aproximadamente el 65% del total esperado. La mayoría de estos ahora están curados e incluyen sus mapeos de relaciones de fármaco-objetivo. Además, hemos completado la presentación inicial para incluir nuevas aprobaciones desde 2010 hasta el segundo trimestre de 2014. Se explorará la presentación posterior a través del enfoque de consenso. Sin embargo, dado que el concepto de "corrección" de un fármaco es complejo y algo abstracto, hemos desarrollado directrices estrictas para maximizar la utilidad de la base de datos. Estos reducen las consecuencias internas de las diferentes representaciones estructurales externas de los mismos fármacos y la división asociada de los mapeos de actividad. Al controlar la expansión de las relaciones, estas simplificaciones mantienen la precisión de las consultas. Nuestras pautas abarcan una variedad de complejidades, pero se pueden ilustrar dos. Dado que los medicamentos pueden tener muchas formas de sal en PubChem, elegimos (es decir, normalizamos) el CID principal para el mapeo de actividades y objetivos, ya que esto generalmente corresponde al mapeo de nombre a estructura de la DCI. Sin embargo, los registros en PubChem BioAssay se pueden asignar a formas de sal, mientras que la inspección de los detalles del ensayo en un papel indica la suposición de asignar, por ejemplo, un IC50 a la molécula madre es razonable (p. ej.si se utilizan dilución y tampón de pH). El otro gran problema de la ambigüedad en la nomenclatura y la división de datos es la estereoquímica. Un ejemplo es cuando se asigna una DCI de un medicamento aprobado a una mezcla enantiomérica (que no se interconvierte en vivo) pero los datos del ensayo se asignan a tres representaciones moleculares diferentes (es decir, los isómeros R y S y la forma "plana"). En este caso, asignamos la etiqueta de fármaco a la mezcla y asignamos datos a esta. Luego, agregamos punteros cruzados a los CID para R y S solo si los datos se han informado y / o asignado a ellos. Un ejemplo bien conocido es el omeprazol como mezcla y el esomeprazol como isómero S, como fármacos aprobados por separado. Es importante tener en cuenta que incluimos tanto los medicamentos descontinuados como los retirados (generalmente reemplazados por medicamentos más nuevos) para maximizar nuestra captura y análisis quiminformático de conjuntos de medicamentos, pero estos se pueden filtrar de las consultas si es necesario.

No, porque la base de datos se centra en la farmacología molecular cuantitativa, capturada como una matriz de relación ligando-objetivo para facilitar la navegación y la minería de datos. Por lo tanto, no es un sustituto de una Farmacopea británica como ejemplo nacional, ni un tipo de recurso centrado en el paciente de Drugs.com. Muchas sustancias aprobadas con fines medicinales impactarían negativamente en la precisión de nuestra base de datos si mapeáramos sus interacciones moleculares como "medicamentos". Estos incluyen nutracéuticos que son principalmente metabolitos (por ejemplo, la entrada "fármaco aprobado" del DrugBank para NADH enumera 144 objetivos), reemplazos de hormonas endógenas y sales inorgánicas (con la importante excepción del litio). Todavía enfrentamos el desafío de encontrar medicamentos únicos aprobados a nivel nacional que no estén incluidos en la lista de la FDA o la EMA, pero tenemos algunos ejemplos exclusivos de Japón.

Los casos en los que se cree que la eficacia clínica está mediada por múltiples mmoas (mecanismos moleculares de acción) se denominan polifarmacología. El arquetipo de esto es un inhibidor dual, como el fasidotrilat, que actúa tanto sobre la ECA como sobre la NEP. Para la curación, mapearemos la reactividad cruzada más potente, pero generalmente no grandes conjuntos de resultados de SAR. Si el autor propone de manera convincente la polifarmacología sobre la base de los datos, asignaremos los ligandos como múltiples objetivos primarios. El desafío aquí puede ser la evidencia limitada de que múltiples mmoas reportados in vitro en realidad se traducen en eficacia sinérgica en ensayos clínicos. Las quinasas son un ejemplo particularmente difícil. Dado que incluimos los tres conjuntos de resultados del panel de matriz, así como datos de actividad seleccionados de artículos individuales, si están disponibles, al menos los datos de reactividad cruzada se muestran para que los usuarios hagan sus propios juicios.

Ciertamente capturamos medicamentos aprobados y algunos candidatos clínicos avanzados con evidencia clara de efectos terapéuticos pero donde el mecanismo de acción completo es desconocido o sigue siendo ambiguo (por ejemplo, litio). También tenemos algunos compuestos de investigación que tienen una lectura fenotípica y / o están mapeados como un mecanismo de acción parcial. Estos tienen comentarios del curador que lo indican (por ejemplo, CCG-1423).

La mayoría de nuestras entradas de ligandos son pequeñas moléculas orgánicas, proteínas, péptidos no modificados y nucleótidos o polisacáridos no modificados más pequeños.Sin embargo, somos conscientes de que un número cada vez mayor de nuevas entidades moleculares terapéuticas en el desarrollo clínico son permutaciones unidas covalentemente de estas formas básicas. En consecuencia, actualmente estamos analizando las opciones. Esto incluye evaluar HELM, Sugar & Splice e InChI para moléculas grandes y otras formas formales de representar restos híbridos. Además, estamos discerniendo cómo las empresas están adaptando sus sistemas de registro para manejar esto. También estamos observando las nuevas directrices INN, FDA y USAN que se están desarrollando, así como el compromiso de PubChem en esta área. En general, no hemos agregado grandes fármacos de proteínas recombinantes a la base de datos donde estos son reemplazos efectivos de proteínas endógenas.

Hay muchos ejemplos que no se ajustan a las reglas estándar para el mapeo de la relación ligando-objetivo. Uno de ellos es fármaco a profármaco, en el que introdujimos específicamente una nueva relación. Las complicaciones surgen cuando no podemos mapear la actividad del fármaco con el objetivo donde el profármaco está inactivo. Como puede ver en los ejemplos de inhibidores de la ECA, el desafío se agrava ya que a ambas formas se les asigna una DCI. Hacemos otro "cambio de reglas" en el que asignamos tanto el profármaco como el fármaco al objetivo principal (de lo contrario, se complicaría ya que algunos profármacos son activos contra el objetivo a menor potencia. La consecuencia es, por tanto, un ligero recuento excesivo de ligandos. . Sin embargo (específicamente para los inhibidores de la ECA) esto se equilibra con algunas asignaciones de actividad objetivo humano "faltante" (por ejemplo, solo se publicaron datos de conejos). Usamos las notas de los curadores para hacer referencias cruzadas entre las relaciones entre el ligando profármaco y el fármaco. Tenga en cuenta que también hacemos esto para la relación fármaco> metabolito en la que se informó que estos metabolitos eran significativamente bioactivos por derecho propio. Otra relación excepcional importante es nuestro registro de las interacciones de unión ligando a ligando en forma de anticuerpos monoclonales terapéuticos (mAb) y sus interacciones diana con citocinas o receptores.

Los experimentadores encuentran valioso para nosotros señalarlos a derivados de ligandos marcados isotópicamente reportados en la literatura como sondas. Sin embargo, si las posiciones del radiomarcaje no son explícitas, no podemos representar la estructura molecular ni hacer coincidirla con un PubChem CID. Por lo tanto, introdujimos una solución pragmática para posiciones de etiquetas no especificadas al duplicar el registro de la estructura no etiquetada con el fin de vincular a la referencia de los resultados del uso de la versión etiquetada (no especificada). Algunos de estos se están remediando a medida que más proveedores de radioquímicos están enviando entradas de PubChem.

No vinculamos a ningún proveedor específico porque el aumento de 2014 en las presentaciones de proveedores de PubChem (actualmente más de 55 millones de CID) significa que ya no podemos mantener vínculos seleccionados. La buena noticia es que

El 80% de nuestros CID tienen un proveedor compatible. Se puede acceder a ellos a través del enlace "Proveedores de productos químicos" en el lado derecho de una entrada de CID.


Conclusiones

sHSPdb alberga un conjunto de datos completo disponible para sHSP, junto con herramientas diseñadas para su análisis en línea. Hasta donde sabemos, no existe una base de datos equivalente para sHSP. Las sHSP se clasifican en clases sobre la base de varios parámetros, especialmente sobre la base de los motivos de aminoácidos que discriminan las clases. Los sHSPdb constituyen así una herramienta eficaz: (i) para la recopilación y organización de datos crecientes sobre sHSP (ii) para la clasificación de las diversas subfamilias de sHSP (iii) para el diseño de experimentos para dilucidar la función de este importante proteínas (iv) para ayudar al análisis de las relaciones estructura-función de la sHSP.

Perspectivas y desarrollos futuros: (i) Las propiedades físico-químicas de la sHSP y el uso de aminoácidos de la sHSP se analizan estadísticamente para todas las clases de sHSP. Así podremos comparar los tres dominios (es decir, el N-terminal, el ACD y el C-terminal), aportando así información adicional a los ya determinados por metodologías estructurales. (ii) Actualmente estamos desarrollando un software para el análisis de la secuencia enviada por los usuarios con el fin de predecir si pertenece a alguna de las clases sHSP. (iii) Dado que descifrar las funciones moleculares de sHSP es un tema importante, proporcionaremos herramientas léxicas (diccionarios por orden alfabético o ocurrencia o sinónimos ...) para un mejor análisis semántico de las palabras que describen los elementos conocidos de la función de sHSP. (iv) Como se señaló anteriormente, las proteínas retenidas que no están completamente clasificadas están en estudio con la ayuda de algunos valores de predicción y de un software de programación de restricciones en desarrollo.


Resultados y discusión

Para inferir los TRN subyacentes del desarrollo de la raíz y los procesos fisiológicos en Arabidopsis, utilizamos dos conjuntos de datos cuidadosamente seleccionados obtenidos de 656 archivos CEL específicos de la raíz de 56 experimentos de microarrays ATH1 (archivo adicional 1). El primer conjunto de datos, que llamamos el conjunto de datos solo TF, es una tabla de 656 columnas por 2088 filas que corresponde a nuestra lista de 2088 conjuntos de sondas TF. El segundo conjunto de datos, que llamamos conjunto de datos completo, es una tabla de 656 por 22810 que contiene todos los 22810 conjuntos de sondas presentes en el chip ATH1. Usamos ambos conjuntos de datos como entrada para el software ARACNe [21]. La salida ARACNe es una lista de pares de conjuntos de sondas que interactúan clasificados a través de un valor de información mutua y su valor p asociado. Los detalles sobre los antecedentes teóricos y el uso práctico de ARACNe se pueden encontrar en [16] y [21] pero, brevemente, una interacción entre el gen A y el gen B significa que el perfil de expresión del gen A a lo largo de los 656 experimentos explica el perfil de expresión de gen B a lo largo de esos mismos 656 experimentos, y viceversa, ya que las interacciones no están dirigidas. En un contexto biológico, una interacción entre el gen A y el gen B implicará que el gen A y el gen B participan en el mismo proceso fisiológico y, más aún, si el gen A es un TF y el gen B es un no TF, la interacción ( el gen A explica el gen B) sugerirá que el gen A es un regulador transcripcional del gen B.

La inferencia de red se centró en los 2088 conjuntos de sondas TF presentes en el chip ATH1 y se obtuvo en tres valores de desigualdad de procesamiento de datos (DPI), 0.0, 0.1 y 0.2. DPI es una propiedad teórica de la información conocida y se explica en el manual complementario en [21]. Brevemente, en DPI 0.0, cuando está presente una camarilla de tres nodos (triángulo), se eliminará la interacción con la información mutua más baja, ya que se considera que esta interacción representa una interacción indirecta. A valores de DPI distintos de 0,0, se permiten tres bucles de genes y, a DPI 1,0, no se eliminan interacciones. Un valor de DPI de 0,2 (que conservará los triángulos si la diferencia entre el valor de información mutua de sus interacciones es del 20% o menos) aumenta la recuperación de las interacciones positivas verdaderas al tiempo que minimiza la recuperación de los falsos positivos [16]. Después de la traducción de los archivos de adyacencia de salida de ARACNe en tablas compatibles con Cytoscape, obtuvimos las bases de datos correspondientes solo TFs (archivo adicional TFsNet 2) y completas (archivo adicional FullNet 3). Como se muestra en la Tabla 1, el número de bordes aumenta drásticamente de DPI 0.0 a DPI 0.1 a DPI 0.2. Para mayor claridad, todas las representaciones gráficas de las redes en este documento son las obtenidas en DPI 0.0.

Los TF que participan en interacciones inferidas se expresan en raíces

Una cuestión importante con respecto a nuestras redes es determinar si los TF que participan en las interacciones inferidas se expresan realmente en los tejidos de las raíces. La función mas5calls del paquete affy R, que se utiliza para marcar valores de expresión de microarrays como Presente, Ausente o Marginal, es una herramienta poco fiable para determinar si un gen se expresa o no [22], especialmente cuando se trata de TF de Arabidopsis [23]. Por lo tanto, para determinar si los TF presentes en nuestras redes se expresan en los tejidos de la raíz, extrajimos tanto de TFsNet como de FullNet obtenidos a DPI 0.0 todos los TF que participan en una interacción y comparamos ambas listas con listas de raíces determinadas experimentalmente. genes expresados ​​(ver Métodos). Los resultados se presentan en la Tabla 2 y en el archivo adicional 4. Se ha determinado experimentalmente que más del 92% de los TF recuperados en los dos tipos de redes se expresan en raíces. Por lo tanto, estamos seguros de que los TF presentes en nuestros conjuntos de datos son de hecho TF raíz y las interacciones que hemos recuperado representan verdaderas en planta interacciones transcripcionales.

Los TF que participan en los mismos procesos se agrupan en TFsNet

El TFsNet se obtuvo a partir de un conjunto de datos solo de TF que excluye todos los genes que no son de TF y constituye una descripción general de las interacciones inferidas de TF de raíces de Arabidopsis (Figura 1). Se espera que los TF que participan en los mismos procesos se agrupen en distintos grupos o módulos. Algunos de estos módulos funcionales han sido identificados y caracterizados experimentalmente y sirven como sondas de la confiabilidad de las redes inferidas.

El TFsNet. (a) Resumen de TFsNet obtenido a DPI 0.0. Los genes se representan como nodos y las interacciones inferidas como bordes. Los nodos son de color gris, excepto los genes mencionados en el texto que son de color verde. El ancho del borde y la intensidad del color son proporcionales al valor de información mutua (MI) de la interacción, y los valores de MI más altos corresponden a los bordes más gruesos y oscuros. Los nombres de los genes se omitieron para mayor claridad. Los acercamientos a grupos de TF particulares se presentan en los paneles siguientes. (bi) Subredes de TF presentes en el grupo SHR-SCR (B), el grupo PLT (C), el grupo de desarrollo vascular (D), el grupo AtGRF (mi), el grupo AtHAM (F), el grupo de respuesta de jasmonato (gramo) el grupo de deficiencia de hierro (h) y el grupo de respuesta a los nitratos (I). Los bordes están etiquetados con el valor p de la interacción. Los bordes de los grupos al resto de la red se omitieron para mayor claridad.

Se han identificado dos vías transcripcionales que controlan el patrón de nichos de células madre [24-28]. La primera vía está compuesta por la familia GRAS RAÍZ CORTA (SHR AT4G37650) y ESPANTAPÁJAROS (SCR AT3G54220) y la familia C2H2, DOMINIO INDETERMINADO (IDD) URRACA (Pop AT1G03840) y GRAJO (JKD AT5G03150). Como se muestra en la Figura 1b, estos cuatro TF se agrupan junto con IDD CASCANUECES (NUC AT5G44160), el coactivador transcripcional del dominio SSXT ANGUSTIFOLIA 3 (AN3 AT5G28640) y la familia GRAS ESPANTAPÁJAROS 3 (SCL-3 AT1G50420). NUC y SCL-3 se proponen dianas transcripcionales directas de SHR [29-31]. Tenga en cuenta que, como las redes obtenidas a DPI 0.0 no pueden contener triángulos, la ausencia de un borde, por ejemplo entre SHR y NUC, no implica una falta de interacción entre estos dos genes, sino simplemente que ambos genes tienen otras interacciones con mejores puntuaciones de MI. Además, las interacciones entre los genes en este módulo tienen valores de MI relativamente bajos, correspondientes a los valores p de 1e-30 y 1e-40 (en relación con el valor p más bajo en el conjunto de datos, 1e-140). Esto probablemente no sea sorprendente, ya que esta vía tiene un modo complejo de interacción molecular [32] que obstaculizará la capacidad del algoritmo ARACNe para recuperar su interacción a partir de datos de microarrays con un valor p más alto [21]. Genes adicionales de IDD, AtIDD4 (AT2G02080), AtIDD5 (AT2G02070), AtIDD14 (AT1G68130), AtIDD15 (AT2G01940) y AtIDD16 (AT1G25250), están presentes en este módulo. Se han informado interacciones proteína-proteína para SCL-3-NUC, MGP-SCR, MGP-SHR, MGP-JKD, SCR-JKD y SHR-JKD [33]. Por otro lado, las proteínas IDD JKD y MGP regulan la expresión y el movimiento de SHR y SCR a través de los tejidos de la raíz a través de interacciones transcripcionales y proteína-proteína [27, 34]. Por último, el movimiento de la proteína SHR se suprime mediante la sustitución de un único residuo de treonina en su motivo VHIID, que se propone mediar las interacciones proteína-proteína de SHR [35] y su localización nuclear [34]. Por tanto, es interesante especular que AtIDD4, AtIDD5, AtIDD14, AtIDD15 y AtIDD16 También podría estar involucrado en el desarrollo y modelado de la raíz a través de la regulación transcripcional de, o interacciones proteína-proteína con SHR y SCR.

La segunda vía implica la señalización de auxinas a través de la activación de factores de respuesta de auxinas (ARF) aún no identificados y la PLÉTORA (PLT) TF, de la familia AP2-EREBP. Los genes PLT, PLT1 (AT3G20840), PLT2 (AT1G51190), PLT3/AIL6 (AT5G10510) y BABY BOOM (BBM AT5G17430), tienen perfiles de expresión superpuestos y actúan de forma redundante [26]. En TFsNet, los cuatro PLT los genes son parte del mismo grupo, que también incluye la bHLH ESPÁTULA (AT4G36930), ARF5/MONOPTEROS (AT1G19850) y los factores de respuesta de citoquininas de la familia ERF CRF2/TMO3 (AT4G23750) y CRF3 (AT5G53290 Figura 1c). Sorprendentemente, los cuatro PLÉTORA proteínas [26] y ARF5[36] están todos expresados ​​en las iniciales de la estela de la raíz de la plántula. Se ha demostrado que el patrón vascular de la raíz depende de una intercomunicación auxina-citoquinina [37] y de la participación en esta interrelación de algunos genes, como SHY2[38], BRX[39] o AHP6[40, 41] se ha demostrado. Sin embargo, una red transcripcional que une el PLÉTORA Todavía falta la vía y los TF sensibles a citoquininas. La presencia de dos CRF TF en este módulo proporciona nuevas pistas en esta dirección.

BODENLOS (BDL AT1G04550), un miembro de la familia Aux / IAA, es un inhibidor transcripcional de ARF5 y su expresión está controlada por ARF5 en embriones [42]. Curiosamente, BDL, así como otros dos OBJETIVO DE MONOPTEROS (TMO) genes, ATAIG1/TMO5 (AT3G25710) y TMO6 (AT5G60200), no agrupar con ARF5 en TFsNet. En cambio, son parte de un grupo de TF involucrados en el desarrollo vascular que incluye genes como IAA13 (AT2G33310), IAA3/SHY2 (AT1G04240) [39], ATHB-14/PHABULOSA (AT2G34710), ATHB-15/CORONA (AT1G52150) [43], IFL/REVOLUTA (AT5G60690) [44], ATHB-8 (AT4G32880) [45], ATHB9 / PHAVOLUTA (AT1G30490) y AtTCP14 (AT3G47620) [46] (Figura 1d). pBDL :: GFP Se ha observado expresión en la estela de la raíz de plántulas de 4-5 días de edad (ver Figura S6 en [42]), lo que apunta a posibles funciones nuevas de estos genes relacionados con las auxinas en el desarrollo vascular.

Otros TF implicados en el desarrollo de órganos también se agrupan en TFsNet. Por ejemplo, los estrechamente relacionados ATHAM1 (AT2G45160), ATHAM2 (AT3G60630) y ATHAM3 (AT4G00150), que pertenecen a la familia GRAS, están implicados en el mantenimiento de la indeterminación del meristemo y son funcionalmente redundantes [47, 48]. Estos tres TF también se agrupan en el mismo módulo en TFsNet que inferimos (Figura 1e). Otro ejemplo se refiere a la AtGRF genes, de la familia GRF, que se expresan en tejidos en desarrollo, como puntas de brotes, botones florales y raíces. Mutantes individuales del AtGRF1 (AT2G22840), AtGRF2 (AT4G37740) o AtGRF3 (AT2G36400) los genes no tienen fenotipo y los mutantes dobles tienen fenotipos menores [49], lo que sugiere que estos tres genes tienen funciones redundantes. AtGRF1, AtGRF2 y AtGRF3 agruparse en la TFsNet presentada aquí (Figura 1f). Curiosamente, nuestra inferencia de red también recupera las interacciones AtGRF3-AN3 (valor de p 1e-70) y AN3-SCR (valor de p 1e-40), lo que sugiere un vínculo entre el AtGRF módulo y el SHR-SCR módulo durante el desarrollo de la raíz.

TFsNet también recupera interacciones transcripcionales entre genes que se sabe que participan en procesos fisiológicos de la raíz distintos del desarrollo. Un primer ejemplo se refiere a los genes implicados en la respuesta al jasmonato (Figura 1g). Este grupo incluye los genes del dominio TIFY JAZ1 (AT1G19180), JAZ2 (AT1G74950), JAZ5 (AT1G17380), JAZ6 (AT1G72450), JAZ7 (AT2G34600), JAZ8 (AT1G30135), JAZ9 (AT1G70700), JAS1/JAZ10 (AT5G13220), dos genes WRKY involucrados en la respuesta de patógenos, WRKY18 (AT4G31800) y WRKY40 (AT1G80840) [50], la familia bHLH AIB (AT2G46510) [51] y MYC2 (AT1G32640) [52] y AP2 / ERF RRTF1 (AT4G34410). Curiosamente, los experimentos de inmunoprecipitación de cromatina han demostrado que WRKY40 se une JAZ8 y RRTF1 regiones reguladoras [53], mientras que MYC2 Recientemente se demostró que está involucrado en la inhibición del desarrollo de la raíz dependiente de jasmonato [54].

Un segundo ejemplo incluye el bHLH TF BHLH038 (AT3G56970), BHLH039 (AT3G56980), BHLH100 (AT2G41240), BHLH101 (AT5G04150), POPEYE (PYE AT3G47640) y la proteína de unión a ADN que codifica BRUTO (BTS AT3G18290), que participan en la regulación del estrés por deficiencia de hierro [55, 56]. BHLH039, BHLH101, PYE y BTS están agrupados en TFsNet (Figura 1h BHLH038 y BHLH100 no están representados en el chip ATH1).

Un tercer ejemplo se refiere a los TF de respuesta a los nitratos [57]. Los primeros TF que se expresan en respuesta al estímulo de nitrato son HRS1 (AT1G13300), LBD37 (AT5G67420), LDB38 (AT3G49940), LBD39 (AT4G37540) y AT3G25790 (grupo 1 en [57]). Cuatro de estos cinco TF, HRS1, LDB38, LBD39 y AT3G25790 se agrupan en TFsNet (Figura 1h). Tenga en cuenta que los datos de microarrays de Long et al., E-GEOD-21443, y Krouk et al., E-GEOD-20044 en la base de datos de EBI, se publicaron unos días después de la descarga de nuestros experimentos de microarrays y no forman parte de los datos. utilizado para nuestro análisis.

Uso de FullNet para integrar y analizar datos genómicos funcionales de alto rendimiento

La FullNet se obtuvo a partir de datos que incluían todos los 22810 conjuntos de sondas presentes en el chip ATH1, y se centró en la lista de 2088 conjuntos de sondas TF (archivo adicional 3). En esta red, los TF serán nodos centrales, con sus interactores, ya sean TF o no TF, como nodos vecinos. Los genes que participan en los mismos procesos deben volver a agruparse. Por ejemplo, los grupos TF identificados en TFsNet todavía están presentes en los mismos grupos en FullNet. Hay que tener en cuenta que en esta red están presentes nodos no TF. Cuando un no TF interactúa con dos TF, y estas interacciones tienen mejores puntuaciones de MI que la interacción TF-TF, entonces la última interacción, a DPI 0.0, se considerará una interacción indirecta y, por lo tanto, no aparecerá en la red. Sin embargo, esto no significa que la interacción TF-TF no exista, solo que está "enmascarada" por un nodo intermedio no TF. Cuando el valor TF-TF MI no es el más bajo en un triángulo, es visible en el DPI 0.0 FullNet. Este es el caso de las interacciones entre PLT1, PLT2 y PLT3/AIL6, en p-valores de 1e-50, el SCR-SHR interacción a un valor p de 1e-30, la interacción del TF temprano sensible a nitratos HRS1 con LBD38, LDB39 y AT3G25790 a valores p de 1e-40 e inferiores, así como la interacción de BHLH039 con BHLH101 a un valor p de 1e-60 y con PYE a un valor p de 1e-20. Interacción entre AGL71 y AGL72, que estaba presente en un valor p de 1e-20 en TFsNet, ahora se recupera con un valor p de 1e-50. Recientemente se ha demostrado que estos dos genes MADS-box actúan de forma redundante en los meristemas apicales y axilares [58].

En FullNet, los interactores de un nodo TF son genes diana potenciales para ese TF. Si este es el caso, uno esperaría que un número significativo de genes diana identificados experimentalmente para ese TF esté presente en las listas correspondientes de interactores ARACNe. Un ejemplo de un TF para el que se confirman experimentalmente interacciones inferidas por ARACNe corresponde a VND7 / ANAC030 (AT1G71930). VND7 es un TF de la familia NAC implicado en la síntesis de la pared celular secundaria y se encuentran disponibles varias listas de sus genes diana putativos [59-62]. Comparamos estas listas de identificadas experimentalmente VND7 genes diana con nuestra lista de VND7 interactores del conjunto de datos completo en DPI 0.0, 0.1 y 0.2 (Tabla 3 y Archivo adicional 5). 14 de 16 genes en DPI 0.0, 24 de 44 en DPI 0.1 y 24 de 107 en DPI 0.2 de nuestro VND7 La lista de vecinos se expresan diferencialmente en al menos uno de los entornos experimentales. Casi todos los genes expresados ​​diferencialmente se encuentran en valores altos de MI, correspondientes a valores p de 1e-50 e inferiores. Finalmente, tres de los cuatro TF expresados ​​diferencialmente identificados por Yamaguchi et al. [62], JLO (AT4G00220), MYB46 (AT5G12870) y MYB103 (AT1G63910), son parte del VND7 clúster en TFsNet, a valores p de 1e-50 e inferiores. Curiosamente, uno de los mejores VND7 interactor en nuestro conjunto de datos, la pinoresinol reductasa ATPRR1 (AT1G32100), no está presente en ninguno de los VND7 listas de genes diana. ATPRR1 tiene, a DPI 0.0, interactores TF con valores de MI más altos que VND7, lo que sugiere que, en cambio, podría estar regulado por uno o más de estos TF de mayor puntuación. Alternativamente, el VND7-ATPRR1 La interacción transcripcional podría ser específica de la edad y no detectable en ninguno de los entornos experimentales mencionados anteriormente.

También hay ejemplos de TF para los que hay poca superposición entre las listas de interactores inferidos por ARACNe y las listas de genes diana experimentales. Dos ejemplos son los TF SHR y SCR. SHR y SCR son genes importantes para el desarrollo de la raíz y se encuentran disponibles varias listas de sus genes diana transcripcionales propuestos [29-31, 63]. Sozzani y col. [30] obtuvo, a través del análisis de datos de microarrays, una lista completa de genes expresados ​​diferencialmente durante un curso temporal de inducción de SCR o SHR, mientras que Cui et al. [31] identificaron genes diana de SHR mediante inmunoprecipitación de cromatina (ChIP). Una comparación directa de las listas de genes diana de Sozzani et al., A las que nos referiremos como las listas Sozzani-SCR y Sozzani-SHR, con nuestra lista ARACNe de interactores SCR o SHR inferidos obtenida en DPI 0.0, 0.1 y 0.2, resultó en una superposición general baja: hay 732 interactores ARACNe-SCR y 719 ARACNe-SHR en DPI 0.2, de los cuales 68 (9.2%) y 159 (22%) se encontraron en las listas correspondientes de SCR- o SHR-Sozzani. En particular, esperaríamos encontrar en las listas de ARACNe y Sozzani genes que se sabe que participan en la vía de regulación transcripcional SHR-SCR, a saber JKD, Pop, NUC y CYCD61 (AT4G03270). Los primeros tres genes son TF y se pueden encontrar en el mismo módulo que SHR y SCR en TFsNet. CYCD61, un no TF, está presente en las listas SCR-Sozzani y SHR-Sozzani, pero no es un interactor inferido por ARACNE de SHR, SCR, JKD, Pop ni NUC. A DPI 0.0, su único TF que interactúa es AGL92 (AT1G31640), que no está cerca del SHR-SCR módulo en TFsNet o FullNet. Si bien es decepcionante, este resultado quizás no sea sorprendente: CYCD61 se expresa en tipos de células de raíz de tipo salvaje muy particulares, las células madre iniciales de la corteza / endodermis y las células endodérmicas del primordio de la raíz lateral [30, 64]. Además, CYCD61 participa en un mecanismo regulador complejo que implica interacciones proteína-proteína, fosforilación de proteínas y degradación de proteínas [64]. Es probable que estos mecanismos se traduzcan mal en niveles de transcripción de los genes correspondientes en muestras de raíces completas, que son los datos de entrada para ARACNe.

La capacidad de ARACNe para recuperar genes diana TF identificados experimentalmente probablemente reflejará el número y la complejidad de las interacciones reguladoras en las que participa TF. VND7 es un TF involucrado exclusivamente en la síntesis de la pared celular secundaria (SCWS) [65, 66]. Como tal, esperamos que VND7 participe en un módulo transcripcional muy específico y que ARACNe recupere con precisión sus genes diana identificados experimentalmente. Por otro lado, SHR y SCR probablemente estén involucrados en numerosas vías de transcripción, ya que los mutantes de estos genes se ven fuertemente afectados en el desarrollo de la raíz [67, 68], y se pueden encontrar más de 200 TF en las listas de genes expresados ​​diferencialmente para SHR. o inducciones de SCR, que analizan un tipo de célula de raíz específico, es decir, tejido de tierra [30]. Un número tan importante de TF expresados ​​diferencialmente (aproximadamente el 10% de todos los TF de Arabidopsis) sugiere además que un número significativo de estos genes diana identificados experimentalmente son objetivos indirectos. Además, la regulación del desarrollo de la raíz por SCR y SHR implica la expresión en tipos celulares definidos, transporte a través de tipos celulares, translocación núcleo-citoplasma, interacciones proteína-proteína y fosforilación de proteínas [27, 30, 34, 35, 64]. En este caso, esperamos que se puedan obtener mejores resultados visualizando genes diana identificados experimentalmente en el contexto de las redes en las que participan. Por lo tanto, decidimos recuperar del conjunto de datos FullNet, obtenido en DPI 0.0 y con un valor p de corte de 1e-30, todas las interacciones para las cuales ambos nodos están presentes en la lista de 2481 genes expresados ​​diferencialmente en la cinética de inducción SHR de Sozzani y estudio del colaborador [30], al que agregamos SHR (AT4G37650). El conjunto de datos resultante ahora contiene 1668 genes (67% de la lista original) y la red correspondiente se dibujó con Cytoscape [69]. 1647 nodos (66%), incluidos SHR, se agrupan en una sola subred (Figuras 2a-d). Observamos que esta subred está claramente dividida en dos secciones, correspondientes a genes que, a medida que avanza el tiempo en la cinética de inducción, pasan de un estado subexpresado a uno sobreexpresado y viceversa. Un análisis de esta subred ahora puede ayudar a identificar los nodos relevantes, que deberían desempeñar un papel importante en la vía transcripcional SHR. Por ejemplo, tres de los nodos principales que cambian de subexpresión a sobreexpresión son PRMT3 (AT3G12270), KYP (AT5G13960) y HD2A (AT3G44750), que son genes que codifican proteínas de modificación de la cromatina (histona metiltransferasa e histona desacetilasa). Un análisis de todos los genes que cambian de subexpresión a sobreexpresión cuando se utilizan David [70, 71] y Enrichment Map [72] revela que este módulo está enriquecido, entre otros, en ciclo celular, microtúbulos, procesamiento de ARN y putativo genes codificadores de proteínas de modificación de la cromatina (Figura 2e).

Subred de genes expresados ​​diferencialmente en un curso temporal de inducción de SHR [30]. Los colores de los nodos corresponden a genes regulados por disminución (verde) o regulados por aumento (magenta) en 1 hora (a), 3 horas (B), 6 horas (C) y 12 horas (D) después de la inducción de SHR. (mi) Enrichment Map [72] red de enriquecimientos de categoría calculados con David [70, 71] para genes en la subred que cambian de un estado regulado hacia abajo a uno regulado hacia arriba durante la cinética de inducción.

Las redes inferidas de ARACNe permiten la predicción de nuevas interacciones genéticas para TF expresados ​​en la raíz: un posible papel para ESPÁTULA en el PLÉTORAruta

La TFsNet se obtuvo a partir de datos que incluían exclusivamente nuestra lista de 2088 conjuntos de sondas TF (ver Métodos). En esta red, los TF que participan en el mismo proceso biológico deben agruparse. Por lo tanto, esperamos que las plantas mutantes de orden superior para genes en un mismo módulo exhiban fenotipos de raíz no observados en plantas mutantes individuales. Nos propusimos probar esta hipótesis con genes que están presentes en el mismo módulo, pero 1) pertenecen a diferentes familias de TF, 2) no son vecinos inmediatos en TFsNet, y 3) cuyos mutantes tienen fenotipos de raíz distintos. Los genes BABY BOOM (BBM) y ESPÁTULA (SPT) coincidió con estos criterios. Ambos genes están presentes en el mismo módulo (Figura 1c), y los mutantes del BBM gen, un TF de dominio AP2, tiene raíces ligeramente más cortas [26], mientras que los mutantes del SPT El gen, un bHLH TF, tiene raíces ligeramente más largas que las plantas de tipo salvaje [73]. Cuando se cultiva en placas verticales, el bbm-2/spt-2 doble mutante exhibió raíces más largas que cualquiera spt-2 o bbm-2 plántulas mutantes simples (Figura 3). Un informe anterior mostró que PIN4 y DR5 :: GUS la expresión se altera en el meristemo raíz de spt-11 plántulas mutantes [73]. En conjunto, estos resultados apuntan a una posible interacción transcripcional entre los PLÉTORA camino y ESPÁTULA en la regulación del transporte y / o respuesta de auxinas en meristemas de raíz de Arabidopsis.

Fotografías de bbm-2 , spt-2 y bbm-2 / spt-2 plántulas mutantes de seis días cultivadas en placas verticales. La barra representa 0,5 cm.

Las redes inferidas de ARACNe permiten la predicción de funciones novedosas para TF expresados ​​en la raíz: el caso de XAL1/AGL12, un TF de caja MADS involucrado en la síntesis secundaria de la pared celular

Dado que nuestras redes inferidas ARACNe pueden recuperar asociaciones de genes conocidas, esperamos que también puedan predecir nuevas funciones de TF. Como ejemplo del poder predictivo de nuestra base de datos, decidimos buscar nuevos TF que pudieran participar en la síntesis de la pared celular secundaria (SCWS). Para ello, nuestra estrategia consistió en seleccionar varios genes, tanto TF como no TF, conocidos por estar implicados en SCWS, recuperar sus interacciones de la FullNet y dibujar la red resultante para identificar nuevos TF de SCWS. Se sabe que varios TF están involucrados en SCWS, entre los cuales elegimos VND6/ANAC101 (AT5G62380), VND7/ANAC030 (AT1G71930) [74], SND2/ANAC073 (AT4G28500) [75], MYB46[76] y IXR11 (AT1G62990) [77]. Como genes SCWS no TF elegimos las celulosa sintasas CESA4 (AT5G44030), CESA7 (AT5G17420) y CESA8 (AT4G18780) [78], las lacasas LAC4 (AT2G38080) y LAC17 (AT5G60020) [79], las cisteína peptidasas XCP1 (AT4G35350) y XCP2 (AT1G20850) [80], el tipo quitinasa ATCTL2 (AT3G16920) [81], el dominio DUF6 WAT1 (AT1G75500) [82], TED6 (AT1G43790) [83], el dominio DUF231 TBL3 (AT5G01360) [84] y la familia 8 glicosiltransferasa GAUT12/IRX8 (AT5G54690) [85]. A continuación, recuperamos de la FullNet todas las interacciones relacionadas con estos genes en DPI 0.0 y un valor de p de corte de 1e-30 y usamos Cytoscape [69] para visualizar la red correspondiente (archivo adicional 6). Inmediatamente parece que estos genes son de hecho parte de una red de genes SCWS que incluye nuestros genes de entrada más varios otros genes SCWS conocidos, o supuestos, incluyendo MYB83 (AT3G08500) [86], ANAC007/VND4 (AT1G12260) [65] o ATPRR1[87], sino también TF de desarrollo vascular como ATHB-15[43], ATHB-16 (AT4G40060) [88] y JLO (AT4G00220) un objetivo de VND7 [62].

En una parte altamente conectada de esta red SCWS, ahora están presentes 22 TF que no formaban parte de nuestra lista de genes de entrada (Figura 4). Recuperamos de FullNet todas las interacciones que involucran estos TF en DPI 0.0, 0.1 y 0.2 y un valor de p de corte de 1e-30. Un análisis de enriquecimiento, utilizando a David, de las listas de interactores para tres de los TF recién identificados, XAL1/AGL12 (una caja MADS), BEE2 y AT1G68810 (dos bHLH) revelaron que están particularmente enriquecidos en genes SCWS (datos no mostrados), las listas de interactores de alto valor de MI para cada TF se muestran en el archivo adicional 7. Como estos tres TF están presentes en la parte altamente conectada de la red SCWS , no es de extrañar que compartan varios de sus interactuadores. AGL12/XAL1 es un factor de transcripción MADS-box que se expresa en los tejidos del floema y participa en la regulación tanto del desarrollo de la raíz como del tiempo de floración [89]. BEE2 fue identificado por primera vez como un TF que responde a los brasinoesteroides [90]. Los brasinoesteroides promueven el crecimiento de las raíces [91], son esenciales para el desarrollo del sistema vascular en los tallos de Arabidopsis [92] y mejoran la transdiferenciación de los vasos del xilema de los cultivos en suspensión de Arabidopsis [74]. AT1G68810 es 1) un TF que encontramos como parte del grupo de desarrollo vascular en TFsNet, 2) estrechamente relacionado con ATAIG1/TMO5, que también forma parte del grupo de desarrollo vascular exclusivo de TF y 3) un interactor proteína-proteína de LONESOME HIGHWAY, un activador transcripcional implicado en el desarrollo vascular [93]. Estos resultados predicen que XAL1, BEE2 y AT1G68810 son TF importantes para SCWS.

Parte altamente conectada de la red SCWS obtenida en DPI 0.0 y un valor de p de corte de 1e-30. Los genes se representan como nodos y las interacciones inferidas como bordes. Los TF que no están presentes en la lista de entrada se muestran en amarillo. Los TF AT1G68810, BEE2 y AGL12 (XAL1) se mencionan con más detalle en el texto y están coloreados en naranja. El ancho del borde es proporcional al valor de información mutua (MI) de la interacción, y los valores de MI más altos corresponden a bordes más gruesos.

Como los TF de caja MADS no suelen estar asociados con SCWS, decidimos buscar la deposición de SCW en xal1-2 raíces mutantes con pérdida de función [89]. Ya que xal1-2 presenta un retraso en el tiempo de floración, las raíces de plantas de la misma edad cronológica podrían revelar diferencias de SCWS relacionadas con la etapa de desarrollo en lugar de un fenotipo de SCWS directo. Por tanto, tanto Col-0 como xal1-2 Las raíces se recolectaron cuando el tallo principal tenía entre 29 y 32 cm de longitud, lo que posiblemente corresponde a plantas en la misma etapa de desarrollo. Como predice nuestra red inferida, xal1-2 De hecho, las raíces adultas han alterado los patrones de la pared celular secundaria con espacios en el xilema secundario y el anillo de fibras (n = 10/10), un fenotipo que rara vez se observa en plantas de tipo silvestre del mismo tamaño (n = 1/10 Figura 5). En un artículo intrigante, Sibout et al. han demostrado que la expansión del xilema en hipocótilos y raíces está relacionada con el tiempo de floración [94]. Casualmente, xal1-2 plantas han retrasado la floración [89] y alterado el SCWS de la raíz, lo que sugiere fuertemente que XAL1 podría ser parte de una TRN que conecta ambos procesos.

Fotografías de tipo salvaje (a) y xal1-2 (b) secciones transversales de raíces adultas observadas bajo luz ultravioleta. La autofluorescencia de los tejidos lignificados se evidencia como una coloración azul claro. Flechas blancas en xal1-2 indican huecos en el anillo de fibra de xilema. Las barras representan 100 micrones.

La confirmación de alteraciones SCWS en xal1-2 Los tejidos radiculares muestran que nuestra metodología bioinformática para inferir TRN es un enfoque exitoso para la predicción precisa de funciones novedosas para TF expresados ​​en la raíz. Este resultado refuerza aún más que nuestras redes probablemente proporcionarán una nueva hipótesis sobre los módulos funcionales involucrados en el desarrollo de la raíz. Como ejemplo adicional, la proteína DUF6 WAT1 [82] tiene, en DPI 0.0 y un valor de p de corte de 1e-50, los interactores TF ATHB-15/CNA, AT1G68810, AT4G29100, STH2, ATHB-16 y AT2G28510, todos los cuales forman parte del grupo de desarrollo vascular de TFsNet (Figura 1d). Esto sugiere, primero, que uno o más de estos TF es el regulador transcripcional de WAT1 en los tejidos de la raíz y, en segundo lugar, que uno o más de estos TF controlan el desarrollo vascular, al menos en parte, a través de la regulación transcripcional directa de WAT1. Finalmente, los genes codificadores de proteínas del dominio DUF6 AT1G43650, AT1G01070, AT3G45870, AT3G18200 y AT4G30420 son interactores de TF que se sabe que están involucrados en SCWS, lo que sugiere que podrían tener roles similares a WAT1 en la raíz SCWS.


Referencias

Terwilliger TC, Waldo G, Peat TS, Newman JM, Chu K, Berendzen J (1998) Determinación de estructura dirigida por clases: base para una iniciativa de estructura de proteínas. Protein Sci 7 (9): 1851–1856. doi: 10.1002 / pro.5560070901

Vitkup D, Melamud E, Moult J, Sander C (2001) Completitud en genómica estructural. Nat Struct Biol 8 (6): 559–566. doi: 10.1038 / 88640

Grabowski M, Joachimiak A, Otwinowski Z, Minor W (2007) Genómica estructural: mantenerse al día con el conocimiento en expansión del universo de las proteínas. Curr Opin Struct Biol 17 (3): 347-353. doi: 10.1016 / j.sbi.2007.06.003

Levitt M (2009) Naturaleza del universo proteico. Proc Natl Acad Sci USA 106 (27): 11079-11084. doi: 10.1073 / pnas.0905029106

Las subvenciones de los NIH de NIGMS (2010) promoverán los estudios sobre la forma y función de las proteínas. http://www.nigms.nih.gov/News/results/Pages/20100930.aspx. Consultado el 4 de noviembre de 2015.

Yokoyama S, Terwilliger TC, Kuramitsu S, Moras D, Sussman JL (2007) RIKEN ayuda a los esfuerzos internacionales de genómica estructural. Nature 445 (7123): 21. doi: 10.1038 / 445021a

Cassman M, World Technology Evaluation Center (2007) Biología de sistemas: investigación y desarrollo internacional. Springer, Dordrecht

Tanaka A, Hirai A, Harai D, Nakayama K, Fujii A, Yokoyama S (2015) Gestión de derechos de propiedad intelectual para la investigación de genómica estructural. http://www.protein.gsc.riken.jp/Concept/Partnership/partner_eng.htm. Consultado el 4 de noviembre de 2015.

Misión y Filosofía de SGC (2015). http://www.thesgc.org/about/what_is_the_sgc. Consultado el 4 de noviembre de 2015.

Gerlt JA, Allen KN, Almo SC, Armstrong RN, Babbitt PC, Cronan JE, Dunaway-Mariano D, Imker HJ, Jacobson MP, Minor W, Poulter CD, Raushel FM, Sali A, Shoichet BK, Sweedler JV (2011) iniciativa de la función enzimática. Biochemistry 50 (46): 9950–9962. doi: 10.1021 / bi201312u

Albeck S, Alzari P, Andreini C, Banci L, Berry IM, Bertini I, Cambillau C, Canard B, Carter L, Cohen SX, Diprose JM, Dym O, Esnouf RM, Felder C, Ferron F, Guillemot F, Hamer R , Ben Jelloul M, Laskowski RA, Laurent T, Longhi S, Lopez R, Luchinat C, Malet H, Mochel T, Morris RJ, Moulinier L, Oinn T, Pajon A, Peleg Y, Perrakis A, Poch O, Prilusky J, Rachedi A, Ripp R, Rosato A, Silman I, Stuart DI, Sussman JL, Thierry JC, Thompson JD, Thornton JM, Unger T, Vaughan B, Vranken W, Watson JD, Whamond G, Henrick K (2006) SPINE bioinformática y Aspectos de gestión de datos de la biología estructural de alto rendimiento. Acta Crystallogr D Biol Crystallogr 62 (Parte 10): 1184-1195. doi: 10.1107 / S090744490602991X

Banci L, Bertini I, Cusack S, de Jong RN, Heinemann U, Jones EY, Kozielski F, Maskos K, Messerschmidt A, Owens R, Perrakis A, Poterszman A, Schneider G, Siebold C, Silman I, Sixma T, Stewart -Jones G, Sussman JL, Thierry JC, Moras D (2006) Primeros pasos hacia métodos efectivos en la explotación de tecnologías de alto rendimiento para la determinación de estructuras de proteínas humanas de alto valor biomédico. Acta Crystallogr D Biol Crystallogr 62 (Parte 10): 1208–1217. doi: 10.1107 / S0907444906029350

Chim N, Habel JE, Johnston JM, Krieger I, Miallau L, Sankaranarayanan R, Morse RP, Bruning J, Swanson S, Kim H, Kim CY, Li H, Bulloch EM, Payne RJ, Manos-Turvey A, Hung LW, Baker EN, Lott JS, James MN, Terwilliger TC, Eisenberg DS, Sacchettini JC, Goulding CW (2011) El consorcio de genómica estructural de la tuberculosis: una década de progreso. Tuberculosis (Edinb) 91 (2): 155-172. doi: 10.1016 / j.tube.2010.11.009

Musa TL, Ioerger TR, Sacchettini JC (2009) El consorcio de genómica estructural de la tuberculosis: un enfoque de genómica estructural para el descubrimiento de fármacos. Adv Protein Chem Struct Biol 77: 41–76. doi: 10.1016 / S1876-1623 (09) 77003-8

Cyranoski D (2006) Proyecto de proteínas "Gran ciencia" bajo fuego. Nature 443 (7110): 382. doi: 10.1038 / 443382a

Petsko GA (2007) Una idea cuyo tiempo se ha ido. Biol del genoma 8 (6): 107. doi: 10.1186 / gb-2007-8-6-107

Banci L, Baumeister W, Heinemann U, Schneider G, Silman I, Stuart DI, Sussman JL (2007) Una idea cuyo momento ha llegado. Genome Biol 8 (11): 408. doi: 10.1186 / gb-2007-8-11-408

Lane E, Ham B (2012) Política científica. La recompensa de la I + D + i federal: iPod, Google y el proyecto del genoma humano. Ciencia 336 (6080): 433

Liu J, Montelione GT, Rost B (2007) Apalancamiento novedoso de la genómica estructural. Nat Biotechnol 25 (8): 849–851. doi: 10.1038 / nbt0807-849

Dessailly BH, Nair R, Jaroszewski L, Fajardo JE, Kouranov A, Lee D, Fiser A, Godzik A, Rost B, Orengo C (2009) PSI-2: genómica estructural para cubrir el espacio familiar de dominios de proteínas. Estructura 17 (6): 869–881. doi: 10.1016 / j.str.2009.03.015

O'Donovan C, Martin MJ, Gattiker A, Gasteiger E, Bairoch A, Apweiler R (2002) Recurso de conocimiento de proteínas de alta calidad: SWISS-PROT y TrEMBL. Breve Bioinform 3 (3): 275–284

Uniprot (2015) Estadísticas de versiones actuales. http://www.ebi.ac.uk/uniprot/TrEMBLstats. Consultado el 4 de noviembre de 2015.

Lee D, Grant A, Marsden RL, Orengo C (2005) Identificación y distribución de familias de proteínas en 120 genomas completos utilizando Gene3D. Proteins 59 (3): 603–615. doi: 10.1002 / prot.20409

Unger R, Uliel S, Havlin S (2003) Ley de escala en tamaños de familias de secuencias de proteínas: desde superfamilias hasta genes huérfanos. Proteins 51 (4): 569–576. doi: 10.1002 / prot.10347

Nair R, Liu J, Soong TT, Acton TB, Everett JK, Kouranov A, Fiser A, Godzik A, Jaroszewski L, Orengo C, Montelione GT, Rost B (2009) La genómica estructural es el mayor contribuyente del nuevo apalancamiento estructural. J Struct Funct Genomics 10 (2): 181-191. doi: 10.1007 / s10969-008-9055-6

Khafizov K, Ivanov MV, Glazova OV, Kovalenko SP (2015) Enfoques computacionales para estudiar los efectos de pequeñas variaciones genómicas. J Mol Modelo 21 (10): 2794. doi: 10.1007 / s00894-015-2794-y

Khafizov K, Madrid-Aliste C, Almo SC, Fiser A (2014) Tendencias en la cobertura estructural del universo proteico y el impacto de la iniciativa de estructura proteica. Proc Natl Acad Sci USA 111 (10): 3733-3738. doi: 10.1073 / pnas.1321614111

Pieper U, Webb BM, Dong GQ, Schneidman-Duhovny D, Fan H, Kim SJ, Khuri N, Spill YG, Weinkam P, Hammel M, Tainer JA, Nilges M, Sali A (2014) ModBase, una base de datos de comparativas anotadas modelos de estructura de proteínas y recursos asociados. Nucleic Acids Res 42 (Edición de la base de datos): D336 – D346. doi: 10.1093 / nar / gkt1144

Arnold K, Kiefer F, Kopp J, Battey JN, Podvinec M, Westbrook JD, Berman HM, Bordoli L, Schwede T (2009) El portal del modelo de proteínas. J Struct Funct Genomics 10 (1): 1–8. doi: 10.1007 / s10969-008-9048-5

Moult J (2005) Una década de CASP: progreso, cuellos de botella y pronóstico en la predicción de la estructura de proteínas. Curr Opin Struct Biol 15 (3): 285-289. doi: 10.1016 / j.sbi.2005.05.011

Lesley SA, Kuhn P, Godzik A, Deacon AM, Mathews I, Kreusch A, Spraggon G, Klock HE, McMullan D, Shin T, Vincent J, Robb A, Brinen LS, Miller MD, McPhillips TM, Miller MA, Scheibe D , Canaves JM, Guda C, Jaroszewski L, Selby TL, Elsliger MA, Wooley J, Taylor SS, Hodgson KO, Wilson IA, Schultz PG, Stevens RC (2002) Genómica estructural de la Thermotoga maritima proteoma implementado en una tubería de determinación de estructura de alto rendimiento. Proc Natl Acad Sci USA 99 (18): 11664-11669. doi: 10.1073 / pnas.142413399

Zhang Y, Thiele I, Weekes D, Li Z, Jaroszewski L, Ginalski K, Deacon AM, Wooley J, Lesley SA, Wilson IA, Palsson B, Osterman A, Godzik A (2009) Vista estructural tridimensional del metabolismo central red de Thermotoga maritima. Science 325 (5947): 1544–1549. doi: 10.1126 / science.1174671

Omenn GS, Lane L, Lundberg EK, Beavis RC, Nesvizhskii AI, Deutsch EW (2015) Métricas para el proyecto del proteoma humano 2015: progreso en el proteoma humano y pautas para la identificación de proteínas de alta confianza. J Proteome Res 14 (9): 3452–3460. doi: 10.1021 / acs.jproteome.5b00499

Gaudet P, Argoud-Puy G, Cusin I, Duek P, Evalet O, Gateau A, Gleizes A, Pereira M, Zahn-Zabal M, Zwahlen C, Bairoch A, Lane L (2013) neXtProt: organizar el conocimiento de las proteínas en el contexto de proyectos de proteoma humano. J Proteome Res 12 (1): 293-298. doi: 10.1021 / pr300830v

Mizianty MJ, Fan X, Yan J, Chalmers E, Woloschuk C, Joachimiak A, Kurgan L (2014) Cubriendo proteomas completos con estructuras de rayos X: una instantánea actual. Acta Crystallogr D Biol Crystallogr 70 (Parte 11): 2781-2793. doi: 10.1107 / S1399004714019427

Wallin E, von Heijne G (1998) Análisis de todo el genoma de proteínas integrales de membrana de organismos eubacterianos, arcaicos y eucariotas. Protein Sci 7 (4): 1029-1038. doi: 10.1002 / pro.5560070420

Kloppmann E, Punta M, Rost B (2012) La genómica estructural extrae proteínas de membrana que cuelgan altas. Curr Opin Struct Biol 22 (3): 326–332. doi: 10.1016 / j.sbi.2012.05.002

Portal de publicaciones de la ISP (2015). http://olenka.med.virginia.edu/psi. Consultado el 24 de agosto de 2015.

Iniciativa de proteómica estructural / genómica de RIKEN. Publicaciones (2015). http://www.rsgi.riken.jp/rsgi_e/ResearchResult/index.html. Consultado el 24 de agosto de 2015.

Publicaciones SGC (2015). www.thesgc.org/publications. Consultado el 24 de agosto de 2015.

Publicaciones CSGID (2015). http://csgid.org/publications. Consultado el 24 de agosto de 2015.

Publicaciones SSGCID (2015). http://www.ssgcid.org/publications. Consultado el 24 de agosto de 2015.

Publicaciones de la iniciativa de función enzimática (2015). http://enzymefunction.org/publications. Consultado el 20 de noviembre de 2015.

Mougous JD, Cuff ME, Raunser S, Shen A, Zhou M, Gifford CA, Goodman AL, Joachimiak G, Ordonez CL, Lory S, Walz T, Joachimiak A, Mekalanos JJ (2006) Un lugar de virulencia de Pseudomonas aeruginosa codifica un aparato de secreción de proteínas. Science 312 (5779): 1526-1530. doi: 10.1126 / science.1128393

Minor W, Cymborowski M, Otwinowski Z, Chruszcz M (2006) HKL-3000: la integración de la reducción de datos y la solución de estructura, desde imágenes de difracción hasta un modelo inicial en minutos. Acta Crystallogr D Biol Crystallogr 62 (Parte 8): 859–866. doi: 10.1107 / S0907444906019949

Cherezov V, Rosenbaum DM, Hanson MA, Rasmussen SG, Thian FS, Kobilka TS, Choi HJ, Kuhn P, Weis WI, Kobilka BK, Stevens RC (2007) Estructura cristalina de alta resolución de una proteína G adrenérgica beta2 humana diseñada receptor acoplado. Science 318 (5854): 1258–1265. doi: 10.1126 / science.1150577

Rosenbaum DM, Cherezov V, Hanson MA, Rasmussen SG, Thian FS, Kobilka TS, Choi HJ, Yao XJ, Weis WI, Stevens RC, Kobilka BK (2007) La ingeniería de GPCR proporciona conocimientos estructurales de alta resolución sobre la función del receptor adrenérgico beta2. Science 318 (5854): 1266–1273. doi: 10.1126 / science.1150609

Crooks GE, Hon G, Chandonia JM, Brenner SE (2004) WebLogo: un generador de logotipos de secuencias. Genome Res 14 (6): 1188-1190. doi: 10.1101 / gr.849004

Gabanyi MJ, Adams PD, Arnold K, Bordoli L, Carter LG, Flippen-Andersen J, Gifford L, Haas J, Kouranov A, McLaughlin WA, Micallef DI, Minor W, Shah R, Schwede T, Tao YP, Westbrook JD, Zimmerman M, Berman HM (2011) La base de conocimientos de biología estructural: un portal a estructuras, secuencias, funciones y métodos de proteínas. J Struct Funct Genomics 12 (2): 45–54. doi: 10.1007 / s10969-011-9106-2

Redner S (1998) ¿Qué tan popular es su artículo? Un estudio empírico de la distribución de citas. Eur Phys J B 4 (2): 131-134. doi: 10.1007 / s100510050359

Albarrán P, Crespo J, Ortuño I, Ruiz-Castillo J (2011) La asimetría de la ciencia en 219 subcampos y varios agregados. Scientometrics 88 (2): 385–397. doi: 10.1007 / s11192-011-0407-9

Brzezinski M (2015) Leyes de poder en distribuciones de citas: evidencia de Scopus. Scientometrics 103 (1): 213-228. doi: 10.1007 / s11192-014-1524-z

Peterson GJ, Pressé S, Dill KA (2010) Escalado de la ley de potencia no universal en la distribución de probabilidad de citas científicas. Proc Natl Acad Sci 107 (37): 16023–16027

Clauset A, Shalizi C, Newman M (2009) Distribuciones de ley de potencia en datos empíricos. SIAM Rev 51 (4): 661–703. doi: 10.1137 / 070710111

Chen L, Oughtred R, Berman HM, Westbrook J (2004) TargetDB: una base de datos de registro de destino para proyectos de genómica estructural. Bioinformatics 20 (16): 2860–2862. doi: 10.1093 / bioinformática / bth300

Morris C (2015) PiMS: un sistema de gestión de datos para proteómica estructural. Methods Mol Biol 1261: 21–34. doi: 10.1007 / 978-1-4939-2230-7_2

Morris C, Pajon A, Griffiths SL, Daniel E, Savitsky M, Lin B, Diprose JM, da Silva AW, Pilicheva K, Troshin P, van Niekerk J, Isaacs N, Naismith J, Nave C, Blake R, Wilson KS, Stuart DI, Henrick K, Esnouf RM (2011) El sistema de gestión de información de proteínas (PiMS): una herramienta genérica para cualquier laboratorio de investigación de biología estructural. Acta Crystallogr D Biol Crystallogr 67 (Parte 4): 249-260. doi: 10.1107 / S0907444911007943

Zolnai Z, Lee PT, Li J, Chapman MR, Newman CS, Phillips GN Jr, Rayment I, Ulrich EL, Volkman BF, Markley JL (2003) Sistema de gestión de proyectos para proteómica estructural y funcional: sésamo. J Struct Funct Genomics 4 (1): 11–23

Berman HM (2008) El banco de datos de proteínas: una perspectiva histórica. Acta Crystallogr A 64 (Parte 1): 88–95. doi: 10.1107 / S0108767307035623

Weekes D, Krishna SS, Bakolitsa C, Wilson IA, Godzik A, Wooley J (2010) TOPSAN: un entorno de anotación colaborativa para la genómica estructural. BMC Bioinform 11: 426. doi: 10.1186 / 1471-2105-11-426

Prilusky J, Hodis E, Canner D, Decatur WA, Oberholser K, Martz E, Berchanski A, Harel M, Sussman JL (2011) Proteopedia: un informe de estado sobre la enciclopedia web colaborativa en 3D de proteínas y otras biomoléculas. J Struct Biol 175 (2): 244-252. doi: 10.1016 / j.jsb.2011.04.011

Zimmerman MD, Grabowski M, Domagalski MJ, Maclean EM, Chruszcz M, Minor W (2014) Gestión de datos en la biología estructural moderna y el entorno de investigación biomédica. Métodos Mol Biol 1140: 1–25. doi: 10.1007 / 978-1-4939-0354-2_1

Gifford LK, Carter LG, Gabanyi MJ, Berman HM, Adams PD (2012) Portal de tecnología de base de conocimientos de biología estructural de la iniciativa de estructura de proteínas: un recurso web de biología estructural. J Struct Funct Genomics 13 (2): 57–62. doi: 10.1007 / s10969-012-9133-7

Kobayashi N, Harano Y, Tochio N, Nakatani E, Kigawa T, Yokoyama S, Mading S, Ulrich EL, Markley JL, Akutsu H, Fujiwara T (2012) Un sistema automatizado diseñado para la deposición y anotación de datos de RMN a gran escala: aplicación a más de 600 entradas de datos de cambios químicos asignados al BioMagResBank de la base de datos interna de la iniciativa de genómica / proteómica estructural de Riken. J Biomol NMR 53 (4): 311-320. doi: 10.1007 / s10858-012-9641-6

Ulrich EL, Akutsu H, Doreleijers JF, Harano Y, Ioannidis YE, Lin J, Livny M, Mading S, Maziuk D, Miller Z, Nakatani E, Schulte CF, Tolmie DE, Kent Wenger R, Yao H, Markley JL (2008 ) BioMagResBank. Nucleic Acids Res 36 (Edición de la base de datos): D402 – D408. doi: 10.1093 / nar / gkm957

Seiler CY, Park JG, Sharma A, Hunter P, Surapaneni P, Sedillo C, Field J, Algar R, Price A, Steel J, Throop A, Fiacco M, LaBaer J (2014) DNASU plásmido y PSI: Biology-Materials repositories : recursos para acelerar la investigación biológica. Investigación de ácidos nucleicos 42 (Edición de la base de datos): D1253 – D1260. doi: 10.1093 / nar / gkt1060

Materiales disponibles de SSGCID (2015). http://www.ssgcid.org/available-materials. Consultado el 23 de noviembre de 2015.

Brown PJ, Muller S (2015) Sondas químicas de acceso abierto para objetivos epigenéticos. Future Med Chem 7 (14): 1901-1917. doi: 10.4155 / fmc.15.127

Collins FS, Tabak LA (2014) Política: NIH planea mejorar la reproducibilidad. Nature 505 (7485): 612–613

Niedzialkowska E, Gasiorowska O, Handing KB, Majorek KA, Porebski PJ, Shabalin IG, Zasadzinska E, Cymborowski M, Minor W (2016) Purificación de proteínas y artefactos de cristalización: la historia generalmente no se cuenta. Proteína Sci 25 (3): 720–733 doi: 10.1002 / pro.2861

Eschenfeldt WH, Lucy S, Millard CS, Joachimiak A, Mark ID (2009) Una familia de vectores LIC para la clonación y purificación de proteínas de alto rendimiento. Methods Mol Biol 498: 105-115. doi: 10.1007 / 978-1-59745-196-3_7

Almo SC, Garforth SJ, Hillerich BS, Love JD, Seidel RD, Burley SK (2013) Producción de proteínas desde la perspectiva de la genómica estructural: logros y necesidades futuras. Curr Opin Struct Biol 23 (3): 335–344. doi: 10.1016 / j.sbi.2013.02.014

Ericsson UB, Hallberg BM, Detitta GT, Dekker N, Nordlund P (2006) Optimización de la estabilidad de alto rendimiento basada en termofluor de proteínas para estudios estructurales. Anal Biochem 357 (2): 289-298. doi: 10.1016 / j.ab.2006.07.027

Newman J, Egan D, Walter TS, Meged R, Berry I, Ben Jelloul M, Sussman JL, Stuart DI, Perrakis A (2005) Hacia la racionalización del cribado de cristalización para laboratorios académicos pequeños y medianos: la estrategia PACT / JCSG + . Acta Crystallogr D Biol Crystallogr 61 (Pt 10): 1426–1431. doi: 10.1107 / S0907444905024984

Sagemark J, Kraulis P, Weigelt J (2010) Una herramienta de software para acelerar el diseño de construcciones de proteínas para la expresión recombinante. Protein Expr Purif 72 (2): 175-178. doi: 10.1016 / j.pep.2010.03.020

Przulj N, Wigle DA, Jurisica I (2004) Topología funcional en una red de interacciones de proteínas. Bioinformatics 20 (3): 340–348. doi: 10.1093 / bioinformática / btg415

NIGMS (2014) Recomendaciones para la inversión continua en biología estructural tras la extinción de la iniciativa de estructura proteica. https://www.nigms.nih.gov/News/reports/Documents/NIGMS-FSBC-report2014.pdf. Consultado el 4 de noviembre de 2015.

Winn MD, Ballard CC, Cowtan KD, Dodson EJ, Emsley P, Evans PR, Keegan RM, Krissinel EB, Leslie AG, McCoy A, McNicholas SJ, Murshudov GN, Pannu NS, Potterton EA, Powell HR, Read RJ, Vagin A , Wilson KS (2011) Descripción general de la suite CCP4 y desarrollos actuales. Acta Crystallogr D Biol Crystallogr 67 (Parte 4): 235–242. doi: 10.1107 / S0907444910045749

Adams PD, Afonine PV, Bunkoczi G, Chen VB, Davis IW, Echols N, Headd JJ, Hung LW, Kapral GJ, Grosse-Kunstleve RW, McCoy AJ, Moriarty NW, Oeffner R, Read RJ, Richardson DC, Richardson JS, Terwilliger TC, Zwart PH (2010) PHENIX: un sistema integral basado en Python para la solución de estructuras macromoleculares. Acta Crystallogr D Biol Crystallogr 66 (Parte 2): 213-221. doi: 10.1107 / S0907444909052925

Chruszcz M, Domagalski M, Osinski T, Wlodawer A, Minor W (2010) Desafíos insatisfechos de la genómica estructural. Curr Opin Struct Biol 20 (5): 587-597. doi: 10.1016 / j.sbi.2010.08.001

Snell G, Cork C, Nordmeyer R, Cornell E, Meigs G, Yegian D, Jaklevic J, Jin J, Stevens RC, Earnest T (2004) Sistema automatizado de alineación y montaje de muestras para cristalografía biológica en una fuente de sincrotrón. Estructura 12 (4): 537–545. doi: 10.1016 / j.str.2004.03.011

Miller MD, Deacon AM (2007) Un sistema basado en microfuentes de rayos X para la detección de cristales y el desarrollo de líneas de luz durante los períodos de parada del sincrotrón. Nucl Instrum Methods Phys Res A 582 (1): 233-235. doi: 10.1016 / j.nima.2007.08.136

Cherezov V, Hanson MA, Griffith MT, Hilgart MC, Sanishvili R, Nagarajan V, Stepanov S, Fischetti RF, Kuhn P, Stevens RC (2009) Estrategia de rasterización para la detección y el centrado de muestras de microcristales de proteínas de membrana humana con un sub-10 Haz de sincrotrón de rayos X de tamaño micromo. J R Soc Interface 6 (Suppl 5): S587 – S597. doi: 10.1098 / rsif.2009.0142.focus

Heras B, Martin JL (2005) Tratamientos de poscristalización para mejorar la calidad de difracción de cristales de proteína. Acta Crystallogr D Biol Crystallogr 61 (Parte 9): 1173–1180. doi: 10.1107 / S0907444905019451

Krojer T, Pike AC, von Delft F (2013) Aprovechar al máximo cada cristal: los detalles finos de la recopilación de datos. Acta Crystallogr D Biol Crystallogr 69 (Parte 7): 1303–1313. doi: 10.1107 / S0907444913013280

Liu G, Shen Y, Atreya HS, Parish D, Shao Y, Sukumaran DK, Xiao R, Yee A, Lemak A, Bhattacharya A, Acton TA, Arrowsmith CH, Montelione GT, Szyperski T (2005) Protocolo de análisis y recopilación de datos de RMN para la determinación de la estructura de proteínas de alto rendimiento. Proc Natl Acad Sci USA 102 (30): 10487–10492. doi: 10.1073 / pnas.0504338102

Yokoyama S (2003) Sistemas de expresión de proteínas para genómica y proteómica estructural. Curr Opin Chem Biol 7 (1): 39–43

Rossi P, Swapna GV, Huang YJ, Aramini JM, Anklin C, Conover K, Hamilton K, Xiao R, Acton TB, Ertekin A, Everett JK, Montelione GT (2010) Una tubería de detección de muestras de RMN de proteínas a microescala. J Biomol NMR 46 (1): 11-22. doi: 10.1007 / s10858-009-9386-z

Everett JK, Tejero R, Murthy SB, Acton TB, Aramini JM, Baran MC, Benach J, Cort JR, Eletsky A, Forouhar F, Guan R, Kuzin AP, Lee HW, Liu G, Mani R, Mao B, Mills JL , Montelione AF, Pederson K, Powers R, Ramelot T, Rossi P, Seetharaman J, Snyder D, Swapna GV, Vorobiev SM, Wu Y, Xiao R, Yang Y, Arrowsmith CH, Hunt JF, Kennedy MA, Prestegard JH, Szyperski T, Tong L, Montelione GT (2015) Un recurso comunitario de datos experimentales para pares de estructuras cristalinas de rayos X / RMN. Protein Sci. doi: 10.1002 / pro.2774

Laskowski RA, Watson JD, Thornton JM (2005) ProFunc: un servidor para predecir la función de las proteínas a partir de la estructura 3D. Investigación de ácidos nucleicos 33 (edición del servidor web): W89 – W93. doi: 10.1093 / nar / gki414

Watson JD, Laskowski RA, Thornton JM (2005) Predicción de la función de la proteína a partir de secuencia y datos estructurales. Curr Opin Struct Biol 15 (3): 275-284. doi: 10.1016 / j.sbi.2005.04.003

Jaroszewski L, Rychlewski L, Li Z, Li W, Godzik A (2005) FFAS03: un servidor para alineaciones de secuencia de perfil-perfil. Nucleic Acids Res 33 (problema del servidor web): W284 – W288. doi: 10.1093 / nar / gki418

Jaroszewski L, Li Z, Cai XH, Weber C, Godzik A (2011) Servidor FFAS: características y aplicaciones novedosas. Nucleic Acids Res 39 (problema del servidor web): W38 – W44. doi: 10.1093 / nar / gkr441

Shumilin IA, Cymborowski M, Chertihin O, Jha KN, Herr JC, Lesley SA, Joachimiak A, Minor W (2012) Identificación de la función de proteína desconocida mediante la detección de cócteles de metabolitos. Estructura 20 (10): 1715-1725. doi: 10.1016 / j.str.2012.07.016

Kuhn ML, Majorek KA, Minor W, Anderson WF (2013) Pantalla de sustrato amplio como herramienta para identificar sustratos para N-acetiltransferasas bacterianas relacionadas con Gcn5 con especificidad de sustrato desconocida. Protein Sci 22 (2): 222-230. doi: 10.1002 / pro.2199

Watson JD, Sanderson S, Ezersky A, Savchenko A, Edwards A, Orengo C, Joachimiak A, Laskowski RA, Thornton JM (2007) Hacia la predicción de funciones completamente automatizada basada en estructuras en genómica estructural: un estudio de caso. J Mol Biol 367 (5): 1511-1522. doi: 10.1016 / j.jmb.2007.01.063

Akiva E, Brown S, Almonacid DE, Barber AE 2nd, Custer AF, Hicks MA, Huang CC, Lauck F, Mashiyama ST, Meng EC, Mischel D, Morris JH, Ojha S, Schnoes AM, Stryke D, Yunes JM, Ferrin TE, Holliday GL, Babbitt PC (2014) La base de datos de vínculo estructura-función. Nucleic Acids Res 42 (Edición de la base de datos): D521 – D530. doi: 10.1093 / nar / gkt1130

Consorcio de Genómica Estructural, Consorcio de Genómica Estructural de China, Consorcio de Genómica Estructural del Noreste, Graslund S, Nordlund P, Weigelt J, Hallberg BM, Bray J, Gileadi O, Knapp S, Oppermann U, Arrowsmith C, Hui R, Ming J, dhePaganon S, Park HW, Savchenko A, Yee A, Edwards A, Vincentelli R, Cambillau C, Kim R, Kim SH, Rao Z, Shi Y, Terwilliger TC, Kim CY, Hung LW, Waldo GS, Peleg Y, Albeck S, Unger T , Dym O, Prilusky J, Sussman JL, Stevens RC, Lesley SA, Wilson IA, Joachimiak A, Collart F, Dementieva I, Donnelly MI, Eschenfeldt WH, Kim Y, Stols L, Wu R, Zhou M, Burley SK, Emtage JS, Sauder JM, Thompson D, Bain K, Luz J, Gheyi T, Zhang F, Atwell S, Almo SC, Bonanno JB, Fiser A, Swaminathan S, Studier FW, Chance MR, Sali A, Acton TB, Xiao R, Zhao L, Ma LC, Hunt JF, Tong L, Cunningham K, Inouye M, Anderson S, Janjua H, Shastry R, ​​Ho CK, Wang D, Wang H, Jiang M, Montelione GT, Stuart DI, Owens RJ, Daenke S , Schutz A, Heinemann U, Yokoyama S, Bussow K, Gunsalus KC (2008) Producto de proteína ucción y purificación. Nat Methods 5 (2): 135-146. doi: 10.1038 / nmeth.f.202

Bandaranayake AD, Almo SC (2014) Avances recientes en la producción de proteínas de mamíferos. FEBS Lett 588 (2): 253–260. doi: 10.1016 / j.febslet.2013.11.035

Almo SC, Love JD (2014) Mejor y más rápido: mejoras y optimización para la producción de proteínas recombinantes de mamíferos. Curr Opin Struct Biol 26: 39–43. doi: 10.1016 / j.sbi.2014.03.006

Glasziou P, Meats E, Heneghan C, Shepperd S (2008) ¿Qué falta en las descripciones del tratamiento en los ensayos y revisiones? BMJ 336 (7659): 1472–1474. doi: 10.1136 / bmj.39590.732037.47

Freedman LP, Cockburn IM, Simcoe TS (2015) La economía de la reproducibilidad en la investigación preclínica. PLoS Biol 13 (6): e1002165. doi: 10.1371 / journal.pbio.1002165


Referencias

Chua G, Robinson MD, Morris Q, Hughes TR: Redes transcripcionales: regulación genética por ingeniería inversa a escala global. Curr Opin Microbiol. 2004, 7: 638-646. 10.1016 / j.mib.2004.10.009.

Giaever G, Chu AM, Ni L, Connelly C, Riles L, Veronneau S, Dow S, Lucau-Danila A, Anderson K, Andre B, et al: Perfiles funcionales del Saccharomyces cerevisiae genoma. Naturaleza. 2002, 418: 387-391. 10.1038 / nature00935.

Bader GD, Heilbut A, Andrews B, Tyers M, Hughes T, Boone C: Genómica funcional y proteómica: trazando un mapa multidimensional de la célula de levadura. Trends Cell Biol. 2003, 13: 344-356. 10.1016 / S0962-8924 (03) 00127-2.

Jorgensen P, Breitkreutz BJ, Breitkreutz K, Stark C, Liu G, Cook M, Sharom J, Nishikawa JL, Ketela T, Bellows D, et al: Harvesting the genome's bounty: integrative genomics. Cold Spring Harb Symp Quant Biol. 2003, 68: 431-443. 10.1101 / sqb.2003.68.431.

Uetz P, Giot L, Cagney G, Mansfield TA, Judson RS, Knight JR, Lockshon D, Narayan V, Srinivasan M, Pochart P, et al: Un análisis completo de las interacciones proteína-proteína en Saccharomyces cerevisiae. Naturaleza. 2000, 403: 623-627. 10.1038 / 35001009.

Ito T, Tashiro K, Muta S, Ozawa R, Chiba T, Nishizawa M, Yamamoto K, Kuhara S, Sakaki Y: Hacia un mapa de interacción proteína-proteína de la levadura en ciernes: un sistema integral para examinar las interacciones de dos híbridos en todos posibles combinaciones entre las proteínas de levadura. Proc Natl Acad Sci USA. 2000, 97: 1143-1147. 10.1073 / pnas.97.3.1143.

Ito T, Chiba T, Ozawa R, Yoshida M, Hattori M, Sakaki Y: un análisis completo de dos híbridos para explorar el interactoma de la proteína de levadura. Proc Natl Acad Sci USA. 2001, 98: 4569-4574. 10.1073 / pnas.061034498.

Ho Y, Gruhler A, Heilbut A, Bader GD, Moore L, Adams SL, Millar A, Taylor P, Bennett K, Boutilier K, et al: Identificación sistemática de complejos de proteínas en Saccharomyces cerevisiae por espectrometría de masas. Naturaleza. 2002, 415: 180-183. 10.1038 / 415180a.

Gavin AC, Bosche M, Krause R, Grandi P, Marzioch M, Bauer A, Schultz J, Rick JM, Michon AM, Cruciat CM, et al: Organización funcional del proteoma de levadura mediante análisis sistemático de complejos de proteínas. Naturaleza. 2002, 415: 141-147. 10.1038 / 415141a.

Tong AH, Evangelista M, Parsons AB, Xu H, Bader GD, Page N, Robinson M, Raghibizadeh S, Hogue CW, Bussey H, et al: Análisis genético sistemático con matrices ordenadas de mutantes por deleción de levadura. Ciencias. 2001, 294: 2364-2368. 10.1126 / science.1065810.

Ooi SL, Shoemaker DD, Boeke JD: Red de interacción de genes de ADN helicasa definida usando letalidad sintética analizada por microarrays. Nat Genet. 2003, 35: 277-286. 10.1038 / ng1258.

Tong AH, Lesage G, Bader GD, Ding H, Xu H, Xin X, Young J, Berriz GF, Brost RL, Chang M, et al: Mapeo global de la red de interacción genética de levadura. Ciencias. 2004, 303: 808-813. 10.1126 / science.1091317.

Pan X, Yuan DS, Xiang D, Wang X, Sookhai-Mahadeo S, Bader JS, Hieter P, Spencer F, Boeke JD: un conjunto de herramientas robusto para el perfil funcional del genoma de la levadura. Mol Cell. 2004, 16: 487-496. 10.1016 / j.molcel.2004.09.035.

Giot L, Bader JS, Brouwer C, Chaudhuri A, Kuang B, Li Y, Hao YL, Ooi CE, Godwin B, Vitols E, et al: Un mapa de interacción de proteínas de Drosophila melanogaster. Ciencias. 2003, 302: 1727-1736. 10.1126 / science.1090289.

Li S, Armstrong CM, Bertin N, Ge H, Milstein S, Boxem M, Vidalain PO, Han JD, Chesneau A, Hao T, et al: Un mapa de la red interactoma del metazoo C. elegans. Ciencias. 2004, 303: 540-543. 10.1126 / science.1091403.

Stelzl U, Worm U, Lalowski M, Haenig C, Brembeck FH, Goehler H, Stroedicke M, Zenkner M, Schoenherr A, Koeppen S, et al: Una red de interacción proteína-proteína humana: un recurso para anotar el proteoma. Celda. 2005, 122: 957-968. 10.1016 / j.cell.2005.08.029.

Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, Berriz GF, Gibbons FD, Dreze M, Ayivi-Guedehoussou N, et al: Hacia un mapa a escala de proteoma de la interacción proteína-proteína humana la red. Naturaleza. 2005, 437: 1173-1178. 10.1038 / nature04209.

Barabasi AL, Albert R: Aparición del escalado en redes aleatorias. Ciencias. 1999, 286: 509-512. 10.1126 / science.286.5439.509.

Albert R, Jeong H, Barabasi AL: tolerancia a errores y ataques de redes complejas. Naturaleza. 2000, 406: 378-382. 10.1038 / 35019019.

Wagner A: ¿Moldea la selección las redes moleculares ?. Sci STKE. 2003, 2003: PE41-

Watts DJ, Strogatz SH: Dinámica colectiva de las redes del 'mundo pequeño'. Naturaleza. 1998, 393: 440-442. 10.1038 / 30918.

Jeong H, Mason SP, Barabasi AL, Oltvai ZN: letalidad y centralidad en las redes de proteínas. Naturaleza. 2001, 411: 41-42. 10.1038 / 35075138.

Wagner A: La red de interacción de proteínas de levadura evoluciona rápidamente y contiene pocos genes duplicados redundantes. Mol Biol Evol. 2001, 18: 1283-1292.

Shen-Orr SS, Milo R, Mangan S, Alon U: motivos de red en la red de regulación transcripcional de Escherichia coli. Nat Genet. 2002, 31: 64-68. 10.1038 / ng881.

Zhang LV, King OD, Wong SL, Goldberg DS, Tong AH, Lesage G, Andrews B, Bussey H, Boone C, Roth FP: motivos, temas y mapas temáticos de un Saccharomyces cerevisiae red de interacción. J Biol. 2005, 4: 6-10.1186 / jbiol23.

Ge H, Liu Z, Church GM, Vidal M: Correlación entre los datos de mapeo de transcriptoma e interactoma de Saccharomyces cerevisiae. Nat Genet. 2001, 29: 482-486. 10.1038 / ng776.

Jansen R, Yu H, Greenbaum D, Kluger Y, Krogan NJ, Chung S, Emili A, Snyder M, Greenblatt JF, Gerstein M: Un enfoque de redes bayesianas para predecir interacciones proteína-proteína a partir de datos genómicos. Ciencias. 2003, 302: 449-453. 10.1126 / science.1087361.

Troyanskaya OG, Dolinski K, Owen AB, Altman RB, Botstein D: Un marco bayesiano para combinar fuentes de datos heterogéneas para la predicción de la función genética (en Saccharomyces cerevisiae). Proc Natl Acad Sci USA. 2003, 100: 8348-8353. 10.1073 / pnas.0832373100.

Lee I, Date SV, Adai AT, Marcotte EM: una red funcional probabilística de genes de levadura. Ciencias. 2004, 306: 1555-1558. 10.1126 / science.1099511.

Wong SL, Zhang LV, Tong AH, Li Z, Goldberg DS, King OD, Lesage G, Vidal M, Andrews B, Bussey H, et al: Combinación de redes biológicas para predecir interacciones genéticas. Proc Natl Acad Sci USA. 2004, 101: 15682-15687. 10.1073 / pnas.0406614101.

Sharan R, Suthram S, Kelley RM, Kuhn T, McCuine S, Uetz P, Sittler T, Karp RM, Ideker T: Patrones conservados de interacción de proteínas en múltiples especies. Proc Natl Acad Sci USA. 2005, 102: 1974-1979. 10.1073 / pnas.0409522102.

Myers CL, Robson D, Wible A, Hibbs MA, Chiriac C, Theesfeld CL, Dolinski K, Troyanskaya OG: Descubrimiento de redes biológicas a partir de diversos datos genómicos funcionales. Biología del genoma. 2005, 6: R114-10.1186 / gb-2005-6-13-r114.

von Mering C, Krause R, Snel B, Cornell M, Oliver SG, Fields S, Bork P: Evaluación comparativa de conjuntos de datos a gran escala de interacciones proteína-proteína. Naturaleza. 2002, 417: 399-403. 10.1038 / nature750.

Bader GD, Hogue CW: Análisis de datos de interacción proteína-proteína de levadura obtenidos de diferentes fuentes. Nat Biotechnol. 2002, 20: 991-997. 10.1038 / nbt1002-991.

Mrowka R, Patzak A, Herzel H: ¿Existe un sesgo en la investigación del proteoma ?. Genome Res. 2001, 11: 1971-1973. 10.1101 / gr.206701.

Hodges PE, Payne WE, Garrels JI: The Yeast Protein Database (YPD): una base de datos de proteomas curada para Saccharomyces cerevisiae. Ácidos nucleicos Res. 1998, 26: 68-72. 10.1093 / nar / 26.1.68.

Mewes HW, Frishman D, Guldener U, Mannhaupt G, Mayer K, Mokrejs M, Morgenstern B, Munsterkotter M, Rudd S, Weil B: MIPS: una base de datos para genomas y secuencias de proteínas. Ácidos nucleicos Res. 2002, 30: 31-34. 10.1093 / nar / 30.1.31.

Zanzoni A, Montecchi-Palazzi L, Quondam M, Ausiello G, Helmer-Citterich M, Cesareni G: MINT: a Molecular INTeraction database. FEBS Lett. 2002, 513: 135-140. 10.1016 / S0014-5793 (01) 03293-8.

Hermjakob H, Montecchi-Palazzi L, Lewington C, Mudali S, Kerrien S, Orchard S, Vingron M, Roechert B, Roepstorff P, Valencia A, et al: IntAct: una base de datos de interacción molecular de código abierto. Ácidos nucleicos Res. 2004, 32 (Problema de la base de datos): D452-D455. 10.1093 / nar / gkh052.

Xenarios I, Salwinski L, Duan XJ, Higney P, Kim SM, Eisenberg D: DIP, la base de datos de proteínas que interactúan: una herramienta de investigación para estudiar las redes celulares de interacciones de proteínas. Ácidos nucleicos Res. 2002, 30: 303-305. 10.1093 / nar / 30.1.303.

Bader GD, Betel D, Hogue CW: BIND: la base de datos de la red de interacción biomolecular. Ácidos nucleicos Res. 2003, 31: 248-250. 10.1093 / nar / gkg056.

Peri S, Navarro JD, Amanchy R, Kristiansen TZ, Jonnalagadda CK, Surendranath V, Niranjan V, Muthusamy B, Gandhi TK, Gronborg M, et al: Desarrollo de una base de datos de referencia de proteínas humanas como plataforma inicial para abordar la biología de sistemas en humanos. Genome Res. 2003, 13: 2363-2371. 10.1101 / gr.1680803.

Stark C, Breitkreutz BJ, Reguly T, Boucher L, Breitkreutz A, Tyers M: BioGRID: un repositorio general para conjuntos de datos de interacción. Ácidos nucleicos Res. 2006, 34 (Problema de la base de datos): D535-D539. 10.1093 / nar / gkj109.

Consorcio Internacional de Intercambio Molecular. [http://imex.sourceforge.net]

Hermjakob H, Montecchi-Palazzi L, Bader G, Wojcik J, Salwinski L, Ceol A, Moore S, Orchard S, Sarkans U, von Mering C, et al: El formato de interacción molecular de HUPO PSI: un estándar comunitario para la representación de datos de interacción de proteínas. Nat Biotechnol. 2004, 22: 177-183. 10.1038 / nbt926.

Harris MA, Clark J, Irlanda A, Lomax J, Ashburner M, Foulger R, Eilbeck K, Lewis S, Marshall B, Mungall C, et al: La base de datos y el recurso informático de Gene Ontology (GO). Ácidos nucleicos Res. 2004, 32 (Edición de la base de datos): D258-261.

Drabkin HJ, Hollenbeck C, Hill DP, Blake JA: Visualización ontológica de interacciones proteína-proteína. BMC Bioinformática. 2005, 6: 29-10.1186 / 1471-2105-6-29.

Krallinger M, Valencia A: Servicios de minería de textos y recuperación de información para biología molecular. Genome Biol. 2005, 6: 224-10.1186 / gb-2005-6-7-224.

Christie KR, Weng S, Balakrishnan R, Costanzo MC, Dolinski K, Dwight SS, Engel SR, Feierbach B, Fisk DG, Hirschman JE, et al: Saccharomyces Genome Database (SGD) proporciona herramientas para identificar y analizar secuencias de Saccharomyces cerevisiae y secuencias relacionadas de otros organismos. Ácidos nucleicos Res. 2004, 32 (Problema de la base de datos): D311-D314. 10.1093 / nar / gkh033.

Kellis M, Patterson N, Endrizzi M, Birren B, Lander ES: Secuenciación y comparación de especies de levadura para identificar genes y elementos reguladores. Naturaleza. 2003, 423: 241-254. 10.1038 / nature01644.

Breitkreutz BJ, Stark C, Tyers M: The GRID: the General Repository for Interaction Datasets. Genome Biol. 2003, 4: R23-10.1186 / gb-2003-4-3-r23.

Han JD, Bertin N, Hao T, Goldberg DS, Berriz GF, Zhang LV, Dupuy D, Walhout AJ, Cusick ME, Roth FP, Vidal M: Evidencia de modularidad organizada dinámicamente en la red de interacción proteína-proteína de levadura. Naturaleza. 2004, 430: 88-93. 10.1038 / nature02555.

Hoffmann R, Valencia A: Ciclos de vida de genes exitosos. Trends Genet. 2003, 19: 79-81. 10.1016 / S0168-9525 (02) 00014-8.

Tatusov RL, Fedorova ND, Jackson JD, Jacobs AR, Kiryutin B, Koonin EV, Krylov DM, Mazumder R, Mekhedov SL, Nikolskaya AN, et al: La base de datos de la COG: una versión actualizada incluye eucariotas. BMC Bioinformática. 2003, 4: 41-10.1186 / 1471-2105-4-41.

Decottignies A, Sánchez-Pérez I, Enfermera P: Schizosaccharomyces pombe genes esenciales: un estudio piloto. Genome Res. 2003, 13: 399-406. 10.1101 / gr.636103.

Koonin EV, Fedorova ND, Jackson JD, Jacobs AR, Krylov DM, Makarova KS, Mazumder R, Mekhedov SL, Nikolskaya AN, Rao BS, et al: Una clasificación evolutiva integral de proteínas codificadas en genomas eucariotas completos. Genome Biol. 2004, 5: R7-10.1186 / gb-2004-5-2-r7.

Grigoriev A: Sobre el número de interacciones proteína-proteína en el proteoma de levadura. Ácidos nucleicos Res. 2003, 31: 4157-4161. 10.1093 / nar / gkg466.

Davierwala AP, Haynes J, Li Z, Brost RL, Robinson MD, Yu L, Mnaimneh S, Ding H, Zhu H, Chen Y, et al: El espectro de interacción genética sintética de genes esenciales. Nat Genet. 2005, 37: 1147-1152. 10.1038 / ng1640.

Tanaka R, Yi TM, Doyle J: Algunos datos de interacción de proteínas no muestran estadísticas de la ley de potencia. FEBS Lett. 2005, 579: 5140-5144. 10.1016 / j.febslet.2005.08.024.

Pereira-Leal JB, Audit B, Peregrin-Alvarez JM, Ouzounis CA: Un núcleo exponencial en el corazón de la red de interacción de proteínas de levadura. Mol Biol Evol. 2005, 22: 421-425. 10.1093 / molbev / msi024.

Maslov S, Sneppen K: Especificidad y estabilidad en topología de redes de proteínas. Ciencias. 2002, 296: 910-913. 10.1126 / science.1065103.

Kelley R, Ideker T: interpretación sistemática de interacciones genéticas utilizando redes de proteínas. Nat Biotechnol. 2005, 23: 561-566. 10.1038 / nbt1096.

Breitkreutz BJ, Stark C, Tyers M: Osprey: un sistema de visualización en red. Genome Biol. 2003, 4: R22-10.1186 / gb-2003-4-3-r22.

Ozier O, Amin N, Ideker T: Arquitectura global de interacciones genéticas en la red de proteínas. Nat Biotechnol. 2003, 21: 490-491. 10.1038 / nbt0503-490.

Ghaemmaghami S, Huh WK, Bower K, Howson RW, Belle A, Dephoure N, O'Shea EK, Weissman JS: Análisis global de la expresión de proteínas en levadura. Naturaleza. 2003, 425: 737-741. 10.1038 / nature02046.

Huh WK, Falvo JV, Gerke LC, Carroll AS, Howson RW, Weissman JS, O'Shea EK: Análisis global de la localización de proteínas en levadura en gemación. Naturaleza. 2003, 425: 686-691. 10.1038 / nature02026.

Batada NN, Shepp LA, Siegmund DO: Modelo estocástico de interacción proteína-proteína: por qué las proteínas de señalización necesitan ser colocalizadas. Proc Natl Acad Sci USA. 2004, 101: 6445-6449. 10.1073 / pnas.0401314101.

Ideker T, Thorsson V, Ranish JA, Christmas R, Buhler J, Eng JK, Bumgarner R, Goodlett DR, Aebersold R, Hood L: Análisis genómicos y proteómicos integrados de una red metabólica sistemáticamente perturbada. Ciencias. 2001, 292: 929-934. 10.1126 / science.292.5518.929.

Hughes TR, Marton MJ, Jones AR, Roberts CJ, Stoughton R, Armor CD, Bennett HA, Coffey E, Dai H, He YD, et al: Descubrimiento funcional a través de un compendio de perfiles de expresión. Celda. 2000, 102: 109-126. 10.1016 / S0092-8674 (00) 00015-5.

Harbison CT, Gordon DB, Lee TI, Rinaldi NJ, Macisaac KD, Danford TW, Hannett NM, Tagne JB, Reynolds DB, Yoo J, et al: Código regulador transcripcional de un genoma eucariota. Naturaleza. 2004, 431: 99-104. 10.1038 / nature02800.

Bader GD, Hogue CW: un método automatizado para encontrar complejos moleculares en grandes redes de interacción de proteínas. BMC Bioinformática. 2003, 4: 2-10.1186 / 1471-2105-4-2.

Rives AW, Galitski T: Organización modular de redes celulares. Proc Natl Acad Sci USA. 2003, 100: 1128-1133. 10.1073 / pnas.0237338100.

Spirin V, Mirny LA: complejos de proteínas y módulos funcionales en redes moleculares. Proc Natl Acad Sci USA. 2003, 100: 12123-12128. 10.1073 / pnas.2032324100.

O'Brien KP, Remm M, Sonnhammer EL: Inparanoid: una base de datos completa de ortólogos eucariotas. Ácidos nucleicos Res. 2005, 33 (Problema de la base de datos): D476-D480. 10.1093 / nar / gki107.

Consorcio FlyBase: La base de datos FlyBase del Drosophila proyectos de genoma y literatura comunitaria. Ácidos nucleicos Res. 2003, 31: 172-175. 10.1093 / nar / gkg094.

Page JS, Masselon CD, Smith RD: Espectrometría de masas FTICR para bioanálisis cualitativos y cuantitativos. Curr Opin Biotechnol. 2004, 15: 3-11. 10.1016 / j.copbio.2004.01.002.

Vidalain PO, Boxem M, Ge H, Li S, Vidal M: aumento de la especificidad en experimentos de dos híbridos de levadura de alto rendimiento. Métodos. 2004, 32: 363-370. 10.1016 / j.ymeth.2003.10.001.

Przulj N, Corneil DG, Jurisica I: Modelado del interactoma: ¿sin escala o geométrico ?. Bioinformática. 2004, 20: 3508-3515. 10.1093 / bioinformatics / btg415.

Jordan IK, Rogozin IB, Wolf YI, Koonin EV: Los genes esenciales se conservan más evolutivamente que los genes no esenciales en las bacterias. Genome Res. 2002, 12: 962-968. 10.1101 / gr.87702. Artículo publicado en línea antes de su impresión en mayo de 2002.

Fraser HB, Hirsh AE, Steinmetz LM, Scharfe C, Feldman MW: tasa evolutiva en la red de interacción de proteínas. Ciencias. 2002, 296: 750-752. 10.1126 / science.1068696.

Jordan IK, Wolf YI, Koonin EV: No hay una dependencia simple entre la tasa de evolución de las proteínas y el número de interacciones proteína-proteína: solo los interactuantes más prolíficos tienden a evolucionar lentamente. BMC Evol Biol. 2003, 3: 1-10.1186 / 1471-2148-3-1.

Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabasi AL: Organización jerárquica de la modularidad en redes metabólicas. Ciencias. 2002, 297: 1551-1555. 10.1126 / science.1073374.

Schuldiner M, Collins SR, Thompson NJ, Denic V, Bhamidipati A, Punna T, Ihmels J, Andrews B, Boone C, Greenblatt JF, et al: Exploración de la función y organización de la vía secretora temprana de la levadura a través de un perfil de miniarray epistático . Celda. 2005, 123: 507-519. 10.1016 / j.cell.2005.08.031.

Ptacek J, Devgan G, Michaud G, Zhu H, Zhu X, Fasolo J, Guo H, Jona G, Breitkreutz A, Sopko R, et al: Análisis global de fosforilación de proteínas en levadura. Naturaleza. 2005, 438: 679-684. 10.1038 / nature04187.

Li F, Long T, Lu Y, Ouyang Q, Tang C: La red de ciclo celular de levadura tiene un diseño robusto. Proc Natl Acad Sci USA. 2004, 101: 4781-4786. 10.1073 / pnas.0305937101.

Ma'ayan A, Jenkins SL, Neves S, Hasseldine A, Grace E, Dubin-Thaler B, Eungdamrong NJ, Weng G, Ram PT, Rice JJ, et al: Formación de patrones reguladores durante la propagación de señales en una red celular de mamíferos. Ciencias. 2005, 309: 1078-1083. 10.1126 / science.1108876.

Joshi-Tope G, Gillespie M, Vastrik I, D'Eustachio P, Schmidt E, de Bono B, Jassal B, Gopinath GR, Wu GR, Matthews L, et al: Reactome: una base de conocimiento de vías biológicas. Ácidos nucleicos Res. 2005, 33 (problema de la base de datos): D428-D432. 10.1093 / nar / gki072.

Kanehisa M, Goto S: KEGG: Enciclopedia de genes y genomas de Kyoto. Ácidos nucleicos Res. 2000, 28: 27-30. 10.1093 / nar / 28.1.27.

Ramani AK, Bunescu RC, Mooney RJ, Marcotte EM: consolidación del conjunto de interacciones proteína-proteína humana conocidas en preparación para el mapeo a gran escala del interactoma humano. Genome Biol. 2005, 6: R40-10.1186 / gb-2005-6-5-r40.

Ideker T, Galitski T, Hood L: Un nuevo enfoque para decodificar la vida: biología de sistemas. Annu Rev Genomics Hum Genet. 2001, 2: 343-372. 10.1146 / annurev.genom.2.1.343.

Muller HM, Kenny EE, Sternberg PW: Textpresso: un sistema de extracción y recuperación de información basado en ontología para literatura biológica. PLoS Biol. 2004, 2: e309-10.1371 / journal.pbio.0020309.

Eisen MB, Spellman PT, Brown PO, Botstein D: análisis de conglomerados y visualización de patrones de expresión en todo el genoma. Proc Natl Acad Sci USA. 1998, 95: 14863-14868. 10.1073 / pnas.95.25.14863.

Bader JS, Chaudhuri A, Rothberg JM, Chant J: ganar confianza en las redes de interacción de proteínas de alto rendimiento. Nat Biotechnol. 2004, 22: 78-85. 10.1038 / nbt924.

Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin N, Schwikowski B, Ideker T: Cytoscape: un entorno de software para modelos integrados de redes de interacción biomolecular. Genome Res. 2003, 13: 2498-2504. 10.1101 / gr.1239303.

Donaldson I, Martin J, de Bruijn B, Wolting C, Lay V, Tuekam B, Zhang S, Baskin B, Bader GD, Michalickova K, et al: PreBIND y Textomy - extrayendo la literatura biomédica para interacciones proteína-proteína usando un soporte máquina de vectores. BMC Bioinformática. 2003, 4: 11-10.1186 / 1471-2105-4-11.

Zhu G, Spellman PT, Volpe T, Brown PO, Botstein D, Davis TN, Futcher B: dos genes forkhead de levadura regulan el ciclo celular y el crecimiento pseudohyphal. Naturaleza. 2000, 406: 90-94. 10.1038 / 35021046.

Yoshimoto H, Saltsman K, Gasch AP, Li HX, Ogawa N, Botstein D, Brown PO, Cyert MS: análisis de todo el genoma de la expresión génica regulada por la vía de señalización de calcineurina / Crz1p en Saccharomyces cerevisiae. J Biol Chem. 2002, 277: 31079-31088. 10.1074 / jbc.M202718200.

Gasch AP, Huang M, Metzner S, Botstein D, Elledge SJ, Brown PO: respuestas de expresión genómica a agentes que dañan el ADN y el papel regulador del homólogo de levadura ATR Mec 1p. Mol Biol Cell. 2001, 12: 2987-3003.

Gasch AP, Spellman PT, Kao CM, Carmel-Harel O, Eisen MB, Storz G, Botstein D, Brown PO: Programas de expresión genómica en la respuesta de las células de levadura a los cambios ambientales. Mol Biol Cell. 2000, 11: 4241-4257.

Spellman PT, Sherlock G, Zhang MQ, Iyer VR, Anders K, Eisen MB, Brown PO, Botstein D, Futcher B: identificación completa de genes de levadura regulados por el ciclo celular Saccharomyces cerevisiae por hibridación de microarrays. Mol Biol Cell. 1998, 9: 3273-3297.

Chu S, DeRisi J, Eisen M, Mulholland J, Botstein D, Brown PO, Herskowitz I: El programa transcripcional de esporulación en levadura en ciernes. Ciencias. 1998, 282: 699-705. 10.1126 / science.282.5389.699.

DeRisi JL, Iyer VR, Brown PO: Explorando el control metabólico y genético de la expresión génica a escala genómica. Ciencias. 1997, 278: 680-686. 10.1126 / science.278.5338.680.

Sudarsanam P, Iyer VR, Brown PO, Winston F: análisis de expresión del genoma completo de mutantes snf / swi de Saccharomyces cerevisiae. Proc Natl Acad Sci USA. 2000, 97: 3364-3369. 10.1073 / pnas.050407197.

Shakoury-Elizeh M, Tiedeman J, Rashford J, Ferea T, Demeter J, García E, Rolfes R, Brown PO, Botstein D, Philpott CC: remodelación transcripcional en respuesta a la privación de hierro en Saccharomyces cerevisiae. Mol Biol Cell. 2004, 15: 1233-1243. 10.1091 / mbc.E03-09-0642.

Ogawa N, DeRisi J, Brown PO: Nuevos componentes de un sistema para la acumulación de fosfato y el metabolismo de polifosfato en Saccharomyces cerevisiae revelado por análisis de expresión genómica. Mol Biol Cell. 2000, 11: 4309-4321.

Gavin AC, Aloy P, Grandi P, Krause R, Boesche M, Marzioch M, Rau C, Jensen LJ, Bastuck S, Dumpelfeld B, et al: La encuesta de proteomas revela la modularidad de la maquinaria de las células de levadura. Naturaleza. 2006, 440: 631-636.

Krogan NJ, Cagney G, Yu H, Zhong G, Guo X, Ignatchenko A, Li J, Pu S, Datta N, Tikuisis AP, et al: Panorama global de complejos de proteínas en la levadura Saccharomyces cerevisiae. Naturaleza. 2006, 440: 637-643.


Materiales y métodos

Usamos datos de publicación proporcionados por el Web de la Ciencia base de datos (www.webofknowledge.com), comprada con fines de investigación por algunos de los autores de esta publicación en 2013. La base de datos incluye varios tipos de resultados científicos, como artículos, cartas, reseñas, editoriales y resúmenes de 1898 a 2012 en más más de 22.000 revistas científicas de amplios dominios, lo que da como resultado un conjunto de más de 50 millones de artículos. Para cada artículo, el conjunto de datos incluye más información sobre la fecha de publicación (mes, día, año), el nombre de la revista y el número de la revista, los nombres de los autores con el orden en que aparecen en el artículo, sus afiliaciones y las referencias a artículos anteriores indexados. en la base de datos. Para Naturaleza descargamos el historial de publicaciones completo usando el Naturaleza Interfaz de programación de aplicaciones opensearch.

Para nuestro análisis, nos centramos en publicaciones de 1960 a 2012 publicadas en revistas interdisciplinarias (Naturaleza, Ciencias, y PNAS), así como en revistas asociadas a cinco campos científicos distintos: medicina, biología, matemáticas, química y física. Para identificar las revistas que pertenecen a cada categoría, primero analizamos páginas dedicadas de Wikipedia que contienen listas de nombres de revistas asociadas a campos científicos específicos y luego las comparamos con las revistas en la base de datos (31). En total, identificamos 97 revistas de biología, 337 de medicina, 243 de física, 248 de matemáticas, 138 de química y 3 revistas interdisciplinarias.

A continuación, extrajimos las publicaciones asociadas a cada una de estas revistas categorizadas. Para asegurarnos de tratar con la investigación original, recopilamos solo publicaciones etiquetadas como artículos, cartas y reseñas y que no tenían un título que contuviera los términos comentario, respuesta, errata o artículo retirado. Además, para tener suficientes estadísticas, solo se tuvieron en cuenta para nuestro análisis las revistas categorizadas que cumplían los siguientes criterios: Las publicaciones recopiladas asociadas a la revista abarcan un período de al menos 10 años, al menos 1000 publicaciones recopiladas se publicaron en la revista en general. , y al menos 100 publicaciones recopiladas se publicaron cada año en la revista.

Después de este preprocesamiento, nuestros datos ascienden a (I) 795.558 publicaciones de 40 revistas de biología, (ii) 1.350.936 publicaciones de 128 revistas de medicina, (iii) 1.753.641 publicaciones de 117 revistas de física, (iv) 208.223 publicaciones de 26 revistas de matemáticas, (v) 1.341.150 publicaciones de 72 revistas de química, y (vi) 251.294 publicaciones de Naturaleza, Ciencias, y PNAS. Los datos sobre la proporción de IP nuevos, establecidos y supervisados ​​a lo largo del tiempo y los valores de c, C y C a l p h a b e t se proporcionan para cada revista en GitHub (https://github.com/SocialComplexityLab/chaperone-open). Datos brutos de Web de la Ciencia no se puede compartir públicamente en la web, pero ofrecemos la posibilidad de reproducir nuestros resultados a partir de registros sin procesar haciendo una visita de investigación a Northeastern University o Central European University, donde los datos son accesibles. Datos sobre la revista Naturaleza se puede descargar gratis desde Naturaleza opensearch (https://www.nature.com/opensearch/).

Desambiguación del nombre del autor.

Formateamos todos los nombres de los autores presentes en las publicaciones recopiladas a minúsculas y convertimos sus nombres solo en la primera letra. Un autor llamado "John Smith" o "Mary Suzy Johnson" se convertiría así al formato "smith, j" o "johnson, ms", respectivamente. Consideramos que la secuencia de publicaciones dentro de la misma revista y autorizadas por un nombre formateado idéntico corresponde al mismo individuo. Esperamos que los errores inducidos por homónimos, es decir, individuos distintos que comparten el mismo nombre formateado, sean bajos, ya que solo comparamos nombres dentro de la misma revista. Por lo tanto, un error solo puede ocurrir si dos individuos distintos comparten el mismo nombre formateado y evolucionan en el mismo campo científico, es decir, la misma revista, que ya es una característica precisa de eliminación de ambigüedades (32).

Robustez de los resultados al orden alfabético.

En ciertos campos científicos es común ordenar a los autores alfabéticamente (17). Por tanto, para entender cómo afecta esto a los resultados, realizamos dos versiones de nuestro análisis: una, teniendo en cuenta todas las publicaciones, y otra, una versión en la que hemos descartado las publicaciones donde los autores están ordenados alfabéticamente. Esto elimina el 17,7% de todas las publicaciones dentro de la biología, el 14,4% dentro de la medicina, el 30,9% dentro de la física, el 75,1% dentro de las matemáticas, el 23,3% dentro de la química y el 20,8% dentro de las revistas interdisciplinarias. Tenga en cuenta que estos números incluyen publicaciones donde los autores están ordenados por elección, pero también publicaciones donde esto ocurrió por casualidad. No obstante, nuestras conclusiones son sólidas para ambos conjuntos de datos, de acuerdo con el resultado que se muestra en la Figura 2 de que existe una diferencia significativa entre el C observado y el del modelo alfabético nulo C a l p h a b e t (Apéndice SI, Fig. S5).


Ver el vídeo: Vídeo 06: Bases de Datos de Publicaciones Científicas (Mayo 2022).