Redes de coexpresión de genes: una valiosa herramienta para el análisis funcional.

ISSN 2660-9134 | Febrero 2021 | Volumen 7 | Artículo 7

Predecir e identificar la función de genes a partir de la secuencia de un genoma constituye un verdadero reto para los investigadores. Ante la dificultad de determinar experimentalmente la función de la gran mayoría de genes, es preciso utilizar otras aproximaciones que permitan expandir el estado actual de las anotaciones funcionales de los mismos. En este sentido, las redes de coexpresión de genes (GCN) permiten agrupar a los genes en patrones de expresión similar bajo unas condiciones determinadas, lo que puede indicar una relación funcional entre ellos. En los últimos años, se le ha dado una vuelta de tuerca más a este concepto, pasando de unas redes “globales” a unas redes específicas de contexto. De esta manera, es posible afinar el estudio funcional de estos genes dentro de un contexto biológico concreto, como puede ser el desarrollo o la respuesta a estrés.

La construcción de estas redes de coexpresión de genes comienza conectando pares de genes que presentan una alta correlación entre sus perfiles de expresión. Lo ideal es utilizar un gran número de muestras para establecer estas correlaciones; y en este sentido, existen repositorios públicos como “Gene Expression Omnibus” (GEO), desde los cuales podemos acceder esa gran cantidad de datos necesarios para calcular estas correlaciones estadísticamente significativas. El segundo paso consiste en establecer redes o módulos agrupando aquellos pares que guardan una relación entre sí.

Esta agrupación en redes, módulos, es posible gracias a algoritmos como el análisis GCN ponderado (WCGNA). Este algoritmo en concreto se ha utilizado con éxito, llevando a la conclusión de que se trata de un método rápido y fácil para procesar nuevos transcriptomas. Un ejemplo de ello es la identificación del papel de un gen de la familia del citocromo P450 que aumenta el tamaño y el peso de las semillas tras su sobreexpresión. Para ello se analizaron mediante el algoritmo WCGNA el perfil transcriptómico de dos cultivares de soja en el contexto específico del desarrollo de las semillas.

El problema de este método es que recupera pocos módulos, conteniendo cada uno de ellos un gran número de genes. De esta manera, es difícil entender la relación funcional y la regulación del módulo. Por ello se cree que muchos transcriptomas están infrautilizados en cuanto a la recuperación de información biológicamente relevante. El caso contrario, es decir, un algoritmo que recupere módulos demasiado pequeños (menos de 10 genes), dificulta el proceso estadístico asignación funcional o reguladora del módulo. Por ello, es especialmente importante un equilibrio entre la cantidad de módulos, el tamaño promedio del módulo y otras características topológicas de la red, tales como la separación y la densidad.

Una vez obtenidas las redes, hay que dotarlas de un significado biológico funcional. Algunos de los genes que forman parte del módulo predicho ya tienen una función conocida. Para ello hay que utilizar métodos de análisis de conjuntos de genes que permitan saber qué genes ya están descritos funcionalmente en catálogos de anotaciones como la ontología genética (GO) o MapMan. Al enriquecer el módulo funcionalmente, es posible generar nuevas hipótesis comprobables, como la predicción de la función de aquellos genes aún no anotados. Por decirlo de otra forma, estas GCN permiten propagar y ampliar la información funcional de los genes del módulo predicho.

Figura 1: Pasos para la construcción de redes de coexpresión de genes específicas de contexto
Figura 1: Pasos para la construcción de redes de coexpresión de genes específicas de contexto

Como se puede intuir, el desarrollo de estas redes de coexpresión de genes específicas de contexto se está convirtiendo en una herramienta de gran valor para los análisis funcionales. Uno de los motivos es que se trata de técnicas con un amplio margen de mejora, tanto a nivel estadístico como a nivel de predicción y evaluación. Un ejemplo reciente son las conocidas como redes reguladoras de genes modulares (GRN). Se trata de nuevos algoritmos de ingeniería inversa que permiten incorporar información sobre interacciones reguladoras, lo que permite diferenciar los factores de transcripción dentro de la red en estudio. Además, hay que tener en cuenta que todos estos métodos se nutren de las anotaciones funcionales preexistentes. De esta manera, entramos en un ciclo de retroalimentación positiva en la que, al generar conocimiento, estamos inherentemente contribuyendo a un perfeccionamiento del método. Por todo ello, no sería de extrañar que en los próximos años seamos testigos de un importante aumento de publicaciones utilizando este tipo de aproximaciones.

REFERENCIAS

Gupta, C., & Pereira, A. (2019). Recent advances in gene function prediction using context-specific coexpression networks in plants. F1000Research8.

Documentación

Autor: Fernando Palencia Ortega y coordinadora: Elena Rojano Rivera para My Scientific Journal Bioinformatic 08/02/2020
 
Fernando Palencia Ortega
Fernando Palencia OrtegaRedactor My Scientific Journal
Bioquímica y Biotecnología | Responsable de contenidos en AvoGo Consulting
Rocío Bautista Moreno
Rocío Bautista MorenoCoordinadora My Scientific Journal
PhD Plataforma Andaluza de Bioinformática - SCBI Universidad de Málaga