Secuenciación de ARN, una joven realidad

ISSN 2660-9134 | Febrero 2021 | Volumen 7 | Artículo 4
RNA-seq (del inglés ribonucleic acid sequencing) (Stark et al., 2019) o secuenciación del ácido ribonucleico (ARN) es una técnica con no más de una década, cuyo uso se ha ido extendiendo e integrando en los laboratorios como una más con el paso de los años. Gracias a ella, se han hecho grandes avances en la comunidad científica, principalmente en el ámbito de la biología molecular. Por ejemplo, se ha podido aplicar en distintos organismos como los famosos ratones de laboratorio (Mus musculus) (Mortazavi et al., 2008) o la levadura de cerveza (Saccharomyces cerevisiae) (Nagalakshmi et al., 2008).

Con esta información pueden surgir las siguientes preguntas: ¿Para qué sirve esta técnica? ¿Es fácil de usar? Vayamos por pasos. Una célula posee en su interior material genético, es decir, las instrucciones necesarias para el correcto funcionamiento del organismo. Esas instrucciones se encuentran codificadas en el ácido desoxirribonucleico (ADN) hasta el momento en el que la célula las necesite, y esas necesidades no siempre serán las mismas. El proceso de descodificación se denomina transcripción y el resultado es ARN. A todas las moléculas de ARN que se encuentran en la célula en un momento determinado se le denomina transcriptoma. Mediante la técnica RNA-seq se puede analizar el transcriptoma, es decir, el conjunto de genes que se expresan en un tejido o tipo celular determinado en función de las condiciones en las que se encuentre.

Ahora bien, para poder detectar los cambios de expresión génica en una célula o tejido determinado, son necesarias tanto técnicas de laboratorio para su detección como análisis computacionales para su interpretación. Los primeros pasos se dan en el propio laboratorio, donde se obtiene la información decodificada (ARN) de las distintas muestras de células, mediante la preparación de librerías de secuenciación que almacenan la información de esas muestras para ser analizadas mediante técnicas de secuenciación. Una vez hecho esto, se lleva a cabo un análisis computacional de los datos de secuenciación obtenidos (lecturas) y, mediante herramientas computacionales, se comprueba si hay cambios significativos en los niveles de expresión genética.

Para la secuenciación de ARN se pueden emplear dos técnicas. Por un lado, los microarrays que fueron los primeros y más conocidos en la comunidad científica; y por otro lado las tecnologías de secuenciación, entre las que cabe destacar la tecnología Illumina. Existen diferencias notables entre ambas, siendo una de las principales ventajas de Illumina la alta especificidad y sensibilidad, lo que permite detectar un mayor número de genes, incluso aquellos que se transcriben en un menor grado. Mientras que con los microarrays, a pesar de ser una técnica más barata, su capacidad de detección de genes es más limitada. Del mismo modo, otra de las ventajas que ofrecen las tecnologías de secuenciación frente al uso de microarrays es la detección de nuevos transcritos al no requerir sondas (oligonucleótidos de ADN complementario) previamente diseñadas.

La tecnología de secuenciación de Illumina requiere la preparación de la librería de secuenciación, que parte de la fragmentación del ARN y la unión de adaptadores. Posteriormente se realiza una amplificación por PCR (del inglés polymerase chain reaction) hasta la obtención de las lecturas (denominadas short-read, de hasta 250 pares de bases). A partir de los archivos de lecturas, el procesamiento computacional de las muestras consiste en la limpieza de las lecturas (eliminación de secuencias de adaptadores, de lecturas de baja calidad o redundantes), control de calidad, alineamiento contra un genoma o transcriptoma de referencia y el análisis de expresión diferencial.

La limitación que presenta el uso de lecturas cortas obtenidas por la tecnología de secuenciación Illumina reside en la naturaleza del tamaño de las cadenas de nucleótidos, muy superiores a los 250 pares de bases. Secuenciar los fragmentos amplificados puede complicar el conteo de las secuencias de genes originales. Existen otras tecnologías que no requieren amplificación por PCR (consideradas como tecnologías de secuenciación de tercera generación) y que permiten la obtención de lecturas de mayor tamaño, denominadas long-read.

Con respecto a las lecturas long-read, pueden obtenerse mediante las tecnologías de Pacific Biosciences (PacBio) y Oxford Nanopore. El problema de estas lecturas es que su generación tiene un rendimiento menor y una tasa de error más elevada con respecto a las de generación de short-reads. Esto puede afectar a la sensibilidad y especificidad de los experimentos, limitando su capacidad de detectar cambios significativos en los niveles de expresión génica.

La comunidad científica, al encontrarse con este problema, recurrió a la combinación de las tecnologías de secuenciación de short-reads de Illumina con las de obtención de long-reads de PacBio. Los resultados demostraron que tanto la especificidad como la sensibilidad aumentaban, al igual que permitían llevar a cabo un mayor número de experimentos. No obstante, a día de hoy sigue dominando la técnica de short-read sequencing de Illumina.

La siguiente cuestión que se plantea es: ¿Para qué se usan estas técnicas? Se conocen múltiples usos para la técnica de RNA-seq, así que en esta revisión nos centraremos en tres de ellos (Hrdlickova et al., 2017).

El primer uso consiste en la secuenciación del ARN para analizar el ayuste alternativo y la fusión genética. Cuando se habla de splicing alternativo se hace referencia a la capacidad que tiene la célula de obtener distintas proteínas usando como molde un único gen. Esto es muy importante en la regulación de los procesos celulares y cualquier modificación en ellos conlleva que se produzcan enfermedades, como la atrofia muscular espinal o la retinitis pigmentosa entre otras. En este caso, para secuenciar las regiones de unión exón-exón se emplea la técnica RASL-Seq (Li et al., 2012). Es una técnica ofrecida por Illumina cuyo objetivo es cuantificar perfiles de expresión de genes en distintas condiciones.

En cuanto a la fusión genética, consiste en la unión de regiones genómicas que no se encuentran continuas en un solo evento de transcripción. Estos eventos suelen darse en aproximadamente el 20% de distintos tipos de cáncer. Sin embargo, las técnicas de RNA-seq por sí solas no son capaces de detectar estas fusiones, por lo que es necesario amplificar (mediante PCR) las lecturas de RNA-seq de los genes que se vayan a analizar, capturar los exones o secuenciar los amplicones.

La solución definitiva tanto para el splicing alternativo como para la fusión de genes consta de dos estrategias. La primera, la secuenciación en tiempo real de una sola molécula (SMRT) que ofrece la tecnología PacBio, aunque es algo costoso y con una alta tasa de error. Y la segunda, la secuenciación sintética de ARN de lectura larga (SLR-RNA-Seq), la cual es capaz de proporcionar lecturas más largas y detectar isoformas.

Otra de las aplicaciones de la tecnología RNA-seq es la secuenciación de ARN dirigido (targeted RNA-Seq), que consiste en la secuenciación de transcriptomas específicos. Es un método muy versátil que suele usarse para caracterizar la expresión de genes, mutaciones, fusión de genes y ARN no codificantes (Martin et al., 2016). Uno de los usos más comunes es para la detección del cáncer, debido a que muchos de ellos se desarrollan como consecuencia de una fusión de genes, por lo que esta técnica es una buena herramienta de detección precoz (Heyer et al., 2019).

Finalmente, mediante la técnica de Single-cell RNA sequencing (scRNA-seq) (Olsen & Baryawno, 2018) se puede analizar el transcriptoma de una única célula, con el fin de comprender el patrón de expresión génica de la misma ante una determinada situación o estadío del desarrollo. Esta técnica es fundamental para conocer perfiles de expresión de células determinadas en distintos tejidos. Asimismo, permite conocer con exactitud qué genes pueden estar asociados a una enfermedad al comparar cuáles se sobreexpresan ante una condición determinada en comparación con los de otras células control. La única desventaja que presenta esta técnica es la escasa cantidad de material genético para analizar, precisando una correcta amplificación para que su detección sea significativa. Como ejemplo de estas técnicas de detección, el método TIVA (de sus siglas en inglés Transcriptome in vivo analysis) permite que una serie de compuestos químicos se unan a las moléculas de ARN mensajero (ARNm) de las células fijadas para, mediante técnicas de fotoactivación, se emita una señal captada por un microscopio confocal. Con la señal de ARNm detectada, se procede a su extracción, purificación y posterior análisis mediante técnicas de RNA-seq.

En resumen, la técnica de RNA-Seq permite el análisis del transcriptoma tanto para ver qué genes se expresan en una condición determinada, como para analizar variantes de ayuste o posibles fusiones génicas que dan lugar a enfermedades. Esta técnica ha supuesto una revolución para el conocimiento científico, y gracias a sus avances en los últimos años ha permitido ahondar en el conocimiento de las funciones de los genes en múltiples organismos.

REFERENCIAS

Heyer, E. E., Deveson, I. W., Wooi, D., Selinger, C. I., Lyons, R. J., Hayes, V. M., O’Toole, S. A., Ballinger, M. L., Gill, D., Thomas, D. M., Mercer, T. R., & Blackburn, J. (2019). Diagnosis of fusion genes using targeted RNA sequencing. Nature Communications, 10(1). https://doi.org/10.1038/s41467-019-09374-9
Hrdlickova, R., Toloue, M., & Tian, B. (2017). RNA-Seq methods for transcriptome analysis. In Wiley Interdisciplinary Reviews: RNA (Vol. 8, Issue 1). https://doi.org/10.1002/wrna.1364
Li, H., Qiu, J., & Fu, X. D. (2012). RASL-seq for Massively Parallel and Quantitative Analysis of Gene Expression. Current Protocols in Molecular Biology, 1(SUPPL.98). https://doi.org/10.1002/0471142727.mb0413s98
Martin, D. P., Miya, J., Reeser, J. W., & Roychowdhury, S. (2016). Targeted RNA sequencing assay to characterize gene expression and genomic alterations. Journal of Visualized Experiments, 2016(114). https://doi.org/10.3791/54090
Mortazavi, A., Williams, B. A., McCue, K., Schaeffer, L., & Wold, B. (2008). Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature Methods, 5(7), 621–628. https://doi.org/10.1038/nmeth.1226
Nagalakshmi, U., Wang, Z., Waern, K., Shou, C., Raha, D., Gerstein, M., & Snyder, M. (2008). The transcriptional landscape of the yeast genome defined by RNA sequencing. Science, 320(5881), 1344–1349. https://doi.org/10.1126/science.1158441
Olsen, T. K., & Baryawno, N. (2018). Introduction to Single-Cell RNA Sequencing. Current Protocols in Molecular Biology, 122(1). https://doi.org/10.1002/cpmb.57
Stark, R., Grzelak, M., & Hadfield, J. (2019). RNA sequencing: the teenage years. In Nature Reviews Genetics (Vol. 20, Issue 11, pp. 631–656). https://doi.org/10.1038/s41576-019-0150-2

Documentación

Autora: Irene Victoria Bermúdez Pérez y coordinadora: Elena Rojano Rivera para My Scientific Journal Bioinformatic 08/02/2020
 
Irene Victoria Bermúdez Pérez
Irene Victoria Bermúdez PérezRedactora My Scientific Journal
Graduada en Biología | Máster en Bioinformática y Bioestadística
Elena Rojano Rivera
Elena Rojano RiveraCoordinadora My Scientific Journal
PhD en Biología Celular y Molecular, especializada en bioinformática y biología de sistemas