Hablamos con Dietmar Fernández Orth sobre la EGA

ISSN 2660-9134 | Abril 2021 | Volumen 8 | Artículo 4
La EGA aporta diversas herramientas para combatir los retos que existen actualmente en el sistema de salud. Por ejemplo, facilita la distribución de datos entre diferentes países, permite que el acceso a ellos sea de una manera rápida y que la comunicación sea más fluida entre distintos centros, aporta una gran capacidad computacional y mantiene toda la información sobre los más estrictos estándares de confidencialidad y privacidad.

Además, este repositorio de datos participa en una gran cantidad de proyectos, que aumentan cada año, y que cada vez están más relacionados con la medicina personalizada.

Con el fin de saber más sobre la EGA y sus aportaciones a la comunidad científica, hemos entrevistado al Dr. Dietmar Fernández Orth, que trabaja como Post Doctoral Bioinformatics Scientist en la EGA y que tuvimos como invitado en el 1er Networking Bioinformatics celebrado en My Scientific.

El European Genome Phenome Archive (EGA) - Dietmar Fernández Orth  - Post Doctoral Bioinformatics Scientist
Dietmar Fernández Orth - Post Doctoral Bioinformatics Scientist

"Desde muy pequeño yo sabía que quería estudiar biología. Mi familia siempre nos inculcó el cuidado del medio ambiente y una pasión incondicional por los animales. Personas como Jane Goodall fueron para mí como una inspiración y me decía a mi mismo que yo quería hacer lo mismo"

My Scientific JournalEchando un vistazo a tu historial académico y profesional, hemos podido observar que desde un primer momento te decantaste por la bioinformática y la biología computacional, ¿Qué pasos tuviste que dar para alcanzar ese objetivo?

Dietmar Fernández Orth. Fue una vez que comencé la carrera que descubrí la genética y cómo gran cantidad de nuestras características vienen determinadas por nuestro código genético. En quinto de carrera tuvimos unas prácticas de bioinformática que me encantaron y los profesores nos comentaron que iba a tener mucho futuro. Ahí, junto con mi interés en los ordenadores, fue cuando me dije a mi mismo que yo podía dedicarme a esto y fue cuando empecé a preguntar cómo podía orientar mi perfil a esta rama en expansión. Fue así como me recomendaron la realización de un máster como manera de ampliar mis conocimientos de la bioinformática. A partir de ese momento las cosas empezaron a ir solas, en el máster hice una parte práctica en una empresa biotecnológica en su departamento de bioinformática dónde, tras finalizar, me concedieron una beca para la realización del doctorado universidad/empresa. Siendo doctor, pasé a formar parte de la plantilla de la empresa en el departamento de bioinformática. ¡Ya había conseguido trabajar en bioinformática!

MScJHoy en día en la era del BigData existen diversas herramientas para el almacén de datos, pero ¿por qué es necesario la existencia de un repositorio de datos como la EGA? ¿Cuál es el papel que desarrollan los bioinformáticos?

DFO. El papel de la EGA surgió de la necesidad de compaginar dos derechos humanos fundamentales: el derecho a compartir los datos genómicos, en aras de enriquecer el conocimiento y la salud, y el derecho a la privacidad. Así pues, se trata de hacer accesible a la comunidad científica la gran cantidad de resultados provenientes de los experimentos genómicos y que no queden “guardados” en un cajón una vez los resultados hayan sido publicados. Se trata pues, de tratar de hacer que futuros investigadores puedan tener acceso a dichos datos que por otra parte tienen un elevado coste económico y que puedan ser utilizados por la comunidad pero siempre respetando la confidencialidad de los mismos.

La EGA surge como la infraestructura capaz de almacenar los datos por tiempo indefinido y facilitar su distribución en condiciones de calidad y seguridad necesarias. En ese sentido, la EGA es el equivalente a la base de datos de dbGaP en Estados Unidos. La EGA lleva detrás un equipo humano con una gran experiencia en su campo donde podemos encontrar bioinformáticos, informáticos, así como gestores, que se encargan de que todo funcione como es debido. Si bien cada uno tiene sus tareas definidas, todos trabajamos de manera conjunta proporcionando el punto de vista adecuado en cada momento. Los bioinformáticos, por nuestra parte, aportamos el enfoque de la biología y somos nosotros los que realizamos los controles de calidad de los ficheros, organizamos que los datos biológicos proporcionados sean coherentes de acuerdo a la información que disponemos de ellos etc. Como repositorio de datos que es la EGA, otra de las tareas de los bioinformáticos es participar junto con otras instituciones europeas en la armonización de los estándares de datos de tal manera que cualquier persona que tenga acceso a los mismos sea capaz de entender lo que hay. Por último, con ayuda de los informáticos es el desarrollar herramientas como el Beacon, que permite con un simple clic saber si un proyecto tiene información (a nivel de fenotipo y genotipo) de una variante que al investigador le interese sin necesidad de tener que descargar el fichero completo ni iniciar el proceso de solicitud de dicho proyecto.

MScJEn el caso de que un investigador solicite a la EGA permiso para acceder a unos datos que le puedan ser de interés para su investigación, ¿qué procedimiento se debería seguir? ¿Cómo puede saber el investigador que los datos a los que va a pedir acceso se adaptan a sus necesidades antes de adquirir dichos datos y poder verlos?

DFO. En primer lugar el investigador tiene que poner en el buscador una serie de términos clave que le permitan obtener una serie de resultados en forma de proyectos que cumplen sus criterios. Una vez se seleccione un proyecto, siempre se va a encontrar una pequeña descripción del mismo así como del tipo de datos disponibles en la EGA para dicho proyecto. Si el investigador está interesado, la EGA dispone de un control de calidad en el que se puede ver información cualitativa adicional de los ficheros que componen dicho proyecto de tal manera que puede obtener una idea de su idoneidad en base a su criterio. En este control de calidad, así como en la página de descripción del estudio, se incluye también un link a las publicaciones en las que han sido utilizados dichos datos lo cual le puede ayudar también en la elección. Por otra parte, existen también los DUO code (Data Use Ontology), que es la primera ontología de consentimientos informados a nivel mundial que permiten determinar si cumples los requisitos del propietario de los datos para poder acceder a ellos.

El siguiente paso es contactar con el comité de acceso a los datos (DAC) por email y será él el que requiera completar el Acuerdo de Acceso a los Datos (DAA). Una vez realizados estos trámites, el DAC comunicará a EGA Helpdesk que el solicitante puede acceder a los datos y se le otorgará acceso a los mismos.

MScJDurante el networking de bioinformática comentaste que actualmente en la EGA se almacenaban alrededor de 12,4 PB. De ahí surge la duda de si llegará un momento en el que la cantidad de datos sea imposible de almacenar (se acabará la memoria de los repositorios). ¿Qué se hace para evitar esto?

DFO. Actualmente los datos se encuentran almacenados en Barcelona en los servidores del Barcelona Supercomputing Centre (BSC) y en los servidores del European Bioinformatics Institute (EBI) en Hinxton (Reino Unido) y en principio la capacidad es ilimitada. Algo que sí puede suceder es que los datos, debido a las leyes de GDPR de los distintos estados, no permitan que salgan de su país y para ello se está trabajando en la creación de EGA’s locales estatales que serían las que irían almacenando los datos estando en directa conexión con la central, lo cual a su vez aumentaría el espacio disponible.

MScJEn la pregunta anterior hablábamos de la gran cantidad de datos que almacena la EGA. Sin embargo, también jugáis un papel fundamental en la reutilización de estos datos, facilitando que otros grupos puedan trabajar con ellos sin necesidad de pasar por la fase de recolección de los mismos. ¿Por qué crees que puede ser interesante trabajar con este tipo de datos?

DFO. Uno de los grandes handicaps de la ciencia es que es relativamente habitual que los resultados de unos experimentos con un coste elevado una vez han sido publicados se “guardan” en un cajón y nunca más son utilizados. La labor de la EGA, es tratar de dar más de una vida a los datos y compartirlos, sin que se tenga que dedicar horas y muchos recursos por parte del científico que generó los mismos.

Son diversas las posibilidades que hacen interesante “reciclar” los datos y entre ellas podemos destacar desde que no haga falta que hagas el experimento con nuevas muestras si lo que estás tratando de hacer es hacer una análisis diferente, o hasta tratar de aumentar el tamaño muestral de tu experimento de tal manera que la potencia estadística sea superior a la que tendrías analizando solo tus datos.

MScJLa EGA colabora con diferentes centros, a nivel nacional estáis trabajando en TransBioNet. Háblanos un poco de este proyecto, ¿cómo puede beneficiar al sistema nacional de salud esta iniciativa?

DFO. Uno de los principales objetivos de TransBioNet es tratar de crear un foro en el que los bioinformáticos puedan compartir sus experiencias así como sus metodologías de trabajo de tal manera que la comunidad se vea beneficiada con dicho conocimiento. Asimismo, la participación en el foro de organizaciones como ELIXIR (European Life Science Infrastructure for Biological Information) y GA4GH (Global Alliance for Genomics and Health) permitirá entre otras cosas el acceso del sistema nacional de salud a los últimos adelantos tecnológicos y a beneficiarse del acceso a infraestructuras del INB (Instituto Nacional de Bioinformática) o ELIXIR. De manera adicional, se puede también impartir cursos de formación al personal bioinformático hospitalario.

MScJPor último, nos gustaría saber cuál es tu opinión acerca del futuro de la medicina personalizada y qué herramientas aporta la EGA para facilitar la aplicación de la misma.

DFO. Uno de los objetivos de la EGA es tratar de estar en la vanguardia de la medicina personalizada y esto se debe principalmente al hecho de que es una plataforma que no siendo propietaria de los datos, ha creado una infraestructura que facilita la difusión de los mismos en la comunidad científica y médica. Es un repositorio en el que se depositan una inmensa cantidad de datos genómicos y fenotípicos. En general, la mayor parte de los datos tienen su origen en proyectos tanto nacionales como europeos de investigación, pero es cada vez mayor la presencia de otras plataformas como UK Biobank o estudios poblacionales. A este factor, en aras de enriquecer aún más el repositorio, la EGA trata de colaborar y mediar para que los hospitales puedan comunicarse entre ellos de una manera segura ofreciendo o sugiriendo la infraestructura necesaria y facilitando así la disponibilidad de información que de otra manera no sería posible.

La labor de la EGA es muy ambiciosa y somos conscientes de que no es sencilla pero sería ideal que se pudiese llegar a estimar en base a las características genómicas de un paciente aspectos como la respuesta a tratamientos, la probabilidad de remisión o recaída, etc. en base a los datos presentes en el repositorio. En línea con este objetivo, la EGA colabora en la implantación de la genómica en los Electronic Health Record (EHR) que actúan como informes de los hospitales con información acerca de diagnósticos, síntomas, tratamientos e intervenciones entre otros aspectos.

El hecho de poder colaborar con los hospitales y centros de investigación en la creación de una base de datos interoperable y accesible con datos estadísticos sumarios, como pueden ser los “Polygenic Risk Scores”, podría facilitar la toma de decisiones médicas personalizadas.

La infraestructura va hacia ello, es el futuro y esperemos que en un futuro no muy lejano.

Ponencia de Dietmar Fernández Orth

Dietmar Fernandez Orth
Dietmar Fernandez OrthPonencia EGA Networking My Scientific
European Genome Phenome Archive (EGA)
Interesante ponencia realizada por Diertmar Fernández Orth, en la que, utilizando un lenguaje asequible y claro, facilita el aprendizaje al estudiantado universitario. A lo largo de aproximadamente 40 minutos, Dietmar tratará de resumir cómo cualquier investigador puede acceder a los datos depositados en EGA de manera gratuita, y las diversas herramientas que se han desarrollado para seleccionar aquellos estudios que pueden ser de más interés para cada investigador.

REFERENCIAS:

DOI: 10.1038/s41467-018-07863-x
DOI: 10.1093/jac/dky540
DOI: 10.1371/journal.pone.0193527 DOI: 10.1128/genomeA.01480-16

Documentación

Autoras: Ana María Burgos Ruiz y Elena Azahara Boutazakht Sánchez y coordinadora: Elena Rojano Rivera para My Scientific Journal Bioinformatic 08/04/2020
 
Ana María Burgos Ruiz
Ana María Burgos RuizRedactora My Scientific Journal
Biologist and MSc in Bioinformatic and Biostatistics
Fiorella Piriz Sapio
Fiorella Piriz SapioRedactora My Scientific Journal
Estudiante de Bioinformática
Elena Rojano Rivera
Elena Rojano RiveraCoordinadora My Scientific Journal
PhD en Biología Celular y Molecular, especializada en bioinformática y biología de sistemas