Reconocimiento de secuencias genéticas de ADN a través de imágenes

web-65-ADN

Puebla, Puebla. 14 de noviembre de 2018 (Agencia Informativa Conacyt).- Creada como una herramienta de diagnóstico que permita auxiliar el trabajo en el laboratorio para la identificación de enfermedades como la hepatitis tipo I, II, III y VI, los estudiantes de
posgrado en ciencias computacionales de la Benemérita Universidad Autónoma de Puebla (BUAP) Sarahí Zúñiga Herrera y Luis Ángel Santamaría Colula desarrollaron un proyecto para reconocimiento de secuencias genéticas de ADN por medio de imágenes.
 
En entrevista para la Agencia Informativa Conacyt, Luis Ángel Santamaría explicó que el análisis y procesamiento de secuencias de ADN se ha realizado desde hace muchos años con redes neuronales normales; sin embargo, su propuesta consiste en utilizar redes neuronales convolucionales, enfocadas en el reconocimiento de imágenes de audio y de lenguaje de alto nivel. 
¿Para qué sirve?
Sarahí Zúñiga expresó que como clasificador utilizaron una base de datos de hepatitis tipo I, II, III y VI. Lo que buscan, dice, es que cuando el paciente llegue al laboratorio con una sospecha de padecer esta enfermedad, lo que se requiere es saber qué tipo de virus tiene para expedirle el tratamiento adecuado. Es así como a partir de una muestra de sangre, que contiene material genético, se hace una secuencia a través de técnicas de biología molecular. Una vez que se obtenga la secuencia genética, a través de técnicas computacionales se puede convertir la secuencia en una imagen que permitirá una clasificación.
“Si nosotros ya tenemos una red neuronal entrenada, es fácil introducir las imágenes obtenidas de las secuencias y entonces este clasificador nos dirá a qué tipo de virus pertenece y de esta manera se genera una herramienta de diagnóstico para auxiliar en la identificación de enfermedades. En este caso, nosotros 
Sarahí Zúñiga y Luis Ángel Santamaría.
probamos con cuatro tipos de hepatitis, pero la metodología puede ser empleada para otros padecimientos, es decir, el trabajo consiste en buscar una nueva forma de representar secuencias de ADN para su análisis y lo que presentamos es generar imágenes a partir de secuencias de ADN y someterlas a análisis por CNN”.
El trabajo de Sarahí Zúñiga —quien estudió la licenciatura en biotecnología— y Luis Ángel Santamaría fue ganador de la XI edición de la Feria de Proyectos (Fepro 2018) organizado por la BUAP, en la categoría de Aplicaciones Avanzadas, en septiembre pasado. El proyecto, que aún no concluye en su totalidad, está asesorado por el doctor Ivo Pineda Torres, académico investigador de esta universidad. 
Cómo funciona
El ADN es el código de la vida, una molécula esencial heredada de nuestros padres que contiene todas las instrucciones químicas necesarias para crear nuestro cuerpo y hacer que funcione. El ADN consta de dos hebras entrelazadas de azúcar y fosfato, unidas en su centro. Estos escalones se forman de base de nitrógeno representados por las letras ATGC, estas siempre se agrupan en pares (A-T) y (G-C).
Los estudiantes de posgrado y becarios del Consejo Nacional de Ciencia y Tecnología (Conacyt) tomaron a partir de esta representación del ADN diversas bases de datos, de las cuales seleccionaron una secuencia y a cada letra (ATGC) le asignaron un color: blanco, negro y dos secuencias de grises, para posteriormente crear una imagen muy similar al código de barras.
Este proceso lo repitieron para todas las secuencias de ADN de su base de datos y con estas imágenes generadas utilizaron una red neuronal convolucional, la cual tiene la capacidad de cumplir tareas como reconocimiento de voz y de imágenes.
Estas redes convolucionales también tienen la capacidad de identificar objetos, clasificándolos según sus características. Esta herramienta está siendo utilizada por Facebook, Google y Microsoft.
Los estudiantes refirieron que se decidieron por probar con estas redes por su alto grado de asertividad, asegurando que de acuerdo con las pruebas que han realizado, lograron 95 por ciento de precisión con 145 imágenes probadas, mostrando el impacto que tiene la computación no solo en la identificación de patrones y objetos, sino también en el área de biología.

Follow Us on Social

Most Read