Machine Learning en la Medicina
Redes neuronales, machine learning, e inteligencia artificial. Éstas son palabras que en la última década han ganado mucha tracción. Con esto de “mucha tracción” no me refiero al ámbito académico, sino a su uso como un punto de venta, una palabra rimbombante, una palabra para vender. Hoy en día podemos encontrar las siglas IA (para inteligencia artificial) en cosas tan simples como hornos de cocina, laptops e incluso dentro de la aplicación de cámara de nuestros celulares.
También interactuamos con estas tecnologías sin darnos cuenta. En Netflix, las series que nos son recomendadas e incluso la imagen con la que nos presentan la serie, son producto del machine learning. Uber usa la información de la hora, tráfico, clima y datos anteriores y mediante machine learning nos asigna una tarifa. Incluso los anuncios que nos aparecen en páginas web o las recomendaciones que nos da Amazon, son producto del machine learning.
Esta tecnología no solo se usa para generar más ventas. Investigadores y científicos llevan tiempo trabajando con esta tecnología en el monitoreo meteorológico para predecir y minimizar el daño de fenómenos climáticos. En la medicina, el principal campo que tiene el machine learning es en la búsqueda de diagnósticos y tratamientos más eficientes para combatir el cáncer.
¿Qué es el Machine Learning?
De manera simple, el machine learning es la utilización de recursos computacionales para resolver problemas, sin la necesidad de programarlas para cada escenario específico. Existen dos grandes categorías de aprendizaje: supervisado y no supervisado
En el no supervisado, se le alimenta un set de datos (no etiquetados) al algoritmo y este arroja patrones y relaciones entre los datos que una persona no podría ver.
En la modalidad supervisada, se le alimenta al algoritmo grandes cantidades de datos donde se conocen las entradas y las salidas, esto con la intención de que “aprenda” de estos casos y pueda resolver otros donde no se conocen las salidas. Este es el tipo de machine learning que usan los investigadores para el cáncer, dado que se tienen miles de registros cínicos con los que se puede alimentar el algoritmo.
Uno de los tipos de machine learning supervisados más populares e interesantes es el de la red neuronal.
¿Qué es una red neuronal?
Una definición formal es: un sistema computacional que opera usando algoritmos basados en las funciones cerebrales para interpretar información no lineal y que no sigue un patrón secuencial. Este tipo de machine learning es inspirado en la red neuronal biológica que se encuentra en nuestros cerebros y son particularmente buenas para encontrar relaciones entre las variables.
Para explicar como se aplica una red neuronal en la prevención y detección de cáncer usaremos como marco de referencia el artículo de Naushad, que podrán encontrar en las referencias.
Lo primero que se necesita es una enorme cantidad de datos para ser analizados. En este caso, los datos son: demografía, interacciones genéticas, nutrición y quienes sí o no desarrollaron el padecimiento. Con esta información se puede entrenar al algoritmo para que identifique patrones ocultos dado que se saben las variables de entrada y las variables de salida (quién sí o no se enferma).
Habiendo alimentado al algoritmo con la información, el siguiente paso es darle un escenario que no conoce. Se sabe el resultado de este escenario por lo que el objetivo de este paso es ver el resultado que arrojaría el algoritmo. Para esto, es importante saber que la red neuronal está compuesta de tres secciones:
Capa de entrada
Capas escondidas
Capa de salida.
Por naturaleza, el resultado del nuevo escenario no va a ser el correcto, a lo que le sigue un proceso de corrección llamada propagación hacia atrás. Este es el proceso de aprendizaje. Las capas escondidas están compuestas por series de números que representan las relaciones entre las variables. En la propagación hacia atrás, se ajustan estas relaciones (por el método del gradiente descendiente) para tratar de acercar el resultado al esperado. Esto se repite hasta que el algoritmo de el resultado deseado.
Este fue, a grandes rasgos, el proceso que siguieron los investigadores del artículo. Llegaron a la conclusión que los factores que más se relacionan al desarrollo de cáncer de mama son deficiencias de ácido fólico y exposición a estrógeno.
En el escenario ideal, donde ya se sabe con completa certeza cuales son los factores que están relacionados con el desarrollo de cualquier cáncer, un médico, nutriólogo, o practicante de la salud podría intervenir para prevenir el desarrollo de la enfermedad.
Referencias:
Naushad, S.M., Ramaiah, M.J., Pavithrakumari, M., Jayapriya, J., Hussain, T., Alrokayan, S.A., Gottumukkala, S.R., Digumarti, R. and Kutala, V.K., 2016. Artificial neural network-based exploration of gene-nutrient interactions in folate and xenobiotic metabolic pathways that modulate susceptibility to breast cancer. Gene, 580(2), pp.159-168.
Milani, C. and Jadavji, N.M., 2017. Solving cancer: The use of artificial neural networks in cancer diagnosis and treatment. Journal of Young Investigators, 33(4).
Woodford, C., 2020. How Neural Networks Work - A Simple Introduction. [online] Explain that Stuff. Available at: <https://www.explainthatstuff.com/introduction-to-neural-networks.html> [Accessed 4 July 2020].
BiSmart, 2020. ¿En qué se diferencian el Machine Learning supervisado y no supervisado?.
How Machine Learning is Fighting Cancer. 2020. [video] Directed by R. Engineering. YouTube.