Mundo 3.0

Agosto - Octubre 2017

Deep learning y black box

Por Monique Brouillette, MIT Technological Review

(Extracto MIT Technological Review, 27.4.17)

Sebastian Thrun, científico especialista en inteligencia artificial, junto a unos colegas de la universidad de Stanford, demostraron que un algoritmo de “deep learning” (aprendizaje profundo) es capaz de diagnosticar lesiones de lunares en la piel potencialmente cancerosas en forma tan precisa o mejor que la de un dermatólogo. Una nueva era está naciendo con el “diagnóstico por software”, en el cual la inteligencia artificial ayuda e incluso compite con los doctores.

Las imágenes como fotografías, rayos-x y las resonancias magnéticas son un insumo ideal para un software de deep learning, que en los últimos años se ha perfeccionado al punto de reconocer en forma precisa caras y objetos en fotos. Al campo de la radiología ya se le llama el “Silicon Valley de la medicina”, debido al alto número de imágenes detalladas que genera.

 

Black box

 

Aunque las predicciones del equipo de Thrun eran altamente precisas, nadie sabe exactamente qué características de un lunar usó el programa de deep learning para clasificarlo como canceroso o benigno. Este es el problema del “black box” (caja negra) del deep learning.

 

A diferencia del sofware visual más tradicional, donde el programador define las reglas -por ejemplo, una señal “pare” tiene 8 lados-, en deep learning el algoritmo encuentra las reglas por sí mismo, sin dejar rastro auditable que explique sus decisiones.

 

Nicholson Price, especialista en leyes de salud de la Universidad de Michigan, señala que en el caso del “black box” en medicina, los doctores no saben qué está pasando porque nadie lo sabe; es esencialmente opaco. Price compara a deep learning con las drogas cuyos beneficios se producen por medios desconocidos hasta ahora. El uso del litio es un ejemplo. Todavía no se descubre el mecanismo exacto por el cual el litio afecta el estado de ánimo, pero esta droga ya está aprobada como tratamiento para el desorden bipolar.

 

Por lo mismo, Price estima que este “black box” de la medicina no debería significar un problema con la US Food and Drug Administration, la cual ya aprobó al menos un algoritmo de deep learning desarrollado por Arterys, una empresa de imágenes médicas con base en San Francisco. Su algoritmo, “DeepVentricle”, analiza imágenes de resonancia magnética del interior de las cavidades del corazón y calcula el volumen de sangre que el corazón de un paciente puede bombear. El cálculo demora sólo 30 segundos, mientras métodos convencionales pueden tardar una hora.

 

Para entrenar a su software, el equipo de Thrun, ex vicepresidente del área de manejo de vehículos sin piloto en Google, lo alimentó con 129.405 imágenes de distintas condiciones de piel y lunares ya evaluados por expertos dermatólogos. Estas imágenes abarcaron 2.032 alteraciones distintas e incluyeron 1.932 imágenes de cáncer a la piel. El software superó a 21 dermatólogos en identificar correctamente los lunares que eran potencialmente cancerosos.

 

Allan Halpern, dermatólogo del Memorial Sloan Kettering y presidente de la Sociedad Internacional de Imágenes Digitales de la Piel, no cree que esta tecnología desplace a los doctores. Al contrario, Halpern cree que la amenaza es la inversa: los algoritmos “podrían aumentar dramáticamente la demanda por servicios dermatológicos”. Ello porque un diagnóstico positivo requiere, además, una biopsia. Halpern agrega que si el software de deep learning estuviera disponible para todos los pacientes como una app de celular inteligente simple de utilizar, no habría suficiente dermatólogos para evaluar esos resultados.

 

Las compañías podrían ofrecer herramientas de deep learning directamente a los consumidores para que escaneen sus propios lunares y averiguar si necesitan acudir al doctor. Aún así, Halpern cree que las personas no estamos todavía suficientemente preparadas para manejar sistemas de diagnósticos de deep learning que nos digan que la probabilidad de que un lunar sea canceroso sea 5% o 50%. Y señala: “No somos buenos para manejar probabilidades. No todavía”.