Nueva tesis mejora el modelo para el procesamiento de imágenes

La tesis de Miguel Pagola Barrio, dirigida por Humberto Bustince Sola, del Departamento de Automática y Computación de la Universidad Pública de Navarra, se centra en la umbralización o segmentación de imágenes, de manera que partiendo de una imagen digital se puedan definir y extraer, de modo automatizado, las zonas que nos interesen. La aplicación de estas técnicas es muy variada y va desde el diagnóstico médico —en detección del cáncer de mama o de próstata— hasta las líneas de producción robotizadas.

Miguel Pagola Barrio, licenciado en Ingeniería Industrial, es en la actualidad profesor ayudante de Ciencias de la computación e inteligencia artificial en la Universidad Pública de Navarra. Su tesis Representación de la incertidumbre con conjuntos intervalo-valorados fuzzy. Aplicación a la umbralización de imágenes ha obtenido la calificación de sobresaliente cum laude.

Pagola Barrio fue profesor visitante en la Universidad Monfort de Leicester (Reino Unido) y, en su trayectoria investigadora, ha publicado una decena de artículos en revistas de referencia, ha participado en once conferencias internacionales y seis nacionales y ha colaborado en la elaboración de capítulos en cuatro libros. Además, ha participado en cuatro proyectos de investigación sobre inteligencia artificial; entre ellos, uno relativo a la aplicación de las técnicas fuzzy en el diagnóstico de melanomas y otro sobre control de trayectorias de robots móviles autónomos.

"Pensemos en una imagen cualquiera: un objeto y un fondo —explica—. Cuando tú tienes una imagen digital, desde el momento en que pasas de tres a dos dimensiones la información no coincide con la imagen real y, aunque a simple vista parezca todo claro, cuando la analizas con detalle lo que ves es un montón de píxeles (la menor unidad que forma parte de una imagen digital) donde es difícil extraer bordes y formas nítidas".

Por ejemplo, en el cáncer de mama o de próstata, las zonas más oscuras de la imagen médica suelen ser las que están afectadas. "Pero esa imagen hecha por ultrasonidos, que es de muy mala calidad, el médico tiene que segmentarla a mano y a partir de ahí, en comparación con la misma imagen obtenida meses atrás, calcular en qué medida ha aumentado el cáncer. Hacerlo a mano les cuesta un tiempo y lo ideal es que el ordenador haga todo ese trabajo y mida automáticamente esos cambios", señala Pagola.

Ésa es la idea de lo que debería ocurrir. Y la teoría fuzzy o de lógica difusa lo que hace es trabajar con esa incertidumbre: representa esos casos difíciles mediante algoritmos (conjunto finito de instrucciones que sirven para ejecutar una tarea o resolver un problema). «Se está investigando mucho en todos estos temas y actualmente, con los algoritmos que creamos, se llega al 80-90%, pero no al 100% de seguridad». No obstante, gracias al procesamiento de imágenes con estas técnicas fuzzy, los profesionales médicos cuentan con un elemento más de apoyo a la hora de realizar sus diagnósticos, ya que pueden delimitar con mayor exactitud si la imagen que ven corresponde o no a una célula cancerosa.

En los últimos años se está dedicando gran esfuerzo investigador a este campo del procesamiento de imágenes. Sus aplicaciones son variadas, desde el ya señalado diagnóstico médico hasta las cámaras de seguridad para identificación de personas, coches inteligentes que puedan identificar señales de tráfico, robótica, etc.

Representación de la incertidumbre

La base de toda la tesis de Miguel Pagola está en el algoritmo de intervalo-valorización, aplicado por primera vez por el ingeniero de la universidad canadiense de Waterloo, Hamid Tizhoosh. "Por ejemplo, con la matemática clásica, en una imagen digital un pixel corresponde al fondo y le damos un valor de 0 ó 1. Pero con la lógica difusa, si no estamos seguros de a qué pertenece (al fondo o al objeto), le damos un grado de pertenencia: 0,5 ó 0,6. Pues bien, con los algoritmos de intervalo-valorización, en lugar de dar un grado de pertenencia le asignamos un intervalo: entre 0,5 y 0,6. Por eso le llamamos representación de la incertidumbre, porque le pedimos que nos mida el desconocimiento que tenemos a la hora de establecer esos parámetros".

Esta es la materia en la que se ha centrado el autor de la tesis, que se muestra satisfecho por "haber mejorado el algoritmo de intervalos, haber conseguido calcular la incertidumbre de manera cada vez más automática".

Aun así, Miguel Pagola aclara que los algoritmos "no son totalmente automáticos; tú no le dices al ordenador ‘segméntame esta imagen’ sino que le tienes que indicar dos funciones de pertenencia y, a partir de ahí, él trabaja". Por ejemplo, imaginemos una línea de producción robotizada: una cinta que transporta naranjas y un brazo robótico que, a través de unas cámaras, obtiene una imagen de la cinta con las naranjas, la segmenta, determina dónde está el centro de la naranja, la coge y la coloca en una caja. "Al indicarle al ordenador las funciones de pertenencia que representan la cinta y las naranjas respectivamente, es unos casos conseguiremos que la máquina coja el 95% de las naranjas, con otros el 97% y con otros el 99%".

Tal y como explica, a modo de conclusión de su tesis, "si utilizas un algoritmo de intervalos, siempre es mejor. Si tú conoces exactamente cuáles son las mejores funciones de pertenencia, puedes utilizar el algoritmo clásico y obtener un buen resultado. Sin embargo, si no sabes cuáles son, es mejor utilizar un algoritmo de intervalos porque, aunque te equivoques en las funciones, como calculamos automáticamente esos intervalos y ese desconocimiento, obtenemos una solución buena. No significa que sea la mejor solución, pero sí una muy buena solución para un amplio número de casos".