Desde que se captura una imagen hasta que se infiere algo de información de la misma actúan una gran variedad de subprocesos. Estos se encargan de procesar la imagen como un conjunto de píxeles para así poder clasificar e interpretar diferentes grupos de píxeles en base a ciertos criterios. En definitiva, tratan de "identificar" qué objetos contiene una determinada escena.

Obtención, caracterización e interpretación de imágenes

Se distinguen fundamentalmente seis subprocesos en el proceso de obtención, caracterización e interpretación de imágenes. Estos a su vez pueden clasificarse según su nivel de abstracción: bajo, medio y alto nivel. El conjunto de subprocesos es generalmente secuencial, pues los resultados obtenidos en una fase suelen determinar los de la siguiente. Los procesos implicados podrían fácilmente variar en función del problema y su complejidad.

1. Subprocesos de bajo nivel

Cubren el área del procesamiento de imágenes. Toman como entrada una imagen y devuelven otra que ha sido realzada en base a ciertos parámetros o criterios.

Figura 1. Subprocesos de bajo nivel

1.1. Captura

Obtención de la imagen bidimensional a través de un dispositivo que capture el mundo tridimensional.

1.2. Pre-procesamiento

Tratamiento de la imagen para mejorar su apariencia mediante la mejora de algunas de sus características.

2. Subprocesos de medio nivel

Encargados de analizar la imagen ya pre-procesada. Reciben una imagen y, tras segmentarla en diferentes regiones de píxeles según las características que los relacionen (proximidad, orientación, similitud, etc) y extraer información cuantitativa de estas, devuelven una clasificación de los objetos según su categoría. Su buen funcionamiento es determinante para el éxito de la tarea general.

Figura 2. Subprocesos de medio nivel (I)

2.1. Segmentación

Agrupación cuantitativa de los píxeles de la imagen en grupos de interés según sus propiedades.

2.2. Descripción

Extracción información a partir de las características relevantes a cada objeto diferenciado en la segmentación.

Características externas del objeto o región: forma geométrica, perímetro, ejes mayor y menor, rectángulo mínimo que contiene al objeto, excentricidad, etc.
Características internas del objeto o región: área de la región, centro de gravedad, patrones de texturas (liso, áspero, regular, etc), color (promedio, mediana de niveles de intensidad, máximo y mínimo de valores de intensidad), etc.

Figura 3. Subprocesos de medio nivel (II)

2.3. Clasificación o reconocimiento

Etapa especialmente densa: reconoce o clasifica los objetos según sus características, englobándolos en diferentes categorías. Esta clasificación se hace de forma automática o, en su defecto, con el mínimo grado de intervención humana posible. Hace uso de diferentes técnicas estadísticas avanzadas, estructurales o basadas en la apariencia, redes neuronales, algoritmos genéticos, etc.

3. Subprocesos de alto nivel

Comprenden la escena que se ha estado analizando en etapas anteriores. La distinción de objetos toma contexto para el proceso general de visión por computador.

Figura 4. Subprocesos de alto nivel

3.1. Interpretación

De ser exitoso, la máquina habría sido capaz de identificar los objetos relevantes para el problema en cuestión. Tras esto, el abanico de posibilidades es tan grande como el número de aplicaciones que existan, por muy específicas que sean.

4. Referencias

Iván García S., Víctor Caranqui S. (2015). La visión artificial y los campos de aplicación (Universidad Politécnica Estatal del Carchi – Ecuador). Recuperado en octubre de 2021.

Este post está también disponible en inglés en "Computer vision #2 | Image acquisition, characterization and interpretation".

jueves, 28 de octubre de 2021

Visión artificial #2 | Obtención, caracterización e interpretación de imágenes