Un grupo de investigadores españoles acaba de presentar una revolucionaria técnica de reconocimiento capaz de detectar hasta 15 gestos en milisegundos.
La interacción hombre-máquina se ha convertido en uno de los principales retos tecnológicos de la sociedad actual. Año tras año, la potencia de los dispositivos electrónicos, como teléfonos móviles, tabletas u ordenadores, crece exponencialmente. Sin embargo, nuestra capacidad para relacionarnos con ellos sigue estancada.
La comunicación en informática siempre funciona en dos direcciones, que se denominan entrada y salida. Cuando un periodista redacta una noticia se 'comunica' con la máquina introduciendo caracteres a través de un teclado (dispositivo de entrada). La máquina, a su vez, se comunica constantemente con el redactor, mostrándole lo que escribe a través de una pantalla (dispositivo de salida). El resultado final de ese proceso creativo será la pieza que usted está leyendo en estos momentos (a través de otro dispositivo de salida).
Tanto la entrada como, sobre todo, la salida, son actividades tremendamente lentas (para nosotros) que además requieren de un gran esfuerzo intelectual, en comparación con el ínfimo porcentaje de cálculo que un ordenador necesita para, por ejemplo, copiar y pegar un documento. Un disco de almacenamiento moderno lee a más de 5.000 MB/s, mientras que, según algunos científicos, nuestro cerebro lo haría a tan solo 6 bits/s. Aunque vivamos inmersos en la revolución digital, los seres humanos seguimos siendo analógicos.

En un abrir y cerrar de ojos
En la actualidad, la mayoría de investigadores centran su actividad en los dispositvos de entrada para acelerar y simplificar la interacción hombre-máquina. El ser humano tiene varios dispositivos de salida intrínsecamente ligados a sus sentidos: gestual, táctil, (movimiento) ocular y oral. Por ejemplo, los asistentes de voz, como Alexa, Google Assistant o Siri, nos permiten dar y recibir información de las máquinas, liberando nuestra vista y manos para otros menesteres. A lo largo de la mayor parte de su vida, el cosmólogo Stephen Hawking probaría todos ellos a fin de comunicarse con el mundo exterior.
La tecnología de reconocimiento gestual funciona de forma distinta a la de reconocimiento del habla. Por sus especiales características (sencillez e inmediatez), actualmente los científicos están invirtiendo la mayoría de sus esfuerzos en conseguir que los ordenadores identifiquen gestos concretos, que funcionen como órdenes directas y concisas. Por ejemplo: "Apaga la tele" o "enciende el aire acondicionado".
Esta misma semana, un grupo de investigadores españoles de la Universidad Politécnica de Madrid han presentado una nueva tecnología de reconocimiento gestual con la que, prometen, seremos capaces de encender nuestra televisión o poner en marcha nuestra calefacción con un simple gesto.

En un artículo publicado en la revista científica Plos One, los ingenieros de la UPM Tomás Mantecón, Carlos Roberto del Blanco, Fernando Jaureguizar y Narciso García, describen su creación. A lo largo de dos años, los investigadores han desarrollado un "vocabulario" de 16 gestos, que han capturado gracias a un sensor óptico ya existente denominado Leap Motion. Su dispositivo es capaz de registrar los movimientos de las manos de los usuarios y ejecutar distintas acciones (sin usar el tacto) en un ordenador a modo de ratón, como dibujar o cambiar de aplicación. Y todo en cuestión de milisegundos.
Según los creadores, gracias a esta base de datos y al algoritmo que la gestiona, el sistema de reconocimiento se puede utilizar en un entorno más profesional para la interacción con robots, ordenadores, en realidad virtual aumentada, así como en ámbitos de domótica para permitir una interacción con los diversos dispositivos de un hogar conectado.
Este dispositivo proporciona imágenes infrarrojas que iluminan más los objetos cercanos, lo que reduce considerablemente la información del fondo irrelevante en el proceso de reconocimiento gestual. "Se trata del mayor exponente en técnicas de reconocimiento gestual que utilizan Leap Motion porque puede extraer un modelo tridimensional sin ruido, que otros no pueden reconocer", explica Mantecón a este periódico.
Esta es solo una de las miles de investigaciones sobre reconocimiento en marcha. La conversación humano-máquina apenas acaba de comenzar. Quién sabe. Puede que algún día ni tan siquiera sean necesarios gestos o palabras...