En la década de 1980, dos destacados filósofos y científicos cognitivos, Jerry Fodor y Zenon Pylyshyn, plantearon un desafío intrigante: ¿las redes neuronales artificiales, que impulsan la inteligencia artificial y el aprendizaje automático, pueden aprender a combinar conceptos, como lo hacen los humanos? Durante años, este debate ha persistido, y en la búsqueda de una respuesta, científicos de la Universidad de Nueva York y la Universidad Pompeu Fabra de España han dado un importante paso en ese sentido.
Un estudio reciente publicado en la revista Nature revela una técnica innovadora llamada "Meta-aprendizaje para Composicionalidad" (MLC, por sus siglas en inglés) que supera a enfoques anteriores y se equipara, e incluso supera, al desempeño humano. En esencia, MLC capacita a las redes neuronales, como las que impulsan sistemas como ChatGPT, en la realización de generalizaciones composicionales.
A diferencia de enfoques anteriores, que esperaban que las generalizaciones composicionales surgieran de métodos de entrenamiento estándar o requerían arquitecturas especializadas, MLC demuestra cómo la práctica explícita de estas habilidades puede habilitar a los sistemas para desbloquear nuevas capacidades.
"Durante 35 años, investigadores en ciencias cognitivas, inteligencia artificial, lingüística y filosofía han debatido si las redes neuronales pueden lograr generalizaciones sistemáticas similares a las humanas. Hemos demostrado, por primera vez, que una red neuronal genérica puede imitar o superar la generalización sistemática humana en una comparación directa", comenta Brenden Lake, profesor asistente en el Centro de Ciencia de Datos y el Departamento de Psicología de la Universidad de Nueva York, y coautor del estudio.
Los humanos sí son capaces de aprender un concepto nuevo y de utilizarlo después para comprender otros usos relacionados; por ejemplo, un niño aprende a saltar, pero inmediatamente aprende a dar saltos alrededor de una habitación, saltar con los brazos en alto, o saltar hacia adelante y hacia atrás. La técnica MLC se basa en un procedimiento de aprendizaje novedoso en el cual una red neuronal se actualiza constantemente para mejorar sus habilidades a lo largo de una serie de episodios. En cada episodio, MLC recibe una nueva palabra y se le pide que la use de manera compositiva, creando nuevas combinaciones de palabras. Por ejemplo, si se le da la palabra "saltar", debe crear combinaciones como "saltar dos veces" o "saltar alrededor dos veces". Con cada nuevo episodio que presenta una palabra diferente, la red mejora sus habilidades composicionales.
Para probar la efectividad de MLC, los investigadores llevaron a cabo experimentos con participantes humanos que eran idénticos a las tareas realizadas por MLC. Sin embargo, en lugar de aprender el significado de palabras reales, los participantes tuvieron que aprender el significado de términos sin sentido, definidos por los investigadores, y cómo aplicarlos de diversas maneras. Sorprendentemente, MLC se desempeñó tan bien como los participantes humanos y, en algunos casos, mejor que ellos. Incluso superó a modelos de lenguaje de gran tamaño como ChatGPT y GPT-4, que, a pesar de sus impresionantes habilidades generales, mostraron dificultades en esta tarea de aprendizaje.
"Los modelos de lenguaje grandes, como ChatGPT, todavía luchan con la generalización compositiva, aunque han mejorado en los últimos años. Pero creemos que MLC puede mejorar aún más las habilidades compositivas de estos modelos de lenguaje de gran tamaño", concluye Marco Baroni, miembro del grupo de investigación de Lingüística Computacional y Teoría Lingüística de la Universidad Pompeu Fabra.
La red neuronal de la que hoy se hace eco la revista Nature presenta por lo tanto habilidades similares a las humanas en esa generalización sistemática -la capacidad de aprender nuevos conceptos y de combinarlos con otros ya existentes-, y los científicos que han participado en este trabajo mantienen que este método puede ser prometedor para desarrollar sistemas de inteligencia artificial que se asemejen más al comportamiento humano.