Cómo desarrollar inteligencia artificial autónoma

Algunos fanáticos argumentarán que la inteligencia artificial (IA) es A punto de volverse consciente.Pero Yann LeCun no lo es, porque tiene razón aprendizaje profundo.
De hecho, LeCun cree que la IA no está en el camino correcto para pensar y aprender como humanos. Señala que, si bien un adolescente puede aprender a conducir en unas 20 horas, un automóvil autónomo decente requiere millones o miles de millones de muestras de datos de entrenamiento etiquetados o experimentos de aprendizaje por refuerzo en entornos simulados, y aún no alcanza la capacidad a nivel humano. para conducir de manera confiable. (Lea también: Hackear autos autónomos: ¿es por eso que todavía no tenemos autos autónomos?)
Sobre la base de esta realización, LeCun ha esbozado una hoja de ruta para crear «inteligencia artificial autónoma». La hoja de ruta de LeCun se inspira en disciplinas tan diversas como el aprendizaje profundo, la robótica, la ciencia cognitiva y la neurociencia para trazar una estructura modular y configurable. Si bien la implementación real de esta hoja de ruta requerirá una mayor exploración, es útil considerar los diferentes componentes necesarios para replicar la inteligencia animal y humana.
Este artículo profundiza en la metodología detrás de la hoja de ruta de IA autónoma de LeCun.
cómo funciona
modelo mundial
En el corazón del marco de LeCun hay un «modelo mundial» que predice las condiciones o estados del mundo. Los animales y los humanos, argumenta LeCun, tienen su propio «modelo del mundo» en algún lugar de la corteza prefrontal.
Aunque ha habido intentos de desarrollar modelos mundiales basados en IA, estos modelos dependen de la tarea y no se pueden adaptar a diferentes tareas. Sin embargo, LeCun no está de acuerdo con el concepto de múltiples modelos de mundo relacionados con tareas y cree en un único modelo de mundo dinámicamente configurable. Según LeCun, el modelo de mundo único de cada persona permite compartir conocimientos en múltiples tareas, lo que lleva a los humanos a razonar por analogía.
En el contexto de la hoja de ruta de IA autónoma de LeCun, la idea de un modelo mundial acompaña a otros modelos que ayudan a los sistemas de IA a comprender el mundo y realizar acciones dentro de él.
modelo perceptivo
Un modelo de «percepción» recopila y procesa señales de sensores y estima el estado del mundo. Por lo tanto, imita los cinco sentidos del hombre. El modelo mundial ayuda al modelo de percepción a realizar dos tareas básicas:
- Rellenar la información que falta en los datos sensoriales (p. ej., objetos ocluidos).
- Predecir el estado futuro más probable del mundo (por ejemplo, mueva la posición del automóvil cinco segundos a partir de ahora).
La arquitectura de IA autónoma de LeCun también incorpora otros modelos que funcionan junto con el modelo mundial para facilitar la capacidad de aprendizaje de la IA. Éstas incluyen:
modelo de costo
Los modelos de costos permiten que los sistemas de IA logren los objetivos deseados. Mide la incomodidad del sistema y consta de dos submodelos:
- Costo intrínseco: Un modelo integrado no entrenable que calcula la incomodidad inmediata (por ejemplo, daño al sistema).
- crítico: Un modelo de aprendizaje para predecir estados futuros a un costo intrínseco.
Los sistemas de IA están diseñados para reducir los costos intrínsecos con el tiempo. Según LeCun, este es un modelo de costos donde hay impulsos conductuales fundamentales y motivaciones intrínsecas. Distinguir este modelo es importante porque permite que los gradientes de costos se propaguen hacia atrás a través de otros modelos, capacitándolos para trabajar juntos para reducir los costos intrínsecos.
modelo actor
El modelo del «actor» actúa para minimizar el nivel de incomodidad (es decir, el costo intrínseco).
modelo de memoria a corto plazo
El modelo de «memoria a corto plazo» recuerda información importante sobre el estado del mundo y los costos intrínsecos correspondientes. Desempeña un papel importante para ayudar a los modelos mundiales a hacer predicciones precisas.
Modelo de configurador
Finalmente, la arquitectura de IA autónoma de LeCun incluye un modelo de «configurador» que proporciona control ejecutivo al sistema.
El objetivo principal del configurador es permitir que la IA maneje una variedad de tareas diferentes. Lo hace ajustando otros modelos en la arquitectura, por ejemplo, ajustando sus parámetros.
Volviendo al ejemplo anterior del «automóvil sin conductor», si desea conducir, su «modelo perceptivo» (sus cinco sentidos) debe absorber información de las partes del automóvil que son relevantes para la conducción: debe estar atento a través del parabrisas, toca el volante y escucha el sonido del motor. Mientras tanto, su «modelo de actor» tiene que planificar las acciones en consecuencia (arranca el motor y cambia de marcha) y su «modelo de costes» tiene en cuenta las normas de tráfico.
Curiosamente, la hoja de ruta de LeCun se inspiró en la teoría del proceso dual propuesta por Daniel Kahneman en «Thinking Fast and Slow». El modelo de Kahneman permite que los sistemas de IA muestren dos tipos de comportamiento:
- Modo 1. El modo 1 es el resultado de la percepción directa del mapeo de la acción y es un comportamiento reflexivo rápido.
- Modo 2. El modo 2 es un comportamiento lento y deliberado que utiliza modelos mundiales, modelos de percepción, modelos de costes, modelos de actores, modelos de memoria a corto plazo y modelos de configuración para el razonamiento y la planificación.
Cómo implementar el marco de IA autónomo de Yann LeCun
Según LeCun, un desafío clave en la realización de su marco conceptual es la implementación.
LeCun cree en la implementación de su modelo utilizando un modelo de aprendizaje profundo que se puede entrenar con algoritmos de optimización basados en gradientes. No cree en el uso de simbología, que requiere conocimiento humano codificado a mano.
Dos formas prometedoras de implementar este marco son:
1. Aprendizaje autosupervisado
Dado que los modelos de aprendizaje profundo requieren grandes conjuntos de datos anotados por humanos para aprender mediante el aprendizaje supervisado, LeCun recomienda el uso del aprendizaje autosupervisado (SSL): un método de aprendizaje no supervisado que utiliza la supervisión naturalmente disponible en el conjunto de datos (es decir, sin anotación humana). LeCun argumenta que los niños humanos también utilizan el aprendizaje autosupervisado para adquirir conocimientos de sentido común sobre el mundo, como la gravedad, las dimensiones, la profundidad y las relaciones sociales.
Más allá de la motivación teórica, SSL ha demostrado una utilidad increíble en el aprendizaje de modelos de lenguaje subyacentes utilizando arquitecturas de aprendizaje profundo basadas en transformadores. (Lea también: Modelos fundamentales: la próxima frontera de la IA.)
2. Modelos basados en energía
Si bien existen varios métodos SSL, como la codificación automática y el aprendizaje contrastivo, LeCun enfatiza el uso de modelos basados en energía (EBM).
EBM codifica datos de alta dimensión (como imágenes) en un espacio de incrustación de baja dimensión al retener solo la información relevante. Recuerde: los modelos de IA se entrenan midiendo si dos observaciones son similares. Con este fin, LeCun propuso una arquitectura de aprendizaje basada en EBM llamada «Arquitectura predictiva de incorporación conjunta (JEPA)» para aprender el modelo mundial.
Según LeCun, una característica clave de JEPA es que puede optar por ignorar detalles superfluos que no son fácilmente predecibles. Por ejemplo, en el procesamiento de imágenes, en lugar de predecir el estado del mundo a nivel de píxel, JEPA tiende a aprender características de baja dimensión que son críticas para una tarea determinada. LeCun también explicó cómo las arquitecturas JEPA se superponen para formar una «JEPA jerárquica» (H-JEPA), que puede ser fundamental para manejar tareas complejas como el razonamiento y la planificación en escalas de tiempo múltiples.
Conclusión: IA autónoma ascendente
Si bien algunos investigadores creen que la inteligencia general artificial (AGI) se puede lograr mediante el escalado masivo de arquitecturas de aprendizaje profundo, LeCun dice que el escalado no es suficiente para la IA autónoma. Si bien el escalado ha logrado un progreso increíble en los modelos de lenguaje que involucran datos discretos, no ha tenido un impacto similar en los datos continuos de alta dimensión, como los videos. (Lea también: Primeros pasos con la tecnología de comprensión del lenguaje natural (NLU).)
LeCun tampoco cree que las funciones de recompensa y los algoritmos de refuerzo sean suficientes para lograr AGI. Argumenta que el aprendizaje por refuerzo requiere una interacción constante con el entorno, a diferencia de los humanos y los animales, que utilizan principalmente la percepción para aprender.
Claramente, el marco de LeCun necesita más exploración para abordar sus desafíos de implementación.








