Un nuevo enfoque para entrenar modelos fundamentales en IA

El aprendizaje justo a tiempo, también conocido como «aprendizaje justo a tiempo», es una estrategia emergente que permite que los modelos de IA preentrenados (también llamados «modelos básicos») se reutilicen para otros fines sin capacitación adicional.
El modelo base se entrena inicialmente usando grandes cantidades de datos no estructurados y luego se ajusta para una tarea específica usando datos etiquetados. Sin embargo, este enfoque requiere la introducción de nuevos parámetros en el modelo. Por ejemplo, ajustar un modelo BERT de lenguaje grande para realizar una clasificación binaria requeriría un conjunto adicional de 1024 x 2 parámetros etiquetados.
Por el contrario, el aprendizaje basado en sugerencias permite a los ingenieros lograr el mismo objetivo sin necesidad de nuevos parámetros. En cambio, las señales de texto en lenguaje natural (llamadas «sugerencias») se inyectan en la entrada del modelo de IA durante la fase previa al entrenamiento. Su propósito es proporcionar contexto de manera proactiva para varias tareas potenciales posteriores. (Lea también: Modelos fundamentales: la próxima frontera de la IA.)
¿Qué es una pista?
Las sugerencias son texto contextual en lenguaje natural relevante para una tarea específica. Por ejemplo, si los ingenieros quisieran habilitar un modelo de lenguaje grande para recomendar una película, podrían agregar el mensaje «es» al fragmento de oración de «vale la pena verlo» y crear el mensaje «es». [blank]»
Si los ingenieros agregan suficientes pistas contextuales, el modelo se puede reutilizar sin parámetros adicionales para predecir con éxito si un espacio en blanco debe contener la palabra «recomendado» o «no recomendado».
Señales discretas y suaves.
El ejemplo anterior entrena un modelo de lenguaje grande (LLM) para clasificar una película como «vale la pena verla», con la señal «Fue», que es una «señal discreta». Los avisos discretos se pueden diseñar manualmente usando ingeniería de avisos o automáticamente usando métodos como AutoPrompt. Al sintonizar señales discretas, las señales se mantienen fijas y se sintoniza el modelo preentrenado.
En cambio, las «señales suaves» son esencialmente vectores aleatorios inyectados en la secuencia de entrada. Mientras se ajustan las señales suaves, el modelo preentrenado se mantiene fijo y las señales se ajustan con precisión.
Desafíos del aprendizaje basado en indicaciones
El aprendizaje basado en sugerencias cierra la brecha entre la etapa previa al entrenamiento de un modelo y su uso para múltiples tareas posteriores. Sin embargo, a pesar de sus ventajas, el aprendizaje basado en señales también plantea algunos desafíos.
En el aprendizaje basado en indicaciones, puede ser difícil:
1. Diseña indicaciones efectivas.
Los investigadores han propuesto métodos manuales y automatizados para crear avisos, los cuales requieren:
- Aquellos que entrenan un modelo de IA entienden su funcionamiento interno.
- Un enfoque de prueba y error.
El aprendizaje basado en sugerencias solo se ha explorado en dominios de aplicación limitados, como la clasificación de textos, la respuesta a preguntas y el razonamiento de sentido común.Otras áreas, como el análisis de textos, la extracción de información y el razonamiento analítico, requerirán más Enfoque desafiante para el diseño de señales. (Lea también: IA centrada en datos frente a IA centrada en modelos: claves para algoritmos mejorados.)
2. Encuentre la combinación correcta de plantilla de solicitud y respuesta.
El aprendizaje basado en indicaciones depende en gran medida de la plantilla de indicaciones (p. ej., «lo es») y de la respuesta dada (p. ej., «vale la pena echarle un vistazo»). Con este fin, encontrar la mejor combinación de plantillas y respuestas sigue siendo un desafío y requiere mucho ensayo y error.
A pesar de estos desafíos, el aprendizaje justo a tiempo está emergiendo rápidamente como la próxima evolución de los modelos subyacentes de capacitación. Pero para explicar por qué, necesitamos alejarnos un poco.
Historia del aprendizaje instantáneo
Los primeros modelos de aprendizaje automático se entrenaron mediante aprendizaje supervisado. El aprendizaje supervisado utiliza conjuntos de datos etiquetados y muestras de salida correctas para enseñar a un algoritmo de aprendizaje cómo clasificar datos o predecir resultados. Sin embargo, puede ser difícil encontrar suficientes datos etiquetados para usar este método de manera consistente.
Por lo tanto, la ingeniería de funciones se convierte en una parte esencial de la canalización del aprendizaje automático. La ingeniería de características extrae las características más importantes de los datos sin procesar y las utiliza para guiar el modelo durante el entrenamiento. Tradicionalmente, los investigadores e ingenieros usan su conocimiento de dominio para decidir qué cuenta como las características «más importantes». Sin embargo, en los últimos años, la llegada del aprendizaje profundo ha reemplazado la ingeniería de funciones «práctica» tradicional con el aprendizaje automático de funciones. (Lea también: ¿Por qué es tan importante la selección de funciones en el aprendizaje automático?)
Pero esto nos lleva de vuelta al punto de partida: todavía hay muy pocos conjuntos de datos etiquetados grandes para entrenar modelos de aprendizaje automático.
El aprendizaje autosupervisado (SSL) es un posible enfoque para este desafío. En este aprendizaje no supervisado, el modelo de aprendizaje adopta señales personalizadas como supervisión y utiliza las representaciones aprendidas para tareas posteriores. La llegada de SSL ha permitido a los investigadores entrenar modelos de IA a escala, especialmente para el procesamiento del lenguaje natural (NLP). También produce modelos básicos: algoritmos de aprendizaje profundo preentrenados que se pueden ampliar para realizar una variedad de tareas.
resumir
El campo de la investigación en inteligencia artificial está experimentando un cambio de paradigma: en lugar de entrenar modelos específicos de tareas, se entrenan previamente grandes modelos basados en lenguaje en conjuntos de datos a gran escala.
Al cerrar la brecha entre el entrenamiento previo y las tareas posteriores, el aprendizaje basado en sugerencias hace que sea más conveniente implementar modelos previamente entrenados para tareas posteriores. Esto es especialmente útil en tareas en las que es difícil ajustar modelos previamente entrenados debido a la cantidad limitada de grandes conjuntos de datos etiquetados. (Lea también: Seis formas en que la inteligencia artificial puede mejorar la productividad empresarial.)








