Un nuevo enfoque para entrenar modelos fundamentales en IA

0 1 4 minutos de lectura

Prompt Learning: A New Way to Train Foundation Models in AI

El aprendizaje justo a tiempo, también conocido como «aprendizaje justo a tiempo», es una estrategia emergente que permite que los modelos de IA preentrenados (también llamados «modelos básicos») se reutilicen para otros fines sin capacitación adicional.

El modelo base se entrena inicialmente usando grandes cantidades de datos no estructurados y luego se ajusta para una tarea específica usando datos etiquetados. Sin embargo, este enfoque requiere la introducción de nuevos parámetros en el modelo. Por ejemplo, ajustar un modelo BERT de lenguaje grande para realizar una clasificación binaria requeriría un conjunto adicional de 1024 x 2 parámetros etiquetados.

Por el contrario, el aprendizaje basado en sugerencias permite a los ingenieros lograr el mismo objetivo sin necesidad de nuevos parámetros. En cambio, las señales de texto en lenguaje natural (llamadas «sugerencias») se inyectan en la entrada del modelo de IA durante la fase previa al entrenamiento. Su propósito es proporcionar contexto de manera proactiva para varias tareas potenciales posteriores. (Lea también: Modelos fundamentales: la próxima frontera de la IA.)

Tabla de Contenidos

¿Qué es una pista?

Las sugerencias son texto contextual en lenguaje natural relevante para una tarea específica. Por ejemplo, si los ingenieros quisieran habilitar un modelo de lenguaje grande para recomendar una película, podrían agregar el mensaje «es» al fragmento de oración de «vale la pena verlo» y crear el mensaje «es». [blank]»

LEER

¿Cómo compone música un modelo de IA?

Si los ingenieros agregan suficientes pistas contextuales, el modelo se puede reutilizar sin parámetros adicionales para predecir con éxito si un espacio en blanco debe contener la palabra «recomendado» o «no recomendado».

Señales discretas y suaves.

El ejemplo anterior entrena un modelo de lenguaje grande (LLM) para clasificar una película como «vale la pena verla», con la señal «Fue», que es una «señal discreta». Los avisos discretos se pueden diseñar manualmente usando ingeniería de avisos o automáticamente usando métodos como AutoPrompt. Al sintonizar señales discretas, las señales se mantienen fijas y se sintoniza el modelo preentrenado.

En cambio, las «señales suaves» son esencialmente vectores aleatorios inyectados en la secuencia de entrada. Mientras se ajustan las señales suaves, el modelo preentrenado se mantiene fijo y las señales se ajustan con precisión.

Desafíos del aprendizaje basado en indicaciones

El aprendizaje basado en sugerencias cierra la brecha entre la etapa previa al entrenamiento de un modelo y su uso para múltiples tareas posteriores. Sin embargo, a pesar de sus ventajas, el aprendizaje basado en señales también plantea algunos desafíos.

En el aprendizaje basado en indicaciones, puede ser difícil:

1. Diseña indicaciones efectivas.

Los investigadores han propuesto métodos manuales y automatizados para crear avisos, los cuales requieren:

Aquellos que entrenan un modelo de IA entienden su funcionamiento interno.
Un enfoque de prueba y error.

El aprendizaje basado en sugerencias solo se ha explorado en dominios de aplicación limitados, como la clasificación de textos, la respuesta a preguntas y el razonamiento de sentido común.Otras áreas, como el análisis de textos, la extracción de información y el razonamiento analítico, requerirán más Enfoque desafiante para el diseño de señales. (Lea también: IA centrada en datos frente a IA centrada en modelos: claves para algoritmos mejorados.)

2. Encuentre la combinación correcta de plantilla de solicitud y respuesta.

El aprendizaje basado en indicaciones depende en gran medida de la plantilla de indicaciones (p. ej., «lo es») y de la respuesta dada (p. ej., «vale la pena echarle un vistazo»). Con este fin, encontrar la mejor combinación de plantillas y respuestas sigue siendo un desafío y requiere mucho ensayo y error.

A pesar de estos desafíos, el aprendizaje justo a tiempo está emergiendo rápidamente como la próxima evolución de los modelos subyacentes de capacitación. Pero para explicar por qué, necesitamos alejarnos un poco.

Historia del aprendizaje instantáneo

Los primeros modelos de aprendizaje automático se entrenaron mediante aprendizaje supervisado. El aprendizaje supervisado utiliza conjuntos de datos etiquetados y muestras de salida correctas para enseñar a un algoritmo de aprendizaje cómo clasificar datos o predecir resultados. Sin embargo, puede ser difícil encontrar suficientes datos etiquetados para usar este método de manera consistente.

Por lo tanto, la ingeniería de funciones se convierte en una parte esencial de la canalización del aprendizaje automático. La ingeniería de características extrae las características más importantes de los datos sin procesar y las utiliza para guiar el modelo durante el entrenamiento. Tradicionalmente, los investigadores e ingenieros usan su conocimiento de dominio para decidir qué cuenta como las características «más importantes». Sin embargo, en los últimos años, la llegada del aprendizaje profundo ha reemplazado la ingeniería de funciones «práctica» tradicional con el aprendizaje automático de funciones. (Lea también: ¿Por qué es tan importante la selección de funciones en el aprendizaje automático?)

Pero esto nos lleva de vuelta al punto de partida: todavía hay muy pocos conjuntos de datos etiquetados grandes para entrenar modelos de aprendizaje automático.

El aprendizaje autosupervisado (SSL) es un posible enfoque para este desafío. En este aprendizaje no supervisado, el modelo de aprendizaje adopta señales personalizadas como supervisión y utiliza las representaciones aprendidas para tareas posteriores. La llegada de SSL ha permitido a los investigadores entrenar modelos de IA a escala, especialmente para el procesamiento del lenguaje natural (NLP). También produce modelos básicos: algoritmos de aprendizaje profundo preentrenados que se pueden ampliar para realizar una variedad de tareas.

resumir

El campo de la investigación en inteligencia artificial está experimentando un cambio de paradigma: en lugar de entrenar modelos específicos de tareas, se entrenan previamente grandes modelos basados en lenguaje en conjuntos de datos a gran escala.

Al cerrar la brecha entre el entrenamiento previo y las tareas posteriores, el aprendizaje basado en sugerencias hace que sea más conveniente implementar modelos previamente entrenados para tareas posteriores. Esto es especialmente útil en tareas en las que es difícil ajustar modelos previamente entrenados debido a la cantidad limitada de grandes conjuntos de datos etiquetados. (Lea también: Seis formas en que la inteligencia artificial puede mejorar la productividad empresarial.)

LEER

He aquí por qué los actores están tan preocupados por la inteligencia artificial

Etiquetas

0 1 4 minutos de lectura

Un nuevo enfoque para entrenar modelos fundamentales en IA

¿Qué es una pista?

Señales discretas y suaves.

Desafíos del aprendizaje basado en indicaciones

1. Diseña indicaciones efectivas.

2. Encuentre la combinación correcta de plantilla de solicitud y respuesta.

Historia del aprendizaje instantáneo

resumir

Read Next

¿Puede la IA reemplazar a los actores?El principio de funcionamiento de la tecnología dual digital es el siguiente

Tecnología de reconocimiento automático de amenazas y seguridad aeroportuaria

AI diseña experimentos de física cuántica más allá de lo que cualquier ser humano haya concebido

Análisis forense digital: la guía definitiva

Evolution Gym esculpe nuevos cuerpos y cerebros de robots

¿Puede la IA reemplazar a los actores?El principio de funcionamiento de la tecnología dual digital es el siguiente

Tecnología de reconocimiento automático de amenazas y seguridad aeroportuaria

AI diseña experimentos de física cuántica más allá de lo que cualquier ser humano haya concebido

Análisis forense digital: la guía definitiva

Evolution Gym esculpe nuevos cuerpos y cerebros de robots

Deja una respuesta Cancelar la respuesta

Vitality Netball Superleague: Saracens y Razia Quashie de Inglaterra se someten a cirugía después de una lesión en el tendón de Aquiles | Noticias de baloncesto

Shakur Stevenson reina después de ser despojado del cinturón por bajo peso Robson Consecco Boxing News

Todas las formas en que la tecnología Blockchain está remodelando la seguridad en línea

Los alquileres se disparan a medida que los inversores adinerados compran parques de casas móviles

Más del 80% de los niños españoles de 3 a 6 años aprenden una lengua extranjera

Cómo evitar que los restaurantes provoquen infecciones por COVID

Finlandia insiste en el derecho a unirse a la OTAN y critica a Rusia

Baloncesto de los Juegos de la Commonwealth: Claire Maxwell liderará a Escocia en Birmingham | Noticias de baloncesto

5 beneficios de obtener servicios de instalación de aislamiento

El primer Foro Ambiental del Golfo de Arabia Saudita ahora está abierto para el registro

Después del fracaso de Ocean Story, los buzos de rescate necesitan un sistema global de alerta de rescate

¿Los antidepresivos son adecuados para usted?Pregunta por tus ondas cerebrales

¿Qué es una pista?

Señales discretas y suaves.

Desafíos del aprendizaje basado en indicaciones

1. Diseña indicaciones efectivas.

2. Encuentre la combinación correcta de plantilla de solicitud y respuesta.

Historia del aprendizaje instantáneo

resumir

Read Next

¿Puede la IA reemplazar a los actores?El principio de funcionamiento de la tecnología dual digital es el siguiente

Tecnología de reconocimiento automático de amenazas y seguridad aeroportuaria

AI diseña experimentos de física cuántica más allá de lo que cualquier ser humano haya concebido

Análisis forense digital: la guía definitiva

Evolution Gym esculpe nuevos cuerpos y cerebros de robots

Castleford Tigers: cómo Lee Radford y Andy Last están aprovechando las lecciones de la Copa Mundial de Rugby League en 2023 | Noticias de la Liga de Rugby

Joseph Parker vence a Jake Massey, Fraser Clark domina a Chris Eubank Jr. vs. Liam Smith | Noticias del boxeo

Publicaciones relacionadas

Deja una respuesta Cancelar la respuesta