23.6 Transferencia de aprendizaje y ajuste: ajuste de capas

El aprendizaje por transferencia, o Transfer Learning, es una técnica poderosa en el campo del aprendizaje automático, especialmente en tareas de visión por computadora y procesamiento del lenguaje natural. En esencia, Transfer Learning implica tomar un modelo previamente entrenado, que fue desarrollado para una tarea específica, y adaptarlo a una nueva tarea relacionada. Esto es particularmente útil cuando tenemos un conjunto de datos limitado para la nueva tarea o cuando queremos ahorrar recursos computacionales que serían necesarios para entrenar un modelo desde cero.

Uno de los aspectos más cruciales del aprendizaje por transferencia es el ajuste, que es el proceso de ajustar el modelo previamente entrenado para la nueva tarea. El ajuste fino se puede realizar en diferentes niveles según la tarea en cuestión y la cantidad de datos disponibles. En este texto, nos centraremos en el ajuste de capas en modelos de aprendizaje profundo, particularmente en redes neuronales convolucionales (CNN) utilizadas en visión por computadora.

Comprensión del modelo previamente entrenado

Los modelos de aprendizaje profundo, como las CNN, se componen de muchas capas que aprenden representaciones de datos en diferentes niveles de abstracción. En los modelos previamente entrenados para visión por computadora, las primeras capas generalmente aprenden características genéricas como bordes y texturas, mientras que las capas más profundas aprenden características más específicas del conjunto de datos en el que fueron entrenadas.

Decidir qué capas ajustar

La decisión de qué capas de un modelo previamente entrenado deben ajustarse depende de varios factores, como la similitud entre la nueva tarea y la tarea original del modelo, la cantidad de datos disponibles para la nueva tarea y la capacidad de potencia informática disponible. Si la nueva tarea es muy similar a la tarea original, puede ser suficiente simplemente ajustar las últimas capas del modelo. Por otro lado, si las tareas son muy diferentes, puede que sea necesario afinar más capas o incluso todas.

Proceso de ajuste

El proceso de ajuste generalmente sigue los siguientes pasos:

  1. Elección de un modelo previamente entrenado: seleccione un modelo que haya sido entrenado en un gran conjunto de datos generalistas, como ImageNet para tareas de visión por computadora.
  2. Adaptación a la nueva tarea: modifique la última capa del modelo (generalmente una capa densa o una capa softmax) para que coincida con el número de clases en la nueva tarea.
  3. Congelar capas: Inicialmente, congele las capas que no desea ajustar, permitiendo que solo las capas no congeladas se actualicen durante el entrenamiento.
  4. Entrenamiento inicial: entrene el modelo con las nuevas capas adaptadas utilizando el nuevo conjunto de datos de tareas. Esto permite que el modelo ajuste los pesos de estas capas para la nueva tarea sin cambiar las características aprendidas en las capas congeladas.
  5. Descongelación selectiva: después del entrenamiento inicial, puede optar por descongelar algunas de las capas congeladas y continuar entrenando para permitir que el modelo ajuste aún más sus pesos a las peculiaridades de la nueva tarea.
  6. Regularización y ajuste fino: durante el ajuste fino, es importante utilizar técnicas de regularización como el abandono y la regularización L2 para evitar un ajuste excesivo, especialmente si el conjunto de datos de la nueva tarea es pequeño.

Consideraciones importantes

Al realizar ajustes, es fundamental tener en cuenta algunas consideraciones importantes:

  • Velocidad de aprendizaje: generalmente se recomienda utilizar una tasa de aprendizaje más baja durante el ajuste fino que la utilizada en el entrenamiento inicial, para evitar destruir las representaciones útiles aprendidas por el modelo previamente entrenado. li>
  • Equilibrio de datos: si el conjunto de datos de la nueva tarea no está equilibrado, pueden ser necesarias técnicas como la ponderación de clases o el sobremuestreo para evitar sesgos en las predicciones del modelo.
  • Supervisión del rendimiento: utilice un conjunto de validación para supervisar el rendimiento del modelo durante el ajuste y ajuste el proceso según sea necesario para evitar un ajuste excesivo o insuficiente.

Conclusión

El ajuste fino es una técnica esencial para aprovechar al máximo los modelos previamente entrenados para nuevas tareas. Al ajustar cuidadosamente las capas de un modelo previamente entrenado, puede lograr un rendimiento notable incluso con conjuntos de datos relativamente pequeños. Sin embargo, el éxito del ajuste depende de una serie de decisiones estratégicas relacionadas con qué capas ajustar, cómo ajustarlas y cómo monitorear y regular el proceso de ajuste.capacitación. Con el enfoque correcto, el ajuste puede ser una herramienta poderosa para resolver una amplia variedad de problemas de aprendizaje automático.

Ahora responde el ejercicio sobre el contenido:

¿Cuál de los siguientes pasos NO es correcto según el proceso de ajuste descrito en el texto?

¡Tienes razón! Felicitaciones, ahora pasa a la página siguiente.

¡Tú error! Inténtalo de nuevo.

Imagen del artículo Transferir aprendizaje y ajuste: congelación de capas 91

Siguiente página del libro electrónico gratuito:

Transferir aprendizaje y ajuste: congelación de capas

Tiempo estimado de lectura: 4 minutos

Descarga la aplicación para obtener una certificación gratuita y escuchar cursos en segundo plano, incluso con la pantalla apagada.

+ 9 millones
estudiantes

Certificado gratuito y
válido con código QR

60 mil ejercicios
gratis

Calificación de 4.8/5
en tiendas de aplicaciones

Cursos gratuitos de
vídeo y audiolibros