¿Cuándo tiene sentido hacer fine-tuning en lugar de usar prompting? Exploramos LoRA, QLoRA y full fine-tuning con casos reales de costos, datasets y métricas de evaluación.
El fine-tuning de modelos de lenguaje permite adaptar un modelo fundacional a un dominio o tarea específica, logrando resultados superiores al prompting para casos con terminología especializada o formatos de salida muy definidos. Técnicas como LoRA y QLoRA han reducido dramáticamente los costos de entrenamiento, haciendo viable el fine-tuning incluso para startups. En esta guía compartimos nuestra metodología: cuándo optar por fine-tuning versus prompting, cómo preparar datasets de calidad, qué hiperparámetros ajustar y cómo evaluar los resultados con métricas objetivas.
