Fundamentos del Muestreo
Un modelo de lenguaje generativo, en su núcleo, es un predictor de probabilidades. Para cada paso en la generación de texto, calcula una distribución de probabilidad sobre todo su vocabulario para determinar cuál será el siguiente "token" (palabra o sub-palabra). Los hiperparámetros de muestreo actúan sobre esta distribución para influir en cómo se selecciona el siguiente token.
Técnicamente, la temperatura modifica la distribución de probabilidad de los logits (los resultados brutos no normalizados) del modelo antes de aplicar la función Softmax.
Los Hiperparámetros Clave
Temperature (El Termostato)
Controla la aleatoriedad. Temperaturas bajas (→0) generan respuestas predecibles y conservadoras. Temperaturas altas (→2) fomentan la creatividad y la diversidad.
Top-p (Nucleus Sampling)
Filtra dinámicamente el conjunto de tokens candidatos basándose en su probabilidad acumulada. Es un método adaptativo para mantener la coherencia.
Top-k (Filtro Fijo)
Limita la selección a los 'k' tokens más probables. Es un método más simple pero menos flexible que Top-p para evitar opciones extrañas.
La Interacción Sinergética
La `Temperatura` es el "acelerador de la creatividad": da oportunidad a opciones raras e inesperadas.
El `Top_p` es el "guardarraíl de la coherencia": elimina la "cola larga" de opciones absurdas, sin importar cuán alta sea la temperatura.
La práctica experta consiste en ajustar ambos para lograr un control granular: usar la temperatura para fomentar la diversidad y `top_p` para mantener la calidad y relevancia.
Perfiles de Configuración (Haz clic para explorar)
1. El Extractor Preciso
Máxima fidelidad y repetibilidad para tareas factuales.
2. El Generador Fiable
Coherencia y profesionalismo para comunicación formal.
3. El Escritor Equilibrado
El punto óptimo entre creatividad y coherencia.
4. El Explorador Creativo
Para generar ideas disruptivas y superar el bloqueo creativo.
5. El Generador de Caos
Aleatoriedad pura para experimentación y arte abstracto.