Modelos de procesamiento del lenguaje: del NLP clásico a los LLM
¿Qué es NLP?
NLP (Procesamiento del Lenguaje Natural) es la disciplina que permite que una máquina entienda, analice y genere texto.
Ejemplos: traductores, chatbots, resumen automático, clasificación de emails, búsqueda inteligente.
1) Modelos clásicos (NLP tradicional)
Los modelos clásicos convierten texto en números de forma simple.
- Bag of Words: cuenta palabras
- TF-IDF: cuenta palabras pero “pesa” más las importantes
✅ Ventaja: rápido y fácil
❌ Limitación: entiende poco contexto (no capta significado profundo)
2) Embeddings (representar significado)
Los embeddings convierten palabras o frases en vectores que capturan relación semántica.
Ejemplo simple:
- “coche” y “automóvil” estarán cerca
- “coche” y “ensalada” estarán lejos
3) Transformers (salto grande)
Transformers usan un mecanismo llamado atención para entender qué partes del texto importan más según el contexto.
Esto mejora muchísimo:
- Comprensión
- Coherencia
- Dependencias largas (frases largas, referencias)
4) LLM (Large Language Models)
Los LLM son modelos muy grandes entrenados con enormes cantidades de texto para:
- Responder preguntas
- Resumir
- Traducir
- Generar contenido
- Ayudar a programar
Pero: no son infalibles. Pueden inventar (alucinaciones), por eso hay que verificar.
Entrenamiento vs inferencia (muy importante)
- Entrenamiento: cuando aprende patrones (costoso)
- Inferencia: cuando tú lo usas para responder (lo que hacemos en el día a día)
Conclusión
Hemos pasado de “contar palabras” a modelos que entienden contexto.
Aun así, el uso profesional exige siempre:
- Validación
- Pruebas
- Criterio humano
