Dominio 2 · Fundamentos de IA generativa AIF-C01

Dominio 2 · IA generativa

Dominio 2 · Fundamentos de IA generativa

◷ 31 min

El Dominio 2 es el bloque donde el examen AIF-C01 comprueba si entiendes de verdad qué es la IA generativa, cómo funciona a alto nivel, qué problemas puede resolver, qué limitaciones tiene y qué tecnologías de AWS aparecen cuando se construyen aplicaciones GenAI. No necesitas saber entrenar un transformer desde cero, pero sí debes razonar bien escenarios sobre tokens, embeddings, prompts, modelos fundacionales, RAG, alucinaciones, coste, latencia, seguridad y servicios como Amazon Bedrock.

GenAI LLM Tokens Embeddings Transformers RAG Amazon Bedrock Guardrails

Enfoque para el examen: este dominio no va solo de memorizar definiciones. AWS suele plantear preguntas donde debes elegir el enfoque más adecuado: cuándo basta con un prompt, cuándo necesitas RAG, cuándo evaluar un modelo, cuándo aplicar guardrails y cuándo el riesgo de alucinación, coste o privacidad cambia la respuesta.

1. Qué cubre el Dominio 2 de AIF-C01

El Dominio 2 se centra en los fundamentos de la IA generativa. En términos prácticos, debes ser capaz de explicar qué hace un modelo generativo, cómo representa el texto, por qué necesita prompts, qué papel tienen los modelos fundacionales, qué limitaciones aparecen y qué servicios de AWS ayudan a construir soluciones de GenAI.

Conceptos básicos de GenAI

Qué es la IA generativa, qué son los modelos fundacionales, qué son los LLM, cómo se usan prompts y qué significa generar contenido nuevo.

Representación del lenguaje

Tokens, embeddings y vectores. Debes entender que el texto se transforma en representaciones numéricas que el modelo puede procesar.

Capacidades y limitaciones

Generación, resumen, transformación, conversación y asistencia; pero también alucinaciones, no determinismo, sesgos, coste, latencia y privacidad.

AWS para GenAI

Amazon Bedrock, modelos fundacionales, Knowledge Bases, Agents, guardrails, SageMaker AI y otros servicios que pueden aparecer en escenarios de examen.

2. Qué es IA generativa

La IA generativa es una rama de la IA capaz de crear contenido nuevo a partir de patrones aprendidos durante el entrenamiento y de instrucciones recibidas en tiempo de inferencia. Ese contenido puede ser texto, código, imágenes, audio, vídeo, resúmenes, respuestas conversacionales o datos estructurados.

La idea clave es que el modelo no se limita a buscar una respuesta exacta en una tabla. Genera una salida probabilística basándose en el contexto recibido y en lo aprendido durante el entrenamiento. Por eso puede ser muy potente para tareas abiertas, pero también puede equivocarse con seguridad si no se controla.

Tipo de tarea	Qué hace GenAI	Ejemplo
Generación	Crea contenido nuevo siguiendo instrucciones.	Redactar un email, generar un resumen ejecutivo o crear una propuesta.
Transformación	Cambia formato, tono, idioma o estructura de una entrada.	Convertir notas de reunión en tareas o traducir un mensaje.
Resumen	Reduce documentos largos a ideas clave.	Resumir contratos, tickets o documentación técnica.
Conversación	Responde preguntas y mantiene contexto.	Asistente interno de soporte o chatbot de atención al cliente.
Razonamiento asistido	Ayuda a analizar información y proponer pasos.	Comparar opciones, generar checklist o explicar errores.

3. Modelo fundacional, LLM y modelo multimodal

Un modelo fundacional es un modelo de gran escala entrenado con grandes cantidades de datos y que puede adaptarse a muchos casos de uso. Un LLM, o large language model, es un modelo fundacional centrado principalmente en lenguaje. Un modelo multimodal puede trabajar con más de una modalidad, por ejemplo texto e imagen.

Modelo fundacional

Base amplia y reutilizable. Puede servir para resumir, clasificar, responder, generar texto o actuar como parte de una aplicación más compleja.

LLM

Modelo especializado en lenguaje natural. Se usa para chatbots, generación de texto, análisis de documentos, clasificación de texto y asistencia conversacional.

Modelo multimodal

Procesa varias modalidades. Puede recibir texto e imagen o generar resultados a partir de diferentes tipos de entrada.

Modelo de difusión

Suele asociarse a generación de imágenes u otros contenidos visuales. El examen puede mencionarlo como un tipo de modelo generativo.

Pista de examen

Si el escenario habla de acceder a modelos fundacionales mediante una API gestionada sin administrar infraestructura, la respuesta suele apuntar a Amazon Bedrock. Si habla de construir, entrenar o desplegar modelos ML personalizados con más control, puede aparecer Amazon SageMaker AI.

4. Tokens: la unidad práctica del texto

Los modelos generativos no procesan el texto exactamente como lo vemos las personas. Primero lo dividen en unidades llamadas tokens. Un token puede ser una palabra, parte de una palabra, un signo de puntuación o una combinación de caracteres. El número de tokens afecta al coste, a la latencia y a la cantidad de contexto que el modelo puede manejar.

Por qué importan los tokens

Coste: muchas soluciones se facturan en función de tokens de entrada y salida.
Latencia: prompts más largos suelen tardar más en procesarse.
Ventana de contexto: cada modelo tiene un máximo de tokens que puede manejar en una interacción.
Diseño de prompts: incluir contexto irrelevante aumenta coste y puede empeorar la respuesta.

Escenario típico: una aplicación envía siempre documentos completos al modelo aunque el usuario solo pregunte por un apartado concreto. La solución no es necesariamente usar un modelo más grande, sino reducir contexto innecesario o recuperar solo fragmentos relevantes mediante RAG.

5. Embeddings y vectores

Un embedding es una representación numérica de un texto, imagen u otro dato. Esa representación permite comparar similitud semántica: dos frases pueden ser parecidas en significado aunque usen palabras distintas. Los embeddings son fundamentales para búsqueda semántica y RAG.

Concepto	Explicación sencilla	Para qué sirve
Embedding	Representación numérica de significado.	Comparar textos por similitud semántica.
Vector	Lista de números que representa el embedding.	Almacenarlo y consultarlo en una base vectorial.
Búsqueda semántica	Busca por significado, no solo por palabras exactas.	Encontrar documentos relevantes aunque el usuario formule la pregunta de otra forma.
Base vectorial	Almacena embeddings y permite recuperar los más parecidos.	Implementar RAG y asistentes sobre documentación.

6. Transformers y atención

Los transformers son una arquitectura clave en muchos modelos modernos de lenguaje. No necesitas dominar las matemáticas para AIF-C01, pero sí entender la idea general: permiten procesar secuencias de texto y prestar atención a las partes relevantes del contexto para generar una respuesta.

El mecanismo de atención ayuda al modelo a ponderar qué tokens del contexto son más importantes para producir la salida. Esto es una de las razones por las que los LLM pueden trabajar con instrucciones, contexto y conversaciones relativamente largas.

No caigas en una trampa: que un modelo pueda procesar contexto largo no significa que razone perfectamente ni que toda respuesta sea verdadera. La arquitectura ayuda, pero no elimina alucinaciones, sesgos ni errores de interpretación.

7. Prompts e ingeniería de peticiones

Un prompt es la instrucción o entrada que se envía al modelo. La calidad del prompt influye mucho en la salida. La ingeniería de peticiones consiste en diseñar instrucciones claras, contexto suficiente, formato esperado, restricciones y ejemplos para mejorar la respuesta sin entrenar un modelo nuevo.

1Rol y objetivo. Indica qué papel debe asumir el modelo y qué tarea debe completar.

2Contexto. Proporciona información relevante, pero evita incluir datos innecesarios o sensibles.

3Restricciones. Define tono, idioma, longitud, formato y límites de respuesta.

4Ejemplos. En few-shot prompting, se incluyen ejemplos de entrada y salida para guiar el patrón esperado.

8. RAG: Retrieval Augmented Generation

RAG combina recuperación de información con generación. Primero se buscan fragmentos relevantes en una fuente externa, como documentos internos. Después esos fragmentos se pasan al modelo como contexto para generar una respuesta mejor fundamentada.

RAG es una idea muy importante para el examen porque resuelve una limitación habitual: los modelos no conocen automáticamente información privada, reciente o específica de una empresa.

Situación	Enfoque más adecuado	Por qué
El modelo inventa respuestas sobre documentación interna	RAG con fuentes autorizadas.	Permite fundamentar la respuesta en documentos reales.
La política cambia cada semana	Actualizar base de conocimiento.	Evita reajustar el modelo constantemente.
El problema es tono o formato	Prompt engineering.	No falta conocimiento; falta controlar la salida.
Hay muchos ejemplos revisados y una tarea estable	Fine-tuning o personalización.	Puede adaptar el comportamiento del modelo si el prompt no basta.

9. Capacidades y limitaciones de GenAI

La IA generativa puede acelerar tareas de conocimiento, pero no debe tratarse como una fuente infalible. Su uso en producción exige controles de calidad, evaluación y seguridad.

Capacidades

Redacción y resumen.
Asistentes conversacionales.
Transformación de texto.
Generación de código o ideas.
Búsqueda semántica con RAG.

Limitaciones

Alucinaciones.
No determinismo.
Sesgos.
Riesgo de fuga de datos.
Coste y latencia elevados si se diseña mal.

10. AWS para aplicaciones de IA generativa

En AIF-C01 debes reconocer qué servicios AWS aparecen en escenarios de GenAI. No necesitas memorizar todos los detalles internos, pero sí saber qué papel cumple cada uno.

Servicio	Rol en GenAI	Cómo puede aparecer en el examen
Amazon Bedrock	Acceso gestionado a modelos fundacionales y herramientas para crear aplicaciones GenAI.	Usar FMs mediante API sin administrar infraestructura.
Knowledge Bases for Amazon Bedrock	Permite implementar RAG con fuentes de datos y recuperación de contexto.	Responder sobre documentación interna actualizada.
Agents for Amazon Bedrock	Permite que una aplicación orqueste pasos y use herramientas o APIs.	Asistente que consulta sistemas o ejecuta acciones.
Guardrails for Amazon Bedrock	Aplica controles de seguridad y filtrado de contenido.	Reducir respuestas dañinas o temas no permitidos.
Amazon SageMaker AI	Construcción, entrenamiento y despliegue de modelos ML con más control.	Escenarios de ML personalizado o ciclo de vida avanzado.
Amazon Q	Asistente generativo para productividad, negocio o desarrollo según el producto.	Asistencia conversacional gestionada para usuarios o desarrolladores.

11. Seguridad y privacidad desde el diseño

GenAI puede manejar información sensible en prompts, documentos, respuestas o logs. Por eso hay que pensar en seguridad desde el principio: autenticación, autorización, mínimo privilegio, cifrado, control de fuentes, auditoría y protección de datos personales.

✓No metas en contexto datos que el usuario no pueda ver. En RAG, la autorización debe aplicarse antes o durante la recuperación, no solo después.

✓Usa guardrails como capa de control. Ayudan a filtrar contenido no deseado, pero no sustituyen IAM, cifrado o gobernanza.

✓Registra y monitoriza. Las aplicaciones GenAI necesitan observabilidad, trazabilidad y revisión de calidad.

12. Cómo razonar preguntas del Dominio 2

Palabras del escenario	Piensa en...	Evita...
Documentación interna, conocimiento actualizado, fuentes	RAG, Knowledge Bases, embeddings, búsqueda semántica.	Confiar solo en el conocimiento preentrenado del modelo.
Formato, tono, estilo, salida estructurada	Prompt engineering, few-shot examples, parámetros de inferencia.	Entrenar desde cero como primera opción.
Contenido no permitido, respuestas dañinas	Guardrails, filtros, políticas de seguridad.	Confiar solo en una instrucción del prompt.
Coste alto o latencia alta	Reducir tokens, elegir modelo adecuado, recuperar solo contexto relevante.	Usar siempre el modelo más grande.
Ejecutar acciones o consultar sistemas	Agents, herramientas, validación y confirmación.	Dar permisos amplios sin control.

Mini escenario de examen

Una empresa quiere un asistente que responda preguntas sobre procedimientos internos que cambian con frecuencia. Quiere evitar reentrenar el modelo cada semana. La opción más razonable es usar RAG o Knowledge Bases con documentos actualizados, no fine-tuning continuo ni entrenamiento desde cero.

13. Errores frecuentes

Confundir tokens con palabras exactas. Un token puede ser una palabra, parte de una palabra o símbolo.
Usar fine-tuning para conocimiento cambiante. Si el problema es información actualizada, suele encajar mejor RAG.
Elegir siempre el modelo más grande. Puede aumentar coste y latencia sin aportar mejora suficiente.
Confiar en el prompt como único control. Para seguridad hacen falta permisos, guardrails, auditoría y control de datos.
Pensar que RAG elimina todas las alucinaciones. RAG ayuda, pero requiere buena recuperación, fuentes fiables y evaluación.

Resumen final

El Dominio 2 exige entender los fundamentos de la IA generativa y aplicarlos a escenarios prácticos. Recuerda la cadena principal: el usuario escribe un prompt, el texto se tokeniza, el modelo procesa el contexto, genera una respuesta y la aplicación debe controlar calidad, seguridad, coste y experiencia de usuario.

Para el examen, asocia conocimiento interno y actualizado con RAG; formato y tono con prompt engineering; modelos fundacionales gestionados con Amazon Bedrock; acciones con sistemas externos con agents; y seguridad de contenido con guardrails. Esa lógica te ayudará a descartar respuestas demasiado absolutas o costosas.

← Anterior Conceptos de IA generativa →