Servicios de AWS para crear aplicaciones de IA generativa

Dominio 2 · IA generativa

Servicios de AWS para crear aplicaciones de IA generativa

◷ 33 min

En AWS, las aplicaciones de IA generativa no se construyen alrededor de un único servicio. Normalmente combinan modelos fundacionales, orquestación, fuentes de datos, seguridad, control de acceso, evaluación, costes y monitorización. Para el examen AWS Certified AI Practitioner AIF-C01, debes reconocer qué servicio AWS encaja en cada escenario y qué problema resuelve dentro de una arquitectura GenAI.

Amazon Bedrock Knowledge Bases Agents Guardrails Amazon Q SageMaker JumpStart Coste por tokens

Pista de examen: cuando el enunciado hable de crear aplicaciones GenAI con modelos fundacionales gestionados, piensa primero en Amazon Bedrock. Si habla de preguntas sobre documentos internos, piensa en Knowledge Bases. Si habla de ejecutar acciones o llamar APIs, piensa en Agents. Si habla de filtros, temas no permitidos o seguridad de contenido, piensa en Guardrails.

1. Qué debes saber de esta página para AIF-C01

Este módulo conecta los conceptos de IA generativa con los servicios concretos de AWS. El examen no te va a pedir desplegar código, pero sí elegir el servicio correcto, identificar cuándo usar un patrón administrado y razonar sobre coste, seguridad, rendimiento y gobierno.

Amazon Bedrock

Servicio administrado para crear aplicaciones de IA generativa usando modelos fundacionales de AWS y de terceros mediante API, sin gestionar infraestructura de entrenamiento o inferencia.

Amazon Q

Familia de asistentes generativos de AWS para productividad, desarrollo, análisis y soporte a usuarios, con integración en contextos empresariales.

Amazon SageMaker AI y JumpStart

Entorno más amplio para construir, entrenar, ajustar, evaluar y desplegar modelos de ML. JumpStart ayuda a descubrir y empezar con modelos, soluciones y ejemplos.

PartyRock

Herramienta de aprendizaje y prototipado rápido para crear aplicaciones GenAI de forma sencilla, útil para experimentar, no para sustituir una arquitectura empresarial gobernada.

2. Amazon Bedrock: el servicio clave para GenAI en AWS

Amazon Bedrock es uno de los servicios más importantes para AIF-C01. Permite acceder a modelos fundacionales mediante APIs administradas y crear aplicaciones generativas sin aprovisionar servidores, clusters de GPU o infraestructura propia para inferencia. En el examen, Bedrock suele aparecer cuando el escenario pide construir una aplicación GenAI en AWS de forma gestionada.

Qué resuelve Bedrock

Acceso a modelos fundacionales de distintos proveedores desde un servicio administrado.
Invocación de modelos para generación de texto, resumen, extracción, clasificación, embeddings o casos multimodales, según el modelo elegido.
Construcción de aplicaciones con patrones como RAG, agentes y guardrails.
Reducción de la carga operativa frente a desplegar modelos manualmente en infraestructura propia.
Integración con controles de seguridad, permisos, cifrado, logs y servicios del ecosistema AWS.

No confundas Bedrock con SageMaker: Bedrock está muy orientado a consumir y construir aplicaciones con modelos fundacionales gestionados. SageMaker AI es una plataforma más amplia de ML para crear, entrenar, ajustar, evaluar y desplegar modelos con más control del ciclo de vida.

3. Amazon Bedrock frente a Amazon SageMaker AI

Una de las decisiones típicas del examen es elegir entre un servicio administrado de modelos fundacionales y una plataforma más flexible para ML. No hay una única respuesta universal: depende del escenario.

Necesidad del escenario	Servicio más probable	Razonamiento
Crear una app GenAI con modelos fundacionales mediante API	Amazon Bedrock	Bedrock reduce operación y permite usar modelos fundacionales gestionados sin administrar infraestructura.
Entrenar, ajustar o desplegar modelos propios con control del ciclo ML	Amazon SageMaker AI	SageMaker encaja mejor cuando necesitas un flujo ML más completo y personalizable.
Explorar modelos y soluciones preconstruidas para empezar rápido	SageMaker JumpStart	JumpStart ayuda a descubrir modelos, notebooks, soluciones y ejemplos.
Prototipar una aplicación GenAI sencilla sin entrar en arquitectura empresarial	PartyRock	PartyRock es útil para experimentar y aprender rápidamente.

4. Knowledge Bases for Amazon Bedrock

Knowledge Bases for Amazon Bedrock permite conectar modelos fundacionales con fuentes de conocimiento empresariales mediante un patrón RAG. Es decir, la aplicación recupera fragmentos relevantes de documentos o datos propios y los proporciona como contexto al modelo para generar una respuesta más fundamentada.

Escenario típico de examen: una empresa quiere que un asistente responda preguntas sobre manuales internos que cambian con frecuencia. No quiere reentrenar el modelo cada semana. La opción razonable es usar RAG con una base de conocimiento actualizada.

Qué problema resuelve

Permite usar conocimiento interno o actualizado sin entrenar desde cero.
Reduce respuestas inventadas cuando el modelo debe basarse en documentación concreta.
Facilita la recuperación de fragmentos relevantes mediante embeddings y búsqueda semántica.
Puede ayudar a citar o mostrar fuentes, dependiendo del diseño de la aplicación.

Qué NO resuelve por sí solo

No elimina la necesidad de controlar permisos sobre los documentos.
No garantiza que todos los documentos estén bien preparados, fragmentados o actualizados.
No sustituye la evaluación de calidad de las respuestas.
No debe usarse como excusa para indexar información sensible sin minimización ni gobierno.

5. Agents for Amazon Bedrock

Agents for Amazon Bedrock permite crear asistentes capaces de razonar sobre una petición, decidir qué pasos seguir y llamar herramientas, APIs o sistemas externos para completar una tarea. En el examen, los agentes suelen aparecer cuando el asistente no solo responde texto, sino que también debe consultar sistemas o ejecutar acciones.

Escenario	¿Agente?	Motivo
Responder preguntas sobre una política interna	No necesariamente	Puede bastar con RAG si solo hay consulta documental.
Consultar el estado de un pedido en un sistema interno	Sí, probablemente	El asistente debe llamar una API o herramienta.
Crear un ticket de soporte después de recopilar datos	Sí	Hay una acción real con impacto operativo.
Resumir un documento subido por el usuario	No necesariamente	Puede resolverse con invocación directa del modelo.

Control importante: si un agente puede ejecutar acciones reales, necesitas confirmación, validación de parámetros, mínimo privilegio, logs y límites claros. No basta con que el modelo “entienda” la petición.

6. Guardrails for Amazon Bedrock

Guardrails for Amazon Bedrock ayuda a aplicar políticas de seguridad y control sobre aplicaciones generativas. Es importante para reducir contenido no deseado, limitar temas, aplicar filtros y controlar entradas y salidas de la aplicación.

Cuándo aparece en el examen

Chatbot público que debe evitar respuestas dañinas o no permitidas.
Asistente empresarial que no debe tratar ciertos temas.
Aplicación que necesita filtrar contenido sensible, inapropiado o fuera de política.
Necesidad de aplicar controles consistentes sobre diferentes modelos o casos de uso.

Los guardrails no sustituyen todos los controles de seguridad. Deben combinarse con IAM, cifrado, control de acceso a datos, privacidad, registros y revisión de riesgos.

7. Amazon Q: asistentes generativos de AWS

Amazon Q agrupa capacidades de asistentes generativos para distintos perfiles y tareas. En AIF-C01, debes entender que Amazon Q no es simplemente “otro modelo”, sino una familia de asistentes diseñados para productividad, desarrollo, análisis o consulta empresarial, dependiendo del producto concreto.

Amazon Q Business

Ayuda a crear asistentes empresariales que responden preguntas, resumen información y trabajan con fuentes de datos corporativas conectadas de forma gobernada.

Amazon Q Developer

Asistente para desarrolladores. Puede ayudar con código, explicación, transformación, solución de problemas y tareas relacionadas con desarrollo en AWS.

Amazon Q en servicios AWS

Puede aparecer integrado en experiencias de AWS para ayudar a consultar, investigar, analizar o acelerar tareas dentro del ecosistema.

Cuándo elegir Amazon Q

Cuando el caso habla de un asistente listo para usuarios o equipos, especialmente productividad empresarial o ayuda al desarrollador, no necesariamente construir una aplicación GenAI desde cero.

8. SageMaker JumpStart y SageMaker AI

SageMaker JumpStart ayuda a descubrir modelos, soluciones y ejemplos para empezar con ML y modelos fundacionales. Puede ser útil cuando el escenario habla de explorar modelos disponibles, probar notebooks o acelerar un prototipo dentro del ecosistema SageMaker.

Amazon SageMaker AI es más amplio: permite preparar datos, entrenar modelos, ajustar hiperparámetros, desplegar endpoints, evaluar modelos, monitorizar drift y construir pipelines. Para GenAI, puede aparecer cuando la empresa necesita más control sobre entrenamiento, ajuste o despliegue de modelos propios.

Señal del enunciado	Piensa en	Por qué
“Acceder a FMs gestionados mediante API”	Bedrock	Es el patrón administrado principal para aplicaciones GenAI con FMs.
“Explorar modelos y soluciones de ejemplo”	SageMaker JumpStart	Ayuda a empezar con modelos y recursos preconstruidos.
“Entrenar y desplegar un modelo propio con pipeline ML”	SageMaker AI	Plataforma más completa de ML.
“Asistente empresarial listo para consultar datos corporativos”	Amazon Q Business	Encaja con productividad y consulta empresarial.

9. PartyRock: prototipado y aprendizaje

PartyRock permite crear aplicaciones generativas de forma rápida y visual. Es útil para aprender, experimentar y validar ideas de alto nivel. En un examen, si el caso exige seguridad empresarial, control de acceso avanzado, auditoría, integración profunda con datos internos o gobierno, PartyRock no suele ser la opción principal.

Cómo razonarlo

Si el escenario habla de “prototipo sencillo”, “aprender”, “experimentar” o “validar una idea”, PartyRock puede encajar. Si habla de producción empresarial, datos sensibles, permisos, auditoría o integración con sistemas internos, piensa en Bedrock, Amazon Q o SageMaker según el caso.

10. Costes: tokens, modelo y rendimiento

Las aplicaciones de IA generativa suelen facturarse según el uso del modelo, el número de tokens procesados, el tipo de modelo elegido y el modo de capacidad. Para AIF-C01 no necesitas memorizar precios, pero sí entender qué factores aumentan coste.

Factores que pueden aumentar el coste

Prompts de entrada muy largos.
Respuestas demasiado extensas.
Enviar documentos completos en vez de fragmentos relevantes.
Usar modelos más potentes de lo necesario.
Alto volumen de usuarios o muchas conversaciones concurrentes.
No controlar límites de salida o contexto.

Rendimiento aprovisionado frente a uso bajo demanda

En escenarios de uso variable, el modelo bajo demanda suele ser más simple porque pagas por uso. En escenarios con carga estable, alta concurrencia o requisitos de rendimiento más predecibles, puede aparecer la idea de capacidad o rendimiento aprovisionado, según el servicio y el modelo.

Situación	Opción más razonable	Motivo
Prototipo o uso irregular	Uso bajo demanda	Menos compromiso y pago ligado al uso.
Producción con carga estable y predecible	Capacidad/rendimiento aprovisionado si aplica	Puede aportar previsibilidad de rendimiento y coste.
Coste alto por prompts largos	Reducir contexto y usar RAG selectivo	Menos tokens innecesarios.
Latencia alta por modelo grande	Evaluar modelo más pequeño o especializado	Un modelo más grande no siempre es necesario.

11. Seguridad y gobierno en servicios GenAI

Crear una aplicación GenAI en AWS no significa relajar los controles de seguridad. La aplicación puede manejar datos sensibles, documentos internos, prompts de usuarios y respuestas que influyen en decisiones de negocio. Por eso, los servicios deben diseñarse con identidad, permisos, cifrado, registros y auditoría.

1IAM y mínimo privilegio. La aplicación solo debe invocar los modelos, leer las fuentes y ejecutar las acciones necesarias.

2Control de acceso en RAG. No recuperes documentos que el usuario no tenga permiso para ver.

3Protección de datos sensibles. Minimiza, enmascara o elimina datos personales que no sean necesarios para el caso de uso.

4Auditoría y trazabilidad. Registra cambios, versiones, accesos, fuentes, métricas y decisiones relevantes.

5Guardrails y validaciones. Añade controles para reducir respuestas dañinas, fugas de información o acciones incorrectas.

12. Arquitecturas típicas que debes reconocer

Chatbot documental con RAG

Una empresa quiere preguntar sobre documentación interna. El flujo habitual sería: usuario pregunta, la aplicación recupera documentos relevantes con una base de conocimiento, el modelo genera una respuesta con ese contexto y la aplicación aplica controles de seguridad y logging.

Asistente que ejecuta acciones

Un usuario quiere consultar pedidos, crear tickets o actualizar un registro. En ese caso, un agente puede orquestar la conversación y llamar APIs, pero debe pedir confirmación y validar parámetros antes de acciones con impacto.

Asistente empresarial de productividad

Si la empresa quiere un asistente para empleados que conecte con fuentes corporativas y mejore productividad, Amazon Q Business puede ser una opción más directa que construir todo desde cero.

Exploración y prototipado

Si el objetivo es aprender, experimentar o validar una idea sin arquitectura compleja, PartyRock o JumpStart pueden aparecer como opciones razonables, según el nivel de control requerido.

13. Tabla rápida de servicios para examen

Servicio/capacidad	Qué hace	Cuándo elegirlo en AIF-C01
Amazon Bedrock	Acceso administrado a modelos fundacionales y capacidades GenAI.	Aplicaciones GenAI gestionadas con FMs mediante API.
Knowledge Bases for Bedrock	RAG administrado con fuentes de conocimiento.	Preguntas sobre documentación interna o conocimiento actualizado.
Agents for Bedrock	Orquestación de tareas y llamadas a herramientas/APIs.	Asistentes que deben ejecutar acciones o consultar sistemas.
Guardrails for Bedrock	Controles de seguridad, temas, filtros y políticas de contenido.	Reducir respuestas dañinas, no permitidas o fuera de política.
Amazon Q Business	Asistente empresarial con datos corporativos.	Productividad y consulta de conocimiento en la organización.
Amazon Q Developer	Asistente para desarrollo de software.	Ayuda con código, explicación, transformación y tareas de desarrollo.
SageMaker JumpStart	Modelos y soluciones preconstruidas para empezar rápido.	Explorar modelos, notebooks o soluciones iniciales.
Amazon SageMaker AI	Plataforma completa de ML.	Entrenar, ajustar, evaluar, desplegar y monitorizar modelos propios.
PartyRock	Prototipado visual de apps GenAI.	Aprendizaje, experimentación y prototipos sencillos.

14. Errores frecuentes

Responder siempre “Bedrock”. Bedrock es clave, pero Amazon Q, SageMaker, JumpStart, Guardrails o Knowledge Bases pueden ser más precisos según el caso.
Confundir RAG con fine-tuning. RAG aporta conocimiento externo actualizado; fine-tuning adapta comportamiento del modelo.
Olvidar permisos en Knowledge Bases. El retrieval debe respetar autorización, no solo la interfaz final.
Usar agentes sin controles. Un agente que ejecuta acciones necesita confirmación, validación y mínimo privilegio.
Ignorar coste por tokens. Prompts largos, respuestas largas y modelos grandes pueden disparar coste y latencia.

Resumen final

Para el examen AIF-C01, debes reconocer los servicios de AWS que permiten crear aplicaciones de IA generativa y saber cuándo usar cada uno. Amazon Bedrock es la base principal para aplicaciones con modelos fundacionales gestionados. Knowledge Bases encaja cuando necesitas RAG sobre datos internos. Agents aparece cuando el asistente debe ejecutar acciones o llamar APIs. Guardrails aparece cuando necesitas aplicar controles de seguridad y contenido. Amazon Q encaja con asistentes empresariales o de desarrollo. SageMaker AI se usa cuando necesitas un ciclo ML más completo y controlado.

La clave no es memorizar nombres, sino leer el escenario: conocimiento actualizado, acción externa, seguridad de contenido, productividad empresarial, entrenamiento propio, prototipo o coste. Cada pista apunta a un servicio o capacidad diferente.

← Anterior Dominio 3 →