Servicios de AWS para crear aplicaciones de IA generativa
En AWS, las aplicaciones de IA generativa no se construyen alrededor de un único servicio. Normalmente combinan modelos fundacionales, orquestación, fuentes de datos, seguridad, control de acceso, evaluación, costes y monitorización. Para el examen AWS Certified AI Practitioner AIF-C01, debes reconocer qué servicio AWS encaja en cada escenario y qué problema resuelve dentro de una arquitectura GenAI.
1. Qué debes saber de esta página para AIF-C01
Este módulo conecta los conceptos de IA generativa con los servicios concretos de AWS. El examen no te va a pedir desplegar código, pero sí elegir el servicio correcto, identificar cuándo usar un patrón administrado y razonar sobre coste, seguridad, rendimiento y gobierno.
Servicio administrado para crear aplicaciones de IA generativa usando modelos fundacionales de AWS y de terceros mediante API, sin gestionar infraestructura de entrenamiento o inferencia.
Familia de asistentes generativos de AWS para productividad, desarrollo, análisis y soporte a usuarios, con integración en contextos empresariales.
Entorno más amplio para construir, entrenar, ajustar, evaluar y desplegar modelos de ML. JumpStart ayuda a descubrir y empezar con modelos, soluciones y ejemplos.
Herramienta de aprendizaje y prototipado rápido para crear aplicaciones GenAI de forma sencilla, útil para experimentar, no para sustituir una arquitectura empresarial gobernada.
2. Amazon Bedrock: el servicio clave para GenAI en AWS
Amazon Bedrock es uno de los servicios más importantes para AIF-C01. Permite acceder a modelos fundacionales mediante APIs administradas y crear aplicaciones generativas sin aprovisionar servidores, clusters de GPU o infraestructura propia para inferencia. En el examen, Bedrock suele aparecer cuando el escenario pide construir una aplicación GenAI en AWS de forma gestionada.
Qué resuelve Bedrock
- Acceso a modelos fundacionales de distintos proveedores desde un servicio administrado.
- Invocación de modelos para generación de texto, resumen, extracción, clasificación, embeddings o casos multimodales, según el modelo elegido.
- Construcción de aplicaciones con patrones como RAG, agentes y guardrails.
- Reducción de la carga operativa frente a desplegar modelos manualmente en infraestructura propia.
- Integración con controles de seguridad, permisos, cifrado, logs y servicios del ecosistema AWS.
3. Amazon Bedrock frente a Amazon SageMaker AI
Una de las decisiones típicas del examen es elegir entre un servicio administrado de modelos fundacionales y una plataforma más flexible para ML. No hay una única respuesta universal: depende del escenario.
| Necesidad del escenario | Servicio más probable | Razonamiento |
|---|---|---|
| Crear una app GenAI con modelos fundacionales mediante API | Amazon Bedrock | Bedrock reduce operación y permite usar modelos fundacionales gestionados sin administrar infraestructura. |
| Entrenar, ajustar o desplegar modelos propios con control del ciclo ML | Amazon SageMaker AI | SageMaker encaja mejor cuando necesitas un flujo ML más completo y personalizable. |
| Explorar modelos y soluciones preconstruidas para empezar rápido | SageMaker JumpStart | JumpStart ayuda a descubrir modelos, notebooks, soluciones y ejemplos. |
| Prototipar una aplicación GenAI sencilla sin entrar en arquitectura empresarial | PartyRock | PartyRock es útil para experimentar y aprender rápidamente. |
4. Knowledge Bases for Amazon Bedrock
Knowledge Bases for Amazon Bedrock permite conectar modelos fundacionales con fuentes de conocimiento empresariales mediante un patrón RAG. Es decir, la aplicación recupera fragmentos relevantes de documentos o datos propios y los proporciona como contexto al modelo para generar una respuesta más fundamentada.
Qué problema resuelve
- Permite usar conocimiento interno o actualizado sin entrenar desde cero.
- Reduce respuestas inventadas cuando el modelo debe basarse en documentación concreta.
- Facilita la recuperación de fragmentos relevantes mediante embeddings y búsqueda semántica.
- Puede ayudar a citar o mostrar fuentes, dependiendo del diseño de la aplicación.
Qué NO resuelve por sí solo
- No elimina la necesidad de controlar permisos sobre los documentos.
- No garantiza que todos los documentos estén bien preparados, fragmentados o actualizados.
- No sustituye la evaluación de calidad de las respuestas.
- No debe usarse como excusa para indexar información sensible sin minimización ni gobierno.
5. Agents for Amazon Bedrock
Agents for Amazon Bedrock permite crear asistentes capaces de razonar sobre una petición, decidir qué pasos seguir y llamar herramientas, APIs o sistemas externos para completar una tarea. En el examen, los agentes suelen aparecer cuando el asistente no solo responde texto, sino que también debe consultar sistemas o ejecutar acciones.
| Escenario | ¿Agente? | Motivo |
|---|---|---|
| Responder preguntas sobre una política interna | No necesariamente | Puede bastar con RAG si solo hay consulta documental. |
| Consultar el estado de un pedido en un sistema interno | Sí, probablemente | El asistente debe llamar una API o herramienta. |
| Crear un ticket de soporte después de recopilar datos | Sí | Hay una acción real con impacto operativo. |
| Resumir un documento subido por el usuario | No necesariamente | Puede resolverse con invocación directa del modelo. |
6. Guardrails for Amazon Bedrock
Guardrails for Amazon Bedrock ayuda a aplicar políticas de seguridad y control sobre aplicaciones generativas. Es importante para reducir contenido no deseado, limitar temas, aplicar filtros y controlar entradas y salidas de la aplicación.
Cuándo aparece en el examen
- Chatbot público que debe evitar respuestas dañinas o no permitidas.
- Asistente empresarial que no debe tratar ciertos temas.
- Aplicación que necesita filtrar contenido sensible, inapropiado o fuera de política.
- Necesidad de aplicar controles consistentes sobre diferentes modelos o casos de uso.
Los guardrails no sustituyen todos los controles de seguridad. Deben combinarse con IAM, cifrado, control de acceso a datos, privacidad, registros y revisión de riesgos.
7. Amazon Q: asistentes generativos de AWS
Amazon Q agrupa capacidades de asistentes generativos para distintos perfiles y tareas. En AIF-C01, debes entender que Amazon Q no es simplemente “otro modelo”, sino una familia de asistentes diseñados para productividad, desarrollo, análisis o consulta empresarial, dependiendo del producto concreto.
Ayuda a crear asistentes empresariales que responden preguntas, resumen información y trabajan con fuentes de datos corporativas conectadas de forma gobernada.
Asistente para desarrolladores. Puede ayudar con código, explicación, transformación, solución de problemas y tareas relacionadas con desarrollo en AWS.
Puede aparecer integrado en experiencias de AWS para ayudar a consultar, investigar, analizar o acelerar tareas dentro del ecosistema.
Cuando el caso habla de un asistente listo para usuarios o equipos, especialmente productividad empresarial o ayuda al desarrollador, no necesariamente construir una aplicación GenAI desde cero.
8. SageMaker JumpStart y SageMaker AI
SageMaker JumpStart ayuda a descubrir modelos, soluciones y ejemplos para empezar con ML y modelos fundacionales. Puede ser útil cuando el escenario habla de explorar modelos disponibles, probar notebooks o acelerar un prototipo dentro del ecosistema SageMaker.
Amazon SageMaker AI es más amplio: permite preparar datos, entrenar modelos, ajustar hiperparámetros, desplegar endpoints, evaluar modelos, monitorizar drift y construir pipelines. Para GenAI, puede aparecer cuando la empresa necesita más control sobre entrenamiento, ajuste o despliegue de modelos propios.
| Señal del enunciado | Piensa en | Por qué |
|---|---|---|
| “Acceder a FMs gestionados mediante API” | Bedrock | Es el patrón administrado principal para aplicaciones GenAI con FMs. |
| “Explorar modelos y soluciones de ejemplo” | SageMaker JumpStart | Ayuda a empezar con modelos y recursos preconstruidos. |
| “Entrenar y desplegar un modelo propio con pipeline ML” | SageMaker AI | Plataforma más completa de ML. |
| “Asistente empresarial listo para consultar datos corporativos” | Amazon Q Business | Encaja con productividad y consulta empresarial. |
9. PartyRock: prototipado y aprendizaje
PartyRock permite crear aplicaciones generativas de forma rápida y visual. Es útil para aprender, experimentar y validar ideas de alto nivel. En un examen, si el caso exige seguridad empresarial, control de acceso avanzado, auditoría, integración profunda con datos internos o gobierno, PartyRock no suele ser la opción principal.
Cómo razonarlo
Si el escenario habla de “prototipo sencillo”, “aprender”, “experimentar” o “validar una idea”, PartyRock puede encajar. Si habla de producción empresarial, datos sensibles, permisos, auditoría o integración con sistemas internos, piensa en Bedrock, Amazon Q o SageMaker según el caso.
10. Costes: tokens, modelo y rendimiento
Las aplicaciones de IA generativa suelen facturarse según el uso del modelo, el número de tokens procesados, el tipo de modelo elegido y el modo de capacidad. Para AIF-C01 no necesitas memorizar precios, pero sí entender qué factores aumentan coste.
Factores que pueden aumentar el coste
- Prompts de entrada muy largos.
- Respuestas demasiado extensas.
- Enviar documentos completos en vez de fragmentos relevantes.
- Usar modelos más potentes de lo necesario.
- Alto volumen de usuarios o muchas conversaciones concurrentes.
- No controlar límites de salida o contexto.
Rendimiento aprovisionado frente a uso bajo demanda
En escenarios de uso variable, el modelo bajo demanda suele ser más simple porque pagas por uso. En escenarios con carga estable, alta concurrencia o requisitos de rendimiento más predecibles, puede aparecer la idea de capacidad o rendimiento aprovisionado, según el servicio y el modelo.
| Situación | Opción más razonable | Motivo |
|---|---|---|
| Prototipo o uso irregular | Uso bajo demanda | Menos compromiso y pago ligado al uso. |
| Producción con carga estable y predecible | Capacidad/rendimiento aprovisionado si aplica | Puede aportar previsibilidad de rendimiento y coste. |
| Coste alto por prompts largos | Reducir contexto y usar RAG selectivo | Menos tokens innecesarios. |
| Latencia alta por modelo grande | Evaluar modelo más pequeño o especializado | Un modelo más grande no siempre es necesario. |
11. Seguridad y gobierno en servicios GenAI
Crear una aplicación GenAI en AWS no significa relajar los controles de seguridad. La aplicación puede manejar datos sensibles, documentos internos, prompts de usuarios y respuestas que influyen en decisiones de negocio. Por eso, los servicios deben diseñarse con identidad, permisos, cifrado, registros y auditoría.
12. Arquitecturas típicas que debes reconocer
Chatbot documental con RAG
Una empresa quiere preguntar sobre documentación interna. El flujo habitual sería: usuario pregunta, la aplicación recupera documentos relevantes con una base de conocimiento, el modelo genera una respuesta con ese contexto y la aplicación aplica controles de seguridad y logging.
Asistente que ejecuta acciones
Un usuario quiere consultar pedidos, crear tickets o actualizar un registro. En ese caso, un agente puede orquestar la conversación y llamar APIs, pero debe pedir confirmación y validar parámetros antes de acciones con impacto.
Asistente empresarial de productividad
Si la empresa quiere un asistente para empleados que conecte con fuentes corporativas y mejore productividad, Amazon Q Business puede ser una opción más directa que construir todo desde cero.
Exploración y prototipado
Si el objetivo es aprender, experimentar o validar una idea sin arquitectura compleja, PartyRock o JumpStart pueden aparecer como opciones razonables, según el nivel de control requerido.
13. Tabla rápida de servicios para examen
| Servicio/capacidad | Qué hace | Cuándo elegirlo en AIF-C01 |
|---|---|---|
| Amazon Bedrock | Acceso administrado a modelos fundacionales y capacidades GenAI. | Aplicaciones GenAI gestionadas con FMs mediante API. |
| Knowledge Bases for Bedrock | RAG administrado con fuentes de conocimiento. | Preguntas sobre documentación interna o conocimiento actualizado. |
| Agents for Bedrock | Orquestación de tareas y llamadas a herramientas/APIs. | Asistentes que deben ejecutar acciones o consultar sistemas. |
| Guardrails for Bedrock | Controles de seguridad, temas, filtros y políticas de contenido. | Reducir respuestas dañinas, no permitidas o fuera de política. |
| Amazon Q Business | Asistente empresarial con datos corporativos. | Productividad y consulta de conocimiento en la organización. |
| Amazon Q Developer | Asistente para desarrollo de software. | Ayuda con código, explicación, transformación y tareas de desarrollo. |
| SageMaker JumpStart | Modelos y soluciones preconstruidas para empezar rápido. | Explorar modelos, notebooks o soluciones iniciales. |
| Amazon SageMaker AI | Plataforma completa de ML. | Entrenar, ajustar, evaluar, desplegar y monitorizar modelos propios. |
| PartyRock | Prototipado visual de apps GenAI. | Aprendizaje, experimentación y prototipos sencillos. |
14. Errores frecuentes
- Responder siempre “Bedrock”. Bedrock es clave, pero Amazon Q, SageMaker, JumpStart, Guardrails o Knowledge Bases pueden ser más precisos según el caso.
- Confundir RAG con fine-tuning. RAG aporta conocimiento externo actualizado; fine-tuning adapta comportamiento del modelo.
- Olvidar permisos en Knowledge Bases. El retrieval debe respetar autorización, no solo la interfaz final.
- Usar agentes sin controles. Un agente que ejecuta acciones necesita confirmación, validación y mínimo privilegio.
- Ignorar coste por tokens. Prompts largos, respuestas largas y modelos grandes pueden disparar coste y latencia.
Resumen final
Para el examen AIF-C01, debes reconocer los servicios de AWS que permiten crear aplicaciones de IA generativa y saber cuándo usar cada uno. Amazon Bedrock es la base principal para aplicaciones con modelos fundacionales gestionados. Knowledge Bases encaja cuando necesitas RAG sobre datos internos. Agents aparece cuando el asistente debe ejecutar acciones o llamar APIs. Guardrails aparece cuando necesitas aplicar controles de seguridad y contenido. Amazon Q encaja con asistentes empresariales o de desarrollo. SageMaker AI se usa cuando necesitas un ciclo ML más completo y controlado.
La clave no es memorizar nombres, sino leer el escenario: conocimiento actualizado, acción externa, seguridad de contenido, productividad empresarial, entrenamiento propio, prototipo o coste. Cada pista apunta a un servicio o capacidad diferente.