Machine Learning e IA en AWS para CLF-C02
En el examen AWS Certified Cloud Practitioner CLF-C02 pueden aparecer preguntas de inteligencia artificial y machine learning, pero a nivel de reconocimiento de servicios. No tienes que entrenar un modelo, programar una red neuronal ni conocer matemáticas avanzadas. Lo importante es saber identificar qué servicio de AWS resuelve cada necesidad: analizar imágenes, convertir texto a voz, transcribir audio, traducir, crear chatbots, usar modelos generativos o construir modelos propios.
Este módulo está pensado para alumnos base. Vamos a diferenciar Machine Learning, servicios de IA preentrenados e IA generativa con un enfoque práctico de examen.
1. Qué debes saber de IA y ML para CLF-C02
El examen no espera que seas científico de datos. Espera que sepas elegir el servicio correcto cuando el escenario dice algo como:
- “Detectar objetos o caras en imágenes”.
- “Extraer sentimiento de comentarios de clientes”.
- “Convertir texto en voz natural”.
- “Transcribir llamadas de audio a texto”.
- “Traducir contenido entre idiomas”.
- “Crear un chatbot conversacional”.
- “Entrenar y desplegar un modelo de machine learning”.
- “Crear una aplicación de IA generativa con modelos fundacionales”.
Cómo leer estas preguntas
No empieces pensando en arquitecturas complejas. Primero identifica el tipo de dato: imagen, texto, audio, voz, idioma, conversación, modelo propio o modelo generativo. Ese dato suele llevarte al servicio correcto.
2. Tres familias: ML personalizado, IA preentrenada e IA generativa
Para estudiar este tema sin perderte, separa los servicios en tres grupos:
- Machine Learning personalizado: cuando una empresa quiere construir, entrenar y desplegar sus propios modelos. Aquí destaca Amazon SageMaker.
- Servicios de IA preentrenados: servicios listos para usar que ya resuelven una tarea concreta, como reconocer imágenes o transcribir audio.
- IA generativa: servicios para construir aplicaciones con modelos fundacionales, como asistentes, generación de texto, resumen, búsqueda semántica o generación de contenido.
3. Amazon SageMaker
Amazon SageMaker es la plataforma gestionada de AWS para el ciclo de vida de machine learning. Permite preparar datos, construir modelos, entrenarlos, evaluarlos, desplegarlos y monitorizarlos.
En CLF-C02, SageMaker aparece cuando el escenario habla de:
- Crear modelos de machine learning personalizados.
- Entrenar modelos con datos propios.
- Desplegar modelos para inferencia.
- Gestionar el ciclo de vida ML de forma administrada.
- Ayudar a equipos de data science a trabajar con modelos.
Escenario tipo examen
Una empresa tiene un conjunto de datos propio y quiere construir, entrenar y desplegar un modelo predictivo. El servicio más probable es Amazon SageMaker.
4. Cuándo no elegir SageMaker
Un error típico es elegir SageMaker para cualquier pregunta que mencione “IA”. Si el problema ya está resuelto por un servicio de IA preentrenado, la respuesta suele ser ese servicio específico.
Por ejemplo:
- Si pide reconocer objetos en imágenes, piensa en Rekognition.
- Si pide analizar sentimiento en texto, piensa en Comprehend.
- Si pide convertir texto a voz, piensa en Polly.
- Si pide transcribir audio, piensa en Transcribe.
- Si pide traducir, piensa en Translate.
5. Amazon Rekognition
Amazon Rekognition analiza imágenes y vídeos. Puede detectar objetos, escenas, texto en imágenes, caras y otros elementos visuales. Para CLF-C02, asócialo con visión artificial.
Rekognition aparece cuando el escenario menciona:
- Detectar objetos en imágenes.
- Analizar vídeos.
- Reconocer caras o etiquetas visuales.
- Moderación de contenido visual.
- Extraer información de imágenes.
6. Amazon Comprehend
Amazon Comprehend es un servicio de procesamiento de lenguaje natural. Ayuda a analizar texto para detectar sentimiento, entidades, frases clave, idioma y temas.
Comprehend aparece cuando el escenario habla de:
- Analizar comentarios de clientes.
- Detectar sentimiento positivo, negativo o neutral.
- Extraer entidades como personas, empresas, fechas o lugares.
- Clasificar texto o entender contenido textual.
- Procesar grandes volúmenes de texto no estructurado.
Ejemplo sencillo
Una empresa quiere analizar miles de reseñas para saber si los clientes están satisfechos o no. El servicio que encaja es Amazon Comprehend.
7. Amazon Polly
Amazon Polly convierte texto en voz. Se usa para generar audio a partir de texto escrito.
Polly aparece cuando la pregunta menciona:
- Convertir texto a voz.
- Crear narraciones automáticas.
- Generar audio para una aplicación.
- Voces naturales a partir de contenido escrito.
8. Amazon Transcribe
Amazon Transcribe convierte voz o audio en texto. Es lo contrario de Polly.
Transcribe aparece cuando el escenario menciona:
- Transcribir llamadas.
- Pasar audio a texto.
- Generar subtítulos desde audio.
- Analizar grabaciones de voz.
9. Amazon Translate
Amazon Translate traduce texto entre idiomas. En CLF-C02, si una pregunta habla de traducción automática, normalmente no hay que pensar en Comprehend ni en SageMaker, sino en Translate.
Translate aparece cuando el escenario dice:
- Traducir contenido de una web.
- Ofrecer soporte en varios idiomas.
- Convertir texto de un idioma a otro.
- Localizar contenido para usuarios globales.
10. Amazon Lex
Amazon Lex permite crear interfaces conversacionales, como chatbots y bots de voz. Es el servicio que se asocia con conversaciones en lenguaje natural, intenciones y respuestas automáticas.
Lex aparece cuando el escenario habla de:
- Crear un chatbot.
- Crear un bot de voz o texto.
- Atención al cliente automatizada.
- Interfaces conversacionales.
Ejemplo tipo examen
Una empresa quiere crear un bot para que los clientes consulten el estado de sus pedidos mediante texto o voz. El servicio que debes reconocer es Amazon Lex.
11. Amazon Bedrock
Amazon Bedrock es un servicio gestionado para crear aplicaciones de IA generativa usando modelos fundacionales. En preguntas de CLF-C02 puede aparecer cuando se habla de modelos fundacionales, generative AI, asistentes, resumen de texto, generación de contenido o aplicaciones con modelos base.
Bedrock aparece cuando el escenario menciona:
- Crear aplicaciones de IA generativa.
- Usar modelos fundacionales mediante un servicio gestionado.
- Generar texto, resumir o crear asistentes.
- Usar varios modelos de proveedores diferentes sin gestionar infraestructura de entrenamiento.
- Construir soluciones con GenAI de forma controlada en AWS.
12. Amazon Q
Amazon Q es un asistente impulsado por IA generativa para ayudar a usuarios y empresas en tareas como responder preguntas, asistir a desarrolladores o trabajar con información empresarial, según el producto y el contexto. Para CLF-C02, si aparece, asócialo con un asistente generativo de AWS orientado a productividad, desarrollo o conocimiento empresarial.
No necesitas memorizar todas sus variantes. Lo importante es diferenciarlo de SageMaker y Bedrock: Bedrock es la plataforma para construir aplicaciones con modelos fundacionales; Amazon Q es una experiencia/asistente ya orientado a casos de uso concretos.
13. Otros servicios que pueden aparecer
Además de los principales, pueden aparecer otros nombres en preguntas o respuestas:
- Amazon Textract: extrae texto, formularios y tablas de documentos escaneados.
- Amazon Kendra: búsqueda inteligente empresarial.
- Amazon Personalize: recomendaciones personalizadas.
- Amazon Forecast: predicciones de series temporales.
- Amazon Fraud Detector: detección de fraude.
- Amazon CodeWhisperer / Amazon Q Developer: ayuda al desarrollo con IA, según el contexto del examen y materiales actuales.
No todos tendrán el mismo peso, pero conviene reconocer el caso de uso general para no caer en distractores.
14. Comparativa principal para examen
| Servicio | Qué hace | Pista típica en CLF-C02 |
|---|---|---|
| SageMaker | Plataforma gestionada para crear, entrenar y desplegar modelos ML. | Modelo propio, entrenamiento, despliegue ML. |
| Rekognition | Analiza imágenes y vídeo. | Objetos, caras, escenas, etiquetas visuales. |
| Comprehend | Analiza texto con NLP. | Sentimiento, entidades, frases clave, texto. |
| Polly | Convierte texto a voz. | Generar audio desde texto. |
| Transcribe | Convierte audio o voz a texto. | Transcripción de llamadas o grabaciones. |
| Translate | Traduce texto entre idiomas. | Traducción automática, contenido multidioma. |
| Lex | Crea chatbots y bots conversacionales. | Bot de voz/texto, atención conversacional. |
| Bedrock | IA generativa con modelos fundacionales gestionados. | GenAI, foundation models, asistentes, generación de contenido. |
| Textract | Extrae texto y datos de documentos. | PDF, formularios, tablas, documentos escaneados. |
| Kendra | Búsqueda inteligente empresarial. | Buscar respuestas en documentos corporativos. |
15. Tabla de decisión rápida
| Requisito del escenario | Servicio más probable | Por qué |
|---|---|---|
| Detectar objetos en imágenes | Rekognition | Está orientado a análisis visual. |
| Analizar sentimiento en reseñas | Comprehend | Procesa lenguaje natural. |
| Convertir texto en audio | Polly | Texto a voz. |
| Convertir audio en texto | Transcribe | Voz/audio a texto. |
| Traducir contenido | Translate | Traducción automática. |
| Crear un chatbot | Lex | Interfaces conversacionales. |
| Entrenar y desplegar un modelo propio | SageMaker | Ciclo de vida ML gestionado. |
| Crear una app con modelos fundacionales | Bedrock | IA generativa gestionada. |
| Extraer datos de formularios y documentos | Textract | OCR y extracción documental. |
| Búsqueda inteligente sobre documentación interna | Kendra | Búsqueda empresarial con ML. |
16. IA preentrenada frente a modelo propio
Esta es una de las ideas más importantes del módulo. Si AWS ya tiene un servicio que hace exactamente lo que necesitas, en una pregunta de nivel Cloud Practitioner normalmente elegirás ese servicio preentrenado.
Ejemplos:
- Para detectar caras: Rekognition, no SageMaker.
- Para traducir texto: Translate, no SageMaker.
- Para convertir texto a voz: Polly, no SageMaker.
- Para entrenar un modelo especializado con datos propios: SageMaker.
Ejemplo de razonamiento
Si una empresa solo quiere detectar sentimiento en opiniones de clientes, Comprehend es directo. Si quiere crear un modelo propio porque tiene una lógica específica que no cubre un servicio preentrenado, SageMaker cobra más sentido.
17. IA generativa frente a ML tradicional
La IA generativa se centra en crear contenido o respuestas nuevas a partir de modelos fundacionales: texto, resumen, respuestas conversacionales, generación de ideas, transformación de contenido o asistentes inteligentes. En AWS, el servicio que debes asociar con este bloque es Amazon Bedrock.
Machine Learning tradicional suele aparecer como predicción, clasificación, entrenamiento de modelos, inferencia o análisis con modelos personalizados. En AWS, el servicio más representativo es SageMaker.
18. Seguridad y responsabilidad en IA
Aunque CLF-C02 no entra en profundidad técnica, sí conviene recordar que usar IA no elimina las responsabilidades del cliente. El cliente debe proteger datos, controlar accesos, revisar salidas, aplicar permisos adecuados, cifrar información sensible y cumplir requisitos de privacidad y compliance.
Cuando se usen servicios de IA, también pueden intervenir servicios ya estudiados: IAM para permisos, KMS para cifrado, CloudTrail para auditoría, CloudWatch para monitorización y Organizations para gobierno multi-cuenta.
19. Errores típicos
- Elegir SageMaker para todo lo que diga “IA”, aunque exista un servicio preentrenado más directo.
- Confundir Polly con Transcribe: Polly es texto a voz; Transcribe es voz a texto.
- Confundir Comprehend con Translate: Comprehend analiza texto; Translate traduce texto.
- Confundir Rekognition con Textract: Rekognition analiza imágenes/vídeo; Textract extrae texto y estructura de documentos.
- Pensar que Bedrock es una base de datos o una herramienta de BI.
- Confundir Lex con Polly: Lex crea bots conversacionales; Polly genera voz.
- Olvidar que Bedrock se relaciona con modelos fundacionales e IA generativa.
- Elegir QuickSight para entrenar modelos ML. QuickSight es BI y visualización.
- Elegir Athena para análisis de sentimiento. Athena consulta datos con SQL.
- Pensar que usar IA elimina controles de seguridad, permisos y gobierno.
20. Cómo razonar preguntas tipo examen
Cuando veas una pregunta de IA o ML, busca primero el verbo principal:
- Detectar en imágenes o vídeos: Rekognition.
- Analizar sentimiento, entidades o texto: Comprehend.
- Convertir texto en voz: Polly.
- Convertir voz/audio en texto: Transcribe.
- Traducir texto: Translate.
- Crear chatbot: Lex.
- Entrenar y desplegar modelo propio: SageMaker.
- Usar modelos fundacionales o IA generativa: Bedrock.
- Extraer texto de documentos: Textract.
- Búsqueda empresarial inteligente: Kendra.
Test del módulo · 12 preguntas
- Amazon Rekognition
- Amazon Route 53
- AWS CloudTrail
- Amazon EBS
Ver respuesta y explicación
Respuesta: A. Rekognition analiza imágenes y vídeos para detectar objetos, escenas, caras o etiquetas.
- Amazon Comprehend
- AWS Shield
- Amazon SQS
- AWS Backup
Ver respuesta y explicación
Respuesta: A. Comprehend procesa lenguaje natural y puede analizar sentimiento, entidades y frases clave.
- Amazon Polly
- Amazon Transcribe
- Amazon RDS
- AWS Config
Ver respuesta y explicación
Respuesta: A. Polly convierte texto en voz.
- Amazon Transcribe
- Amazon Polly
- AWS DMS
- Amazon ECR
Ver respuesta y explicación
Respuesta: A. Transcribe convierte audio o voz en texto.
- Amazon Bedrock
- Amazon EFS
- AWS Artifact
- AWS Organizations
Ver respuesta y explicación
Respuesta: A. Bedrock se asocia con IA generativa y modelos fundacionales gestionados.
- Amazon SageMaker
- Amazon Translate
- Amazon CloudFront
- AWS Budgets
Ver respuesta y explicación
Respuesta: A. SageMaker cubre el ciclo de vida de machine learning gestionado.
- Amazon Translate
- Amazon Comprehend
- Amazon Textract
- Amazon Athena
Ver respuesta y explicación
Respuesta: A. Translate está diseñado para traducción automática de texto.
- Amazon Lex
- Amazon Polly
- Amazon Redshift
- AWS CloudFormation
Ver respuesta y explicación
Respuesta: A. Lex permite crear interfaces conversacionales y chatbots.
- Polly convierte texto a voz; Transcribe convierte voz a texto
- Polly traduce texto; Transcribe detecta objetos
- Polly crea bases de datos; Transcribe gestiona DNS
- Son el mismo servicio
Ver respuesta y explicación
Respuesta: A. Son servicios opuestos en dirección: texto a voz frente a voz a texto.
- Amazon Textract
- Amazon Rekognition
- AWS WAF
- Amazon VPC
Ver respuesta y explicación
Respuesta: A. Textract está orientado a extracción de texto y datos desde documentos.
- Amazon Kendra
- Amazon EBS
- AWS Backup
- Amazon Route 53
Ver respuesta y explicación
Respuesta: A. Kendra se asocia con búsqueda empresarial inteligente.
- Usar SageMaker para modelos propios y servicios preentrenados para tareas concretas ya cubiertas
- Usar siempre SageMaker para cualquier caso de IA
- Usar siempre Rekognition para texto, audio e imágenes
- Usar Bedrock para DNS y balanceo de carga
Ver respuesta y explicación
Respuesta: A. SageMaker encaja con ciclo de vida ML personalizado; servicios preentrenados encajan con tareas específicas listas para usar.
Resumen final
Para CLF-C02, machine learning e IA en AWS se estudian por casos de uso. SageMaker es la plataforma para crear, entrenar y desplegar modelos propios. Rekognition analiza imágenes y vídeos. Comprehend analiza texto. Polly convierte texto a voz. Transcribe convierte voz a texto. Translate traduce texto. Lex crea chatbots. Bedrock permite construir aplicaciones de IA generativa con modelos fundacionales. Otros servicios como Textract, Kendra, Personalize o Forecast pueden aparecer como distractores o casos específicos.
La clave para aprobar no es memorizar una lista larga, sino asociar cada servicio con su problema principal. Si sabes identificar el tipo de dato y la acción que pide el escenario, tendrás muchas más opciones de responder bien.