Conceptos básicos de IA, ML y deep learning para AIF-C01

Dominio 1 · Fundamentos IA/ML

Conceptos básicos de IA, ML y deep learning

◷ 30 min

Este módulo construye el vocabulario base que vas a necesitar durante todo el examen AWS Certified AI Practitioner AIF-C01. Antes de hablar de Amazon Bedrock, SageMaker AI, modelos fundacionales, RAG o IA responsable, tienes que distinguir bien qué es IA, qué es machine learning, qué aporta el deep learning, qué significa entrenar un modelo y qué ocurre cuando ese modelo se usa en producción para hacer inferencia.

IA Machine Learning Deep Learning Modelo Algoritmo Entrenamiento Inferencia Sesgo LLM

Pista de examen: en AIF-C01 muchas preguntas no buscan que programes un modelo, sino que sepas elegir el concepto correcto según el escenario. Si el resultado es una categoría, piensa en clasificación. Si es un número, piensa en regresión. Si no hay etiquetas y se buscan patrones, piensa en clustering. Si el modelo crea contenido nuevo, entra IA generativa.

1. IA, ML y deep learning: la relación correcta

La inteligencia artificial es el campo más amplio. Describe sistemas capaces de realizar tareas que normalmente asociamos con inteligencia humana: interpretar lenguaje, reconocer imágenes, tomar decisiones, generar contenido, planificar acciones o encontrar patrones en datos. Dentro de ese campo aparece el machine learning, que permite que un sistema aprenda patrones desde datos en lugar de depender únicamente de reglas escritas manualmente. Dentro del machine learning aparece el deep learning, que usa redes neuronales con muchas capas para resolver problemas complejos como visión por computador, procesamiento de lenguaje natural o reconocimiento de voz.

Concepto	Qué significa	Cómo reconocerlo en el examen
IA	Campo amplio que busca crear sistemas capaces de realizar tareas inteligentes.	El enunciado habla de automatización inteligente, asistencia a decisiones, comprensión de lenguaje, percepción o generación.
Machine Learning	Subcampo de IA donde los sistemas aprenden patrones a partir de datos para hacer predicciones o clasificaciones.	Hay datos históricos, entrenamiento, etiquetas, métricas, predicciones o detección de patrones.
Deep Learning	Subcampo de ML basado en redes neuronales profundas, útil para problemas complejos y datos no estructurados.	Aparecen imágenes, voz, lenguaje natural, modelos grandes, redes neuronales o grandes volúmenes de datos.
IA generativa	IA capaz de crear contenido nuevo como texto, imágenes, código, resúmenes o respuestas conversacionales.	El escenario habla de generar, resumir, redactar, conversar o crear contenido.
IA agéntica	Sistemas capaces de razonar sobre una tarea, usar herramientas y ejecutar acciones para alcanzar un objetivo.	El asistente no solo responde, también consulta APIs, crea tickets, reserva recursos o ejecuta pasos.

2. Algoritmo, modelo y datos: no son lo mismo

Una confusión habitual es usar algoritmo y modelo como si fueran lo mismo. Para AIF-C01 conviene separarlos claramente. El algoritmo es el método o procedimiento usado para aprender. El modelo es el resultado del entrenamiento. Los datos son la materia prima desde la que el modelo aprende patrones.

Datos

Ejemplos históricos, texto, imágenes, registros, eventos, conversaciones, transacciones o documentos. Su calidad condiciona directamente el resultado del modelo.

Algoritmo

Método que aprende desde los datos. Puede ser un algoritmo de clasificación, regresión, clustering, red neuronal u otro enfoque.

Modelo

Resultado del entrenamiento. Es lo que después se usa para inferir, predecir, clasificar o generar respuestas con datos nuevos.

Inferencia

Uso del modelo ya entrenado para obtener una salida: una predicción, una categoría, una recomendación, un texto o una decisión asistida.

Ejemplo sencillo: tienes datos históricos de clientes, compras y cancelaciones. Un algoritmo aprende patrones durante el entrenamiento. El modelo resultante puede inferir la probabilidad de que un cliente nuevo cancele en el futuro.

3. Datos, features, labels y predicciones

Los modelos de ML aprenden desde datos. Pero no todos los datos tienen el mismo papel. En aprendizaje supervisado, normalmente se trabaja con features y labels. Las features son las variables de entrada; la label es la respuesta correcta conocida durante el entrenamiento. Después, cuando llega un caso nuevo, el modelo usa las features disponibles para producir una predicción.

Término	Definición	Ejemplo
Feature	Variable de entrada que ayuda al modelo a aprender o predecir.	Edad del cliente, país, importe de compra, número de visitas, tipo de producto.
Label	Resultado conocido que el modelo intenta aprender durante el entrenamiento supervisado.	Cliente canceló: sí/no. Precio final. Fraude: sí/no.
Predicción	Salida estimada por el modelo para un dato nuevo.	Probabilidad de fraude, precio esperado, categoría de imagen.
Dataset	Conjunto de datos usado para entrenamiento, validación o prueba.	Histórico de pedidos de los últimos 24 meses.

Ojo con el examen: si el escenario menciona una variable que solo se conoce después del evento que se quiere predecir, puede haber data leakage. El modelo parecerá muy bueno durante pruebas, pero fallará en producción porque está usando información que no tendría disponible en el momento real.

4. Entrenamiento e inferencia

El entrenamiento y la inferencia son fases diferentes. Durante el entrenamiento, el sistema aprende patrones desde datos. Durante la inferencia, se usa el modelo entrenado para obtener una salida con datos nuevos.

1Entrenamiento: se usan datos históricos para crear o ajustar un modelo. Suele requerir más cómputo, preparación de datos, evaluación y control de calidad.

2Validación: se comprueba si el modelo funciona bien con datos que no ha usado directamente para aprender. Ayuda a detectar sobreajuste.

3Inferencia: se usa el modelo entrenado para generar una predicción o respuesta. Aquí importan latencia, coste, disponibilidad y seguridad.

4Monitorización: se observa el rendimiento del modelo con datos reales para detectar drift, errores, sesgos o degradación.

5. Tipos de aprendizaje automático

El examen espera que puedas identificar qué técnica encaja con cada caso de uso. No hace falta que implementes algoritmos matemáticos, pero sí debes reconocer el patrón del problema.

Tipo	Qué usa	Objetivo	Ejemplo de examen
Aprendizaje supervisado	Datos con labels conocidas.	Aprender una relación entre entradas y salida conocida.	Predecir si una transacción es fraude o estimar el precio de una vivienda.
Aprendizaje no supervisado	Datos sin labels.	Descubrir patrones, grupos o estructuras ocultas.	Segmentar clientes por comportamiento de compra sin categorías previas.
Aprendizaje por refuerzo	Agente, acciones, entorno y recompensas.	Aprender una estrategia mediante prueba, error y recompensa.	Optimizar decisiones secuenciales como rutas, juegos o control robótico.
Aprendizaje profundo	Redes neuronales con muchas capas.	Aprender representaciones complejas desde grandes volúmenes de datos.	Reconocimiento de imágenes, voz, texto y modelos de lenguaje.

6. Clasificación, regresión y clustering

Estas tres palabras aparecen mucho en preguntas tipo examen. La clave está en fijarse en el tipo de salida que se espera.

Clasificación

La salida es una categoría. Ejemplos: fraude/no fraude, aprobado/rechazado, imagen de perro/gato, sentimiento positivo/negativo.

Regresión

La salida es un valor numérico continuo. Ejemplos: precio esperado, demanda futura, minutos de entrega, consumo previsto.

Clustering

El modelo agrupa datos similares sin labels previas. Ejemplos: segmentos de clientes o agrupación de documentos por similitud.

Generación

El modelo crea contenido nuevo. Ejemplos: redactar respuestas, generar código, resumir documentos o crear imágenes.

Regla rápida para el examen

Si la salida es una categoría, normalmente es clasificación.
Si la salida es un número, normalmente es regresión.
Si se buscan grupos sin etiquetas, normalmente es clustering.
Si se crea contenido nuevo, entra IA generativa.

7. Fit, overfitting y underfitting

El término fit describe cómo de bien un modelo se ajusta a los datos. Un buen modelo no debe memorizar el conjunto de entrenamiento; debe generalizar bien ante datos nuevos. Aquí aparecen dos problemas importantes: sobreajuste y subajuste.

Concepto	Qué ocurre	Señal típica	Riesgo
Buen ajuste	El modelo aprende patrones útiles y generaliza correctamente.	Buen rendimiento en entrenamiento y en prueba.	Es el objetivo.
Overfitting	El modelo memoriza demasiado los datos de entrenamiento.	Muy bien en entrenamiento, mal con datos nuevos.	Falla en producción.
Underfitting	El modelo es demasiado simple o no aprende suficiente.	Mal rendimiento en entrenamiento y prueba.	No captura patrones reales.

8. Sesgo, fairness y datos representativos

El sesgo puede aparecer cuando los datos no representan bien la realidad, cuando contienen decisiones históricas injustas o cuando el diseño del modelo perjudica sistemáticamente a ciertos grupos. En AIF-C01 este concepto se conecta con IA responsable, pero empieza aquí: los modelos aprenden de datos, y si los datos están sesgados, el modelo puede reproducir o amplificar ese sesgo.

Importante: una métrica global buena puede ocultar problemas por subgrupos. Un modelo puede parecer preciso en promedio y aun así fallar más en ciertos colectivos, idiomas, regiones, tipos de cliente o casos minoritarios.

Buenas prácticas para reducir riesgos:

Revisar calidad y representatividad de los datos.
Evaluar resultados por subgrupos relevantes.
Evitar variables que actúen como proxies sensibles cuando no correspondan.
Aplicar revisión humana en decisiones de alto impacto.
Documentar límites conocidos del modelo.

9. Métricas básicas de evaluación

Las métricas permiten medir si el modelo está funcionando. En el examen pueden pedirte elegir la métrica correcta según el riesgo del caso. No es lo mismo reducir falsos positivos que reducir falsos negativos.

Métrica	Qué mide	Cuándo importa
Accuracy	Proporción total de predicciones correctas.	Útil cuando las clases están equilibradas y los errores tienen coste similar.
Precision	De lo que el modelo marcó como positivo, cuánto era realmente positivo.	Importa cuando los falsos positivos son costosos, por ejemplo alertas manuales innecesarias.
Recall	De los positivos reales, cuántos detectó el modelo.	Importa cuando perder un positivo real es grave, por ejemplo fraude o casos médicos urgentes.
F1 score	Equilibrio entre precision y recall.	Útil cuando necesitas balancear falsos positivos y falsos negativos.
Error medio	Diferencia entre valor predicho y valor real en problemas numéricos.	Importa en regresión: demanda, precio, tiempo de entrega o consumo.

Ejemplo de examen: una aplicación médica quiere detectar el mayor número posible de casos urgentes, aunque eso genere más revisiones innecesarias. La métrica clave será recall, porque el objetivo es reducir falsos negativos.

10. LLM, GenAI y modelos fundacionales

Un large language model o LLM es un modelo de lenguaje entrenado con grandes cantidades de texto para comprender y generar lenguaje natural. Los LLM forman parte de la IA generativa, pero no toda IA generativa es solo texto: también puede haber generación de imágenes, audio, vídeo, código o contenido multimodal.

Un modelo fundacional es un modelo grande entrenado con datos amplios que puede adaptarse a muchos casos de uso. En AWS, este concepto aparece especialmente con servicios como Amazon Bedrock, que permite acceder a modelos fundacionales mediante API, y con SageMaker AI para construir, entrenar y desplegar modelos de ML.

Concepto	Qué debes recordar	Trampa habitual
LLM	Modelo especializado en lenguaje natural: responder, resumir, traducir, clasificar texto o generar contenido.	No todos los problemas requieren un LLM.
GenAI	Capacidad de crear contenido nuevo a partir de prompts, contexto o datos de entrada.	Generar contenido no garantiza que sea verdadero.
Modelo fundacional	Modelo base reutilizable para múltiples tareas y casos de uso.	El modelo más grande no siempre es el mejor para coste o latencia.
Agente	Sistema que puede usar herramientas o APIs para completar tareas.	Un agente necesita permisos, validaciones y límites de acción.

11. IA tradicional, ML clásico y GenAI: cuándo usar cada uno

No todo necesita IA generativa. En el examen pueden plantearte una necesidad de negocio y pedirte el enfoque más adecuado. Elegir GenAI por defecto puede ser incorrecto si el problema requiere una predicción estructurada, una regla exacta o una consulta tradicional.

Necesidad	Enfoque más probable	Por qué
Predecir demanda futura	Regresión / forecasting.	La salida esperada es un valor numérico o una serie temporal.
Detectar fraude	Clasificación o anomalías.	La salida suele ser una categoría o puntuación de riesgo.
Segmentar clientes sin etiquetas	Clustering.	Se buscan grupos naturales en los datos.
Responder preguntas sobre documentos internos	GenAI + RAG.	Se necesita lenguaje natural y conocimiento documental actualizado.
Aplicar una regla fiscal exacta	Lógica determinista.	Si la salida debe ser exacta por norma, una regla tradicional puede ser más adecuada.

12. Servicios AWS que pueden aparecer asociados

Esta página se centra en conceptos, pero AIF-C01 suele conectar esos conceptos con servicios administrados de AWS. Debes reconocerlos a alto nivel.

Amazon SageMaker AI

Servicio administrado para construir, entrenar, desplegar y gobernar modelos de machine learning.

Amazon Bedrock

Servicio para crear aplicaciones de IA generativa usando modelos fundacionales gestionados mediante API.

Amazon Comprehend

Procesamiento de lenguaje natural: entidades, sentimiento, frases clave o clasificación de texto.

Amazon Rekognition

Análisis de imágenes y vídeo: objetos, escenas, rostros, moderación visual y detección.

Amazon Textract

Extracción de texto, tablas y datos desde documentos escaneados o formularios.

Amazon Transcribe y Polly

Transcribe convierte voz a texto. Polly convierte texto a voz.

13. Cómo razonar preguntas de este módulo

1Identifica la salida esperada. Categoría, número, grupo, texto generado, recomendación o acción.

2Comprueba si hay labels. Si hay respuestas históricas conocidas, probablemente aplica aprendizaje supervisado.

3Evalúa el riesgo del error. No es lo mismo recomendar una película que priorizar una reclamación crítica.

4Distingue predicción de generación. Predecir fraude no es lo mismo que redactar una respuesta de soporte.

5Piensa en datos y métricas. Un modelo no se evalúa por intuición: se mide con métricas técnicas y de negocio.

14. Errores frecuentes

Confundir IA con ML. ML es una parte de IA, no todo el campo.
Confundir regresión con clasificación. Mira si la salida es número o categoría.
Creer que deep learning siempre es mejor. Puede ser más costoso y no necesario para problemas simples.
Olvidar la inferencia. Entrenar es solo una parte; en producción importan latencia, coste, disponibilidad y seguridad.
Ignorar el sesgo. Los modelos aprenden de datos; si los datos no son representativos, el resultado puede ser injusto o poco fiable.
Usar GenAI para todo. A veces una regla, consulta SQL, API o modelo clásico es más apropiado.

Resumen final

IA es el campo amplio; machine learning es una forma de crear sistemas que aprenden patrones desde datos; deep learning usa redes neuronales profundas para problemas complejos; e IA generativa crea contenido nuevo. Un algoritmo aprende desde datos durante el entrenamiento y produce un modelo. Ese modelo se usa en inferencia para predecir, clasificar, recomendar o generar respuestas.

Para aprobar AIF-C01, debes reconocer qué técnica encaja con cada escenario: clasificación para categorías, regresión para valores numéricos, clustering para grupos sin etiquetas y GenAI para creación o transformación de contenido. También debes recordar que los modelos tienen límites: pueden estar sesgados, sobreajustarse, degradarse con el tiempo o no ser adecuados si se necesita una salida exacta y determinista.

← Anterior Casos de uso de IA →