Conceptos básicos de IA, ML y deep learning
Este módulo construye el vocabulario base que vas a necesitar durante todo el examen AWS Certified AI Practitioner AIF-C01. Antes de hablar de Amazon Bedrock, SageMaker AI, modelos fundacionales, RAG o IA responsable, tienes que distinguir bien qué es IA, qué es machine learning, qué aporta el deep learning, qué significa entrenar un modelo y qué ocurre cuando ese modelo se usa en producción para hacer inferencia.
1. IA, ML y deep learning: la relación correcta
La inteligencia artificial es el campo más amplio. Describe sistemas capaces de realizar tareas que normalmente asociamos con inteligencia humana: interpretar lenguaje, reconocer imágenes, tomar decisiones, generar contenido, planificar acciones o encontrar patrones en datos. Dentro de ese campo aparece el machine learning, que permite que un sistema aprenda patrones desde datos en lugar de depender únicamente de reglas escritas manualmente. Dentro del machine learning aparece el deep learning, que usa redes neuronales con muchas capas para resolver problemas complejos como visión por computador, procesamiento de lenguaje natural o reconocimiento de voz.
| Concepto | Qué significa | Cómo reconocerlo en el examen |
|---|---|---|
| IA | Campo amplio que busca crear sistemas capaces de realizar tareas inteligentes. | El enunciado habla de automatización inteligente, asistencia a decisiones, comprensión de lenguaje, percepción o generación. |
| Machine Learning | Subcampo de IA donde los sistemas aprenden patrones a partir de datos para hacer predicciones o clasificaciones. | Hay datos históricos, entrenamiento, etiquetas, métricas, predicciones o detección de patrones. |
| Deep Learning | Subcampo de ML basado en redes neuronales profundas, útil para problemas complejos y datos no estructurados. | Aparecen imágenes, voz, lenguaje natural, modelos grandes, redes neuronales o grandes volúmenes de datos. |
| IA generativa | IA capaz de crear contenido nuevo como texto, imágenes, código, resúmenes o respuestas conversacionales. | El escenario habla de generar, resumir, redactar, conversar o crear contenido. |
| IA agéntica | Sistemas capaces de razonar sobre una tarea, usar herramientas y ejecutar acciones para alcanzar un objetivo. | El asistente no solo responde, también consulta APIs, crea tickets, reserva recursos o ejecuta pasos. |
2. Algoritmo, modelo y datos: no son lo mismo
Una confusión habitual es usar algoritmo y modelo como si fueran lo mismo. Para AIF-C01 conviene separarlos claramente. El algoritmo es el método o procedimiento usado para aprender. El modelo es el resultado del entrenamiento. Los datos son la materia prima desde la que el modelo aprende patrones.
Ejemplos históricos, texto, imágenes, registros, eventos, conversaciones, transacciones o documentos. Su calidad condiciona directamente el resultado del modelo.
Método que aprende desde los datos. Puede ser un algoritmo de clasificación, regresión, clustering, red neuronal u otro enfoque.
Resultado del entrenamiento. Es lo que después se usa para inferir, predecir, clasificar o generar respuestas con datos nuevos.
Uso del modelo ya entrenado para obtener una salida: una predicción, una categoría, una recomendación, un texto o una decisión asistida.
3. Datos, features, labels y predicciones
Los modelos de ML aprenden desde datos. Pero no todos los datos tienen el mismo papel. En aprendizaje supervisado, normalmente se trabaja con features y labels. Las features son las variables de entrada; la label es la respuesta correcta conocida durante el entrenamiento. Después, cuando llega un caso nuevo, el modelo usa las features disponibles para producir una predicción.
| Término | Definición | Ejemplo |
|---|---|---|
| Feature | Variable de entrada que ayuda al modelo a aprender o predecir. | Edad del cliente, país, importe de compra, número de visitas, tipo de producto. |
| Label | Resultado conocido que el modelo intenta aprender durante el entrenamiento supervisado. | Cliente canceló: sí/no. Precio final. Fraude: sí/no. |
| Predicción | Salida estimada por el modelo para un dato nuevo. | Probabilidad de fraude, precio esperado, categoría de imagen. |
| Dataset | Conjunto de datos usado para entrenamiento, validación o prueba. | Histórico de pedidos de los últimos 24 meses. |
4. Entrenamiento e inferencia
El entrenamiento y la inferencia son fases diferentes. Durante el entrenamiento, el sistema aprende patrones desde datos. Durante la inferencia, se usa el modelo entrenado para obtener una salida con datos nuevos.
5. Tipos de aprendizaje automático
El examen espera que puedas identificar qué técnica encaja con cada caso de uso. No hace falta que implementes algoritmos matemáticos, pero sí debes reconocer el patrón del problema.
| Tipo | Qué usa | Objetivo | Ejemplo de examen |
|---|---|---|---|
| Aprendizaje supervisado | Datos con labels conocidas. | Aprender una relación entre entradas y salida conocida. | Predecir si una transacción es fraude o estimar el precio de una vivienda. |
| Aprendizaje no supervisado | Datos sin labels. | Descubrir patrones, grupos o estructuras ocultas. | Segmentar clientes por comportamiento de compra sin categorías previas. |
| Aprendizaje por refuerzo | Agente, acciones, entorno y recompensas. | Aprender una estrategia mediante prueba, error y recompensa. | Optimizar decisiones secuenciales como rutas, juegos o control robótico. |
| Aprendizaje profundo | Redes neuronales con muchas capas. | Aprender representaciones complejas desde grandes volúmenes de datos. | Reconocimiento de imágenes, voz, texto y modelos de lenguaje. |
6. Clasificación, regresión y clustering
Estas tres palabras aparecen mucho en preguntas tipo examen. La clave está en fijarse en el tipo de salida que se espera.
La salida es una categoría. Ejemplos: fraude/no fraude, aprobado/rechazado, imagen de perro/gato, sentimiento positivo/negativo.
La salida es un valor numérico continuo. Ejemplos: precio esperado, demanda futura, minutos de entrega, consumo previsto.
El modelo agrupa datos similares sin labels previas. Ejemplos: segmentos de clientes o agrupación de documentos por similitud.
El modelo crea contenido nuevo. Ejemplos: redactar respuestas, generar código, resumir documentos o crear imágenes.
Regla rápida para el examen
- Si la salida es una categoría, normalmente es clasificación.
- Si la salida es un número, normalmente es regresión.
- Si se buscan grupos sin etiquetas, normalmente es clustering.
- Si se crea contenido nuevo, entra IA generativa.
7. Fit, overfitting y underfitting
El término fit describe cómo de bien un modelo se ajusta a los datos. Un buen modelo no debe memorizar el conjunto de entrenamiento; debe generalizar bien ante datos nuevos. Aquí aparecen dos problemas importantes: sobreajuste y subajuste.
| Concepto | Qué ocurre | Señal típica | Riesgo |
|---|---|---|---|
| Buen ajuste | El modelo aprende patrones útiles y generaliza correctamente. | Buen rendimiento en entrenamiento y en prueba. | Es el objetivo. |
| Overfitting | El modelo memoriza demasiado los datos de entrenamiento. | Muy bien en entrenamiento, mal con datos nuevos. | Falla en producción. |
| Underfitting | El modelo es demasiado simple o no aprende suficiente. | Mal rendimiento en entrenamiento y prueba. | No captura patrones reales. |
8. Sesgo, fairness y datos representativos
El sesgo puede aparecer cuando los datos no representan bien la realidad, cuando contienen decisiones históricas injustas o cuando el diseño del modelo perjudica sistemáticamente a ciertos grupos. En AIF-C01 este concepto se conecta con IA responsable, pero empieza aquí: los modelos aprenden de datos, y si los datos están sesgados, el modelo puede reproducir o amplificar ese sesgo.
Buenas prácticas para reducir riesgos:
- Revisar calidad y representatividad de los datos.
- Evaluar resultados por subgrupos relevantes.
- Evitar variables que actúen como proxies sensibles cuando no correspondan.
- Aplicar revisión humana en decisiones de alto impacto.
- Documentar límites conocidos del modelo.
9. Métricas básicas de evaluación
Las métricas permiten medir si el modelo está funcionando. En el examen pueden pedirte elegir la métrica correcta según el riesgo del caso. No es lo mismo reducir falsos positivos que reducir falsos negativos.
| Métrica | Qué mide | Cuándo importa |
|---|---|---|
| Accuracy | Proporción total de predicciones correctas. | Útil cuando las clases están equilibradas y los errores tienen coste similar. |
| Precision | De lo que el modelo marcó como positivo, cuánto era realmente positivo. | Importa cuando los falsos positivos son costosos, por ejemplo alertas manuales innecesarias. |
| Recall | De los positivos reales, cuántos detectó el modelo. | Importa cuando perder un positivo real es grave, por ejemplo fraude o casos médicos urgentes. |
| F1 score | Equilibrio entre precision y recall. | Útil cuando necesitas balancear falsos positivos y falsos negativos. |
| Error medio | Diferencia entre valor predicho y valor real en problemas numéricos. | Importa en regresión: demanda, precio, tiempo de entrega o consumo. |
10. LLM, GenAI y modelos fundacionales
Un large language model o LLM es un modelo de lenguaje entrenado con grandes cantidades de texto para comprender y generar lenguaje natural. Los LLM forman parte de la IA generativa, pero no toda IA generativa es solo texto: también puede haber generación de imágenes, audio, vídeo, código o contenido multimodal.
Un modelo fundacional es un modelo grande entrenado con datos amplios que puede adaptarse a muchos casos de uso. En AWS, este concepto aparece especialmente con servicios como Amazon Bedrock, que permite acceder a modelos fundacionales mediante API, y con SageMaker AI para construir, entrenar y desplegar modelos de ML.
| Concepto | Qué debes recordar | Trampa habitual |
|---|---|---|
| LLM | Modelo especializado en lenguaje natural: responder, resumir, traducir, clasificar texto o generar contenido. | No todos los problemas requieren un LLM. |
| GenAI | Capacidad de crear contenido nuevo a partir de prompts, contexto o datos de entrada. | Generar contenido no garantiza que sea verdadero. |
| Modelo fundacional | Modelo base reutilizable para múltiples tareas y casos de uso. | El modelo más grande no siempre es el mejor para coste o latencia. |
| Agente | Sistema que puede usar herramientas o APIs para completar tareas. | Un agente necesita permisos, validaciones y límites de acción. |
11. IA tradicional, ML clásico y GenAI: cuándo usar cada uno
No todo necesita IA generativa. En el examen pueden plantearte una necesidad de negocio y pedirte el enfoque más adecuado. Elegir GenAI por defecto puede ser incorrecto si el problema requiere una predicción estructurada, una regla exacta o una consulta tradicional.
| Necesidad | Enfoque más probable | Por qué |
|---|---|---|
| Predecir demanda futura | Regresión / forecasting. | La salida esperada es un valor numérico o una serie temporal. |
| Detectar fraude | Clasificación o anomalías. | La salida suele ser una categoría o puntuación de riesgo. |
| Segmentar clientes sin etiquetas | Clustering. | Se buscan grupos naturales en los datos. |
| Responder preguntas sobre documentos internos | GenAI + RAG. | Se necesita lenguaje natural y conocimiento documental actualizado. |
| Aplicar una regla fiscal exacta | Lógica determinista. | Si la salida debe ser exacta por norma, una regla tradicional puede ser más adecuada. |
12. Servicios AWS que pueden aparecer asociados
Esta página se centra en conceptos, pero AIF-C01 suele conectar esos conceptos con servicios administrados de AWS. Debes reconocerlos a alto nivel.
Servicio administrado para construir, entrenar, desplegar y gobernar modelos de machine learning.
Servicio para crear aplicaciones de IA generativa usando modelos fundacionales gestionados mediante API.
Procesamiento de lenguaje natural: entidades, sentimiento, frases clave o clasificación de texto.
Análisis de imágenes y vídeo: objetos, escenas, rostros, moderación visual y detección.
Extracción de texto, tablas y datos desde documentos escaneados o formularios.
Transcribe convierte voz a texto. Polly convierte texto a voz.
13. Cómo razonar preguntas de este módulo
14. Errores frecuentes
- Confundir IA con ML. ML es una parte de IA, no todo el campo.
- Confundir regresión con clasificación. Mira si la salida es número o categoría.
- Creer que deep learning siempre es mejor. Puede ser más costoso y no necesario para problemas simples.
- Olvidar la inferencia. Entrenar es solo una parte; en producción importan latencia, coste, disponibilidad y seguridad.
- Ignorar el sesgo. Los modelos aprenden de datos; si los datos no son representativos, el resultado puede ser injusto o poco fiable.
- Usar GenAI para todo. A veces una regla, consulta SQL, API o modelo clásico es más apropiado.
Resumen final
IA es el campo amplio; machine learning es una forma de crear sistemas que aprenden patrones desde datos; deep learning usa redes neuronales profundas para problemas complejos; e IA generativa crea contenido nuevo. Un algoritmo aprende desde datos durante el entrenamiento y produce un modelo. Ese modelo se usa en inferencia para predecir, clasificar, recomendar o generar respuestas.
Para aprobar AIF-C01, debes reconocer qué técnica encaja con cada escenario: clasificación para categorías, regresión para valores numéricos, clustering para grupos sin etiquetas y GenAI para creación o transformación de contenido. También debes recordar que los modelos tienen límites: pueden estar sesgados, sobreajustarse, degradarse con el tiempo o no ser adecuados si se necesita una salida exacta y determinista.