Bases de datos AWS: RDS, Aurora, DynamoDB, Redshift y más

Dominio 3 · Tecnología y servicios AWS

Bases de datos AWS

◷ 11 min

AWS tiene muchas bases de datos, y eso al principio puede parecer un lío. Pero en CLF-C02 no esperan que seas DBA ni que administres motores en profundidad. Lo que el examen quiere comprobar es más sencillo: que sepas reconocer qué tipo de base de datos encaja mejor con cada caso de uso.

La pregunta clave no es “¿cuál es la mejor base de datos de AWS?”, porque esa base de datos universal no existe. La pregunta correcta es: ¿qué necesita la aplicación? ¿SQL? ¿NoSQL? ¿baja latencia? ¿analítica? ¿caché? ¿relaciones tipo grafo? ¿documentos? ¿series temporales?

Idea clave: elige la base de datos por el modelo de datos y el patrón de acceso. SQL transaccional apunta a RDS o Aurora; NoSQL serverless a DynamoDB; analítica y data warehouse a Redshift; caché a ElastiCache; grafos a Neptune; documentos compatibles con MongoDB a DocumentDB; series temporales a Timestream.

1. Primero entiende las familias de bases de datos

Antes de memorizar servicios, ordena las bases de datos por familias. Esto ayuda muchísimo en preguntas de examen.

Relacionales: datos en tablas, SQL, relaciones, transacciones. Piensa en RDS y Aurora.
NoSQL clave-valor/documento: alta escala, baja latencia, modelos flexibles. Piensa en DynamoDB.
Data warehouse: analítica, BI, reporting y grandes volúmenes de datos. Piensa en Redshift.
Caché en memoria: reducir latencia y descargar lecturas de una base principal. Piensa en ElastiCache o MemoryDB.
Grafos: relaciones complejas entre entidades. Piensa en Neptune.
Documentos: documentos JSON y compatibilidad con MongoDB. Piensa en DocumentDB.
Series temporales: métricas, sensores, IoT y datos con marca de tiempo. Piensa en Timestream.
Ledger: histórico inmutable y verificable. Piensa en QLDB.

Cómo lo piensa el examen

Si el escenario menciona SQL, PostgreSQL, MySQL u Oracle, piensa en RDS o Aurora. Si habla de NoSQL serverless y milisegundos de latencia, DynamoDB. Si habla de reporting, BI o data warehouse, Redshift. Si habla de acelerar lecturas, ElastiCache.

2. Amazon RDS: bases relacionales gestionadas

Amazon RDS es el servicio gestionado de bases de datos relacionales de AWS. Lo usarías cuando quieres una base SQL tradicional sin encargarte de muchas tareas operativas como backups automáticos, parches, alta disponibilidad o réplicas, según configuración.

RDS soporta motores conocidos como:

MySQL.
PostgreSQL.
MariaDB.
Oracle.
Microsoft SQL Server.
Db2.

Para CLF-C02, la asociación es clara: base relacional gestionada + motor SQL conocido = Amazon RDS.

Pista de examen: si una aplicación necesita una base PostgreSQL, MySQL, Oracle o SQL Server gestionada, la respuesta suele ser Amazon RDS.

3. Amazon Aurora: relacional optimizada para AWS

Amazon Aurora también es relacional, pero está diseñada para AWS. Es compatible con MySQL y PostgreSQL y suele aparecer cuando el escenario habla de alto rendimiento, disponibilidad y una base relacional cloud-native.

No pienses en Aurora como “otra NoSQL”. Aurora es relacional. La diferencia mental frente a RDS es que Aurora es una opción optimizada por AWS para cargas relacionales compatibles con MySQL/PostgreSQL.

Compatible con MySQL y PostgreSQL.
Diseñada para alta disponibilidad y rendimiento en AWS.
Gestionada por AWS.
Puede ser buena opción para aplicaciones relacionales críticas.

RDS o Aurora

Si el examen solo dice “base relacional gestionada PostgreSQL”, RDS puede encajar. Si enfatiza alto rendimiento, disponibilidad gestionada y compatibilidad MySQL/PostgreSQL optimizada para AWS, Aurora puede aparecer como respuesta.

4. Amazon DynamoDB: NoSQL serverless de baja latencia

Amazon DynamoDB es una base de datos NoSQL serverless de clave-valor y documento. Es una de las bases más importantes para CLF-C02 porque aparece en escenarios de aplicaciones modernas, serverless, alto tráfico, escalabilidad automática y baja latencia.

Piensa en DynamoDB cuando una aplicación necesita responder muy rápido a muchísimas peticiones y no requiere joins SQL complejos.

NoSQL.
Serverless.
Clave-valor y documento.
Baja latencia.
Escala automáticamente.
Muy usado en arquitecturas serverless con Lambda y API Gateway.

Pista de examen: NoSQL + serverless + baja latencia + escala masiva = Amazon DynamoDB.

5. Amazon Redshift: data warehouse, no base transaccional

Amazon Redshift es el data warehouse de AWS. Se usa para analítica, BI, reporting y consultas sobre grandes volúmenes de datos. No es la primera opción para una aplicación web que necesita guardar pedidos uno a uno en tiempo real.

La diferencia importante es esta:

Servicio	Uso principal
Amazon RDS / Aurora	Aplicaciones transaccionales: usuarios, pedidos, inventario, operaciones SQL del día a día.
Amazon Redshift	Analítica: reporting, BI, data warehouse, consultas complejas sobre grandes datasets.
Amazon Athena	Consultas SQL directamente sobre datos en S3, sin cargar un data warehouse.

Pista de examen: data warehouse, BI, reporting empresarial o consultas analíticas sobre grandes volúmenes = Amazon Redshift.

6. ElastiCache y MemoryDB: memoria para ir más rápido

Amazon ElastiCache proporciona caché en memoria compatible con Redis o Memcached. Su objetivo habitual es reducir latencia y descargar trabajo de una base de datos principal.

Ejemplo sencillo: una aplicación consulta muchas veces los mismos datos. En lugar de ir siempre a la base principal, guarda resultados frecuentes en caché para responder más rápido.

ElastiCache: caché en memoria con Redis o Memcached.
MemoryDB for Redis: base de datos en memoria compatible con Redis, duradera y de alto rendimiento.

Cómo reconocer caché

Si una pregunta habla de reducir latencia de lectura, mejorar tiempos de respuesta o descargar una base de datos muy consultada, piensa en ElastiCache.

7. Amazon Neptune: base de datos de grafos

Amazon Neptune es una base de datos de grafos. Se usa cuando lo importante son las relaciones entre entidades: nodos, aristas, conexiones y recorridos.

Casos típicos:

Redes sociales.
Recomendaciones.
Detección de fraude.
Grafos de conocimiento.
Relaciones complejas entre usuarios, productos, cuentas o eventos.

Pista de examen: relaciones complejas, nodos, aristas, grafos o recomendaciones basadas en conexiones = Amazon Neptune.

8. Amazon DocumentDB: documentos compatibles con MongoDB

Amazon DocumentDB es una base documental gestionada compatible con cargas MongoDB. Se usa cuando el modelo de datos se basa en documentos, normalmente tipo JSON.

No la confundas con DynamoDB. Ambas pueden sonar “NoSQL”, pero no son lo mismo:

DynamoDB: NoSQL serverless clave-valor/documento, muy orientada a escala y baja latencia.
DocumentDB: base documental gestionada compatible con MongoDB.

9. Amazon Timestream: series temporales

Amazon Timestream está pensada para datos de series temporales. Es decir, datos donde el tiempo es parte esencial del análisis.

Ejemplos típicos:

Métricas de sistemas.
Datos de sensores.
Telemetría IoT.
Eventos con timestamp.
Mediciones repetidas a lo largo del tiempo.

Pista de examen: sensores, IoT, métricas y datos con marca temporal = Amazon Timestream.

10. Amazon QLDB: ledger inmutable y verificable

Amazon Quantum Ledger Database (QLDB) es una base de datos tipo ledger. Su objetivo es mantener un historial inmutable y verificable de cambios.

Puede aparecer en escenarios donde una organización necesita trazabilidad fuerte, registro histórico verificable o un libro mayor centralizado sin administrar una red blockchain.

Historial inmutable.
Registro verificable.
Auditoría de cambios.
Ledger centralizado.

11. Comparativa para examen

Servicio	Modelo	Pista de examen
RDS	Base relacional gestionada.	SQL, MySQL, PostgreSQL, Oracle, SQL Server.
Aurora	Relacional cloud-native compatible MySQL/PostgreSQL.	Rendimiento y disponibilidad gestionada en AWS.
DynamoDB	NoSQL serverless clave-valor/documento.	Baja latencia, escala masiva, sin administrar servidores.
Redshift	Data warehouse analítico.	BI, reporting, consultas sobre grandes datasets.
ElastiCache	Caché en memoria.	Reducir latencia, Redis/Memcached.
MemoryDB	Base en memoria compatible con Redis.	Alto rendimiento con durabilidad y compatibilidad Redis.
Neptune	Base de grafos.	Relaciones complejas, nodos y aristas.
DocumentDB	Base documental gestionada.	Cargas compatibles con MongoDB, documentos JSON.
Timestream	Series temporales.	IoT, métricas, datos por tiempo.
QLDB	Ledger database.	Historial inmutable y verificable.

12. Cómo razonar una pregunta de bases de datos

Cuando veas una pregunta de bases de datos, intenta seguir este orden:

Identifica si es transaccional o analítica. Transaccional suele ir a RDS/Aurora/DynamoDB. Analítica suele ir a Redshift o Athena.
Mira si pide SQL. SQL tradicional apunta a RDS o Aurora.
Mira si pide NoSQL serverless y baja latencia. Eso apunta a DynamoDB.
Mira si pide caché. Eso apunta a ElastiCache.
Mira si el modelo de datos es especial. Grafos, documentos, series temporales o ledger apuntan a servicios especializados.
No elijas el servicio más famoso. Elige el que resuelve exactamente el requisito.

Escenario tipo examen

Si el escenario dice “base SQL gestionada”, piensa en RDS/Aurora. Si dice “NoSQL serverless con latencia de milisegundos”, DynamoDB. Si dice “dashboard analítico sobre grandes datos”, Redshift o QuickSight según la capa. Si dice “caché para reducir lecturas”, ElastiCache.

13. Diferencias que suelen confundir

RDS vs Aurora: ambos son relacionales; Aurora está optimizada para AWS y es compatible con MySQL/PostgreSQL.
RDS vs DynamoDB: RDS es SQL relacional; DynamoDB es NoSQL serverless.
DynamoDB vs DocumentDB: DynamoDB es clave-valor/documento serverless; DocumentDB se asocia a compatibilidad MongoDB.
Redshift vs RDS: Redshift es analítica/data warehouse; RDS es transaccional.
Redshift vs Athena: Redshift es un data warehouse; Athena consulta datos en S3 con SQL de forma serverless.
ElastiCache vs RDS: ElastiCache no sustituye normalmente a la base principal; acelera lecturas y reduce latencia.
Neptune vs DocumentDB: Neptune es grafos; DocumentDB es documentos.
Timestream vs DynamoDB: Timestream está optimizada para datos temporales; DynamoDB es NoSQL general de baja latencia.

14. Cómo estudiar este módulo

Te recomiendo aprenderlo como una tabla mental de decisiones:

¿Necesito SQL gestionado? RDS.
¿Necesito SQL compatible MySQL/PostgreSQL optimizado para AWS? Aurora.
¿Necesito NoSQL serverless y baja latencia? DynamoDB.
¿Necesito data warehouse para BI? Redshift.
¿Necesito caché en memoria? ElastiCache.
¿Necesito relaciones complejas? Neptune.
¿Necesito documentos compatibles con MongoDB? DocumentDB.
¿Necesito datos de sensores o métricas por tiempo? Timestream.
¿Necesito historial inmutable y verificable? QLDB.

15. Errores típicos

Elegir Redshift para una aplicación transaccional normal.
Elegir DynamoDB cuando el requisito pide joins SQL complejos.
Olvidar ElastiCache cuando el requisito es caché en memoria.
Confundir DocumentDB con DynamoDB solo porque ambas son NoSQL.
Usar RDS cuando el escenario pide grafos o series temporales.
Elegir Aurora pensando que es NoSQL.
Elegir Athena cuando el escenario pide un data warehouse gestionado para BI empresarial.
Olvidar que las bases especializadas existen para casos muy concretos.

16. Cómo saber si dominas este módulo

Vas bien si puedes responder sin mirar apuntes:

Qué servicio elegirías para PostgreSQL gestionado.
Qué diferencia hay entre RDS y Aurora.
Cuándo elegir DynamoDB frente a RDS.
Por qué Redshift no es la primera opción para una aplicación OLTP normal.
Qué servicio usarías para caché en memoria.
Qué servicio usarías para grafos.
Qué servicio usarías para documentos compatibles con MongoDB.
Qué servicio usarías para datos de sensores con marca temporal.
Qué servicio usarías para un ledger inmutable y verificable.

Test del módulo · preguntas de repaso

1. Una aplicación necesita una base relacional PostgreSQL gestionada. ¿Qué servicio encaja?

Amazon RDS
Amazon S3
AWS Shield
Amazon CloudFront

Ver respuesta y explicación

Respuesta: A. RDS soporta motores relacionales gestionados como PostgreSQL, MySQL, MariaDB, Oracle, SQL Server y Db2.

2. Una aplicación serverless necesita NoSQL de baja latencia y alta escala. ¿Qué servicio elegirías?

Amazon DynamoDB
Amazon Redshift
Amazon EBS
AWS Artifact

Ver respuesta y explicación

Respuesta: A. DynamoDB es una base NoSQL serverless orientada a baja latencia y escala automática.

3. Una empresa quiere un data warehouse para BI y reporting. ¿Qué servicio usaría?

Amazon Redshift
Amazon Route 53
AWS KMS
AWS WAF

Ver respuesta y explicación

Respuesta: A. Redshift es el servicio de data warehouse de AWS para analítica, BI y reporting.

4. Necesitas una caché en memoria para reducir latencia de lecturas repetidas. ¿Qué servicio encaja?

Amazon ElastiCache
AWS DMS
Amazon Macie
AWS Config

Ver respuesta y explicación

Respuesta: A. ElastiCache proporciona Redis o Memcached gestionado para caché en memoria.

5. Una aplicación necesita modelar relaciones complejas tipo grafo. ¿Qué servicio usaría?

Amazon Neptune
Amazon SQS
Amazon EFS
AWS Budgets

Ver respuesta y explicación

Respuesta: A. Neptune es la base de datos de grafos de AWS.

6. Datos de sensores con marca temporal requieren una base optimizada para series temporales. ¿Qué servicio encaja?

Amazon Timestream
Amazon CloudFront
AWS Organizations
Amazon ECR

Ver respuesta y explicación

Respuesta: A. Timestream está orientado a datos de series temporales como sensores, IoT y métricas.

7. Una empresa necesita una base documental gestionada compatible con cargas MongoDB. ¿Qué servicio debería considerar?

Amazon DocumentDB
Amazon Redshift
AWS CloudTrail
Amazon Route 53

Ver respuesta y explicación

Respuesta: A. DocumentDB es una base documental gestionada compatible con MongoDB.

8. Una organización necesita un historial inmutable y verificable de cambios para auditoría. ¿Qué servicio encaja mejor?

Amazon QLDB
Amazon CloudFront
Amazon EBS
AWS Budgets

Ver respuesta y explicación

Respuesta: A. QLDB es una base tipo ledger para mantener un historial inmutable y verificable.

Resumen final

Las bases de datos AWS se entienden mejor cuando las estudias por patrón de uso. No intentes memorizar una lista sin contexto. Pregúntate siempre qué necesita la aplicación: SQL, NoSQL, analítica, caché, grafos, documentos, series temporales o historial inmutable.

Para CLF-C02, las asociaciones más importantes son: RDS para bases relacionales gestionadas; Aurora para relacional optimizada en AWS; DynamoDB para NoSQL serverless de baja latencia; Redshift para data warehouse; ElastiCache para caché; Neptune para grafos; DocumentDB para documentos compatibles con MongoDB; Timestream para series temporales; QLDB para ledger.

Tu siguiente paso: continúa con serverless y contenedores. Ahí verás cómo Lambda, ECS, EKS y Fargate encajan con aplicaciones modernas y arquitecturas gestionadas.

← CloudFront, Route 53 y servicios edge para CLF-C02 Serverless y contenedores: Lambda, ECS, EKS y Fargate →

Curso AWS Cloud Practitioner CLF-C02