Temario del curso
Fundamentos de las operaciones en la nube con AWS
- Roles y responsabilidades operativas en la nube.
- Estructura de cuentas de AWS, organizaciones y estrategias de múltiples cuentas.
- Servicios operativos centrales: CloudWatch, CloudTrail y AWS Config.
Infraestructura como Código y aprovisionamiento
- Principios de IaC e infraestructura inmutable.
- Aprovisionamiento con Terraform y AWS CloudFormation.
- Gestión del estado, módulos y promoción de entornos.
Estrategias de CI/CD y despliegue
- Diseño de pipelines de CI/CD para aplicaciones nativas en la nube.
- Despliegues blue/green, canario y por rodadura (rolling).
- Automatización de reversión, verificaciones de salud y validación de lanzamientos.
Monitoreo, observabilidad y alertas
- Métricas, registros y trazas: envío, almacenamiento y análisis.
- Uso de CloudWatch, X-Ray y herramientas de observabilidad de terceros.
- Definición de SLO/SLI, políticas de alerta y prácticas de guardia (on-call).
Operaciones de seguridad y gestión de identidades
- Mejores prácticas de IAM, principio de menor privilegio y acceso entre cuentas.
- Gestión de secretos, KMS y almacenes de parámetros seguros.
- Seguridad operativa: estrategias de parches, escaneo de vulnerabilidades y registros de auditoría.
Resiliencia, respaldo y recuperación ante desastres
- Diseño para tolerancia a fallos y alta disponibilidad.
- Estrategias de respaldo, automatización de instantáneas y procedimientos de restauración.
- Planificación de recuperación ante desastres y creación de manuales de procedimiento (runbooks).
Optimización de costos y gobernanza
- Visibilidad de costos: facturación, etiquetado y estrategias de asignación de costos.
- Ajuste de recursos (rightsizing), instancias reservadas/planes de ahorro y controles presupuestarios.
- Gobernanza: políticas, salvaguardas y automatización para el cumplimiento normativo.
Contenedores, servicios sin servidor (serverless) y operaciones de ejecución
- Consideraciones operativas para ECS, EKS y Lambda.
- Detección de servicios, escalado automático y límites de recursos.
- Registro, trazado y depuración de cargas de trabajo en contenedores.
Respuesta a incidentes, manuales de procedimiento (playbooks) e ingeniería del caos
- Respuesta a incidentes basada en manuales y prácticas de análisis postmortem.
- Automatización de remediación y patrones de autocuración.
- Introducción a los experimentos de caos para validar la resiliencia.
Taller práctico: Operación de una carga de trabajo de ejemplo
- Despliegue de una aplicación de ejemplo usando IaC y un pipeline de CI/CD.
- Implementación de monitoreo, alertas y un script de remediación automatizada.
- Simulación de incidentes y práctica de respuesta basada en manuales de procedimiento.
Resumen y siguientes pasos
Requerimientos
- Conocimientos básicos de conceptos de nube y redes.
- Familiaridad con la línea de comandos de Linux y scripting.
- Experiencia con control de versiones (Git) y conceptos básicos de CI/CD.
Público objetivo
- Ingenieros de operaciones en la nube.
- Ingenieros de confiabilidad de sitios (SRE) e ingenieros de plataformas.
- Ingenieros de DevOps y líderes técnicos de equipos.
Testimonios (2)
He descubierto cosas nuevas y interesantes sobre Lambda y Serverless
Oleg Buldumac - PUBLIC COURSE
Curso - AWS Lambda for Developers
Traducción Automática
Todo en general.
Bruno - Verizon Connect
Curso - Amazon Redshift
Traducción Automática