Skip to main content
PROMPT SPACE
0

chaos-engineering

by PromptSpace

Diseña experimentos rigurosos de ingeniería del caos y auditorías de resiliencia para verificar la fiabilidad de los sistemas en producción.

21 views

Free

One-time purchase

⚡ Skill ready to install in Claude Code, Gemini CLI, or any MCP-compatible client. Read the install guides →

Included in download

  • Downloadable skill package
  • Works with OpenClaw, Cursor
  • Instant install

See it in action

Hipótesis: La latencia P99 de /checkout se mantiene <1,2 s durante la latencia del gateway de pago.
Perturbación: Inyectar 300 ms de latencia en el servicio 'payment-v2' para el 5% del tráfico durante 10 minutos.
Condición de cancelación: Tasa de errores > 2% durante 120 s.
Amplificador objetivo: Tormenta de reintentos y agotamiento del pool de hilos.

About This Skill

La ciencia del fallo controlado

Más allá de las listas de verificación genéricas, esta habilidad transforma tu agente de IA en un ingeniero del caos sénior. Aborda el problema fundamental de la «resiliencia teórica» sustituyendo las recomendaciones vagas por experimtexto en cursivaentos falsificables basados en evidencia. En lugar de sugerirte que «añadas reintentos», te ayuda a diseñar la prueba de estrés exacta necesaria para demostrar que tu sistema no colapsará ante una tormenta de reintentos.

Qué hace

  • Diseño de experimentos: Elabora experimentos de caos específicos con hipótesis medibles, perturbaciones de una sola variable y radios de explosión definidos.
  • Auditoría de resiliencia: Identifica amplificadores arquitectónicos ocultos como manadas de truenos, fallos grises y retrocesos sincronizados.
  • Rigor operacional: Define los roles humanos (Responsable, Observador, Autoridad de Cancelación) y los indicadores de preparación necesarios para ejecutar experimentos de forma segura en producción.
  • Conversión de post-mortem: Analiza incidentes pasados para crear experimentos de «nunca más» que verifiquen las correcciones aplicadas.

¿Por qué usar esta habilidad?

El uso estándar de IA suele generar listas de «mejores prácticas» difíciles de llevar a la acción. Esta habilidad impone un procedimiento riguroso de cuatro fases (Hipotetizar, Perturbar, Minimizar, Aprender) que trata la infraestructura como un laboratorio. Se centra en el riesgo de cola (P99/P99.9) en lugar de los promedios, garantizando que tus sistemas estén reforzados frente a los peores escenarios que realmente provocan interrupciones del servicio.

Use Cases

  • Diseñar experimentos controlados de inyección de fallos para entornos de producción.
  • Identificar puntos únicos de fallo en arquitecturas de microservicios distribuidos.
  • Planificar simulaciones de alto impacto tipo 'Game Day' para equipos de ingeniería.
  • Auditar arquitecturas en busca de 'fallos grises' y amplificadores ocultos de acoplamiento entre sistemas.
  • Especificar límites de seguridad medibles y condiciones de cancelación para pruebas de fiabilidad.

Reviews

No reviews yet. Be the first to review this skill after you install it.

Security Scanned

Passed automated security review

Permissions

No special permissions declared or detected

OpenClaw, Cursor, Claude Code, Codex CLI

Creator

P

PromptSpace

We build AI agent skill packages for content creators. Specializing in Chinese social media automation.

Frequently Asked Questions

chaos-engineering — AI Agent Skill | PromptSpace