
chaos-engineering
by PromptSpace
Diseña experimentos rigurosos de ingeniería del caos y auditorías de resiliencia para verificar la fiabilidad de los sistemas en producción.
- Diseñar experimentos controlados de inyección de fallos para entornos de producción.
- Identificar puntos únicos de fallo en arquitecturas de microservicios distribuidos.
- Planificar simulaciones de alto impacto tipo 'Game Day' para equipos de ingeniería.
Free
One-time purchase
Included in download
- Downloadable skill package
- Works with OpenClaw, Cursor
- Instant install
See it in action
Hipótesis: La latencia P99 de /checkout se mantiene <1,2 s durante la latencia del gateway de pago. Perturbación: Inyectar 300 ms de latencia en el servicio 'payment-v2' para el 5% del tráfico durante 10 minutos. Condición de cancelación: Tasa de errores > 2% durante 120 s. Amplificador objetivo: Tormenta de reintentos y agotamiento del pool de hilos.
chaos-engineering
by PromptSpace
Diseña experimentos rigurosos de ingeniería del caos y auditorías de resiliencia para verificar la fiabilidad de los sistemas en producción.
Free
One-time purchase
⚡ Skill ready to install in Claude Code, Gemini CLI, or any MCP-compatible client. Read the install guides →
Included in download
- Downloadable skill package
- Works with OpenClaw, Cursor
- Instant install
See it in action
Hipótesis: La latencia P99 de /checkout se mantiene <1,2 s durante la latencia del gateway de pago. Perturbación: Inyectar 300 ms de latencia en el servicio 'payment-v2' para el 5% del tráfico durante 10 minutos. Condición de cancelación: Tasa de errores > 2% durante 120 s. Amplificador objetivo: Tormenta de reintentos y agotamiento del pool de hilos.
About This Skill
La ciencia del fallo controlado
Más allá de las listas de verificación genéricas, esta habilidad transforma tu agente de IA en un ingeniero del caos sénior. Aborda el problema fundamental de la «resiliencia teórica» sustituyendo las recomendaciones vagas por experimtexto en cursivaentos falsificables basados en evidencia. En lugar de sugerirte que «añadas reintentos», te ayuda a diseñar la prueba de estrés exacta necesaria para demostrar que tu sistema no colapsará ante una tormenta de reintentos.
Qué hace
- Diseño de experimentos: Elabora experimentos de caos específicos con hipótesis medibles, perturbaciones de una sola variable y radios de explosión definidos.
- Auditoría de resiliencia: Identifica amplificadores arquitectónicos ocultos como manadas de truenos, fallos grises y retrocesos sincronizados.
- Rigor operacional: Define los roles humanos (Responsable, Observador, Autoridad de Cancelación) y los indicadores de preparación necesarios para ejecutar experimentos de forma segura en producción.
- Conversión de post-mortem: Analiza incidentes pasados para crear experimentos de «nunca más» que verifiquen las correcciones aplicadas.
¿Por qué usar esta habilidad?
El uso estándar de IA suele generar listas de «mejores prácticas» difíciles de llevar a la acción. Esta habilidad impone un procedimiento riguroso de cuatro fases (Hipotetizar, Perturbar, Minimizar, Aprender) que trata la infraestructura como un laboratorio. Se centra en el riesgo de cola (P99/P99.9) en lugar de los promedios, garantizando que tus sistemas estén reforzados frente a los peores escenarios que realmente provocan interrupciones del servicio.
Use Cases
- Diseñar experimentos controlados de inyección de fallos para entornos de producción.
- Identificar puntos únicos de fallo en arquitecturas de microservicios distribuidos.
- Planificar simulaciones de alto impacto tipo 'Game Day' para equipos de ingeniería.
- Auditar arquitecturas en busca de 'fallos grises' y amplificadores ocultos de acoplamiento entre sistemas.
- Especificar límites de seguridad medibles y condiciones de cancelación para pruebas de fiabilidad.
Known Limitations
- Solo planificación: la habilidad diseña experimentos, pero no los ejecuta. Los experimentos los ejecutas tú con tus propias herramientas (Gremlin, Litmus, Chaos Mesh, AWS FIS, herramientas personalizadas).
- Basura entra, basura sale en cuanto al contexto del sistema: el agente no conoce tu arquitectura específica. Tú describes el sistema y las dependencias; el agente diseña los experimentos en función de lo que describes. Las dependencias no documentadas no serán detectadas.
- Más adecuado para sistemas con telemetría observable. Las arquitecturas que carecen de dashboards, seguimiento de latencia P99 o alertas de tasa de errores encontrarán un obstáculo en la fase de hipótesis de estado estable.
- No sustituye a la cultura de post-mortem. La habilidad planifica experimentos y aprende de los resultados; no conduce retrospectivas ni redacta informes de incidentes.
- Enfoque en un experimento a la vez: la habilidad diseña un experimento por vez. La estrategia de automatización continua del caos (experimentos continuos sobre la flota al estilo Chaos Monkey) requiere herramientas adicionales y un diseño de programa más allá de lo que enseña esta habilidad.
- El vocabulario asume patrones estándar de sistemas distribuidos (Kubernetes, nube, microservicios, reintentos, circuit breakers). Menos aplicable directamente a arquitecturas muy propietarias o inusuales sin adaptación.
How to Install
mkdir -p ~/.claude/skills/chaos-engineering && curl -s -X POST 'https://api.promptspace.in/api/skills/chaos-engineering/install' | python3 -c "import sys,json; sys.stdout.write(json.load(sys.stdin).get('installInstructions') or '')" > ~/.claude/skills/chaos-engineering/SKILL.mdFree skills install directly. Paid skills require purchase - use the download button above after buying.
Reviews
Security Scanned
Passed automated security review
Permissions
No special permissions declared or detected
OpenClaw, Cursor, Claude Code, Codex CLI
Creator
PromptSpace
We build AI agent skill packages for content creators. Specializing in Chinese social media automation.