Construye Agente SRE IA con MCP: Arquitectura

Esta es la Parte 1 de una serie de 3 partes sobre cómo construir un agente SRE de IA con MCP. La Parte 2 cubre el código del servidor y los guardarrailes de seguridad. La Parte 3 cubre el despliegue en producción.

A las 2:00 AM del último trimestre, una fuga de memoria en staging desencadenó un fallo en cascada por tres namespaces. El ingeniero de guardia (lee mi historia) perdió cuarenta minutos ejecutando los mismos comandos de diagnóstico que le había enseñado al equipo la semana anterior: kubectl get pods, kubectl logs, kubectl describe deployment. Para cuando encontró la causa raíz, el radio de explosión ya había alcanzado un servicio de producción adyacente.

Ese incidente me llevó a preguntarme algo simple: ¿qué pasaría si un agente de IA ejecutara esos diagnósticos en segundos, presentara un resumen preciso y escalara solo cuando el criterio humano sea indispensable? No un chatbot que adivine. Un agente con uso de herramientas, la capacidad de ejecutar comandos reales contra infraestructura real y devolver resultados estructurados a un modelo de razonamiento.

¿Qué es MCP?

MCP significa Model Context Protocol. Un protocolo abierto que estandariza cómo las aplicaciones de IA se conectan a fuentes de datos externas y herramientas, según la especificación MCP. Piénsalo como un puerto USB-C para aplicaciones de IA: una interfaz estandarizada, periféricos ilimitados.

Un servidor MCP es un proceso ligero que expone herramientas (funciones que la IA puede llamar), recursos (datos que la IA puede leer) y prompts (plantillas reutilizables). El cliente de IA, en nuestro caso Claude Desktop, descubre estas capacidades dinámicamente e invoca las que la conversación requiera.

En MCP, una herramienta es una función tipada que la IA invoca según la conversación.

Qué Vas a Construir

Al final de esta guía tendrás:

Un servidor FastMCP de Python que expone herramientas de diagnóstico de Kubernetes
Capas de seguridad: solo lectura por defecto, modo dry-run y una cola de aprobación
Integración con Claude Desktop para diagnósticos de clúster en lenguaje natural
Un plano de arquitectura de 4 capas: observabilidad → MCP → runtime del agente → gobernanza

Prerrequisitos

Requisito	Mínimo	Recomendado	Comando de verificación
Python	3.10	3.12	`python3 --version`
kubectl	1.28	1.30+	`kubectl version --client`
Acceso a Kubernetes	Solo lectura	Lectura-escritura (para remediación)	`kubectl auth can-i get pods`
Claude Desktop	Última	Última	Verifica versión de la app
uv (opcional)	0.4	0.5+	`uv --version`

Yo uso uv para gestión rápida de entornos Python, pero pip y venv funcionan igual.

La Arquitectura de 4 Capas

Antes de escribir código, déjame mostrarte la arquitectura que uso para sistemas SRE agenticos. Aprendí por las malas que conectar una IA a kubectl sin límites es una receta para el desastre.

┌─────────────────────────────────────────────────────────────┐
│  Capa 4: Gobernanza y supervisión humana                      │
│  → Colas de aprobación, registros de auditoría, cumplimiento │
├─────────────────────────────────────────────────────────────┤
│  Capa 3: Runtime del agente (Claude Desktop / API)           │
│  → Razonamiento, planificación, selección de herramientas    │
├─────────────────────────────────────────────────────────────┤
│  Capa 2: Servidor MCP (FastMCP + cliente de Kubernetes)      │
│  → Definiciones de herramientas, validación, seguridad        │
├─────────────────────────────────────────────────────────────┤
│  Capa 1: Observabilidad e infraestructura                    │
│  → API de Kubernetes, métricas, logs, trazas                  │
└─────────────────────────────────────────────────────────────┘

La Capa 1 es tu clúster. El servidor MCP se comunica con la API de Kubernetes a través del cliente oficial de Python. La Capa 2 es donde validamos entradas, aplicamos solo lectura por defecto y envolvemos cada comando en lógica de seguridad. La Capa 3 es la IA misma (Claude en este caso) que razona sobre lo que el usuario quiere y selecciona las herramientas correctas. La Capa 4 es la gobernanza: rastros de auditoría, compuertas de aprobación para acciones destructivas y políticas organizacionales.

Nunca saltes la Capa 4. He visto demostraciones donde un agente de IA borra namespaces alegremente porque el prompt era ambiguo. Por eso los sistemas agenticos exigen guardarrailes, no solo capacidades.

Preguntas Frecuentes

¿Qué es una herramienta MCP y en qué se diferencia de una API normal?

Una herramienta MCP es una función tipada que el cliente de IA descubre dinámicamente. A diferencia de una API donde el llamante controla la solicitud, la IA decide cuándo invocar cada herramienta según la conversación. La definición también sirve como documentación que la IA lee para entender las capacidades disponibles.

¿Es segura la arquitectura de 4 capas para producción?

Sí, cuando implementas las cuatro capas. La Capa 4 proporciona registros de auditoría, colas de aprobación y cumplimiento de políticas. Combinado con solo lectura por defecto y lista blanca de namespaces de la Parte 2, este sistema sigue el principio de mínimo privilegio. Nunca saltes la gobernanza.

¿Puedo usar este agente con otros clientes de IA?

MCP es un protocolo abierto. Claude Desktop tiene el soporte MCP más maduro, pero OpenAI Agents SDK y varios clientes open-source están agregando compatibilidad. El servidor que construyas funcionará con cualquier cliente compatible con MCP.

Continúa con la Parte 2 donde escribiremos el código del servidor, implementaremos los guardarrailes de seguridad y conectaremos todo con Claude Desktop.