Agentic DevOps: Servidores MCP para APIs Infra
Tabla de contenidos
Parte 2 de 5 | ← Parte 1 | Parte 3 → | Parte 4 → | Parte 5 →
Cómo los Servidores MCP Conectan Modelos de IA con APIs de Infraestructura
Un servidor MCP es un servicio ligero que expone datos y capacidades de infraestructura a agentes de IA a través del Model Context Protocol, una interfaz estandarizada desarrollada por Anthropic. Actúa como una capa de traducción entre tus sistemas y el LLM, transformando la intención en lenguaje natural en llamadas a APIs estructuradas.
En lugar de dar a un agente acceso directo a kubectl, construyes un servidor MCP que expone herramientas cuidadosamente delimitadas: get_pod_logs, list_deployments, restart_deployment. El agente descubre estas herramientas dinámicamente y las invoca vía JSON-RPC.
Los Tres Primitivos de los Servidores MCP
Cada servidor MCP proporciona tres primitivos que definen las capacidades del agente:
- Resources: Datos de solo lectura que el agente puede consultar (logs, métricas, configs, documentación)
- Tools: Funciones que el agente puede invocar (reiniciar pods, escalar deployments, consultar bases de datos)
- Prompts: Plantillas pre-escritas que guían el razonamiento del agente y aseguran comportamiento consistente
El protocolo es agnóstico al transporte. Los servidores MCP pueden ejecutarse localmente vía stdio, remotamente sobre HTTP/SSE, o dentro de tu cluster como sidecars. Esta flexibilidad los hace ideales para conectar agentes de IA a la infraestructura existente sin cambios arquitectónicos mayores.
Por Qué los Servidores MCP Importan para el Agentic DevOps
Sin servidores MCP, cada agente de IA necesita código de integración personalizado para cada API que toca. Con servidores MCP, escribes la integración una vez y cualquier agente compatible puede usarla. Este desacoplamiento es lo que permite que el agentic devops opere en entornos grandes y heterogéneos.
Por ejemplo, si estás desplegando Ollama en Kubernetes, un servidor MCP puede exponer métricas de GPU y el estado de servicio de modelos a tu agente de IA, permitiéndole detectar cuando un endpoint de modelo está fallando y disparar un reinicio gradual.
Arquitectura de IA SRE: Cuatro Capas de Sistemas Agenticos
Un sistema de agentic devops en producción tiene cuatro capas que separan responsabilidades y permiten operaciones autónomas seguras.
Capa 1: El Plano de Observabilidad
Tu stack existente. Prometheus, Grafana, Loki, Jaeger, proporciona datos estructurados sobre el estado del sistema. No lo reemplazas; lo expones a través de recursos de servidor MCP. Esta capa responde la pregunta: “¿Qué está pasando ahora mismo?”
Capa 2: La Capa de Servidor MCP
Los servidores MCP traducen tus APIs de infraestructura en herramientas compatibles con el protocolo. Podrías tener un servidor MCP de Kubernetes para operaciones de pods, un servidor MCP de AWS para consultas de EC2, y un servidor MCP de PagerDuty para gestión de incidentes. Cada uno es independientemente desplegable y delimitado. Esta capa responde: “¿Qué puede hacer el agente?”
Capa 3: El Runtime del Agente
La capa de orquestación gestiona el LLM, la invocación de herramientas, la memoria y la planificación. Las opciones incluyen Claude Code, LangGraph, CrewAI, o implementaciones personalizadas usando el OpenAI Agents SDK. Un buen runtime mantiene el contexto a través de turnos, maneja fallas con elegancia y escala de forma inteligente. Esta capa responde: “¿Cómo piensa y decide el agente?”
Capa 4: La Capa de Gobernanza
Las políticas, logs de auditoría, límites de tasa y colas de aprobación viven aquí. Cada invocación de herramienta debe ser registrada con contexto completo: quién la disparó, cuál fue el razonamiento del LLM, y cuál fue el resultado. Esta capa responde: “¿Esto es seguro y conforme?”
FAQ
¿Qué es un servidor MCP en el contexto de Agentic DevOps?
Un servidor MCP es un servicio ligero que expone herramientas y datos de infraestructura a agentes de IA a través del Model Context Protocol. Actúa como una capa de traducción segura entre un LLM y tus sistemas, en lugar de dar acceso directo a kubectl, proporcionas herramientas delimitadas como get_pod_logs o restart_deployment.
¿Cuáles son los tres primitivos de cada servidor MCP?
Cada servidor MCP proporciona Resources (datos de solo lectura como logs y métricas), Tools (funciones que el agente puede invocar) y Prompts (plantillas pre-escritas que guían el razonamiento). Estos tres primitivos definen exactamente qué puede ver, hacer y cómo debe comportarse el agente.
¿Cómo mejoran los servidores MCP la seguridad comparado con el acceso directo a APIs?
Los servidores MCP aplican el principio de menor privilegio por diseño. Defines herramientas estrechas y delimitadas en lugar de dar credenciales amplias al agente. Cada invocación es auditables, y el protocolo soporta workflows de aprobación y límites de tasa de forma nativa.
¿Puedo ejecutar servidores MCP dentro de mi cluster de Kubernetes?
Sí. Los servidores MCP pueden desplegarse como sidecars o pods independientes. Para operación in-cluster, usa config.load_incluster_config() y asocia un ServiceAccount con permisos RBAC delimitados. Esto mantiene el runtime del agente fuera del cluster mientras el servidor MCP opera dentro de él.
Partes en esta serie: ← Parte 1 | Parte 3 → | Parte 4 → | Parte 5 →