Firewall de LLM
¿Qué es Firewall de LLM?
Firewall de LLMControl de seguridad que se sitúa entre los usuarios y un gran modelo de lenguaje para inspeccionar prompts, contexto recuperado y salidas en tiempo real, bloqueando o reescribiendo el tráfico que viola la política.
Un firewall de LLM —también llamado AI firewall o LLM gateway— aplica inspección, clasificación y aplicación de políticas al tráfico hacia y desde los endpoints LLM. Capacidades típicas: detección de inyección y jailbreak, redacción de PII y secretos, moderación de contenido, validación de esquema y de llamadas a herramientas, rate limiting por identidad, control de salida de RAG y registro detallado. Productos y proyectos open-source: LLM Guard, Prompt Shield, Lakera Guard, así como ofertas de Cloudflare, F5, Palo Alto y los grandes hiperescaladores. Complementa, pero no sustituye, los guardrails del modelo, el diseño seguro de RAG, el control de acceso basado en identidad y las prácticas MLSecOps. Es más eficaz en arquitecturas de defensa en profundidad, aplicando políticas propias por encima de la safety del proveedor.
● Ejemplos
- 01
Un gateway bloquea los prompts que contienen números de tarjeta antes de llegar a la API del LLM.
- 02
Un firewall de LLM elimina una firma conocida de inyección de prompts de un documento antes de añadirlo al contexto RAG.
● Preguntas frecuentes
¿Qué es Firewall de LLM?
Control de seguridad que se sitúa entre los usuarios y un gran modelo de lenguaje para inspeccionar prompts, contexto recuperado y salidas en tiempo real, bloqueando o reescribiendo el tráfico que viola la política. Pertenece a la categoría de Seguridad de IA y ML en ciberseguridad.
¿Qué significa Firewall de LLM?
Control de seguridad que se sitúa entre los usuarios y un gran modelo de lenguaje para inspeccionar prompts, contexto recuperado y salidas en tiempo real, bloqueando o reescribiendo el tráfico que viola la política.
¿Cómo funciona Firewall de LLM?
Un firewall de LLM —también llamado AI firewall o LLM gateway— aplica inspección, clasificación y aplicación de políticas al tráfico hacia y desde los endpoints LLM. Capacidades típicas: detección de inyección y jailbreak, redacción de PII y secretos, moderación de contenido, validación de esquema y de llamadas a herramientas, rate limiting por identidad, control de salida de RAG y registro detallado. Productos y proyectos open-source: LLM Guard, Prompt Shield, Lakera Guard, así como ofertas de Cloudflare, F5, Palo Alto y los grandes hiperescaladores. Complementa, pero no sustituye, los guardrails del modelo, el diseño seguro de RAG, el control de acceso basado en identidad y las prácticas MLSecOps. Es más eficaz en arquitecturas de defensa en profundidad, aplicando políticas propias por encima de la safety del proveedor.
¿Cómo defenderse de Firewall de LLM?
Las defensas contra Firewall de LLM combinan habitualmente controles técnicos y prácticas operativas, como se detalla en la definición.
¿Cuáles son otros nombres para Firewall de LLM?
Nombres alternativos comunes: Firewall de IA, Gateway de LLM.
● Términos relacionados
- ai-security№ 618
Guardrails de LLM
Mecanismos que restringen lo que una aplicación basada en LLM puede recibir o emitir, aplicando reglas de safety, seguridad y negocio alrededor del modelo subyacente.
- ai-security№ 866
Inyección de prompts
Ataque que anula las instrucciones originales de un LLM al introducir texto adversarial en el prompt, haciendo que el modelo ignore sus salvaguardas o ejecute acciones del atacante.
- ai-security№ 777
OWASP LLM Top 10
Lista mantenida por OWASP con los diez riesgos de seguridad más críticos para aplicaciones construidas sobre grandes modelos de lenguaje.
- ai-security№ 898
Seguridad de RAG
Disciplina dedicada a proteger los pipelines de generación aumentada por recuperación para que los documentos, almacenes vectoriales y pasos de recuperación que alimentan al LLM no puedan envenenarse, abusarse ni filtrar datos.
- ai-security№ 027
Gobernanza de IA
Conjunto de políticas, procesos, roles y controles con los que organizaciones y reguladores garantizan que los sistemas de IA se desarrollan, despliegan y operan de forma responsable y legal.
- ai-security№ 691
MLSecOps
Disciplina que integra controles de seguridad y riesgo en todo el ciclo de vida del aprendizaje automático, desde la obtención de datos hasta el entrenamiento, despliegue, monitoreo y retiro.