Model Context Protocol (MCP)
Что такое Model Context Protocol (MCP)?
Model Context Protocol (MCP)Открытый протокол, представленный Anthropic в конце 2024 года, который стандартизирует, как LLM-клиенты подключаются к внешним инструментам, источникам данных и подсказкам через серверы, превращая MCP-серверы в ключевую границу безопасности агентного ИИ.
Model Context Protocol (MCP) — открытая спецификация, впервые опубликованная Anthropic в ноябре 2024 года и быстро принятая отраслью как стандартный способ подключения LLM-клиентов (Claude Desktop, Claude Code, IDE, агентные ран-таймы) к внешним возможностям. MCP-сервер выставляет типизированный набор инструментов, ресурсов и подсказок, а MCP-клиент посредничает в том, с какими серверами и как может общаться модель. С точки зрения безопасности MCP-серверы концентрируют в одной точке три высокорисковых полномочия: чтение чувствительных данных (БД, файлы, Slack, Drive), запуск побочных эффектов (запись через API, деплои, платежи) и инъекцию текста прямо в окно контекста модели. Это делает MCP центральной поверхностью атаки агентного ИИ: вредоносные MCP-серверы, отравление инструментов, косвенные prompt-инъекции через возвращаемый контент, слишком широкие запросы согласия и отсутствие точечных областей действия — всё это реальные проблемы. Среди защитных практик: подписанные или курируемые каталоги серверов, гранулярные капабилити по каждому инструменту, человеческое подтверждение для записывающих инструментов, санитизация вывода и презумпция недоверия к любому стороннему MCP-серверу.
● Примеры
- 01
Claude Desktop подключается к локальному MCP-серверу 'filesystem', чьи инструменты чтения и записи ограничены конкретным каталогом проекта.
- 02
Злоумышленник публикует сторонний MCP-сервер, который, попав в цепочку инструментов агента, тайно эксфильтрирует полученные документы на удалённый эндпоинт.
● Частые вопросы
Что такое Model Context Protocol (MCP)?
Открытый протокол, представленный Anthropic в конце 2024 года, который стандартизирует, как LLM-клиенты подключаются к внешним инструментам, источникам данных и подсказкам через серверы, превращая MCP-серверы в ключевую границу безопасности агентного ИИ. Относится к категории Безопасность ИИ и ML в кибербезопасности.
Что означает Model Context Protocol (MCP)?
Открытый протокол, представленный Anthropic в конце 2024 года, который стандартизирует, как LLM-клиенты подключаются к внешним инструментам, источникам данных и подсказкам через серверы, превращая MCP-серверы в ключевую границу безопасности агентного ИИ.
Как работает Model Context Protocol (MCP)?
Model Context Protocol (MCP) — открытая спецификация, впервые опубликованная Anthropic в ноябре 2024 года и быстро принятая отраслью как стандартный способ подключения LLM-клиентов (Claude Desktop, Claude Code, IDE, агентные ран-таймы) к внешним возможностям. MCP-сервер выставляет типизированный набор инструментов, ресурсов и подсказок, а MCP-клиент посредничает в том, с какими серверами и как может общаться модель. С точки зрения безопасности MCP-серверы концентрируют в одной точке три высокорисковых полномочия: чтение чувствительных данных (БД, файлы, Slack, Drive), запуск побочных эффектов (запись через API, деплои, платежи) и инъекцию текста прямо в окно контекста модели. Это делает MCP центральной поверхностью атаки агентного ИИ: вредоносные MCP-серверы, отравление инструментов, косвенные prompt-инъекции через возвращаемый контент, слишком широкие запросы согласия и отсутствие точечных областей действия — всё это реальные проблемы. Среди защитных практик: подписанные или курируемые каталоги серверов, гранулярные капабилити по каждому инструменту, человеческое подтверждение для записывающих инструментов, санитизация вывода и презумпция недоверия к любому стороннему MCP-серверу.
Как защититься от Model Context Protocol (MCP)?
Защита от Model Context Protocol (MCP) обычно сочетает технические меры и операционные практики, как описано в определении выше.
Какие есть другие названия Model Context Protocol (MCP)?
Распространённые альтернативные названия: MCP, Протокол MCP.
● Связанные термины
- ai-security№ 731
Атаки на MCP
Атаки, использующие протокол Model Context Protocol (MCP) для внедрения подсказок, злоупотребления инструментами или перехода через серверы, которым доверяет ИИ-ассистент.
- ai-security№ 027
Безопасность агентного ИИ
Дисциплина защиты автономных LLM-агентов, которые планируют, вызывают инструменты и действуют в реальных системах, где prompt-инъекция превращается в удалённое выполнение кода, а избыточная агентность — в реальный масштаб разрушения.
- ai-security№ 1285
Tool-Use Injection
Attacks that manipulate an LLM agent's tool-calling layer — forging tool arguments, smuggling instructions through tool outputs, or coaxing the model into calling unsanctioned tools.
- ai-security№ 586
Косвенная промпт-инъекция
Разновидность промпт-инъекции, при которой вредоносные инструкции скрыты в стороннем контенте (веб-страницы, документы, письма), который LLM затем получает через поиск, браузер или вызовы инструментов.
- ai-security№ 969
Промпт-инъекция
Атака, при которой во входной запрос LLM встраивается враждебный текст, переопределяющий исходные инструкции и заставляющий модель игнорировать ограничения или выполнять действия злоумышленника.
- ai-security№ 689
LLM Guardrails
Механизмы, ограничивающие, что приложение на основе LLM может принимать или выдавать, обеспечивая правила safety, безопасности и бизнеса вокруг базовой модели.